Tendencias21

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Investigadores de la Universidad del Sur de California (EEUU) han desarrollado algoritmos que permiten a las máquinas entender el habla con precisión a una velocidad similar a la humana, un desafío clave para avanzar en la aplicación de los asistentes de voz. La tecnología se ha puesto a prueba con un juego, en el que Eva, una agente de procesamiento del lenguaje, adivina rápidamente de qué imagen está hablando el jugador real, gracias al buen y rápido entendimiento entre ellos. Por Patricia Pérez

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Los asistentes de voz invaden ordenadores y todo tipo de dispositivos móviles tratando de facilitarnos la vida y de no dejar pregunta sin respuesta. Sin embargo, aunque se puede establecer la comunicación, todavía queda lejos de la conversación natural y fluida propia de la interacción entre dos o más personas. La diferencia reside en la rapidez con la que los hablantes se entienden y responden mutuamente, característica determinante para conseguir interfaces de voz más parecidas a las humanas.

En esa línea trabajan en el Instituto de Tecnologías Creativas de la Universidad del Sur de California (USC), en Estados Unidos, en una investigación que cuenta con el apoyo de la Fundación Nacional de Ciencia (NSF). Al mando del profesor David DeVault, están desarrollando un sistema de procesamiento del lenguaje de alta velocidad que aspira a competir en rapidez y eficiencia con el de los hablantes humanos en entornos específicos.

«A pesar de que las personas suelen comprender y responder a lo que alguien les dice en una fracción de segundo, una interfaz de voz típica requiere mucho más tiempo, entre uno y dos segundos, para tratar de entender lo que se ha dicho y responder de manera apropiada”, explica DeVault en un comunicado de la NSF. Ese ritmo relativamente lento es una de las razones por las que muchos usuarios siguen encontrando la experiencia ineficiente y frustrante.

Frente a las interfaces actuales, el equipo de DeVault está estudiando nuevas técnicas para simplificar las conversaciones, permitiendo que el sistema lleve a cabo todo el procesamiento informático necesario en tiempo real mientras el usuario está hablando. De esta forma puede averiguar lo que el hablante quiere decir y responderle incluso antes de que termine.

Jugando contra Eve

La investigación parte de un estudio previo en el que diseñan un juego, con una agente de procesamiento del lenguaje de alto rendimiento llamada Eve. La dinámica es sencilla: cada jugador ve un conjunto de ocho imágenes en la pantalla de su ordenador. Siempre son las mismas en cada ronda, aunque dispuestas en un orden diferente. A medida que se van resaltando, el jugador debe describirlas mientras el sistema trata de adivinar de qué se trata de la forma más rápida y precisa, para conseguir la puntuación más alta.

Eve puede optimizarse y operar en tres modos de procesamiento diferentes de forma gradual, con algoritmos para resolver el reconocimiento de voz, la comprensión del lenguaje y el diálogo. A medida que aumenta la progresión, el nivel de comprensión y respuesta de la jugadora virtual será tan rápido como el de sus rivales humanos.

Para llevar a cabo el estudio se contó con la colaboración de 125 participantes, con los que evaluaron las tres arquitecturas incrementales enfrentándolos por equipos contra la máquina por un lado, y comparando después el resultado con el rendimiento del juego entre humanos.

A diferencia de las fases iniciales en la que Eve espera hasta que el jugador acaba de hablar para tratar de entenderlo y responder, los usuarios califican sus interacciones con la versión más progresiva como más natural, eficiente y, en definitiva, de mayor entendimiento común, consiguiendo resultados comparables a los obtenidos en el juego entre rivales de carne y hueso.

Aplicación

«Estos resultados subrayan la importancia de posibilitar sistemas no sólo para entender lo que dicen los usuarios, sino para que lo hagan tan pronto como lo haría un humano», subraya DeVault.

Así, a medida que se consiga crear interfaces de voz más rápidas y de mayor entendimiento se avanzará hacia experiencias más naturales. Esto propiciará su adaptación a una amplia gama de aplicaciones relevantes, incluyendo el acceso a la información, educación, salud, entretenimiento o formación. «Estamos en el comienzo de un cambio radical en lo que podemos lograr a través de la conversación con los ordenadores», asegura el profesor.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Las montañas esconden los mayores reservorios de energía limpia 21 marzo, 2025
    Una nueva investigación sugiere que podrían existir reservas masivas de gas de hidrógeno natural escondiéndose en las cadenas montañosas del planeta: estos recursos podrían darnos acceso a una enorme fuente de energía limpia, capaz de solucionar la crisis energética actual.
    Pablo Javier Piacente / T21
  • Un anillo con IA optimiza la comunicación de personas con problemas auditivos 21 marzo, 2025
    Investigadores de la Universidad de Cornell, en Estados Unidos, han desarrollado un innovador dispositivo llamado SpellRing: se trata de un anillo potenciado por Inteligencia Artificial (IA) que utiliza tecnología de microsonar para rastrear en tiempo real el deletreo manual en el Lenguaje de Señas Americano (ASL). Este avance podría transformar la forma en que las […]
    Pablo Javier Piacente / T21
  • Identifican la vía química que regula cómo tienen sexo los ratones 21 marzo, 2025
    Una aceitada maquinaria química marca el ritmo sexual de los ratones machos: la dopamina y la acetilcolina van cumpliendo diferentes papeles desde antes del coito y hasta la eyaculación. Los descubrimientos podrían habilitar nuevas instancias terapéuticas para trastornos sexuales en humanos, como por ejemplo la eyaculación precoz.
    Redacción T21
  • Un nuevo mapa revela el paisaje oculto bajo el hielo de la Antártida y la vulnerabilidad del continente helado 21 marzo, 2025
    Un nuevo mapa elaborado por científicos británicos revela por primera vez con precisión milimétrica las sorprendentes características del paisaje oculto bajo el hielo antártico y confirma el enorme riesgo climático que supone el deshielo acelerado en la región.
    Redacción T21
  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21
  • Sudáfrica y China logran una conexión cuántica satelital récord de casi 13.000 kilómetros 20 marzo, 2025
    Un equipo internacional de científicos ha establecido una conexión satelital cuántica histórica entre Sudáfrica y China, cubriendo una distancia récord de 12.900 kilómetros. Gracias al fenómeno del entrelazamiento cuántico, esta tecnología garantiza comunicaciones absolutamente seguras frente a cualquier intento de espionaje.
    Redacción T21
  • Los tribunales no reconocen derechos de autor a la Inteligencia Artificial 20 marzo, 2025
    Un tribunal de apelaciones en Estados Unidos ha puesto límites a la creatividad de las máquinas: las obras generadas exclusivamente por inteligencia artificial no pueden ser protegidas por derechos de autor. El fallo reafirma que la ley actual requiere la participación humana para garantizar la protección legal de una obra.
    Redacción T21