Tendencias21

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Investigadores de la Universidad del Sur de California (EEUU) han desarrollado algoritmos que permiten a las máquinas entender el habla con precisión a una velocidad similar a la humana, un desafío clave para avanzar en la aplicación de los asistentes de voz. La tecnología se ha puesto a prueba con un juego, en el que Eva, una agente de procesamiento del lenguaje, adivina rápidamente de qué imagen está hablando el jugador real, gracias al buen y rápido entendimiento entre ellos. Por Patricia Pérez

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Los asistentes de voz invaden ordenadores y todo tipo de dispositivos móviles tratando de facilitarnos la vida y de no dejar pregunta sin respuesta. Sin embargo, aunque se puede establecer la comunicación, todavía queda lejos de la conversación natural y fluida propia de la interacción entre dos o más personas. La diferencia reside en la rapidez con la que los hablantes se entienden y responden mutuamente, característica determinante para conseguir interfaces de voz más parecidas a las humanas.

En esa línea trabajan en el Instituto de Tecnologías Creativas de la Universidad del Sur de California (USC), en Estados Unidos, en una investigación que cuenta con el apoyo de la Fundación Nacional de Ciencia (NSF). Al mando del profesor David DeVault, están desarrollando un sistema de procesamiento del lenguaje de alta velocidad que aspira a competir en rapidez y eficiencia con el de los hablantes humanos en entornos específicos.

«A pesar de que las personas suelen comprender y responder a lo que alguien les dice en una fracción de segundo, una interfaz de voz típica requiere mucho más tiempo, entre uno y dos segundos, para tratar de entender lo que se ha dicho y responder de manera apropiada”, explica DeVault en un comunicado de la NSF. Ese ritmo relativamente lento es una de las razones por las que muchos usuarios siguen encontrando la experiencia ineficiente y frustrante.

Frente a las interfaces actuales, el equipo de DeVault está estudiando nuevas técnicas para simplificar las conversaciones, permitiendo que el sistema lleve a cabo todo el procesamiento informático necesario en tiempo real mientras el usuario está hablando. De esta forma puede averiguar lo que el hablante quiere decir y responderle incluso antes de que termine.

Jugando contra Eve

La investigación parte de un estudio previo en el que diseñan un juego, con una agente de procesamiento del lenguaje de alto rendimiento llamada Eve. La dinámica es sencilla: cada jugador ve un conjunto de ocho imágenes en la pantalla de su ordenador. Siempre son las mismas en cada ronda, aunque dispuestas en un orden diferente. A medida que se van resaltando, el jugador debe describirlas mientras el sistema trata de adivinar de qué se trata de la forma más rápida y precisa, para conseguir la puntuación más alta.

Eve puede optimizarse y operar en tres modos de procesamiento diferentes de forma gradual, con algoritmos para resolver el reconocimiento de voz, la comprensión del lenguaje y el diálogo. A medida que aumenta la progresión, el nivel de comprensión y respuesta de la jugadora virtual será tan rápido como el de sus rivales humanos.

Para llevar a cabo el estudio se contó con la colaboración de 125 participantes, con los que evaluaron las tres arquitecturas incrementales enfrentándolos por equipos contra la máquina por un lado, y comparando después el resultado con el rendimiento del juego entre humanos.

A diferencia de las fases iniciales en la que Eve espera hasta que el jugador acaba de hablar para tratar de entenderlo y responder, los usuarios califican sus interacciones con la versión más progresiva como más natural, eficiente y, en definitiva, de mayor entendimiento común, consiguiendo resultados comparables a los obtenidos en el juego entre rivales de carne y hueso.

Aplicación

«Estos resultados subrayan la importancia de posibilitar sistemas no sólo para entender lo que dicen los usuarios, sino para que lo hagan tan pronto como lo haría un humano», subraya DeVault.

Así, a medida que se consiga crear interfaces de voz más rápidas y de mayor entendimiento se avanzará hacia experiencias más naturales. Esto propiciará su adaptación a una amplia gama de aplicaciones relevantes, incluyendo el acceso a la información, educación, salud, entretenimiento o formación. «Estamos en el comienzo de un cambio radical en lo que podemos lograr a través de la conversación con los ordenadores», asegura el profesor.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Revelan la primera molécula fractal en la naturaleza 15 abril, 2024
    Los científicos han descubierto una molécula en la naturaleza que sigue un patrón geométrico de autosimilitud, conocido como fractal. La enzima microbiana denominada citrato sintasa es la primera estructura fractal molecular ensamblada directamente en la naturaleza que ha logrado identificarse hasta el momento. Los especialistas creen que este fractal puede representar un accidente evolutivo.
    Pablo Javier Piacente
  • El cambio climático podría estar relacionado con el aumento de los accidentes cerebrovasculares 15 abril, 2024
    Una nueva investigación ha demostrado que el número de muertes ligadas a accidentes cerebrovasculares y otras patologías relacionadas ha ido creciendo desde 1990, a la par del aumento de las temperaturas extremas. Durante 2019, el último año analizado, más de 500.000 muertes por accidentes cerebrovasculares se vincularon con temperaturas "no óptimas", provocadas por el calentamiento […]
    Pablo Javier Piacente
  • La globalización está fracturando a la humanidad 15 abril, 2024
    La globalización no está conduciendo a una civilización universal con valores compartidos, sino que está creando una brecha creciente entre los países occidentales de altos ingresos y el resto del mundo, en cuanto a valores como la tolerancia, la diversidad y la libertad.
    Eduardo Martínez de la Fe
  • En el caso de los caracoles, el huevo fue lo primero 14 abril, 2024
    Un caracol marino que primero fue ovíparo y evolucionó hacia la viviparidad revela que los saltos evolutivos ocurren gradualmente, a través de una serie de pequeños cambios.
    Redacción T21
  • Revelan el misterio del árbol tropical que camina 13 abril, 2024
    La denominada "palma caminante" o Socratea exorrhiza es un árbol de América Central y del Sur que según distintas versiones podría "caminar" y erguirse en determinadas situaciones: ahora, este mito parece haber sido resuelto bajo criterios científicos. Según los investigadores, aunque el árbol puede crecer rápidamente y crear nuevas raíces para lidiar con la pérdida […]
    Pablo Javier Piacente
  • Descubren 50 especies desconocidas para la ciencia en la exótica Isla de Pascua 12 abril, 2024
    Una expedición a la Cordillera de Salas y Gómez, frente a Rapa Nui, en el Océano Pacífico, documentó 160 especies animales que no se sabía que habitaban esta región de la misteriosa Isla de Pascua, en Chile. Además, descubrieron 50 criaturas que son absolutamente nuevas para la ciencia.
    Pablo Javier Piacente
  • El clima espacial podría generar un caos satelital sin precedentes 12 abril, 2024
    Los satélites en órbita terrestre baja (LEO) pueden perder su brújula cuando el clima espacial ofrece situaciones inesperadas. El problema afecta a la Estación Espacial Internacional, la estación espacial Tiangong de China y muchos satélites de observación de la Tierra. Los expertos sostienen que esta incertidumbre de posicionamiento aumenta el riesgo de colisiones orbitales peligrosas, […]
    Pablo Javier Piacente
  • La Inteligencia Artificial puede ser envenenada para proteger los derechos de autor 12 abril, 2024
    Una herramienta llamada Nightshade cambia imágenes digitales de manera casi imperceptible para el ojo humano, pero que se ven totalmente diferentes por los modelos de IA: una forma polémica de proteger las obras de arte de posibles infracciones de derechos de autor.
    Redacción T21
  • La acidez cerebral podría estar relacionada con múltiples trastornos neurológicos 11 abril, 2024
    Un estudio en animales a gran escala vincula los cambios en el pH del cerebro con problemas cognitivos de amplio alcance, ligados a patologías como el autismo o el Alzheimer, entre otras. Los científicos creen que los problemas metabólicos en el cerebro podrían estar directamente relacionados con una variedad de trastornos neuropsiquiátricos y neurodegenerativos.
    Pablo Javier Piacente
  • Cultivan organoides cerebrales con conexiones neuronales similares a las de un cerebro real 11 abril, 2024
    Un equipo internacional de investigadores ha desarrollado una técnica para conectar tejidos cultivados en laboratorio que imitan al cerebro humano de una manera que se asemeja a los circuitos neuronales del cerebro real. El "sistema" de mini cerebros interconectados podría revolucionar nuestra comprensión de las funciones cerebrales.
    Pablo Javier Piacente