Tendencias21

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Investigadores de la Universidad del Sur de California (EEUU) han desarrollado algoritmos que permiten a las máquinas entender el habla con precisión a una velocidad similar a la humana, un desafío clave para avanzar en la aplicación de los asistentes de voz. La tecnología se ha puesto a prueba con un juego, en el que Eva, una agente de procesamiento del lenguaje, adivina rápidamente de qué imagen está hablando el jugador real, gracias al buen y rápido entendimiento entre ellos. Por Patricia Pérez

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Los asistentes de voz invaden ordenadores y todo tipo de dispositivos móviles tratando de facilitarnos la vida y de no dejar pregunta sin respuesta. Sin embargo, aunque se puede establecer la comunicación, todavía queda lejos de la conversación natural y fluida propia de la interacción entre dos o más personas. La diferencia reside en la rapidez con la que los hablantes se entienden y responden mutuamente, característica determinante para conseguir interfaces de voz más parecidas a las humanas.

En esa línea trabajan en el Instituto de Tecnologías Creativas de la Universidad del Sur de California (USC), en Estados Unidos, en una investigación que cuenta con el apoyo de la Fundación Nacional de Ciencia (NSF). Al mando del profesor David DeVault, están desarrollando un sistema de procesamiento del lenguaje de alta velocidad que aspira a competir en rapidez y eficiencia con el de los hablantes humanos en entornos específicos.

«A pesar de que las personas suelen comprender y responder a lo que alguien les dice en una fracción de segundo, una interfaz de voz típica requiere mucho más tiempo, entre uno y dos segundos, para tratar de entender lo que se ha dicho y responder de manera apropiada”, explica DeVault en un comunicado de la NSF. Ese ritmo relativamente lento es una de las razones por las que muchos usuarios siguen encontrando la experiencia ineficiente y frustrante.

Frente a las interfaces actuales, el equipo de DeVault está estudiando nuevas técnicas para simplificar las conversaciones, permitiendo que el sistema lleve a cabo todo el procesamiento informático necesario en tiempo real mientras el usuario está hablando. De esta forma puede averiguar lo que el hablante quiere decir y responderle incluso antes de que termine.

Jugando contra Eve

La investigación parte de un estudio previo en el que diseñan un juego, con una agente de procesamiento del lenguaje de alto rendimiento llamada Eve. La dinámica es sencilla: cada jugador ve un conjunto de ocho imágenes en la pantalla de su ordenador. Siempre son las mismas en cada ronda, aunque dispuestas en un orden diferente. A medida que se van resaltando, el jugador debe describirlas mientras el sistema trata de adivinar de qué se trata de la forma más rápida y precisa, para conseguir la puntuación más alta.

Eve puede optimizarse y operar en tres modos de procesamiento diferentes de forma gradual, con algoritmos para resolver el reconocimiento de voz, la comprensión del lenguaje y el diálogo. A medida que aumenta la progresión, el nivel de comprensión y respuesta de la jugadora virtual será tan rápido como el de sus rivales humanos.

Para llevar a cabo el estudio se contó con la colaboración de 125 participantes, con los que evaluaron las tres arquitecturas incrementales enfrentándolos por equipos contra la máquina por un lado, y comparando después el resultado con el rendimiento del juego entre humanos.

A diferencia de las fases iniciales en la que Eve espera hasta que el jugador acaba de hablar para tratar de entenderlo y responder, los usuarios califican sus interacciones con la versión más progresiva como más natural, eficiente y, en definitiva, de mayor entendimiento común, consiguiendo resultados comparables a los obtenidos en el juego entre rivales de carne y hueso.

Aplicación

«Estos resultados subrayan la importancia de posibilitar sistemas no sólo para entender lo que dicen los usuarios, sino para que lo hagan tan pronto como lo haría un humano», subraya DeVault.

Así, a medida que se consiga crear interfaces de voz más rápidas y de mayor entendimiento se avanzará hacia experiencias más naturales. Esto propiciará su adaptación a una amplia gama de aplicaciones relevantes, incluyendo el acceso a la información, educación, salud, entretenimiento o formación. «Estamos en el comienzo de un cambio radical en lo que podemos lograr a través de la conversación con los ordenadores», asegura el profesor.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Los gorilas occidentales votan para tomar decisiones colectivas 30 octubre, 2024
    Un nuevo estudio desmonta la creencia de que, entre los grandes simios, es el macho dominante quien decide por todo el grupo. Entre los gorilas occidentales de la República Centroafricana, cada individuo tiene voz y voto, especialmente cuando se trata de cambiar de asentamiento.
    Redacción T21
  • Podemos comprender oraciones escritas en un parpadeo 29 octubre, 2024
    Nuestro cerebro puede entender oraciones escritas en lo que dura el parpadeo de un ojo, según revela un nuevo estudio. Los científicos descubrieron que el procesamiento del lenguaje escrito ocurre a velocidades significativamente más rápidas de las necesarias para hablar o comunicarse en voz alta.
    Pablo Javier Piacente
  • El beso humano habría comenzado como un ritual de acicalamiento de los simios 29 octubre, 2024
    El acto final del aseo de los simios implica labios sobresalientes y una ligera succión, para eliminar los desechos o parásitos, un comportamiento que persistió incluso cuando su función higiénica disminuyó. Un nuevo estudio sugiere que esta conducta refleja la forma, el contexto y la función de los besos humanos modernos.
    Pablo Javier Piacente
  • Thriller policial en la arqueología: el ADN confirma una leyenda nórdica de 800 años 29 octubre, 2024
    Un fascinante descubrimiento arqueológico en Noruega ha arrojado nueva luz sobre un misterioso episodio de la historia medieval del país. Revela que hace 800 años existió una deriva genética única que se puede observar entre los actuales habitantes del sur del país.
    Redacción T21
  • Descubren moléculas complejas de carbono en el espacio interestelar 28 octubre, 2024
    Un equipo de investigadores ha descubierto grandes moléculas que contienen carbono en una distante nube interestelar de gas y polvo: el hallazgo muestra que las moléculas orgánicas complejas, que incluyen carbono e hidrógeno, probablemente existieron en la nube de gas frío y oscuro que dio origen a nuestro Sistema Solar.
    Pablo Javier Piacente
  • El colapso de una corriente oceánica clave podría tener impactos catastróficos en todo el planeta 28 octubre, 2024
    Los científicos ya no consideran de baja probabilidad el colapso de la Circulación de Volteo Meridional del Atlántico (AMOC), que incluye a la Corriente del Golfo: se trata de una de las corrientes oceánicas más importantes para el equilibrio ambiental y climático global, y su debilitamiento provocaría eventos climáticos extremos, trayendo mucha más inestabilidad y […]
    Pablo Javier Piacente
  • Desafío a la consciencia: la cognición puede existir en organismos sin cerebro 28 octubre, 2024
    Una nueva investigación ha comprobado que los hongos muestran indicios de cognición y consciencia mínima, sin tener cerebro ni sistema nervioso para percibir el entorno ni tomar decisiones. Su comportamiento sigue patrones cognitivos para asegurar su supervivencia y crecimiento, todo un desafío a lo que sabemos sobre la consciencia.
    Eduardo Martínez de la Fe
  • Nuestra percepción del tiempo se modifica de acuerdo con lo que vemos 27 octubre, 2024
    Una nueva investigación revela que diferentes estímulos visuales pueden distorsionar significativamente la percepción humana del tiempo: ver escenas más destacadas y memorables puede crear la impresión de que el tiempo avanza más lentamente, en tanto que las imágenes desordenadas y caóticas comprimen la percepción del tiempo, haciendo que parezca acelerarse.
    Pablo Javier Piacente
  • Crean un cerebro fantasma en forma de cubo impreso en 3D 26 octubre, 2024
    Investigadores austriacos han desarrollado un modelo de cerebro impreso en 3D basado en la estructura de las fibras cerebrales visibles mediante imágenes de resonancia magnética. Permite estudiar la compleja red neuronal con una precisión sin precedentes.
    Redacción T21
  • Crean un atlas de embriones que muestra cómo las células se mueven y se desarrollan a través del tiempo 25 octubre, 2024
    Un equipo de científicos ha desarrollado un atlas celular denominado "Zebrahub", que evidencia el desarrollo de embriones de pez cebra y la evolución celular con el paso del tiempo: los investigadores dicen que también nos ayudará a aprender más sobre nuestro propio desarrollo biológico.
    Pablo Javier Piacente