Tendencias21

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Investigadores de la Universidad del Sur de California (EEUU) han desarrollado algoritmos que permiten a las máquinas entender el habla con precisión a una velocidad similar a la humana, un desafío clave para avanzar en la aplicación de los asistentes de voz. La tecnología se ha puesto a prueba con un juego, en el que Eva, una agente de procesamiento del lenguaje, adivina rápidamente de qué imagen está hablando el jugador real, gracias al buen y rápido entendimiento entre ellos. Por Patricia Pérez

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Los asistentes de voz invaden ordenadores y todo tipo de dispositivos móviles tratando de facilitarnos la vida y de no dejar pregunta sin respuesta. Sin embargo, aunque se puede establecer la comunicación, todavía queda lejos de la conversación natural y fluida propia de la interacción entre dos o más personas. La diferencia reside en la rapidez con la que los hablantes se entienden y responden mutuamente, característica determinante para conseguir interfaces de voz más parecidas a las humanas.

En esa línea trabajan en el Instituto de Tecnologías Creativas de la Universidad del Sur de California (USC), en Estados Unidos, en una investigación que cuenta con el apoyo de la Fundación Nacional de Ciencia (NSF). Al mando del profesor David DeVault, están desarrollando un sistema de procesamiento del lenguaje de alta velocidad que aspira a competir en rapidez y eficiencia con el de los hablantes humanos en entornos específicos.

«A pesar de que las personas suelen comprender y responder a lo que alguien les dice en una fracción de segundo, una interfaz de voz típica requiere mucho más tiempo, entre uno y dos segundos, para tratar de entender lo que se ha dicho y responder de manera apropiada”, explica DeVault en un comunicado de la NSF. Ese ritmo relativamente lento es una de las razones por las que muchos usuarios siguen encontrando la experiencia ineficiente y frustrante.

Frente a las interfaces actuales, el equipo de DeVault está estudiando nuevas técnicas para simplificar las conversaciones, permitiendo que el sistema lleve a cabo todo el procesamiento informático necesario en tiempo real mientras el usuario está hablando. De esta forma puede averiguar lo que el hablante quiere decir y responderle incluso antes de que termine.

Jugando contra Eve

La investigación parte de un estudio previo en el que diseñan un juego, con una agente de procesamiento del lenguaje de alto rendimiento llamada Eve. La dinámica es sencilla: cada jugador ve un conjunto de ocho imágenes en la pantalla de su ordenador. Siempre son las mismas en cada ronda, aunque dispuestas en un orden diferente. A medida que se van resaltando, el jugador debe describirlas mientras el sistema trata de adivinar de qué se trata de la forma más rápida y precisa, para conseguir la puntuación más alta.

Eve puede optimizarse y operar en tres modos de procesamiento diferentes de forma gradual, con algoritmos para resolver el reconocimiento de voz, la comprensión del lenguaje y el diálogo. A medida que aumenta la progresión, el nivel de comprensión y respuesta de la jugadora virtual será tan rápido como el de sus rivales humanos.

Para llevar a cabo el estudio se contó con la colaboración de 125 participantes, con los que evaluaron las tres arquitecturas incrementales enfrentándolos por equipos contra la máquina por un lado, y comparando después el resultado con el rendimiento del juego entre humanos.

A diferencia de las fases iniciales en la que Eve espera hasta que el jugador acaba de hablar para tratar de entenderlo y responder, los usuarios califican sus interacciones con la versión más progresiva como más natural, eficiente y, en definitiva, de mayor entendimiento común, consiguiendo resultados comparables a los obtenidos en el juego entre rivales de carne y hueso.

Aplicación

«Estos resultados subrayan la importancia de posibilitar sistemas no sólo para entender lo que dicen los usuarios, sino para que lo hagan tan pronto como lo haría un humano», subraya DeVault.

Así, a medida que se consiga crear interfaces de voz más rápidas y de mayor entendimiento se avanzará hacia experiencias más naturales. Esto propiciará su adaptación a una amplia gama de aplicaciones relevantes, incluyendo el acceso a la información, educación, salud, entretenimiento o formación. «Estamos en el comienzo de un cambio radical en lo que podemos lograr a través de la conversación con los ordenadores», asegura el profesor.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren un helecho tropical que transforma sus hojas muertas en nuevas raíces 9 febrero, 2024
    Para sobrevivir en el suelo anegado y bajo en nutrientes del bosque de Quebrada Chorro, en el oeste de Panamá, una especie de helecho tropical arborescente reutiliza sus hojas muertas, convirtiéndolas en nuevas raíces. Los científicos descubrieron que el helecho reconfigura estas “hojas zombis”, invirtiendo el flujo de agua para atraer nutrientes de regreso a […]
    Pablo Javier Piacente
  • Descubren una extraña combinación de minerales en las muestras lunares de la misión Chang'e-5 de China 9 febrero, 2024
    Los minerales antiguos y nuevos identificados en las muestras lunares traídas por la misión Chang'e-5 de China están ayudando a los científicos a comprender mejor la historia de la Luna: ahora, los especialistas han descubierto más propiedades del sexto nuevo mineral lunar, llamado Changesite-(Y). Además, otros compuestos hallados, la seifertita y la stishovita, pueden coexistir […]
    Pablo Javier Piacente
  • Los robots que atienden a pacientes llegan a los hospitales 9 febrero, 2024
    Robots diseñados para brindar comodidad a los pacientes de edad avanzada y aliviar su ansiedad, han sido probados con éxito en un hospital de París: saludan, responden a preguntas, comprenden conversaciones grupales y apoyan las tareas de enfermería.
    Redacción T21
  • Una pequeña luna de Saturno parecida a la “Estrella de la Muerte” de Star Wars contiene un océano oculto 8 febrero, 2024
    Por debajo de la superficie repleta de cráteres de Mimas, una de las lunas más pequeñas de Saturno, se esconde un océano global de agua líquida de reciente formación. El satélite posee tan sólo unos 400 kilómetros de diámetro y presenta un notable parecido con la “Estrella de la Muerte”, una estación espacial imperial que […]
    Pablo Javier Piacente
  • Logran controlar un objeto virtual con la mente durante un sueño lúcido 8 febrero, 2024
    Un grupo de participantes en un nuevo estudio científico logró manejar un vehículo virtual a través de un avatar únicamente con su mente, mientras sus cerebros permanecían en la fase REM del sueño. Además de profundizar en los misterios de la consciencia humana, la innovación podría facilitar el acceso a nuevos desarrollos tecnológicos, como un […]
    Pablo Javier Piacente
  • Un proyecto global trabaja para crear de forma colaborativa un cerebro robótico general 8 febrero, 2024
    El auge de la inteligencia artificial generativa impulsa un proyecto global que trabaja para crear un cerebro robótico general, capaz de generar androides como los que hemos visto hasta ahora solo en la ciencia ficción. Pero es cuestión de tiempo que convivamos con ellos en perfecta armonía. Ya no es una utopía.
    Eduardo Martínez de la Fe
  • La IA está capacitada para resolver dilemas morales cuando conduce vehículos autónomos 8 febrero, 2024
    Los sistemas de IA muestran significativas similitudes éticas con las reacciones humanas ante dilemas morales, lo que los acreditan para conducir vehículos autónomos tal como lo harían las personas.
    Redacción T21
  • Los huracanes se están volviendo tan fuertes que ya no existen categorías para clasificarlos 7 febrero, 2024
    Cinco tormentas en la última década tuvieron velocidades de viento que pertenecen a una hipotética categoría 6 en la escala de huracanes Saffir-Simpson: el fenómeno obligaría a los científicos a crear una nueva clasificación, capaz de reflejar la virulencia de los huracanes en la actualidad. Las causas principales del fenómeno tienen su origen en el […]
    Pablo Javier Piacente
  • Un asteroide habría explotado sobre la Antártida hace unos 2,5 millones de años 7 febrero, 2024
    Un asteroide se desintegró sobre el continente antártico hace aproximadamente 2,5 millones de años: la evidencia proviene de un análisis químico de más de 100 pequeños trozos de roca extraterrestre, que se han preservado dentro de las enormes capas de hielo. Hasta el momento, solo se conocen otros dos eventos de explosiones aéreas antiguas en […]
    Pablo Javier Piacente
  • Crean la primera niña de inteligencia artificial del mundo 7 febrero, 2024
    La primera niña IA del mundo ha sido creada por científicos chinos, que la han dotado de emociones e intelecto y de la capacidad de aprender de forma autónoma. Se comporta como si tuviera tres o cuatro años y representa un avance significativo para el campo de la inteligencia artificial general.
    Redacción T21