Tendencias21

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Investigadores de la Universidad del Sur de California (EEUU) han desarrollado algoritmos que permiten a las máquinas entender el habla con precisión a una velocidad similar a la humana, un desafío clave para avanzar en la aplicación de los asistentes de voz. La tecnología se ha puesto a prueba con un juego, en el que Eva, una agente de procesamiento del lenguaje, adivina rápidamente de qué imagen está hablando el jugador real, gracias al buen y rápido entendimiento entre ellos. Por Patricia Pérez

Un algoritmo permite a las máquinas entender el habla humana rápidamente

Los asistentes de voz invaden ordenadores y todo tipo de dispositivos móviles tratando de facilitarnos la vida y de no dejar pregunta sin respuesta. Sin embargo, aunque se puede establecer la comunicación, todavía queda lejos de la conversación natural y fluida propia de la interacción entre dos o más personas. La diferencia reside en la rapidez con la que los hablantes se entienden y responden mutuamente, característica determinante para conseguir interfaces de voz más parecidas a las humanas.

En esa línea trabajan en el Instituto de Tecnologías Creativas de la Universidad del Sur de California (USC), en Estados Unidos, en una investigación que cuenta con el apoyo de la Fundación Nacional de Ciencia (NSF). Al mando del profesor David DeVault, están desarrollando un sistema de procesamiento del lenguaje de alta velocidad que aspira a competir en rapidez y eficiencia con el de los hablantes humanos en entornos específicos.

«A pesar de que las personas suelen comprender y responder a lo que alguien les dice en una fracción de segundo, una interfaz de voz típica requiere mucho más tiempo, entre uno y dos segundos, para tratar de entender lo que se ha dicho y responder de manera apropiada”, explica DeVault en un comunicado de la NSF. Ese ritmo relativamente lento es una de las razones por las que muchos usuarios siguen encontrando la experiencia ineficiente y frustrante.

Frente a las interfaces actuales, el equipo de DeVault está estudiando nuevas técnicas para simplificar las conversaciones, permitiendo que el sistema lleve a cabo todo el procesamiento informático necesario en tiempo real mientras el usuario está hablando. De esta forma puede averiguar lo que el hablante quiere decir y responderle incluso antes de que termine.

Jugando contra Eve

La investigación parte de un estudio previo en el que diseñan un juego, con una agente de procesamiento del lenguaje de alto rendimiento llamada Eve. La dinámica es sencilla: cada jugador ve un conjunto de ocho imágenes en la pantalla de su ordenador. Siempre son las mismas en cada ronda, aunque dispuestas en un orden diferente. A medida que se van resaltando, el jugador debe describirlas mientras el sistema trata de adivinar de qué se trata de la forma más rápida y precisa, para conseguir la puntuación más alta.

Eve puede optimizarse y operar en tres modos de procesamiento diferentes de forma gradual, con algoritmos para resolver el reconocimiento de voz, la comprensión del lenguaje y el diálogo. A medida que aumenta la progresión, el nivel de comprensión y respuesta de la jugadora virtual será tan rápido como el de sus rivales humanos.

Para llevar a cabo el estudio se contó con la colaboración de 125 participantes, con los que evaluaron las tres arquitecturas incrementales enfrentándolos por equipos contra la máquina por un lado, y comparando después el resultado con el rendimiento del juego entre humanos.

A diferencia de las fases iniciales en la que Eve espera hasta que el jugador acaba de hablar para tratar de entenderlo y responder, los usuarios califican sus interacciones con la versión más progresiva como más natural, eficiente y, en definitiva, de mayor entendimiento común, consiguiendo resultados comparables a los obtenidos en el juego entre rivales de carne y hueso.

Aplicación

«Estos resultados subrayan la importancia de posibilitar sistemas no sólo para entender lo que dicen los usuarios, sino para que lo hagan tan pronto como lo haría un humano», subraya DeVault.

Así, a medida que se consiga crear interfaces de voz más rápidas y de mayor entendimiento se avanzará hacia experiencias más naturales. Esto propiciará su adaptación a una amplia gama de aplicaciones relevantes, incluyendo el acceso a la información, educación, salud, entretenimiento o formación. «Estamos en el comienzo de un cambio radical en lo que podemos lograr a través de la conversación con los ordenadores», asegura el profesor.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Un enorme objeto interestelar modificó para siempre a nuestro Sistema Solar 22 enero, 2025
    Un estudio sugiere que es posible que un objeto de origen interestelar de enorme tamaño y peso se introdujera en el Sistema Solar al principio de su formación, dejando una huella imborrable en las órbitas planetarias, antes de desviarse nuevamente hacia otros confines del Universo. El visitante fugaz podría haber tenido características similares al misterioso […]
    Pablo Javier Piacente / T21
  • Cada vez más cerca de la energía limpia e ilimitada: el “Sol artificial” de China rompe un nuevo récord 22 enero, 2025
    La posibilidad de disfrutar de una fuente energética limpia e inagotable está más cerca de ser una realidad, luego que este lunes 20 de enero el Experimental Advanced Superconducting Tokamak (EAST), el reactor de fusión experimental conocido como el “Sol artificial” chino, rompiera un nuevo récord de producción de plasma: superó en más del doble […]
    Pablo Javier Piacente / T21
  • La costumbre de orinar en grupos provendría de los monos 22 enero, 2025
    Las personas generalmente van al baño en grupos: según una nueva investigación, los chimpancés hacen lo mismo, posiblemente para fortalecer los lazos sociales. Es posible que la tendencia en los seres humanos hacia la "micción contagiosa" sea una herencia evolutiva proveniente de otros primates.
    Redacción T21
  • Descubren antiguos sacrificios para hacer "renacer" al Sol después de una enorme erupción volcánica 21 enero, 2025
    Cientos de artefactos de piedra descubiertos en la isla danesa de Bornholm pueden haber sido ofrecidos a los dioses para evitar una crisis climática: se entregaron a modo de sacrificio hace casi 5.000 años, para lograr el "regreso" de un Sol oscurecido luego de una gigantesca erupción volcánica. Los investigadores creen que todo el hemisferio […]
    Pablo Javier Piacente / T21
  • El cambio climático está "atrapando" a algunas bacterias en un bucle temporal eterno 21 enero, 2025
    Especies de bacterias en un lago de Wisconsin están en una suerte de "bucle interminable" evolutivo: han crecido rápidamente y regresado abruptamente a su estado inicial, repitiendo una y otra vez ese ciclo, aparentemente en respuesta a estaciones y otros parámetros ambientales que cambiaron drásticamente como consecuencia del cambio climático.
    Pablo Javier Piacente / T21
  • Tendremos un futuro utópico y distópico a la vez. El futuro se adelanta una vez más. 21 enero, 2025
    La nueva edición de la exposición ArtFutura, que se desarrolla en el Palacio Neptuno de Madrid, transmite un mensaje claro: la Inteligencia Artificial Generativa no es una amenaza para el arte, sino una nueva herramienta que expande los límites de nuestra creatividad. Sin miedo.
    Alejandro Sacristán (enviado especial T21)
  • Una interfaz cerebro-ordenador permite a una persona con parálisis operar un helicóptero virtual 21 enero, 2025
    La interfaz cerebro-ordenador puede permitir a las personas con parálisis interactuar con otros, participar en trabajos remotos y disfrutar de actividades recreativas: un implante colocado quirúrgicamente en una persona con parálisis en las cuatro extremidades proporcionó un nivel de control sin precedentes sobre un cuadricóptero virtual, solo pensando en el movimiento de los dedos para […]
    Redacción T21
  • Una abeja robótica rompe los récords de polinización y hace acrobacias en el aire 20 enero, 2025
    Un insecto-robot que simula a una abeja y pesa menos de un gramo, aletea con la misma eficacia que los insectos en la naturaleza y fue diseñado para la polinización artificial: podría sentar las bases para una producción agrícola realizada totalmente es espacios interiores. El avance permitiría cultivar frutas y verduras dentro de un almacén […]
    Pablo Javier Piacente / T21
  • Nuevos hallazgos reafirman el origen genético de la depresión 20 enero, 2025
    Un nuevo estudio señala los "genes de la depresión" en todas las etnias: se trata de 239 factores de riesgo genéticos para la depresión que inciden en todas las principales poblaciones mundiales. Esto permitirá a los científicos predecir por primera vez el riesgo de depresión independientemente del origen étnico de cada persona.
    Pablo Javier Piacente / T21
  • Doctor Manuel Corpas: un viaje alucinante a través de la Genómica y la Bioinformática 20 enero, 2025
    El científico español Manuel Corpas ha sido pionero en compartir en Internet la base genética de su familia con la finalidad de descubrir hasta qué punto los genomas influyen en nuestras elecciones de vida. Ahora está construyendo una red internacional de investigación en torno a los genomas de diversidad latinoamericanos para descubrir cómo la migración […]
    Alejandro Sacristán/T21