Tendencias21
Crean un robot que aprende un idioma como lo hace un niño

Crean un robot que aprende un idioma como lo hace un niño

Investigadores del MIT han desarrollado un sistema que permite a un robot aprender un idioma tal como lo hace un niño: es capaz de relacionar imágenes de video con subtítulos descriptivos y mediante algoritmos “entender” significados, incluso del lenguaje coloquial.

Crean un robot que aprende un idioma como lo hace un niño

Investigadores del Instituto Tecnológico de Massachusetts han desarrollado un analizador semántico que aprende el lenguaje de la misma forma que lo hacen los niños, lo que permitirá a un robot aprender a hablar de forma más rápida y natural.

Se trata de toda una proeza tecnológica, ya que hasta ahora los analizadores semánticos utilizados en computación basan su aprendizaje en oraciones creadas por seres humanos que describen la estructura y significado que ocultan las palabras. Con este sistema tradicional se han creado por ejemplo sistemas de reconocimiento de voz, como los de Alexa (el servicio de voz ubicado en la nube de Amazon) o Siri, el asistente inteligente de Apple.

En un artículo presentado en la conferencia Empirical Methods in Natural Language Processing celebrada en Bélgica, los investigadores del MIT describen un analizador que aprende a través de la observación para imitar más estrechamente el proceso de adquisición del lenguaje de un niño, toda una revolución en el campo del aprendizaje automático.

Para aprender la estructura del lenguaje, este analizador observa videos subtitulados, sin otra información, y asocia las palabras de los subtítulos con los objetos y acciones grabadas. De esta forma, puede usar lo que aprendió sobre la estructura del lenguaje para predecir con precisión el significado de una oración, en algún momento incluso sin necesidad de apoyarse en  el video.

Imitando a los niños

Este sistema imita la forma en la que los niños aprenden un idioma: lo hacen observando su entorno, escuchando a las personas que los rodean y conectando lo que ven con lo que escuchan. De manera similar, el nuevo sistema también observa el entorno, establece relaciones y aprende el idioma.

Gracias a este sistema, un robot dotado con este analizador puede adaptarse a situaciones domésticas especiales: por ejemplo, al lenguaje coloquial que empleamos en familia. Es capaz de observar nuestras expresiones, aunque no estén totalmente ajustadas a la gramática, de aprender lo que significan y de entender una orden que podamos darle, según explica uno de los artífices de este descubrimiento, Andrei Barbu, en un comunicado del MIT.

El analizador también ayudará a comprender mejor cómo aprenden el lenguaje los niños pequeños. «Un niño tiene acceso a información redundante y complementaria de diferentes fuentes, como padres o hermanos que hablan, así como información táctil e información visual que le ayuda a entender el mundo», añade el también coautor Boris Katz.  “Procesar toda esta información sensorial es un rompecabezas increíble. Nuestro trabajo ayudará a entender mejor cómo ocurre este tipo de aprendizaje en el mundo cotidiano».

Aprendizaje visual

Para conseguir este resultado, los investigadores combinaron un analizador semántico con un componente de visión artificial entrenado en reconocimiento de objetos, humanos y actividades en video.

El analizador aprendió analizando 400 videos que muestran a personas realizando una serie de acciones, entre ellas recoger un objeto o dejarlo, o caminar hacia un objeto. Todas las secuencias van acompañadas de un total de 1.200 subtítulos en los que se describen esas acciones.

Al final del aprendizaje, los investigadores comprobaron su eficacia: el sistema fue capaz de reconocer la validez de una oración según la imagen del video: la mujer está recogiendo una manzana.

Un algoritmo de visión computarizada examina cada secuencia del video para rastrear cómo se transforman los objetos y las personas con el tiempo, y determina si las acciones del vídeo se están ejecutando tal como se describe en el subtítulo. De esta manera, determina si el significado del subtítulo se corresponde con la escena del vídeo.

El entrenamiento produce una gramática sintáctica y semántica para las palabras que se aprenden. Dada una nueva oración, el analizador ya no requiere videos, sino que aprovecha su gramática y léxico para determinar la estructura y el significado de la oración.

En última instancia, este proceso significa que el analizador aprende «como si fuera un niño», concluye Barbu. “Ve el mundo a su alrededor y escucha a las personas hablar para aprender el significado. Un día, puedo darle una oración y preguntar qué significa e, incluso sin una imagen, sabe el significado».

Referencia

Grounding language acquisition by training semantic parsers using captioned videos. Ross, C, Barbu, A, Berzak, Y, Myanganbayar, B, Katz, B. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Un nuevo microscopio permite ver electrones en movimiento 26 agosto, 2024
    Una nueva investigación ha presentado al microscopio más rápido del mundo: funciona a una velocidad asombrosa y se ha transformado en el primer dispositivo capaz de capturar una imagen clara de electrones en movimiento. El microscopio utiliza pulsos de electrones a la velocidad de un solo attosegundo, correspondiente a un quintillón de un segundo.
    Pablo Javier Piacente
  • Las avalanchas submarinas pueden ser un gran riesgo para Internet 26 agosto, 2024
    Las avalanchas submarinas son poderosos eventos naturales que ocurren todo el tiempo bajo la superficie del océano: un nuevo estudio comprueba que estos fenómenos representan un peligro para nuestras comunicaciones globales, ya que la proliferación de Internet ha requerido una red cada vez mayor de cables de fibra óptica ubicados en el fondo marino, que […]
    Pablo Javier Piacente
  • Un pacto digital global se perfila en el horizonte 26 agosto, 2024
    La ONU se propone lanzar este mes de septiembre, en la Cumbre del Futuro, el Pacto digital global, un reto que concierne a la vanguardia tecnológica de gobiernos, think tanks y organizaciones civiles, del que no pueden quedar excluidas las nuevas generaciones ni la descarbonización ineludible.
    Alejandro Sacristán
  • Los libros de la era Victoriana podrían ser mortales 23 agosto, 2024
    Una nueva investigación muestra que los libros de colores brillantes que datan de la época Victoriana contienen tintes con tóxicos y venenos químicos, que podrían dañar a los lectores. Estos libros antiguos y potencialmente mortales pueden estar aún disponibles en universidades, bibliotecas públicas y colecciones privadas.
    Pablo Javier Piacente
  • El Sol está mucho más activo de lo previsto 23 agosto, 2024
    Aunque los especialistas sabían que nos estamos acercando al pico de actividad solar dentro del actual ciclo de 11 años, algunos datos los están sorprendiendo y muestran que la actividad del astro rey podría ser mucho más intensa en los próximos meses y años de lo que se pensaba inicialmente: un número récord de manchas […]
    Pablo Javier Piacente
  • La IA puede predecir las olas de calor y vincularlas con el cambio climático 23 agosto, 2024
    La Inteligencia Artificial puede deducir cómo y cuándo se producirán olas de calor en medio de condiciones climáticas cambiantes y ayuda a aclarar las conexiones entre el calentamiento global y los eventos climáticos extremos individuales.
    Stanford Report/T21
  • Los científicos comprueban que algunas veces duele pensar: la verdadera razón 22 agosto, 2024
    El esfuerzo mental parece estar relacionado con sentimientos desagradables en muchas situaciones, según una nueva revisión de múltiples estudios realizados entre 2019 y 2020. Los especialistas concluyeron que mientras mayor era el esfuerzo o desafío mental de los participantes en los estudios, crecían de la misma forma los sentimientos desagradables como frustración, irritación, estrés o […]
    Pablo Javier Piacente
  • La evolución de la IA no sería un peligro para la humanidad: la investigación futura 22 agosto, 2024
    La ciencia ficción y últimamente algunos estudios científicos han planteado que la Inteligencia Artificial (IA) podría ser peligrosa para la humanidad si alcanza una determinada capacidad de razonamiento independiente. Sin embargo, una nueva investigación concluye que en realidad ese peligro no existe: los científicos sostienen que los modelos de IA como ChatGPT son menos capaces […]
    Pablo Javier Piacente
  • La IA desentierra los secretos de Gilgamesh, un relato épico de 4.000 años de antigüedad 22 agosto, 2024
    La inteligencia artificial está desenterrando secretos milenarios con algoritmos y procesamiento de datos. El objeto estelar de su búsqueda: la Epopeya de Gilgamesh, un héroe de la mitología mesopotámica, que constituye el relato épico más antiguo de la humanidad.
    Redacción T21
  • La piedra del altar de Stonehenge proviene de Escocia 22 agosto, 2024
    La “piedra azul” más grande en el corazón de Stonehenge proviene del norte de Escocia, no de Gales, según una nueva investigación. El descubrimiento desafía todo lo que creíamos saber sobre las relaciones entre las diferentes poblaciones neolíticas de Gran Bretaña.
    Redacción T21