Tendencias21
Crean un robot que aprende un idioma como lo hace un niño

Crean un robot que aprende un idioma como lo hace un niño

Investigadores del MIT han desarrollado un sistema que permite a un robot aprender un idioma tal como lo hace un niño: es capaz de relacionar imágenes de video con subtítulos descriptivos y mediante algoritmos “entender” significados, incluso del lenguaje coloquial.

Crean un robot que aprende un idioma como lo hace un niño

Investigadores del Instituto Tecnológico de Massachusetts han desarrollado un analizador semántico que aprende el lenguaje de la misma forma que lo hacen los niños, lo que permitirá a un robot aprender a hablar de forma más rápida y natural.

Se trata de toda una proeza tecnológica, ya que hasta ahora los analizadores semánticos utilizados en computación basan su aprendizaje en oraciones creadas por seres humanos que describen la estructura y significado que ocultan las palabras. Con este sistema tradicional se han creado por ejemplo sistemas de reconocimiento de voz, como los de Alexa (el servicio de voz ubicado en la nube de Amazon) o Siri, el asistente inteligente de Apple.

En un artículo presentado en la conferencia Empirical Methods in Natural Language Processing celebrada en Bélgica, los investigadores del MIT describen un analizador que aprende a través de la observación para imitar más estrechamente el proceso de adquisición del lenguaje de un niño, toda una revolución en el campo del aprendizaje automático.

Para aprender la estructura del lenguaje, este analizador observa videos subtitulados, sin otra información, y asocia las palabras de los subtítulos con los objetos y acciones grabadas. De esta forma, puede usar lo que aprendió sobre la estructura del lenguaje para predecir con precisión el significado de una oración, en algún momento incluso sin necesidad de apoyarse en  el video.

Imitando a los niños

Este sistema imita la forma en la que los niños aprenden un idioma: lo hacen observando su entorno, escuchando a las personas que los rodean y conectando lo que ven con lo que escuchan. De manera similar, el nuevo sistema también observa el entorno, establece relaciones y aprende el idioma.

Gracias a este sistema, un robot dotado con este analizador puede adaptarse a situaciones domésticas especiales: por ejemplo, al lenguaje coloquial que empleamos en familia. Es capaz de observar nuestras expresiones, aunque no estén totalmente ajustadas a la gramática, de aprender lo que significan y de entender una orden que podamos darle, según explica uno de los artífices de este descubrimiento, Andrei Barbu, en un comunicado del MIT.

El analizador también ayudará a comprender mejor cómo aprenden el lenguaje los niños pequeños. «Un niño tiene acceso a información redundante y complementaria de diferentes fuentes, como padres o hermanos que hablan, así como información táctil e información visual que le ayuda a entender el mundo», añade el también coautor Boris Katz.  “Procesar toda esta información sensorial es un rompecabezas increíble. Nuestro trabajo ayudará a entender mejor cómo ocurre este tipo de aprendizaje en el mundo cotidiano».

Aprendizaje visual

Para conseguir este resultado, los investigadores combinaron un analizador semántico con un componente de visión artificial entrenado en reconocimiento de objetos, humanos y actividades en video.

El analizador aprendió analizando 400 videos que muestran a personas realizando una serie de acciones, entre ellas recoger un objeto o dejarlo, o caminar hacia un objeto. Todas las secuencias van acompañadas de un total de 1.200 subtítulos en los que se describen esas acciones.

Al final del aprendizaje, los investigadores comprobaron su eficacia: el sistema fue capaz de reconocer la validez de una oración según la imagen del video: la mujer está recogiendo una manzana.

Un algoritmo de visión computarizada examina cada secuencia del video para rastrear cómo se transforman los objetos y las personas con el tiempo, y determina si las acciones del vídeo se están ejecutando tal como se describe en el subtítulo. De esta manera, determina si el significado del subtítulo se corresponde con la escena del vídeo.

El entrenamiento produce una gramática sintáctica y semántica para las palabras que se aprenden. Dada una nueva oración, el analizador ya no requiere videos, sino que aprovecha su gramática y léxico para determinar la estructura y el significado de la oración.

En última instancia, este proceso significa que el analizador aprende «como si fuera un niño», concluye Barbu. “Ve el mundo a su alrededor y escucha a las personas hablar para aprender el significado. Un día, puedo darle una oración y preguntar qué significa e, incluso sin una imagen, sabe el significado».

Referencia

Grounding language acquisition by training semantic parsers using captioned videos. Ross, C, Barbu, A, Berzak, Y, Myanganbayar, B, Katz, B. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • El núcleo de la Tierra podría estar a punto de estallar: habría volcanes a 5.000 kilómetros de profundidad 11 febrero, 2025
    Un estudio revela que el núcleo interno de la Tierra está cambiando de forma misteriosa y aún incierta: los científicos han desvelado que el núcleo interno giratorio no solamente modifica su velocidad de rotación, sino que también parece cambiar de forma, con variaciones que se manifiestan a través de las ondas acústicas que se propagan […]
    Redacción T21
  • Una exposición muestra el camino a la extinción de millones de seres vivos marinos conscientes 11 febrero, 2025
    Ecos del océano, una exposición que une ciencia, tecnología, arte y creatividad, muestra los ecos que surgen en la mente de una ballena cuando tropieza con la contaminación sonora generada por la actividad humana. Una experiencia inmersiva invita a preservar el equilibrio entre el ser humano, la naturaleza y el resto de especies que conviven en […]
    Alejandro Sacristán (enviado especial).
  • La IA ya supera a los humanos en el fraude digital 10 febrero, 2025
    Un nuevo estudio destaca la creciente sofisticación de los grandes modelos de lenguaje (LLM), la estructura detrás de los chatbots de IA más conocidos, para crear estrategias de fraude cibernético. Estos modelos pueden diseñar campañas de phishing hiperpersonalizadas y persuasivas, a una fracción del coste y el tiempo que requieren los métodos tradicionales desarrollados por […]
    Pablo Javier Piacente / T21
  • Alerta: Creciente riesgo de que restos de cohetes afecten zonas de intenso tráfico aéreo 10 febrero, 2025
    Un nuevo estudio publicado en la revista Scientific Reports advierte sobre el aumento del peligro que representa la basura espacial para la aviación comercial. La investigación, realizada por científicos de la Universidad de Columbia Británica, en Canadá, concluye que existe una probabilidad anual del 26% de que los desechos de cohetes espaciales reingresen a la […]
    Pablo Javier Piacente / T21
  • Los cantos de las ballenas son similares al lenguaje humano: puedes comprobarlo aquí 10 febrero, 2025
    Los científicos han descubierto la misma estructura o conjunto de patrones rítmicos que son un sello distintivo del lenguaje humano en el canto de las ballenas jorobadas: los hallazgos muestran que incluso especies tan disímiles evolutivamente pueden compartir sistemas de comunicación que se transmiten culturalmente de generación en generación.
    Redacción T21
  • El Rapto del Mundo: la democracia naufraga en la era del ultraliberalismo, pero no ha sido conquistada 10 febrero, 2025
    Lo que está pasando con la democracia puede compararse con el mito del rapto de Europa: seducida con engaños, se ha adentrado en un proceso de erosión de las instituciones, polarización social y desregulación económica que la aleja de su inspiración humanista. ¿Estamos presenciando el nacimiento de un nuevo orden político global?
    EDUARDO MARTÍNEZ DE LA FE/T21
  • La IA puede ser más creativa que los seres humanos 9 febrero, 2025
    La IA puede superar a la mayoría de los humanos en tareas de pensamiento creativo, según un nuevo estudio: los chatbots de IA de modelo de lenguaje grande (LLM) pueden superar al humano promedio en una tarea de pensamiento creativo en la que el participante idea usos alternativos para objetos cotidianos, un ejemplo en el […]
    Pablo Javier Piacente
  • El primer conectoma del cerebro de un insecto revoluciona la neurociencia 8 febrero, 2025
    Los científicos han conseguido por primera vez establecer el diagrama de las conexiones sinápticas del cerebro de un insecto que tiene 100.000 neuronas, toda una proeza para comprender mejor al cerebro humano y potenciar la Inteligencia Artificial.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Producir energía limpia cultivada en hojas: ¿el camino hacia la sostenibilidad energética? 7 febrero, 2025
    Los científicos han desarrollado “nanoflores” de cobre que imitan la fotosíntesis, ofreciendo una nueva forma de convertir el dióxido de carbono en fuentes de combustible y productos químicos, transformando potencialmente las estrategias a través de las cuales generamos energía limpia.
    Pablo Javier Piacente / T21
  • Los perros que son capaces de aprender permanecen jóvenes por más tiempo 7 febrero, 2025
    Los telómeros cumplen un papel crucial en la protección de los cromosomas: con el envejecimiento y la oxidación celular, se van acortando y promueven el deterioro de distintas funciones orgánicas. Un nuevo estudio ha demostrado que los perros domésticos (Canis lupus familiaris) que se mantienen entrenados y adquieren permanentemente nuevas capacidades preservan por más tiempo […]
    Pablo Javier Piacente / T21