Tendencias21
Crean un robot que aprende un idioma como lo hace un niño

Crean un robot que aprende un idioma como lo hace un niño

Investigadores del MIT han desarrollado un sistema que permite a un robot aprender un idioma tal como lo hace un niño: es capaz de relacionar imágenes de video con subtítulos descriptivos y mediante algoritmos “entender” significados, incluso del lenguaje coloquial.

Crean un robot que aprende un idioma como lo hace un niño

Investigadores del Instituto Tecnológico de Massachusetts han desarrollado un analizador semántico que aprende el lenguaje de la misma forma que lo hacen los niños, lo que permitirá a un robot aprender a hablar de forma más rápida y natural.

Se trata de toda una proeza tecnológica, ya que hasta ahora los analizadores semánticos utilizados en computación basan su aprendizaje en oraciones creadas por seres humanos que describen la estructura y significado que ocultan las palabras. Con este sistema tradicional se han creado por ejemplo sistemas de reconocimiento de voz, como los de Alexa (el servicio de voz ubicado en la nube de Amazon) o Siri, el asistente inteligente de Apple.

En un artículo presentado en la conferencia Empirical Methods in Natural Language Processing celebrada en Bélgica, los investigadores del MIT describen un analizador que aprende a través de la observación para imitar más estrechamente el proceso de adquisición del lenguaje de un niño, toda una revolución en el campo del aprendizaje automático.

Para aprender la estructura del lenguaje, este analizador observa videos subtitulados, sin otra información, y asocia las palabras de los subtítulos con los objetos y acciones grabadas. De esta forma, puede usar lo que aprendió sobre la estructura del lenguaje para predecir con precisión el significado de una oración, en algún momento incluso sin necesidad de apoyarse en  el video.

Imitando a los niños

Este sistema imita la forma en la que los niños aprenden un idioma: lo hacen observando su entorno, escuchando a las personas que los rodean y conectando lo que ven con lo que escuchan. De manera similar, el nuevo sistema también observa el entorno, establece relaciones y aprende el idioma.

Gracias a este sistema, un robot dotado con este analizador puede adaptarse a situaciones domésticas especiales: por ejemplo, al lenguaje coloquial que empleamos en familia. Es capaz de observar nuestras expresiones, aunque no estén totalmente ajustadas a la gramática, de aprender lo que significan y de entender una orden que podamos darle, según explica uno de los artífices de este descubrimiento, Andrei Barbu, en un comunicado del MIT.

El analizador también ayudará a comprender mejor cómo aprenden el lenguaje los niños pequeños. «Un niño tiene acceso a información redundante y complementaria de diferentes fuentes, como padres o hermanos que hablan, así como información táctil e información visual que le ayuda a entender el mundo», añade el también coautor Boris Katz.  “Procesar toda esta información sensorial es un rompecabezas increíble. Nuestro trabajo ayudará a entender mejor cómo ocurre este tipo de aprendizaje en el mundo cotidiano».

Aprendizaje visual

Para conseguir este resultado, los investigadores combinaron un analizador semántico con un componente de visión artificial entrenado en reconocimiento de objetos, humanos y actividades en video.

El analizador aprendió analizando 400 videos que muestran a personas realizando una serie de acciones, entre ellas recoger un objeto o dejarlo, o caminar hacia un objeto. Todas las secuencias van acompañadas de un total de 1.200 subtítulos en los que se describen esas acciones.

Al final del aprendizaje, los investigadores comprobaron su eficacia: el sistema fue capaz de reconocer la validez de una oración según la imagen del video: la mujer está recogiendo una manzana.

Un algoritmo de visión computarizada examina cada secuencia del video para rastrear cómo se transforman los objetos y las personas con el tiempo, y determina si las acciones del vídeo se están ejecutando tal como se describe en el subtítulo. De esta manera, determina si el significado del subtítulo se corresponde con la escena del vídeo.

El entrenamiento produce una gramática sintáctica y semántica para las palabras que se aprenden. Dada una nueva oración, el analizador ya no requiere videos, sino que aprovecha su gramática y léxico para determinar la estructura y el significado de la oración.

En última instancia, este proceso significa que el analizador aprende «como si fuera un niño», concluye Barbu. “Ve el mundo a su alrededor y escucha a las personas hablar para aprender el significado. Un día, puedo darle una oración y preguntar qué significa e, incluso sin una imagen, sabe el significado».

Referencia

Grounding language acquisition by training semantic parsers using captioned videos. Ross, C, Barbu, A, Berzak, Y, Myanganbayar, B, Katz, B. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Revelan cómo nace el miedo en el cerebro y una posible vía para paralizarlo 19 marzo, 2024
    Un nuevo estudio ha logrado descifrar una serie de modificaciones en la química cerebral que, al influir sobre circuitos neuronales específicos, provocan que el miedo se generalice y aparezca en situaciones en las que no debería hacerlo. Este sistema es el que genera la sensación de miedo exacerbada y permanente que experimentan las personas que […]
    Pablo Javier Piacente
  • Crean el mapa 3D más extenso de los agujeros negros supermasivos activos del Universo 19 marzo, 2024
    En una verdadera proeza astronómica, los científicos han creado el mapa más extenso hasta el momento de los agujeros negros supermasivos activos y cuásares en el cosmos: el avance marca un salto significativo en nuestra comprensión de estos gigantes cósmicos y podría ayudar a entender mejor las propiedades de la materia oscura.
    Pablo Javier Piacente
  • Descubren cómo las primeras células de la Tierra aprovecharon el H2 como fuente de energía 19 marzo, 2024
    Un nuevo informe descubre cómo el gas hidrógeno, la energía del futuro, proporcionó energía en el pasado, en el origen de la vida hace 4 mil millones de años. Y confirmaría que la vida se originó en respiradores hidrotermales.
    HHU/T21
  • Algo extraño ocurre en el Cometa Diablo que nos visita durante el eclipse solar de abril 19 marzo, 2024
    Un cometa casi tan famoso como el Halley está brillando en el cielo nocturno de la Tierra y podría ser visible durante el eclipse solar total del 8 de abril que tendrá lugar sobre Norteamérica, pero algo extraño parece suceder en su núcleo.
    Redacción T21
  • Resuelto el misterio de una criatura marina con un caparazón repleto de ojos 18 marzo, 2024
    Los quitones o chitones son moluscos marinos dotados de pequeños ojos desperdigados por todo su caparazón, con lentes confeccionados con un mineral llamado aragonita. Estos primitivos órganos sensoriales son capaces de distinguir formas y luz: un nuevo estudio ha revelado por qué evolucionaron tan rápidamente y cuál es su papel en el desarrollo de los […]
    Pablo Javier Piacente
  • La mayor erupción volcánica de la era geológica actual ocurrió en Japón hace 7.300 años 18 marzo, 2024
    Un estudio detallado de los depósitos volcánicos submarinos alrededor de la caldera Kikai, en Japón, descubrió que un evento que tuvo lugar en esa región de Asia hace 7.300 años fue, con claridad, la mayor erupción volcánica registrada en el planeta durante el Holoceno, la época geológica actual iniciada hace aproximadamente 11.500 años.
    Pablo Javier Piacente
  • Las enfermedades neurológicas ya son el primer problema de salud mundial 18 marzo, 2024
    El 43% de la población mundial padece enfermedades neurológicas: afectan a 3.400 millones de personas y cuestan la pérdida de 443 millones de años de vida saludable. España supera en un 18% la media mundial de afectados por patologías que van desde dolores de cabeza tensionales hasta accidentes cerebrovasculares.
    Redacción T21
  • La Inteligencia Artificial aprende lo que significa estar vivo 18 marzo, 2024
    La IA ha descubierto en seis semanas unas células que la ciencia había tardado 134 años en identificar. Puede que haya tropezado también con un tipo de célula totalmente desconocida. ¿Qué va a pasar con los biólogos humanos?
    Eduardo Martínez de la Fe
  • Las ranas les guiñan el ojo a los machos elegidos para el apareamiento 17 marzo, 2024
    Un curioso estudio ha descubierto que las ranas les guiñan el ojo al macho para indicarle que le gusta. En respuesta al parpadeo, el macho lanza repetidamente un grito entrecortado y salta junto a ella para aparearse.
    N+1/T21
  • Los perros son nuestros terapeutas de cuatro patas 16 marzo, 2024
    Investigadores de Corea del Sur colocaron auriculares con electrodos a 30 adultos y luego midieron los cambios en sus ondas cerebrales mientras interactuaban con un caniche llamado Aro. Los resultados indicaron que pasear al perro hizo que los participantes se sintieran más relajados, cepillarle mejoró la concentración y jugar con la mascota produjo ambos efectos.
    Redacción T21