Tendencias21
Los robots aprenden a decidir mediante videojuegos

Los robots aprenden a decidir mediante videojuegos

Una nueva generación de robots que toman decisiones autónomas y se adaptan a una realidad cambiante como los seres humanos podría estar cada vez más cerca, gracias a una técnica que combina el aprendizaje por refuerzo profundo y los videojuegos.

Investigadores de la Universidad de Illinois en Urbana-Champaign han desarrollado una innovadora técnica para entrenar a los robots en la toma de decisiones independientes, como así también en la adaptación frente a los cambios en las situaciones que afronten. Según una nota de prensa, los especialistas combinaron una estrategia de aprendizaje por refuerzo profundo con el videojuego “Capture the Flag”.

Mientras crecen las actividades en las cuales los robots comienzan a reemplazar a los seres humanos, por ejemplo en situaciones de peligro como las misiones de rescate, también se hace más evidente la necesidad de contar con robots que tomen decisiones por su cuenta y tengan la capacidad de optar entre distintas alternativas para superar un problema. También es imprescindible que logren ser flexibles y adaptarse a los cambios e imprevistos.

En el marco de un trabajo presentado en la Conferencia Internacional IEEE sobre Robótica y Automatización (ICRA) de 2020, los investigadores estadounidenses demostraron los avances obtenidos en esta compleja tarea. Básicamente, utilizaron un modelo basado en el videojuego “Capture the Flag” para desarrollar una nueva versión del aprendizaje por refuerzo profundo, que ayuda a los robots a evaluar su próximo movimiento.

Optimizar un proceso de decisión

El aprendizaje por refuerzo profundo es una nueva generación de las técnicas de aprendizaje automático dentro del campo de la Inteligencia Artificial, orientadas a lograr una evolución en la forma en la cual las máquinas aprenden a realizar una tarea. Con estas técnicas, los robots o agentes inteligentes logran optimizar un proceso de decisión, ganando en autonomía.

Según Huy Tran, uno de los integrantes del grupo de investigadores y científico del Departamento de Ingeniería Aeroespacial de la Universidad de Illinois en Urbana-Champaign, “los robots pueden aprender a reaccionar en un entorno como un juego competitivo mediante un tipo de proceso de prueba y error, llamado aprendizaje por refuerzo profundo. Logran aprender qué acciones deben tomar en una situación determinada ejercitando con el videojuego”.

Sin embargo, el especialista destacó que además del proceso de toma de decisiones, “el desafío es descubrir cómo crear agentes inteligentes o robots que también puedan adaptarse a situaciones inesperadas». ¿Tendremos en un futuro cercano robots con la flexibilidad suficiente para variar sus estrategias y comportamientos en función de los súbitos cambios de la realidad?

Incremento de la adaptación a los cambios

Para avanzar en este camino, los expertos seleccionaron el videojuego “Capture the Flag” porque puede jugarse en dos grupos con varios integrantes, cada uno de los cuales debe tomar decisiones. Aunque la tarea general del juego es capturar una bandera, existen diversas subtareas que los investigadores modelaron en una estructura jerárquica, incluyendo además la posibilidad de sumar nuevas dinámicas de juego para poner a prueba la adaptabilidad.

El objetivo principal era explorar si con este tipo de jerarquía y con los cambios o variaciones se potenciaba la capacidad de adaptación de los robots. Los científicos comprobaron que aunque los robots necesitaban diversas ayudas para tomar decisiones, al dividir la actividad en subtareas fue posible mejorar la adaptación. Incluso capacitaron a un robot como “tomador de decisiones de alto nivel”, para que asigne una subtarea para cada agente.

En función de las conclusiones de los investigadores, el nuevo enfoque tiene el potencial de resolver problemas interesantes y desafiantes, pero al mismo tiempo existen todavía muchos inconvenientes que será imprescindible abordar antes de poder implementar estos sistemas en situaciones del mundo real. Sin embargo, destacaron que con esta clase de marcos y esquemas se puede mejorar la adaptación de los robots en entornos cambiantes e inesperados.

Referencia

Evaluating Adaptation Performance of Hierarchical Deep Reinforcement Learning. Huy Tran, Neale Van Stolen et al. IEEE International Conference on Robotics and Automation (ICRA) (2020).DOI:https://dx.doi.org/10.1109/ICRA40945.2020.9197052

Foto:

Los investigadores testean un dron. Crédito: University of Illinois at Urbana-Champaign.

Video: Tran Research Group.

Pablo Javier Piacente

Pablo Javier Piacente es periodista especializado en comunicación científica y tecnológica.

Hacer un comentario

RSS Lo último de Tendencias21

  • La vida extraterrestre podría prosperar sin necesidad de un planeta que la cobije 1 noviembre, 2024
    Los investigadores sostienen que las condiciones de soporte vital creadas únicamente por estructuras biológicas podrían de hecho existir, haciendo completamente posible que algunas formas de vida prosperen en hábitats espaciales muy diferentes a los existentes en la Tierra. Incluso, podrían existir civilizaciones extraterrestres en hábitats autosustentables vagando en el espacio, sin necesidad de contar con […]
    Pablo Javier Piacente
  • Un nuevo tratamiento para eliminar residuos cerebrales podría extender la vida humana 1 noviembre, 2024
    La prevención de la acumulación de F-actina en el envejecimiento de las moscas de la fruta, a través de la modificación de genes específicos, optimizó el reciclaje celular, disminuyó la acumulación de desechos cerebrales y prolongó su vida útil saludable en aproximadamente un 30 %, según un nuevo estudio. El hallazgo podría propiciar el futuro […]
    Pablo Javier Piacente
  • La IA puede procesar ilusiones ópticas como lo hace el cerebro humano 1 noviembre, 2024
    Un nuevo sistema de inteligencia artificial (IA) puede imitar por primera vez cómo las personas interpretan ilusiones ópticas complejas, gracias al gato de Schrödinger. Un impulso a la visión artificial, la seguridad aérea y la navegación espacial.
    Eduardo Martínez de la Fe
  • Objetos desconocidos podrían existir en los confines del Sistema Solar 31 octubre, 2024
    Una serie de observaciones realizadas con el Telescopio Subaru han permitido descubrir nuevos objetos en el Sistema Solar exterior, sugiriendo la existencia de una población de cuerpos más grande y no identificada hasta el momento más allá del Cinturón de Kuiper. El hallazgo de los misteriosos 11 objetos se concretó en el marco de la […]
    Pablo Javier Piacente
  • Un implante ocular logra restaurar la visión de pacientes ciegos 31 octubre, 2024
    Una startup biotecnológica anunció que ha desarrollado una interfaz cerebro-ordenador que puede ayudar a los pacientes con pérdida severa de la visión: mediante un implante ocular conectado al sistema, lograron restaurar la capacidad de leer con fluidez y reconocer rostros en personas ciegas. Es un gran avance contra la degeneración macular relacionada con la edad, […]
    Pablo Javier Piacente
  • El cambio climático amenaza con una futura hambruna global 31 octubre, 2024
    El calentamiento global no solo está disparado, sino que pone en peligro la vida de millones de personas en todo el mundo. También está provocando una disminución de la productividad agrícola que podría llevar a una escasez de alimentos y a un aumento de la desnutrición a nivel global.
    Redacción T21
  • La lluvia colabora con el océano para atrapar más carbono 30 octubre, 2024
    Hasta el momento, la lluvia ha sido ignorada en los cálculos de la capacidad del océano para absorber dióxido de carbono (CO2), pero una nueva estimación indica que las precipitaciones mejoran la capacidad del océano para atrapar las emisiones entre un 5 % y un 7 %, cumpliendo un papel vital en el ambiente. Este […]
    Pablo Javier Piacente
  • Los animales se vuelven menos sociables con el avance de la edad, al igual que los humanos 30 octubre, 2024
    Una serie de estudios científicos en torno al comportamiento de cientos de especies de animales revela que las variedades más sociables amplían su expectativa de vida y se reproducen por más tiempo. Además, los investigadores descubrieron que algunas especies, al igual que los seres humanos, tienden a reducir sus relaciones sociales a una edad avanzada: […]
    Pablo Javier Piacente
  • Los gorilas occidentales votan para tomar decisiones colectivas 30 octubre, 2024
    Un nuevo estudio desmonta la creencia de que, entre los grandes simios, es el macho dominante quien decide por todo el grupo. Entre los gorilas occidentales de la República Centroafricana, cada individuo tiene voz y voto, especialmente cuando se trata de cambiar de asentamiento.
    Redacción T21
  • Podemos comprender oraciones escritas en un parpadeo 29 octubre, 2024
    Nuestro cerebro puede entender oraciones escritas en lo que dura el parpadeo de un ojo, según revela un nuevo estudio. Los científicos descubrieron que el procesamiento del lenguaje escrito ocurre a velocidades significativamente más rápidas de las necesarias para hablar o comunicarse en voz alta.
    Pablo Javier Piacente