Tendencias21
Los robots aprenden a decidir mediante videojuegos

Los robots aprenden a decidir mediante videojuegos

Una nueva generación de robots que toman decisiones autónomas y se adaptan a una realidad cambiante como los seres humanos podría estar cada vez más cerca, gracias a una técnica que combina el aprendizaje por refuerzo profundo y los videojuegos.

Investigadores de la Universidad de Illinois en Urbana-Champaign han desarrollado una innovadora técnica para entrenar a los robots en la toma de decisiones independientes, como así también en la adaptación frente a los cambios en las situaciones que afronten. Según una nota de prensa, los especialistas combinaron una estrategia de aprendizaje por refuerzo profundo con el videojuego “Capture the Flag”.

Mientras crecen las actividades en las cuales los robots comienzan a reemplazar a los seres humanos, por ejemplo en situaciones de peligro como las misiones de rescate, también se hace más evidente la necesidad de contar con robots que tomen decisiones por su cuenta y tengan la capacidad de optar entre distintas alternativas para superar un problema. También es imprescindible que logren ser flexibles y adaptarse a los cambios e imprevistos.

En el marco de un trabajo presentado en la Conferencia Internacional IEEE sobre Robótica y Automatización (ICRA) de 2020, los investigadores estadounidenses demostraron los avances obtenidos en esta compleja tarea. Básicamente, utilizaron un modelo basado en el videojuego “Capture the Flag” para desarrollar una nueva versión del aprendizaje por refuerzo profundo, que ayuda a los robots a evaluar su próximo movimiento.

Optimizar un proceso de decisión

El aprendizaje por refuerzo profundo es una nueva generación de las técnicas de aprendizaje automático dentro del campo de la Inteligencia Artificial, orientadas a lograr una evolución en la forma en la cual las máquinas aprenden a realizar una tarea. Con estas técnicas, los robots o agentes inteligentes logran optimizar un proceso de decisión, ganando en autonomía.

Según Huy Tran, uno de los integrantes del grupo de investigadores y científico del Departamento de Ingeniería Aeroespacial de la Universidad de Illinois en Urbana-Champaign, “los robots pueden aprender a reaccionar en un entorno como un juego competitivo mediante un tipo de proceso de prueba y error, llamado aprendizaje por refuerzo profundo. Logran aprender qué acciones deben tomar en una situación determinada ejercitando con el videojuego”.

Sin embargo, el especialista destacó que además del proceso de toma de decisiones, “el desafío es descubrir cómo crear agentes inteligentes o robots que también puedan adaptarse a situaciones inesperadas». ¿Tendremos en un futuro cercano robots con la flexibilidad suficiente para variar sus estrategias y comportamientos en función de los súbitos cambios de la realidad?

Incremento de la adaptación a los cambios

Para avanzar en este camino, los expertos seleccionaron el videojuego “Capture the Flag” porque puede jugarse en dos grupos con varios integrantes, cada uno de los cuales debe tomar decisiones. Aunque la tarea general del juego es capturar una bandera, existen diversas subtareas que los investigadores modelaron en una estructura jerárquica, incluyendo además la posibilidad de sumar nuevas dinámicas de juego para poner a prueba la adaptabilidad.

El objetivo principal era explorar si con este tipo de jerarquía y con los cambios o variaciones se potenciaba la capacidad de adaptación de los robots. Los científicos comprobaron que aunque los robots necesitaban diversas ayudas para tomar decisiones, al dividir la actividad en subtareas fue posible mejorar la adaptación. Incluso capacitaron a un robot como “tomador de decisiones de alto nivel”, para que asigne una subtarea para cada agente.

En función de las conclusiones de los investigadores, el nuevo enfoque tiene el potencial de resolver problemas interesantes y desafiantes, pero al mismo tiempo existen todavía muchos inconvenientes que será imprescindible abordar antes de poder implementar estos sistemas en situaciones del mundo real. Sin embargo, destacaron que con esta clase de marcos y esquemas se puede mejorar la adaptación de los robots en entornos cambiantes e inesperados.

Referencia

Evaluating Adaptation Performance of Hierarchical Deep Reinforcement Learning. Huy Tran, Neale Van Stolen et al. IEEE International Conference on Robotics and Automation (ICRA) (2020).DOI:https://dx.doi.org/10.1109/ICRA40945.2020.9197052

Foto:

Los investigadores testean un dron. Crédito: University of Illinois at Urbana-Champaign.

Video: Tran Research Group.

Pablo Javier Piacente

Pablo Javier Piacente es periodista especializado en comunicación científica y tecnológica.

Hacer un comentario

RSS Lo último de Tendencias21

  • Los vínculos sociales alinean a las personas en la misma longitud de onda 20 marzo, 2024
    El vínculo social mejora el intercambio de información y sincroniza las actividades cerebrales entre el líder de un grupo y sus seguidores, colocando a todo el grupo en la misma longitud de onda cerebral, según un nuevo estudio de sincronización neuronal.
    Pablo Javier Piacente
  • Partículas desconocidas de energía oscura serían la fuerza impulsora detrás de la expansión del Universo 20 marzo, 2024
    Una nueva investigación teórica sugiere que la misteriosa energía oscura estaría compuesta por "no partículas" y podría estar ligada a la expansión del cosmos, "separando" lentamente al Universo. Esto explicaría por qué los científicos no logran comprender aún en profundidad cómo el Universo se expande de forma cada vez más acelerada. También revelaría la causa […]
    Pablo Javier Piacente
  • Las mujeres científicas lideran las investigaciones sobre la sequía 20 marzo, 2024
    Las mujeres científicas están a la vanguardia de las investigaciones sobre la sequía para preservar la producción agrícola, gestionar el agua y mitigar los efectos del calentamiento global. Sobre el terreno, están también mejor preparadas para gestionar los desastres naturales.
    Alicia Domínguez y Eduardo Costas (*)
  • Los robots humanoides llegan a la industria automotriz 20 marzo, 2024
    Mercedes ha contratado robots humanoides para trabajar en sus fábricas: participan en las líneas de ensamblaje y automatizan tareas de baja complejidad y alta exigencia física.
    Redacción T21
  • Revelan cómo nace el miedo en el cerebro y una posible vía para paralizarlo 19 marzo, 2024
    Un nuevo estudio ha logrado descifrar una serie de modificaciones en la química cerebral que, al influir sobre circuitos neuronales específicos, provocan que el miedo se generalice y aparezca en situaciones en las que no debería hacerlo. Este sistema es el que genera la sensación de miedo exacerbada y permanente que experimentan las personas que […]
    Pablo Javier Piacente
  • Crean el mapa 3D más extenso de los agujeros negros supermasivos activos del Universo 19 marzo, 2024
    En una verdadera proeza astronómica, los científicos han creado el mapa más extenso hasta el momento de los agujeros negros supermasivos activos y cuásares en el cosmos: el avance marca un salto significativo en nuestra comprensión de estos gigantes cósmicos y podría ayudar a entender mejor las propiedades de la materia oscura.
    Pablo Javier Piacente
  • Descubren cómo las primeras células de la Tierra aprovecharon el H2 como fuente de energía 19 marzo, 2024
    Un nuevo informe descubre cómo el gas hidrógeno, la energía del futuro, proporcionó energía en el pasado, en el origen de la vida hace 4 mil millones de años. Y confirmaría que la vida se originó en respiradores hidrotermales.
    HHU/T21
  • Algo extraño ocurre en el Cometa Diablo que nos visita durante el eclipse solar de abril 19 marzo, 2024
    Un cometa casi tan famoso como el Halley está brillando en el cielo nocturno de la Tierra y podría ser visible durante el eclipse solar total del 8 de abril que tendrá lugar sobre Norteamérica, pero algo extraño parece suceder en su núcleo.
    Redacción T21
  • Resuelto el misterio de una criatura marina con un caparazón repleto de ojos 18 marzo, 2024
    Los quitones o chitones son moluscos marinos dotados de pequeños ojos desperdigados por todo su caparazón, con lentes confeccionados con un mineral llamado aragonita. Estos primitivos órganos sensoriales son capaces de distinguir formas y luz: un nuevo estudio ha revelado por qué evolucionaron tan rápidamente y cuál es su papel en el desarrollo de los […]
    Pablo Javier Piacente
  • La mayor erupción volcánica de la era geológica actual ocurrió en Japón hace 7.300 años 18 marzo, 2024
    Un estudio detallado de los depósitos volcánicos submarinos alrededor de la caldera Kikai, en Japón, descubrió que un evento que tuvo lugar en esa región de Asia hace 7.300 años fue, con claridad, la mayor erupción volcánica registrada en el planeta durante el Holoceno, la época geológica actual iniciada hace aproximadamente 11.500 años.
    Pablo Javier Piacente