Tendencias21
Los robots aprenden a decidir mediante videojuegos

Los robots aprenden a decidir mediante videojuegos

Una nueva generación de robots que toman decisiones autónomas y se adaptan a una realidad cambiante como los seres humanos podría estar cada vez más cerca, gracias a una técnica que combina el aprendizaje por refuerzo profundo y los videojuegos.

Investigadores de la Universidad de Illinois en Urbana-Champaign han desarrollado una innovadora técnica para entrenar a los robots en la toma de decisiones independientes, como así también en la adaptación frente a los cambios en las situaciones que afronten. Según una nota de prensa, los especialistas combinaron una estrategia de aprendizaje por refuerzo profundo con el videojuego “Capture the Flag”.

Mientras crecen las actividades en las cuales los robots comienzan a reemplazar a los seres humanos, por ejemplo en situaciones de peligro como las misiones de rescate, también se hace más evidente la necesidad de contar con robots que tomen decisiones por su cuenta y tengan la capacidad de optar entre distintas alternativas para superar un problema. También es imprescindible que logren ser flexibles y adaptarse a los cambios e imprevistos.

En el marco de un trabajo presentado en la Conferencia Internacional IEEE sobre Robótica y Automatización (ICRA) de 2020, los investigadores estadounidenses demostraron los avances obtenidos en esta compleja tarea. Básicamente, utilizaron un modelo basado en el videojuego “Capture the Flag” para desarrollar una nueva versión del aprendizaje por refuerzo profundo, que ayuda a los robots a evaluar su próximo movimiento.

Optimizar un proceso de decisión

El aprendizaje por refuerzo profundo es una nueva generación de las técnicas de aprendizaje automático dentro del campo de la Inteligencia Artificial, orientadas a lograr una evolución en la forma en la cual las máquinas aprenden a realizar una tarea. Con estas técnicas, los robots o agentes inteligentes logran optimizar un proceso de decisión, ganando en autonomía.

Según Huy Tran, uno de los integrantes del grupo de investigadores y científico del Departamento de Ingeniería Aeroespacial de la Universidad de Illinois en Urbana-Champaign, “los robots pueden aprender a reaccionar en un entorno como un juego competitivo mediante un tipo de proceso de prueba y error, llamado aprendizaje por refuerzo profundo. Logran aprender qué acciones deben tomar en una situación determinada ejercitando con el videojuego”.

Sin embargo, el especialista destacó que además del proceso de toma de decisiones, “el desafío es descubrir cómo crear agentes inteligentes o robots que también puedan adaptarse a situaciones inesperadas». ¿Tendremos en un futuro cercano robots con la flexibilidad suficiente para variar sus estrategias y comportamientos en función de los súbitos cambios de la realidad?

Incremento de la adaptación a los cambios

Para avanzar en este camino, los expertos seleccionaron el videojuego “Capture the Flag” porque puede jugarse en dos grupos con varios integrantes, cada uno de los cuales debe tomar decisiones. Aunque la tarea general del juego es capturar una bandera, existen diversas subtareas que los investigadores modelaron en una estructura jerárquica, incluyendo además la posibilidad de sumar nuevas dinámicas de juego para poner a prueba la adaptabilidad.

El objetivo principal era explorar si con este tipo de jerarquía y con los cambios o variaciones se potenciaba la capacidad de adaptación de los robots. Los científicos comprobaron que aunque los robots necesitaban diversas ayudas para tomar decisiones, al dividir la actividad en subtareas fue posible mejorar la adaptación. Incluso capacitaron a un robot como “tomador de decisiones de alto nivel”, para que asigne una subtarea para cada agente.

En función de las conclusiones de los investigadores, el nuevo enfoque tiene el potencial de resolver problemas interesantes y desafiantes, pero al mismo tiempo existen todavía muchos inconvenientes que será imprescindible abordar antes de poder implementar estos sistemas en situaciones del mundo real. Sin embargo, destacaron que con esta clase de marcos y esquemas se puede mejorar la adaptación de los robots en entornos cambiantes e inesperados.

Referencia

Evaluating Adaptation Performance of Hierarchical Deep Reinforcement Learning. Huy Tran, Neale Van Stolen et al. IEEE International Conference on Robotics and Automation (ICRA) (2020).DOI:https://dx.doi.org/10.1109/ICRA40945.2020.9197052

Foto:

Los investigadores testean un dron. Crédito: University of Illinois at Urbana-Champaign.

Video: Tran Research Group.

Pablo Javier Piacente

Pablo Javier Piacente es periodista especializado en comunicación científica y tecnológica.

Hacer un comentario

RSS Lo último de Tendencias21

  • La acidez cerebral podría estar relacionada con múltiples trastornos neurológicos 11 abril, 2024
    Un estudio en animales a gran escala vincula los cambios en el pH del cerebro con problemas cognitivos de amplio alcance, ligados a patologías como el autismo o el Alzheimer, entre otras. Los científicos creen que los problemas metabólicos en el cerebro podrían estar directamente relacionados con una variedad de trastornos neuropsiquiátricos y neurodegenerativos.
    Pablo Javier Piacente
  • Cultivan organoides cerebrales con conexiones neuronales similares a las de un cerebro real 11 abril, 2024
    Un equipo internacional de investigadores ha desarrollado una técnica para conectar tejidos cultivados en laboratorio que imitan al cerebro humano de una manera que se asemeja a los circuitos neuronales del cerebro real. El "sistema" de mini cerebros interconectados podría revolucionar nuestra comprensión de las funciones cerebrales.
    Pablo Javier Piacente
  • Los Estados se exponen a condenas judiciales por inacción climática 11 abril, 2024
    Suiza es el primer Estado condenado judicialmente por no resolver el desafío climático y violar los derechos humanos de las personas mayores. Hace un año, 16 niños y jóvenes obtuvieron una sentencia condenatoria contra el Estado de Montana por destruir con sus leyes el medioambiente. Cualquier Estado puede ser denunciado si no preserva el ambiente en […]
    Eduardo Martínez de la Fe
  • Detectan extraños pulsos de radio procedentes de un magnetar que desconciertan a los científicos 10 abril, 2024
    Los astrónomos han detectado señales de radio inusuales procedentes de XTE J1810-197, un radiomagnetar o estrella de neutrones ultramagnética situada a 8.100 años luz de distancia de la Tierra, en la constelación de Sagitario. Los resultados son inesperados y sin precedentes: a diferencia de las señales de radio que se han detectado en otros magnetares, […]
    Pablo Javier Piacente
  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente