Tendencias21
Los robots aprenden a decidir mediante videojuegos

Los robots aprenden a decidir mediante videojuegos

Una nueva generación de robots que toman decisiones autónomas y se adaptan a una realidad cambiante como los seres humanos podría estar cada vez más cerca, gracias a una técnica que combina el aprendizaje por refuerzo profundo y los videojuegos.

Investigadores de la Universidad de Illinois en Urbana-Champaign han desarrollado una innovadora técnica para entrenar a los robots en la toma de decisiones independientes, como así también en la adaptación frente a los cambios en las situaciones que afronten. Según una nota de prensa, los especialistas combinaron una estrategia de aprendizaje por refuerzo profundo con el videojuego “Capture the Flag”.

Mientras crecen las actividades en las cuales los robots comienzan a reemplazar a los seres humanos, por ejemplo en situaciones de peligro como las misiones de rescate, también se hace más evidente la necesidad de contar con robots que tomen decisiones por su cuenta y tengan la capacidad de optar entre distintas alternativas para superar un problema. También es imprescindible que logren ser flexibles y adaptarse a los cambios e imprevistos.

En el marco de un trabajo presentado en la Conferencia Internacional IEEE sobre Robótica y Automatización (ICRA) de 2020, los investigadores estadounidenses demostraron los avances obtenidos en esta compleja tarea. Básicamente, utilizaron un modelo basado en el videojuego “Capture the Flag” para desarrollar una nueva versión del aprendizaje por refuerzo profundo, que ayuda a los robots a evaluar su próximo movimiento.

Optimizar un proceso de decisión

El aprendizaje por refuerzo profundo es una nueva generación de las técnicas de aprendizaje automático dentro del campo de la Inteligencia Artificial, orientadas a lograr una evolución en la forma en la cual las máquinas aprenden a realizar una tarea. Con estas técnicas, los robots o agentes inteligentes logran optimizar un proceso de decisión, ganando en autonomía.

Según Huy Tran, uno de los integrantes del grupo de investigadores y científico del Departamento de Ingeniería Aeroespacial de la Universidad de Illinois en Urbana-Champaign, “los robots pueden aprender a reaccionar en un entorno como un juego competitivo mediante un tipo de proceso de prueba y error, llamado aprendizaje por refuerzo profundo. Logran aprender qué acciones deben tomar en una situación determinada ejercitando con el videojuego”.

Sin embargo, el especialista destacó que además del proceso de toma de decisiones, “el desafío es descubrir cómo crear agentes inteligentes o robots que también puedan adaptarse a situaciones inesperadas». ¿Tendremos en un futuro cercano robots con la flexibilidad suficiente para variar sus estrategias y comportamientos en función de los súbitos cambios de la realidad?

Incremento de la adaptación a los cambios

Para avanzar en este camino, los expertos seleccionaron el videojuego “Capture the Flag” porque puede jugarse en dos grupos con varios integrantes, cada uno de los cuales debe tomar decisiones. Aunque la tarea general del juego es capturar una bandera, existen diversas subtareas que los investigadores modelaron en una estructura jerárquica, incluyendo además la posibilidad de sumar nuevas dinámicas de juego para poner a prueba la adaptabilidad.

El objetivo principal era explorar si con este tipo de jerarquía y con los cambios o variaciones se potenciaba la capacidad de adaptación de los robots. Los científicos comprobaron que aunque los robots necesitaban diversas ayudas para tomar decisiones, al dividir la actividad en subtareas fue posible mejorar la adaptación. Incluso capacitaron a un robot como “tomador de decisiones de alto nivel”, para que asigne una subtarea para cada agente.

En función de las conclusiones de los investigadores, el nuevo enfoque tiene el potencial de resolver problemas interesantes y desafiantes, pero al mismo tiempo existen todavía muchos inconvenientes que será imprescindible abordar antes de poder implementar estos sistemas en situaciones del mundo real. Sin embargo, destacaron que con esta clase de marcos y esquemas se puede mejorar la adaptación de los robots en entornos cambiantes e inesperados.

Referencia

Evaluating Adaptation Performance of Hierarchical Deep Reinforcement Learning. Huy Tran, Neale Van Stolen et al. IEEE International Conference on Robotics and Automation (ICRA) (2020).DOI:https://dx.doi.org/10.1109/ICRA40945.2020.9197052

Foto:

Los investigadores testean un dron. Crédito: University of Illinois at Urbana-Champaign.

Video: Tran Research Group.

Pablo Javier Piacente

Pablo Javier Piacente es periodista especializado en comunicación científica y tecnológica.

Hacer un comentario

RSS Lo último de Tendencias21

  • Algo invisible podría esconderse bajo la superficie de la Luna 5 julio, 2024
    Las extrañas estructuras arremolinadas de origen magnético que se han descubierto en la Luna y que aún no tienen explicación, podrían crearse a partir de la actividad de algo desconocido que existe en el interior del satélite: un nuevo estudio intenta determinar qué podría ser exactamente lo que está oculto bajo la superficie lunar y […]
    Pablo Javier Piacente
  • Las explosiones solares extremas combinadas con un campo magnético débil podrían ser un gran peligro para la Tierra 5 julio, 2024
    Los científicos advierten que en momentos en que el campo magnético de la Tierra es débil, las tormentas solares muy intensas podrían tener un efecto dramático para la vida en todo el planeta. Aunque no es posible saber cuándo podría concretarse esta combinación mortal, indican que es necesario estar alertas durante el máximo solar o […]
    Pablo Javier Piacente
  • Se crea el primer acceso gratuito a la superficie lunar 5 julio, 2024
    Un software de código abierto llamado Moonindex facilita a los científicos una herramienta gratuita para explorar el posible uso de los recursos minerales de la Luna en futuras misiones espaciales y para identificar sitios de aterrizaje adecuados.
    Redacción T21
  • Crean el primer robot organoide con materia cerebral humana 4 julio, 2024
    Un sistema de interfaz cerebro-ordenador desarrollado en China combina la materia cerebral humana con un chip para crear un robot híbrido: se trata de un organoide creado en base a células madre en un entorno controlado de laboratorio, que interactúa con electrodos para llevar adelante funciones cerebrales básicas.
    Pablo Javier Piacente
  • Una pierna biónica puede ser controlada por el cerebro y hasta permite escalar o bailar 4 julio, 2024
    Los investigadores han desarrollado una nueva pierna protésica que se puede controlar a través de señales cerebrales: permite caminar a velocidades máximas equivalentes a las personas sin amputación, además de realizar excursiones, escalar y hasta bailar. Se trata de la primera prótesis con estas características que puede ser controlada totalmente por el sistema nervioso del […]
    Pablo Javier Piacente
  • Descubren yacimientos de biodiversidad que podrían evitar la sexta gran extinción 4 julio, 2024
    En el mundo hay 16.825 yacimientos de biodiversidad que podrían evitar la sexta gran extinción de la vida en la Tierra. Se encuentran principalmente en los trópicos y subtrópicos y su conservación es asequible y alcanzable.
    Eduardo Martínez de la Fe
  • Las células de nuestro cerebro se resisten a morir 3 julio, 2024
    Un análisis comparativo de tejido cerebral post mortem y muestras tomadas de pacientes vivos ha revelado por primera vez diferencias significativas en la forma en que se modifican las hebras de ARN (ácido ribonucleico) durante la vida y al momento de morir, exponiendo nuevos objetivos potenciales para el diagnóstico y tratamiento de enfermedades.
    Pablo Javier Piacente
  • Las hormigas invasoras hacen autostop para encontrar un nuevo hogar 3 julio, 2024
    Se sabe que los insectos son especialistas en utilizar todo tipo de formas de transporte para atravesar amplias distancias, pero un nuevo estudio ha revelado que las hormigas también dominan el autostop: estos insectos sociales recogen a toda la familia, incluida su reina, y se suben al primer vehículo que encuentran para emprender un viaje […]
    Pablo Javier Piacente
  • Descubren un antiguo mundo perdido en las profundidades de la Antártida 3 julio, 2024
    Un gigantesco sistema fluvial que existió hace millones de años en las profundidades del hielo antártico conformó un verdadero mundo hoy ya extinto: los científicos identificaron restos de un enorme río que existió hace aproximadamente 34 millones de años y dio vida a una zona que actualmente está dominada por grandes masas de hielo.
    Pablo Javier Piacente
  • Jocelyn Bell Burnell, ignorada por el Nobel, reconocida por el mundo científico 3 julio, 2024
    Jocelyn Bell Burnell, descubridora del primer púlsar, quedó excluida del Premio Nobel de Física en 1974, concedido a los científicos con los que había realizado el hallazgo. Más de 50 años después, fue galardonada con el Premio Breakthrough Especial en Física Fundamental, por toda una vida de liderazgo científico inspirador. El importe del premio lo […]
    Alicia Domínguez, Eduardo Costas (*).