Tendencias21
Los robots aprenden a decidir mediante videojuegos

Los robots aprenden a decidir mediante videojuegos

Una nueva generación de robots que toman decisiones autónomas y se adaptan a una realidad cambiante como los seres humanos podría estar cada vez más cerca, gracias a una técnica que combina el aprendizaje por refuerzo profundo y los videojuegos.

Investigadores de la Universidad de Illinois en Urbana-Champaign han desarrollado una innovadora técnica para entrenar a los robots en la toma de decisiones independientes, como así también en la adaptación frente a los cambios en las situaciones que afronten. Según una nota de prensa, los especialistas combinaron una estrategia de aprendizaje por refuerzo profundo con el videojuego “Capture the Flag”.

Mientras crecen las actividades en las cuales los robots comienzan a reemplazar a los seres humanos, por ejemplo en situaciones de peligro como las misiones de rescate, también se hace más evidente la necesidad de contar con robots que tomen decisiones por su cuenta y tengan la capacidad de optar entre distintas alternativas para superar un problema. También es imprescindible que logren ser flexibles y adaptarse a los cambios e imprevistos.

En el marco de un trabajo presentado en la Conferencia Internacional IEEE sobre Robótica y Automatización (ICRA) de 2020, los investigadores estadounidenses demostraron los avances obtenidos en esta compleja tarea. Básicamente, utilizaron un modelo basado en el videojuego “Capture the Flag” para desarrollar una nueva versión del aprendizaje por refuerzo profundo, que ayuda a los robots a evaluar su próximo movimiento.

Optimizar un proceso de decisión

El aprendizaje por refuerzo profundo es una nueva generación de las técnicas de aprendizaje automático dentro del campo de la Inteligencia Artificial, orientadas a lograr una evolución en la forma en la cual las máquinas aprenden a realizar una tarea. Con estas técnicas, los robots o agentes inteligentes logran optimizar un proceso de decisión, ganando en autonomía.

Según Huy Tran, uno de los integrantes del grupo de investigadores y científico del Departamento de Ingeniería Aeroespacial de la Universidad de Illinois en Urbana-Champaign, “los robots pueden aprender a reaccionar en un entorno como un juego competitivo mediante un tipo de proceso de prueba y error, llamado aprendizaje por refuerzo profundo. Logran aprender qué acciones deben tomar en una situación determinada ejercitando con el videojuego”.

Sin embargo, el especialista destacó que además del proceso de toma de decisiones, “el desafío es descubrir cómo crear agentes inteligentes o robots que también puedan adaptarse a situaciones inesperadas». ¿Tendremos en un futuro cercano robots con la flexibilidad suficiente para variar sus estrategias y comportamientos en función de los súbitos cambios de la realidad?

Incremento de la adaptación a los cambios

Para avanzar en este camino, los expertos seleccionaron el videojuego “Capture the Flag” porque puede jugarse en dos grupos con varios integrantes, cada uno de los cuales debe tomar decisiones. Aunque la tarea general del juego es capturar una bandera, existen diversas subtareas que los investigadores modelaron en una estructura jerárquica, incluyendo además la posibilidad de sumar nuevas dinámicas de juego para poner a prueba la adaptabilidad.

El objetivo principal era explorar si con este tipo de jerarquía y con los cambios o variaciones se potenciaba la capacidad de adaptación de los robots. Los científicos comprobaron que aunque los robots necesitaban diversas ayudas para tomar decisiones, al dividir la actividad en subtareas fue posible mejorar la adaptación. Incluso capacitaron a un robot como “tomador de decisiones de alto nivel”, para que asigne una subtarea para cada agente.

En función de las conclusiones de los investigadores, el nuevo enfoque tiene el potencial de resolver problemas interesantes y desafiantes, pero al mismo tiempo existen todavía muchos inconvenientes que será imprescindible abordar antes de poder implementar estos sistemas en situaciones del mundo real. Sin embargo, destacaron que con esta clase de marcos y esquemas se puede mejorar la adaptación de los robots en entornos cambiantes e inesperados.

Referencia

Evaluating Adaptation Performance of Hierarchical Deep Reinforcement Learning. Huy Tran, Neale Van Stolen et al. IEEE International Conference on Robotics and Automation (ICRA) (2020).DOI:https://dx.doi.org/10.1109/ICRA40945.2020.9197052

Foto:

Los investigadores testean un dron. Crédito: University of Illinois at Urbana-Champaign.

Video: Tran Research Group.

Pablo Javier Piacente

Pablo Javier Piacente es periodista especializado en comunicación científica y tecnológica.

Hacer un comentario

RSS Lo último de Tendencias21

  • Confirmado: la música calma a las fieras y reduce el dolor 12 febrero, 2025
    Una nueva investigación comprueba un antiguo dicho popular: la música puede calmar a las fieras y reducir el dolor, siempre y cuando se encuentre al ritmo correcto. El alivio del dolor se concreta cuando se reproduce música a un ritmo que se alinea con el tempo natural de una persona.
    Pablo Javier Piacente / T21
  • En el pasado, el movimiento de las orejas nos habría ayudado a oír 12 febrero, 2025
    Escuchar atentamente activa pequeños músculos del oído, los mismos que permiten a algunas personas mover las orejas, según muestra un nuevo estudio. En el pasado, podrían habernos ayudado a oír, como sucede con otras especies. Ahora, estos músculos vestigiales no nos ayudan a oír, pero se activan cuando requerimos un esfuerzo extra al identificar un […]
    Pablo Javier Piacente / T21
  • El telescopio Webb estudiará al asteroide 2024 YR4, que podría impactar con la Tierra en 2032 12 febrero, 2025
    El asteroide 2024 YR4 tiene una probabilidad de aproximadamente el 2,3% de impactar con la Tierra en 2032: las posibilidades se han duplicado luego de los últimos análisis, motivando que el equipo a cargo del Telescopio Espacial James Webb (JWST) se comprometa a estudiar el tamaño real de la roca espacial y otras de sus […]
    Redacción T21
  • El futuro digital de la muerte: ¿inmortalidad virtual o espejismo tecnológico? 12 febrero, 2025
    La digitalización está transformando nuestra relación con la muerte y el duelo: el difunto se ha vuelto cada vez más "invisible". En su lugar, cobran protagonismo las representaciones digitales del fallecido en las redes sociales, así como proliferan los cementerios virtuales.
    Redacción T21
  • ¿Puede la gripe aviar desatar una nueva pandemia? 11 febrero, 2025
    Una nueva cepa de gripe aviar en Nevada, Estados Unidos, muestra una mutación preocupante: se trata de una variedad que intriga a los científicos, porque se relaciona directamente con la influenza aviar altamente patógena (IAAP) en humanos, que provocó la primera y única muerte humana relacionada con la gripe aviar en América del Norte hasta […]
    Pablo Javier Piacente / T21
  • Descubren cómo el cerebro supera el miedo 11 febrero, 2025
    Un equipo de investigadores ha identificado cómo el cerebro supera al miedo en roedores: han logrado describir el mecanismo cerebral que se activa en los ratones para superar el miedo instintivo. De confirmarse en humanos, el hallazgo podría ayudar a la investigación de tratamientos y soluciones para personas con patologías como el trastorno de estrés […]
    Pablo Javier Piacente / T21
  • El núcleo de la Tierra podría estar a punto de estallar: habría volcanes a 5.000 kilómetros de profundidad 11 febrero, 2025
    Un estudio revela que el núcleo interno de la Tierra está cambiando de forma misteriosa y aún incierta: el núcleo interno giratorio no solamente modifica su velocidad de rotación, sino que también parece cambiar de forma, con variaciones que se manifiestan a través de las ondas acústicas que se propagan por el centro de la […]
    Redacción T21
  • Una exposición muestra el camino a la extinción de millones de seres vivos marinos conscientes 11 febrero, 2025
    Ecos del océano, una exposición que une ciencia, tecnología, arte y creatividad, muestra los ecos que surgen en la mente de una ballena cuando tropieza con la contaminación sonora generada por la actividad humana. Una experiencia inmersiva invita a preservar el equilibrio entre el ser humano, la naturaleza y el resto de especies que conviven en […]
    Alejandro Sacristán (enviado especial).
  • La IA ya supera a los humanos en el fraude digital 10 febrero, 2025
    Un nuevo estudio destaca la creciente sofisticación de los grandes modelos de lenguaje (LLM), la estructura detrás de los chatbots de IA más conocidos, para crear estrategias de fraude cibernético. Estos modelos pueden diseñar campañas de phishing hiperpersonalizadas y persuasivas, a una fracción del coste y el tiempo que requieren los métodos tradicionales desarrollados por […]
    Pablo Javier Piacente / T21
  • Alerta: Creciente riesgo de que restos de cohetes afecten zonas de intenso tráfico aéreo 10 febrero, 2025
    Un nuevo estudio publicado en la revista Scientific Reports advierte sobre el aumento del peligro que representa la basura espacial para la aviación comercial. La investigación, realizada por científicos de la Universidad de Columbia Británica, en Canadá, concluye que existe una probabilidad anual del 26% de que los desechos de cohetes espaciales reingresen a la […]
    Pablo Javier Piacente / T21