La visión artificial es algo que forma parte de nuestra vida cotidiana: gracias a ella se puede garantizar la privacidad de nuestros teléfonos inteligentes o conducir coches autónomos, entre otras aplicaciones.
Ese tipo de visión representa toda una proeza tecnológica: se vale de un algoritmo utilizado en Aprendizaje Automático (una rama de la Inteligencia Artificial), llamado Redes Neuronales Convolucionales (en inglés CNN), para otorgar a un sistema informático la capacidad de “ver” un entorno determinado.
Para conseguirlo, ese algoritmo (CNN) tiene varias capas de reconocimiento a través de las cuales detecta líneas y curvas. A continuación llega a las capas más profundas de su estructura para identificar formas complejas, como una cara o el perfil de un animal.
Para que esa red neuronal aprenda por sí sola a reconocer en un espacio diferentes imágenes, como las de un perro y un gato, necesita al menos analizar previamente 10.000 imágenes de gatos y otras 10.000 de perros: solo así podrá concluir que lo que está viendo se corresponde con una de esas categorías animales, independientemente de que el gato o el perro sea blanco, negro, esté de frente o de perfil. Sabe que son diferentes especies de animales.
Ilusiones compartidas
Las redes neuronales convolucionales se inspiran en el comportamiento del sistema visual humano, que es el encargado de convertir las ondas electromagnéticas del espectro visible que llegan hasta los ojos, en señales nerviosas interpretadas por el cerebro.
Esta similitud entre ambos sistemas de visión ha permitido descubrir algo sorprendente: la visión computarizada puede percibir, al igual que los humanos, ilusiones ópticas.
Una ilusión óptica es una distorsión que ocurre en el proceso natural de la visión que nos lleva a percibir la realidad de una forma diferente a como es en realidad.
Las ilusiones ópticas pueden suceder de manera natural o ser creadas por efectos visuales específicos. Cuando ocurren de forma natural, el origen puede ser fisiológico: las genera el cerebro para optimizar la visión natural.
El cerebro nos engaña
Aunque todavía no conocemos bien cómo se las arregla el cerebro para combinar todas las percepciones de color, forma, movimiento y textura, y obtener así una imagen coherente del entorno, lo cierto es que no cuenta con la suficiente capacidad para gestionar toda la información que proporcionan los ojos.
Por este motivo, muchas veces el cerebro interpreta la información visual y compone para nuestra percepción una imagen amañada del entorno: por ejemplo, es capaz de aumentar la resolución de una imagen defectuosa aportada por el ojo.
Como continuamente parpadeamos, el cerebro debe añadir la información que falta al sistema visual para componer la imagen del entorno sin fisuras: lo vemos discurrir como una película, sin los lapsus del parpadeo.
Virtualidad engañosa
Lo que ha descubierto la nueva investigación, desarrollada por científicos de las universidades Pompeu Fabra (Barcelona) y de Valencia, es que las redes neuronales artificiales (CNN) también pueden ser «engañadas» por ilusiones visuales, de la misma forma que las ilusiones visuales engañan a los humanos.
Los autores del estudio, Alexander Gómez Villa, Adrian Martín, Javier Vázquez-Corral y Marcelo Bertalmío, miembros del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF, junto a Jesús Malo, de la Universidad de Valencia, entrenaron las CNN para tareas simples que la visión humana también desarrolla, como por ejemplo la eliminación de ruido y el desenfoque de imágenes, según se informa en un comunicado.
Así descubrieron que las redes CNN entrenadas en estas circunstancias experimentales también son «engañadas» por ilusiones visuales de brillo y color para mejorar la calidad de la imagen digital, de la misma forma que las ilusiones visuales engañan a los humanos.
Es decir, que las redes neuronales pueden ser entrenadas para repetir lo que hace el cerebro: optimizar la visión natural mediante ilusiones ópticas.
Diferencias importantes
Sin embargo, los investigadores apreciaron diferencias importantes: las ilusiones ópticas artificiales no generan siempre el mismo efecto en la percepción que las ilusiones ópticas creadas por el cerebro.
En algunas ocasiones, esas ilusiones ópticas artificiales son incluso peores que sus equivalentes biológicas: pueden ser muy diferentes a las que crea el cerebro humano.
Es decir, aunque somos capaces de replicar artificialmente el sistema visual humano, estamos muy lejos todavía de conseguir lo que el cerebro hace magistralmente: crear ilusiones ópticas perfectas para optimizar la percepción visual.
Precaución
Tampoco hemos conseguido que las redes neuronales artificiales especialmente diseñadas para replicar el sistema de visión de los seres humanos, desencadenen en el sistema virtual las mismas reacciones que experimentamos los humanos: asumir las ilusiones ópticas como parte de la visión natural.
Por este motivo, los autores señalan en su artículo, publicado en la revista Vision Research, las limitaciones de los sistemas de visión artificial para suplir al cerebro humano en su tarea de optimizar la percepción visual mediante ilusiones ópticas, una advertencia especialmente llamativa para aplicaciones de la CNN como la conducción autónoma de vehículos.
Referencia
Color illusions also deceive CNNs for low-level vision tasks: Analysis and implications. A. Gomez-Villaa et al. Vision Research, Volume 176, November 2020, Pages 156-174. DOI:https://doi.org/10.1016/j.visres.2020.07.010