Tendencias21
Nuevo software relaciona dibujos abstractos con objetos reales

Nuevo software relaciona dibujos abstractos con objetos reales

Ya no importa ser un mal dibujante, pues investigadores de la Universidad de Brown y Berlín se han unido para desarrollar una aplicación informática capaz de relacionar el dibujo más abstracto o icónico con la imagen que representa. Con la Inteligencia Artificial como base, los investigadores entrenaron a una serie de algoritmos para identificar 250 categorías de objetos, con 20.000 bocetos en total. El resultado es una precisión cercana al 56%, frente al 73% de acierto en humanos. Por Patricia Pérez.

Nuevo software relaciona dibujos abstractos con objetos reales

El ser humano ha utilizado el dibujo para representar todo lo que le rodea desde la Prehistoria. Incluso hoy en día es posiblemente la única técnica universal para dar forma a un objeto a disposición de cualquier persona, independientemente de su edad, idioma o limitaciones lingüísticas. Sin embargo, algo tan sencillo de reconocer para el hombre, sigue siendo un problema sin resolver en gran parte por los equipos informáticos.

Investigadores de la Universidad de Brown en Providence, Estados Unidos, y la Universidad Técnica de Berlín, en Alemania, se han unido ahora para desarrollar un programa informático capaz de identificar simples bocetos abstractos de los objetos más cotidianos casi con el mismo nivel de acierto que espectadores humanos.

Los avances actuales habían conseguido sistemas capaces de relacionar dibujos con objetos, siempre que estos fueran representaciones exactas. Es el caso de aplicaciones que hacen coincidir bocetos de la policía con caras reales en fotografías. Sin embargo, iconos o trazos más sencillos, aquellos que la mayoría de las personas puede realizar fácilmente, seguían siendo un reto para los ordenadores.

El software creado por el equipo dirigido por James Hays, profesor asistente de Ciencias Informáticas en Brown, junto a Mathias Eitz y Marc Alexa de Berlín, puede reconocer bocetos incluso mientras se están dibujando, en tiempo real. Se convierte así en la primera aplicación informática que permite la “comprensión semántica” de dibujos abstractos, según afirman los investigadores en el comunicado emitido por la universidad estadounidense.

Aplicando Inteligencia Artificial

La investigación que sustenta el programa se presentó en la trigésimo novena edición de Siggraph, la conferencia líder mundial en Infografía y Técnicas Interactivas celebrada el mes pasado en Los Ángeles.

En ella citan a modo de ejemplo cómo cuando se pide a alguien que dibuje un conejo, normalmente opta por el aspecto caricaturesco, grandes orejas, dientes alargados y cola de algodón. Otra persona probablemente no tendría muchos problemas para reconocer al simpático animalito, a pesar de que poco tenga que ver con un conejo real.

“Puede ser que lo reconozcamos como un conejo porque todos hemos crecido viéndolo de esa manera”, señala el profesor Hays. Pero conseguir que un equipo “entienda lo que hemos asimilado a través de años de cómics y libros para colorear es una tarea monumentalmente difícil”, añade.

La clave para que este nuevo programa funcione es una gran base de datos de bocetos que se podrían utilizar para enseñar a una computadora cómo dibujan las cosas los humanos, recurriendo una vez más a la Inteligencia Artificial (IA). «Esta es realmente la primera vez que se ha examinado una gran base de datos con bocetos reales», destaca Hays.

Para dar sentido a esa base de datos, los investigadores crearon en primer lugar una lista con aquellos objetos cotidianos más susceptibles de ser dibujados. “Nos fijamos en la base de datos de imágenes LabelMe, que tiene un montón de fotografías comentadas», recuerda el profesor. “Analizamos la frecuencia de etiquetado y de ahí extrajimos los objetos fotografiados más populares. A ello añadimos otras cosas de interés que pensamos que podrían ser dibujadas, como el arco iris, por ejemplo».

El resultado fue un listado con 250 categorías. Para darle forma, los investigadores recurrieron a Mechanical Turk, un mercado de trabajo basado en el crowdsourcing y dirigido por Amazon, donde se contrató a gente para dibujar los objetos de cada categoría; uno o varios dibujos representativos o icónicos de cada una hasta llegar a los 20.000 bocetos en total.

Esos datos fueron introducidos en los algoritmos de reconocimiento y aprendizaje automático existentes para enseñar al programa qué bocetos pertenecen a cada categoría. A partir de ahí, el equipo desarrolló una interfaz que permite a los usuarios introducir nuevos bocetos que la aplicación intenta identificar en tiempo real, mientras se están dibujando.

De esta forma se ha conseguido que el software reconozca con éxito bocetos con una precisión cercana al 56 por ciento, siempre y cuando el objeto se incluya en una de las 250 categorías. No está mal, teniendo en cuenta que cuando los investigadores pidieron a usuarios reales que identificaran algunos bocetos de la base de datos, acertaron en torno al 73 por ciento. “La diferencia entre el rendimiento de la máquina y la persona no es tan grande, o al menos no tanto como lo es en otras tareas informáticas», admite Hays.

Ampliación y usos potenciales

El programa no está preparado aún para dominar el clásico juego de mesa Pictionary, principalmente por la limitación de sus 250 categorías. Sin embargo, los investigadores no descartan su ampliación. Una forma de hacerlo sería convertir el programa en un juego y recoger los datos de entrada de los jugadores.

“El juego puede pedir al usuario que dibuje algo y si otra persona es capaz de reconocerlo con éxito se puede decir que ha sido un boceto bastante decente”, explica Hays, quien asegura que se puede recoger todo tipo de datos de entrenamiento con esta fórmula, continuando con la filosofía de crowdsourcing que ha sido clave para el proyecto hasta ahora.

“La recogida de datos es la única manera para conseguir el aprendizaje de las máquinas”, subraya el profesor. “No hay manera de aprender a reconocer bocetos de leones basándonos en un algoritmo inteligente. El algoritmo necesita ver cerca de 100 ejemplos de cómo la gente dibuja los leones para ser capaz de distinguir estos animales de plantas en macetas”, cita Hays como ejemplo.

Mientras baraja la opción del juego para ampliar la base de datos, el equipo ya ha creado una aplicación gratuita para iPhone e iPad llamada WhatsMySketch. En ella el usuario puede hacer un dibujo al azar que los algoritmos son capaces de transformar en un conjunto de características que relacionan con los bocetos disponibles en la base de datos. La aplicación va mostrando un listado con las nueve categorías más probables, predicción que se actualiza a medida que se añaden nuevos rasgos al boceto.

Sin embargo, un programa como éste podría llegar a ser mucho más que juego y diversión. Podría utilizarse para desarrollar interfaces más sencillas o en aplicaciones de búsqueda en red basadas en la imagen. Y es que, a pesar de la propagación de las pantallas táctiles, la búsqueda a través del dibujo todavía no está muy extendida, aunque “es probable que eso se deba a que no ha funcionado del todo bien”, matiza Hays.

Una interfaz mejorada podría optimizar la búsqueda en red a partir de dibujos, facilitando el trabajo en algunos ámbitos y para ciertos colectivos. Además evitaría todos los problemas con el idioma, y eso ya es un avance.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • ¿El próximo Einstein será un algoritmo? Nace la primera científica artificial que genera conocimiento 2 junio, 2025
    Una inteligencia artificial ha concebido, ejecutado y escrito una investigación original que ha sido aceptada en ACL 2025, uno de los foros científicos más prestigiosos del mundo. Zochi es la primera científica artificial reconocida por la élite.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Crean un "hormigón viviente" que se repara a sí mismo 2 junio, 2025
    Un equipo de investigadores ha desarrollado un tipo de concreto que puede curarse a sí mismo aprovechando el poder del liquen sintético. Mejora notablemente intentos anteriores de producir hormigón "vivo" hecho con bacterias, ya que el nuevo material logra ser completamente autosuficiente.
    Redacción T21
  • El eco cuántico del cerebro: ¿estamos entrelazados con nuestros pensamientos? 2 junio, 2025
    El entrelazamiento cuántico, la "acción fantasmal a distancia" que tanto intrigó a Einstein, podría no ser solo una rareza del microcosmos, sino que tendría un eco medible en los procesos cognitivos inconscientes mediante un aparente fenómeno “supercuántico”.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Un enorme desierto en Asia se está transformando en un vergel gracias al cambio climático 1 junio, 2025
    Los hallazgos de un nuevo estudio muestran que la ecologización del desierto de Thar ha sido impulsada principalmente por más lluvias durante las temporadas de monzones de verano, un aumento del 64% en las precipitaciones en general por el cambio climático y, en segundo lugar, por la infraestructura de riego que lleva el agua subterránea […]
    Pablo Javier Piacente / T21
  • La NASA está observando una enorme y creciente anomalía en el campo magnético de la Tierra 31 mayo, 2025
    La NASA está haciendo un seguimiento detallado de la "abolladura" o "bache" en el campo magnético terrestre descubierta en 1961, que crece rápidamente y podría ser el preludio de una inversión geomagnética: ocurre cuando los polos magnéticos norte y sur intercambian posiciones.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Los árboles pueden predecir las erupciones volcánicas 30 mayo, 2025
    La NASA, en colaboración con el Instituto Smithsonian, en Estados Unidos, está desarrollando nuevos métodos para anticipar erupciones volcánicas. Cuando el magma asciende a la superficie libera dióxido de carbono, y los árboles cercanos que absorben ese gas se vuelven más verdes y frondosos. Satélites como Landsat 8 vigilan la vegetación en zonas volcánicas, captando […]
    Pablo Javier Piacente / T21
  • Los delfines se ponen nombres "en clave" 30 mayo, 2025
    Un nuevo estudio ha identificado que los delfines no solo se dan nombres para reconocerse, sino que además estas denominaciones podrían esconder información secreta o "en clave", que estaría ligada a los sistemas sociales que sustentan el equilibrio de sus comunidades.
    Pablo Javier Piacente / T21
  • Sorprenden a una “estrella araña” devorando a su compañera 30 mayo, 2025
    Una colaboración internacional de astrónomos ha identificado un extraño sistema estelar en el que un púlsar conocido como “estrella araña” devora material de su estrella compañera, en un hallazgo que representa un eslabón perdido en la evolución de sistemas binarios compactos. 
    Redacción T21
  • Planetas a la deriva: el origen caótico de los mundos lejanos respalda la existencia del Planeta Nueve 30 mayo, 2025
    En los márgenes más remotos de los sistemas planetarios, gigantes invisibles orbitan en silencio. Un nuevo modelo sugiere que estos mundos distantes son productos inevitables del caos primordial que reina cuando las estrellas y sus planetas compiten por sobrevivir en los abarrotados viveros estelares. ¿Podría nuestro propio Sistema Solar albergar uno de estos esquivos colosos?
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Unas gafas de realidad mixta devuelven "el mundo entero" a las personas con pérdida parcial de la visión 29 mayo, 2025
    Una técnica desarrollada por oftalmólogos e informáticos canadienses devuelve la visión perdida a personas afectadas por una lesión cerebral, que han sufrido la reducción de gran parte de su campo visual. Las gafas de realidad mixta registran y "proyectan" ese sector que las personas no pueden ver con sus ojos.
    Pablo Javier Piacente / T21