Tendencias21

Crean ordenadores que “aprenden” a organizar fotos con criterios semánticos

Informáticos norteamericanos han desarrollado un sistema que enseña a los ordenadores a archivar imágenes con criterios semánticos. Utilizando un vocabulario de más de 300 palabras en inglés, asociadas a decenas de miles de imágenes de referencia, un ordenador puede catalogar una imagen de Internet y archivarla con una descripción coherente en sólo 1,4 segundos. Los aciertos son del 98%. El sistema permitirá archivar y realizar búsquedas de imágenes con mucha mayor precisión y rapidez que los procedimientos actuales y tendrá múltiples aplicaciones, desde la catalogación de colecciones de arte hasta de fotos de satélite. Por Vanessa Marsh.

Crean ordenadores que “aprenden” a organizar fotos con criterios semánticos

Investigadores de la Penn State University han conseguido enseñar a los ordenadores a interpretar imágenes utilizando un vocabulario de más de 330 palabras en inglés, de manera que puedan describir una fotografía cualquiera con varios términos y archivarla con criterios lógicos.

Según un comunicado de dicha universidad, este nuevo sistema puede identificar colecciones completas de fotografías on-line cuando son archivadas, lo que supone un gran ahorro de tiempo para los millones de usuarios de Internet que etiquetan a mano las imágenes que guardan en sus ordenadores. Asimismo, este sistema puede facilitar la búsqueda de fotografías con la utilización de palabras clave.

El sistema ha sido desarrollado por James Wang, profesor asociado del College of Information Sciences and Technology de la Penn State University, que se dedica al estudio de la recuperación semántico-sensitiva de imágenes, a la seguridad de los archivos gráficos y al desarrollo de sistemas de catalogación de fotografías con índices lingüísticos aprendidos, entre otras actividades de investigación.

El sistema, descrito en el artículo Real-Time Computerized Annotation of Pictures por Wang y su colaboradora Jia Li, del departamento de estadística de la misma universidad, aspira a resolver el problema de la catalogación automática de las imágenes digitales.

Según ambos autores, desarrollar la capacidad de los ordenadores para realizar este trabajo puede tener múltiples aplicaciones, como la búsqueda de imágenes en la Web, en los sites de álbumes de fotos emulando a un motor de búsqueda, e incluso para facilitar la realización de experimentos científicos. Asimismo, podría servir para catalogar colecciones de arte, imágenes de satélite o fotos de enfermedades concretas.

Avanzados modelos estadísticos

Con la sistematización de avanzados modelos estadísticos y la optimización de las técnicas, los investigadores han conseguido enseñar a los ordenadores cientos de conceptos semánticos a partir de imágenes que ejemplifican cada uno de dichos conceptos.

Así ha surgido el sistema ALIPR (Automatic Linguistic Indexing of Pictures-Real Time), completamente automático. De manera rápida, este sistema puede catalogar imágenes on-line en tiempo real. Las pruebas que se han realizado en sitios de imágenes en Internet han demostrado que permite catalogarlas con una precisión óptima.

La mayoría de los buscadores actuales se basan en etiquetados textuales para describir imágenes, pero no todos los conjuntos de texto se anotan. Como resultado, las imágenes que no se catalogan no pueden ser encontradas por los buscadores web, al mismo tiempo que muchas descripciones textuales son confusas respecto a la imagen archivada. Esta herramienta automática puede en cambio presentar muchas más imágenes y con mucha más precisión respecto a criterios de búsqueda.

Analizando los píxeles

ALIPR funciona analizando los píxeles (puntos de una imagen gráfica) de las imágenes y comparándolos con los datos que el ordenador tiene almacenados en una base de datos pertenecientes a decenas de miles de imágenes de referencia. El ordenador sugiere a partir de dicho archivo 15 posibles palabras para catalogar la nueva imagen.

Gracias a la introducción de estas decenas de miles de imágenes, los ordenadores han aprendido a reconocer ciertos objetos y conceptos, que automáticamente atribuyen a las nuevas imágenes que jamás han “visto”.

Los científicos han conseguido de esta forma que, en el 98% de las imágenes analizadas, el sistema genere al menos una anotación correcta de las 15 palabras seleccionadas. Estas anotaciones las hace el sistema en una media de un 1,4 segundos.

El sistema presenta, sin embargo, dificultades en el reconocimiento de fotos borrosas o de bajo contraste o baja resolución, cuando los objetos se ven sólo parcialmente o cuando el ángulo de la fotografía presenta un objeto registrado en el archivo del ordenador, pero desde cualquier otro ángulo. Para tratar de resolver estos problemas, los investigadores introducirán cada vez más imágenes en la base de datos, lo que ampliará las posibilidades de reconocimiento.

Trabajos futuros

Teniendo en cuenta que las imágenes son el principal medio de expresión en Internet, habría por tanto que asegurar la búsqueda sencilla y efectiva en toda la cantidad de información gráfica que hay en la Red, que crece continuamente. La catalogación automática y en tiempo real se hace por eso cada vez más necesaria, aseguran los investigadores.

Los próximos pasos para mejorar el sistema ALIPR y su exactitud comprenderán la incorporación de información tridimensional en los procesos de aprendizaje informático, lo que mejorará el funcionamiento del sistema. Asimismo, se aumentará y mejorará la cantidad de imágenes de archivo que suministran los conceptos semánticos que sirven para reconocer nuevas imágenes.

Respecto a las aplicaciones, el sistema ALIPR comenzará a probarse en ciertos dominios, como la biomedicina. También podría ser integrado en otros sistemas de recuperación de datos para mejorar su propia eficacia. El desarrollo de ALIPR ha sido subvencionado por la National Science Foundation.

Vanessa Marsh

Hacer un comentario

RSS Lo último de Tendencias21

  • La memoria universal promete revolucionar a la informática 12 febrero, 2024
    La memoria universal podría reemplazar tanto a la RAM como al almacenamiento interno en los ordenadores de uso masivo, brindando una alternativa más rápida y más eficiente a nivel energético. Un nuevo estudio muestra un posible enfoque revolucionario de la memoria universal: empleando un nuevo material denominado GST467, los investigadores apreciaron que la memoria mejora […]
    Pablo Javier Piacente
  • Los relámpagos volcánicos habrían encendido la llama de la vida en la Tierra primitiva 12 febrero, 2024
    Cuando la Tierra era joven y salvaje, los procesos en nuestro planeta transformaron una mezcla de ingredientes en lo necesario para impulsar la vida. Para esto es crucial el nitrógeno, un nutriente esencial para formar proteínas, aminoácidos y ácidos nucleicos. Los científicos han descubierto evidencias geológicas que indican que las descargas de rayos asociadas con […]
    Pablo Javier Piacente
  • La genética tiene mucho que decir sobre el asesinato de una madre adoptiva 12 febrero, 2024
    Según la genética, el comportamiento de los hijos adoptados está mayoritariamente influido por los padres biológicos, mientras que el parecido entre padres e hijos en una familia adoptiva es muy pequeño. Además, un hijo adoptado no tiene vínculos genéticos con su madre adoptiva y puede heredar ciertas maneras de pensar de sus padres biológicos, especialmente […]
    Eduardo Costas | Catedrático de la UCM y Académico de Farmacia
  • Europa logra un récord mundial de fusión nuclear 12 febrero, 2024
    En un importante logro científico, investigadores de la instalación Joint European Torus (JET) han establecido un récord energético mundial de 69 megajulios liberados en energía de fusión sostenida y controlada. Otro impulso para el futuro reactor europeo a gran escala ITER.
    Eduardo Martínez de la Fe
  • Un árbol fosilizado hace 350 millones de años sorprende a los científicos: parece alienígena 11 febrero, 2024
    Un fósil tridimensional de árboles más antiguos que los dinosaurios revela que los bosques de hace 350 millones de años eran extraños y alienígenas. Formaban parte de un bosquecillo que fue sepultado después de un terremoto.
    Redacción T21
  • El meteorito de Berlín resultó ser un raro objeto de origen ígneo 11 febrero, 2024
    El asteroide que se desintegró sobre Berlín a mediados de enero pertenece a un tipo raro de meteorito de origen ígneo. Se compone principalmente de silicatos de magnesio, enstatita y forsterita, además casi no contiene hierro y tiene una corteza vítrea translúcida.
    Redacción T21
  • Descubren un helecho tropical que transforma sus hojas muertas en nuevas raíces 9 febrero, 2024
    Para sobrevivir en el suelo anegado y bajo en nutrientes del bosque de Quebrada Chorro, en el oeste de Panamá, una especie de helecho tropical arborescente reutiliza sus hojas muertas, convirtiéndolas en nuevas raíces. Los científicos descubrieron que el helecho reconfigura estas “hojas zombis”, invirtiendo el flujo de agua para atraer nutrientes de regreso a […]
    Pablo Javier Piacente
  • Descubren una extraña combinación de minerales en las muestras lunares de la misión Chang'e-5 de China 9 febrero, 2024
    Los minerales antiguos y nuevos identificados en las muestras lunares traídas por la misión Chang'e-5 de China están ayudando a los científicos a comprender mejor la historia de la Luna: ahora, los especialistas han descubierto más propiedades del sexto nuevo mineral lunar, llamado Changesite-(Y). Además, otros compuestos hallados, la seifertita y la stishovita, pueden coexistir […]
    Pablo Javier Piacente
  • Los robots que atienden a pacientes llegan a los hospitales 9 febrero, 2024
    Robots diseñados para brindar comodidad a los pacientes de edad avanzada y aliviar su ansiedad, han sido probados con éxito en un hospital de París: saludan, responden a preguntas, comprenden conversaciones grupales y apoyan las tareas de enfermería.
    Redacción T21
  • Una pequeña luna de Saturno parecida a la “Estrella de la Muerte” de Star Wars contiene un océano oculto 8 febrero, 2024
    Por debajo de la superficie repleta de cráteres de Mimas, una de las lunas más pequeñas de Saturno, se esconde un océano global de agua líquida de reciente formación. El satélite posee tan sólo unos 400 kilómetros de diámetro y presenta un notable parecido con la “Estrella de la Muerte”, una estación espacial imperial que […]
    Pablo Javier Piacente