Tendencias21

Crean ordenadores que “aprenden” a organizar fotos con criterios semánticos

Informáticos norteamericanos han desarrollado un sistema que enseña a los ordenadores a archivar imágenes con criterios semánticos. Utilizando un vocabulario de más de 300 palabras en inglés, asociadas a decenas de miles de imágenes de referencia, un ordenador puede catalogar una imagen de Internet y archivarla con una descripción coherente en sólo 1,4 segundos. Los aciertos son del 98%. El sistema permitirá archivar y realizar búsquedas de imágenes con mucha mayor precisión y rapidez que los procedimientos actuales y tendrá múltiples aplicaciones, desde la catalogación de colecciones de arte hasta de fotos de satélite. Por Vanessa Marsh.

Crean ordenadores que “aprenden” a organizar fotos con criterios semánticos

Investigadores de la Penn State University han conseguido enseñar a los ordenadores a interpretar imágenes utilizando un vocabulario de más de 330 palabras en inglés, de manera que puedan describir una fotografía cualquiera con varios términos y archivarla con criterios lógicos.

Según un comunicado de dicha universidad, este nuevo sistema puede identificar colecciones completas de fotografías on-line cuando son archivadas, lo que supone un gran ahorro de tiempo para los millones de usuarios de Internet que etiquetan a mano las imágenes que guardan en sus ordenadores. Asimismo, este sistema puede facilitar la búsqueda de fotografías con la utilización de palabras clave.

El sistema ha sido desarrollado por James Wang, profesor asociado del College of Information Sciences and Technology de la Penn State University, que se dedica al estudio de la recuperación semántico-sensitiva de imágenes, a la seguridad de los archivos gráficos y al desarrollo de sistemas de catalogación de fotografías con índices lingüísticos aprendidos, entre otras actividades de investigación.

El sistema, descrito en el artículo Real-Time Computerized Annotation of Pictures por Wang y su colaboradora Jia Li, del departamento de estadística de la misma universidad, aspira a resolver el problema de la catalogación automática de las imágenes digitales.

Según ambos autores, desarrollar la capacidad de los ordenadores para realizar este trabajo puede tener múltiples aplicaciones, como la búsqueda de imágenes en la Web, en los sites de álbumes de fotos emulando a un motor de búsqueda, e incluso para facilitar la realización de experimentos científicos. Asimismo, podría servir para catalogar colecciones de arte, imágenes de satélite o fotos de enfermedades concretas.

Avanzados modelos estadísticos

Con la sistematización de avanzados modelos estadísticos y la optimización de las técnicas, los investigadores han conseguido enseñar a los ordenadores cientos de conceptos semánticos a partir de imágenes que ejemplifican cada uno de dichos conceptos.

Así ha surgido el sistema ALIPR (Automatic Linguistic Indexing of Pictures-Real Time), completamente automático. De manera rápida, este sistema puede catalogar imágenes on-line en tiempo real. Las pruebas que se han realizado en sitios de imágenes en Internet han demostrado que permite catalogarlas con una precisión óptima.

La mayoría de los buscadores actuales se basan en etiquetados textuales para describir imágenes, pero no todos los conjuntos de texto se anotan. Como resultado, las imágenes que no se catalogan no pueden ser encontradas por los buscadores web, al mismo tiempo que muchas descripciones textuales son confusas respecto a la imagen archivada. Esta herramienta automática puede en cambio presentar muchas más imágenes y con mucha más precisión respecto a criterios de búsqueda.

Analizando los píxeles

ALIPR funciona analizando los píxeles (puntos de una imagen gráfica) de las imágenes y comparándolos con los datos que el ordenador tiene almacenados en una base de datos pertenecientes a decenas de miles de imágenes de referencia. El ordenador sugiere a partir de dicho archivo 15 posibles palabras para catalogar la nueva imagen.

Gracias a la introducción de estas decenas de miles de imágenes, los ordenadores han aprendido a reconocer ciertos objetos y conceptos, que automáticamente atribuyen a las nuevas imágenes que jamás han “visto”.

Los científicos han conseguido de esta forma que, en el 98% de las imágenes analizadas, el sistema genere al menos una anotación correcta de las 15 palabras seleccionadas. Estas anotaciones las hace el sistema en una media de un 1,4 segundos.

El sistema presenta, sin embargo, dificultades en el reconocimiento de fotos borrosas o de bajo contraste o baja resolución, cuando los objetos se ven sólo parcialmente o cuando el ángulo de la fotografía presenta un objeto registrado en el archivo del ordenador, pero desde cualquier otro ángulo. Para tratar de resolver estos problemas, los investigadores introducirán cada vez más imágenes en la base de datos, lo que ampliará las posibilidades de reconocimiento.

Trabajos futuros

Teniendo en cuenta que las imágenes son el principal medio de expresión en Internet, habría por tanto que asegurar la búsqueda sencilla y efectiva en toda la cantidad de información gráfica que hay en la Red, que crece continuamente. La catalogación automática y en tiempo real se hace por eso cada vez más necesaria, aseguran los investigadores.

Los próximos pasos para mejorar el sistema ALIPR y su exactitud comprenderán la incorporación de información tridimensional en los procesos de aprendizaje informático, lo que mejorará el funcionamiento del sistema. Asimismo, se aumentará y mejorará la cantidad de imágenes de archivo que suministran los conceptos semánticos que sirven para reconocer nuevas imágenes.

Respecto a las aplicaciones, el sistema ALIPR comenzará a probarse en ciertos dominios, como la biomedicina. También podría ser integrado en otros sistemas de recuperación de datos para mejorar su propia eficacia. El desarrollo de ALIPR ha sido subvencionado por la National Science Foundation.

Vanessa Marsh

Hacer un comentario

RSS Lo último de Tendencias21

  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente
  • Un lejano mundo deja ver una increíble explosión de luz en sus cielos "metálicos" 8 abril, 2024
    Utilizando datos del Telescopio Espacial CHEOPS de la Agencia Espacial Europea (ESA), cuyo centro de operaciones científicas se localiza en la Universidad de Ginebra, en Suiza, un equipo internacional de científicos logró detectar por primera vez un extraño fenómeno lumínico denominado “gloria” en un exoplaneta: el estallido de luz se apreció en WASP-76b, un mundo […]
    Pablo Javier Piacente
  • El ordenador cuántico desembarca en el mundo universitario 8 abril, 2024
    La última computadora cuántica System One de IBM se ha instalado en el Instituto Politécnico Rensselaer (RPI) en Nueva York. Es la primera máquina cuántica de IBM instalada en un campus universitario de Estados Unidos. Una revolución en el mundo académico que impulsa la formación de un ecosistema cuántico global.
    Eduardo Martínez de la Fe
  • Los cocodrilos imitan a las ballenas antes de aparearse 7 abril, 2024
    Los cocodrilos cortejan a las hembras lanzando un chorro de agua al aire, tal como hacen las ballenas cuando salen a la superficie. A ellas les encantan también los silbidos y las burbujas que les dedican sus parejas antes de aparearse. Se está elaborando un diccionario de cocodrilos.
    Redacción T21
  • Los drones policiales se implantan en Estados Unidos 6 abril, 2024
    Chula Vista, un suburbio de San Diego, California, con una población de 275.000 habitantes, es una de las pocas ciudades estadounidenses que utiliza sistemáticamente drones para ayudar a la policía en caso de emergencia. En activo desde 2018, el sistema está sirviendo de referencia a otros Estados y tal vez otros países.
    Redacción T21