Tendencias21
Patentan un sistema informático que mejorará la busqueda de imágenes en Internet

Patentan un sistema informático que mejorará la busqueda de imágenes en Internet

Informáticos estadounidenses han patentado un sistema para catalogar y buscar fotos en Internet. Este sistema fue creado hace dos años, pero es ahora cuando empieza a tener aplicaciones prácticas. La patente abre la posibilidad de su explotación comercial. Basado en un sistema estadístico, “enseña” al ordenador a reconocer el contenido de las fotografías. Es decir, en lugar de buscar en función de las palabras que aparecen asociadas a ella, lo hace en función de lo que aparece en la propia instantánea. Según sus creadores, su porcentaje de acierto se acerca al 90% y permitirá acceder a fotografías ocultas por no estar asociadas a ninguna palabra o porque su descripción no corresponde con lo que representa. El equipo de investigación acaba de conseguir la patente del ALIPR y su intención es que pueda usarse por la industria para catalogar y etiquetar imágenes o integrarse dentro de los buscadores de Internet. Por Raúl Morales.

Patentan un sistema informático que mejorará la busqueda de imágenes en Internet

Dos informáticos de la Universidad Penn State han patentado un sistema estadístico, llamado Linguistic Indexing of Pictures in Real-Time (ALIPR) que podría facilitar mucho la búsqueda de imágenes en Internet.

Sus creadores han sido James Wang, profesor asociado del College of Information Sciences and Technology de la Penn State University, y Jia Li, que es profesor asociado de estadística en la misma Universidad.

Hace dos años, Tendencias 21 se hacía eco de este sistema. La gran novedad, aparte de la patente conseguida por los dos informáticos, lo que abre una posibilidad comercial, es que han empezado a usarla en aplicaciones concretas que, a medio plazo, podrían formar parte de procesos cotidianos.

En este sentido, los investigadores quieren que los internautas les ayuden a hacer esta herramienta más inteligente. Todo el mundo está invitado a visitar la página web de ALIPR para “subir” fotos y evaluar cómo las categoriza y etiqueta. Asimismo, están buscando nuevas ideas que les permita mejorar el sistema.

Así, la tecnología ALIPR se está usando en una aplicación llamada Story Picturing Engine, que genera un “storyboard” (guión gráfico) para ilustrar cualquier historia remitida por un usuario.

Además, la están testando para, eventualmente, utilizar imágenes y no letras en el test CAPTCHA. CAPTCHA es el acrónimo de Completely Automated Public Turing test to tell Computers and Humans Apart (Prueba de Turing pública y automática para diferenciar a máquinas y humanos).

Se trata de una prueba utilizada en computación (y ya de manera masiva en muchos getiones hechas en Internet) para determinar si el usuario es o no humano. El término se empezó a utilizar en el año 2000 por Luis von Ahn, Manuel Blum y Nicholas J. Hopper, de la Carnegie Mellon University, y John Langford de IBM.

La prueba más común consiste en que el usuario introduzca un conjunto de caracteres que se muestran en una imagen distorsionada que aparece en pantalla. Se supone que una máquina no es capaz de comprender e introducir la secuencia de forma correcta, por lo que solamente el humano podría hacerlo.

El sistema CAPTCHA basado en imágenes se llama “Imagination” y pide a los usuarios que identifiquen el centro geométrico de un objeto dentro de una imagen. Ha sido desarrollado por el informático Ritendra Datta, de la misma Universidad, bajo la supervisión de Wang y Li.

Búsqueda por el contenido

El ALIPR enseña al ordenador a reconocer el contenido de las fotografías, como un edificio, personas o paisajes. Es decir, en lugar de buscar en función de las palabras que aparecen junto a la foto, como hacen la mayor parte de los buscadores, se fija en lo que aparece en la propia foto.

En la actualidad, la mayor parte de los buscadores buscan las etiquetas que acompañan a cada foto. El problema es que muchas no llevan ningún tipo de descripción o de etiqueta, o bien ésta no responde a la realidad, por lo que es invisible para los buscadores.

El desarrollo de estos dos informáticos evitaría que muchas fotos permanecieran escondidas. El equipo acaba de obtener una patente para el sofisticado ALIPR. Su intención es que pueda usarse por la industria para catalogar y etiquetar imágenes de todo tipo, o bien integrarse dentro de los buscadores de Internet.

“Nuestro enfoque básico ha sido tomar gran número de fotos (hemos empezado por 60.000) para etiquetarlas manualmente con variedad de palabras clave que describen sus contenidos. Por ejemplo, seleccionamos 100 fotografías de parques nacionales y las etiquetamos con las siguientes palabras: parque nacional, paisaje y árbol.”, comenta Li en un comunicado. “Después, creamos un modelo estadístico para enseñar al ordenador a reconocer patrones en el color y la textura de estas 100 fotos, así como para asignar esas palabras clave a nuevas fotos que puedan contener parques nacionales, paisajes y/o árboles. Eventualmente, esperamos revertir el proceso, de tal modo que el usuario pueda usar las mismas palabras para buscar en la Web imágenes relevantes”, puntualiza Li.

Estudiar los píxeles

Li asegura que los sistemas de búsqueda de fotos actuales hace su pesquisa a partir de las palabras asociadas a la foto o a partir del nombre que se le ha dado. Esta técnica se salta con demasiada frecuencia fotos relevantes y encuentra otras que no tienen nada que ver con lo que realmente se está buscando. Por el contrario, la nueva técnica de Penn State enseña al ordenador a reconocer la semántica de las imágenes basándose en la información obtenida a partir de sus píxeles (un píxel es un punto de imagen gráfica).

Según Li, el ALIPR funciona con un 90% de precisión, pero asegura que su grado de acierto depende mucho de las expectativas de quien busca. Por ejemplo, la herramienta clasifica o diferencia animales de personas, pero no siempre podría diferenciar entre un niño y un adulto. Esta investigadora duda que el sistema llegue a alcanzar el 100% de precisión, pero asegura que debería mejorar mucho la búsqueda de imágenes en la Red.

“Hay tantas imágenes y tantas variaciones en el contexto de esas imágenes que no creo que sea posible que ALIPR alcance el 100% de exactitud”, dice Li. “ALIPR funciona reconociendo patrones en el color y la textura. Por ejemplo, si un gato en una foto está cubierto por una prenda roja, es posible que ALIPR la catalogue con palabras que no tienen nada que ver con un gato”, asegura.

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Sudáfrica y China logran una conexión cuántica satelital récord de casi 13.000 kilómetros 20 marzo, 2025
    Un equipo internacional de científicos ha establecido una conexión satelital cuántica histórica entre Sudáfrica y China, cubriendo una distancia récord de 12.900 kilómetros. Gracias al fenómeno del entrelazamiento cuántico, esta tecnología garantiza comunicaciones absolutamente seguras frente a cualquier intento de espionaje.
    Redacción T21
  • Los tribunales no reconocen derechos de autor a la Inteligencia Artificial 20 marzo, 2025
    Un tribunal de apelaciones en Estados Unidos ha puesto límites a la creatividad de las máquinas: las obras generadas exclusivamente por inteligencia artificial no pueden ser protegidas por derechos de autor. El fallo reafirma que la ley actual requiere la participación humana para garantizar la protección legal de una obra.
    Redacción T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21
  • Microsoft e Inait revolucionan la Inteligencia Artificial con cerebros digitales casi humanos 20 marzo, 2025
    Microsoft ha unido fuerzas con la startup suiza Inait para desarrollar sistemas de IA inspirados en el cerebro humano. Esta colaboración busca crear modelos que no solo aprenden de datos, sino que también razonan como el cerebro humano.
    Redacción T21
  • Una prueba de consciencia corporal desafía las visiones tradicionales sobre la cognición animal 19 marzo, 2025
    Los gorilas pueden ser tan conscientes de sí mismos como los chimpancés, según ha comprobado una nueva investigación: luego de realizar una prueba de autoconsciencia corporal bajo parámetros diferentes a las tradicionales, los científicos verificaron que las capacidades cognitivas de estos simios se habían menospreciado hasta hoy.
    Pablo Javier Piacente / T21
  • China plantea la necesidad de etiquetar el contenido generado con IA 19 marzo, 2025
    En colaboración con varios ministerios gubernamentales, la Administración China de Control del Ciberespacio (CAC) ha anunciado que todo el contenido generado por IA en Internet tendrá que ser etiquetado como tal. Sería la forma a través de la cual el gigante asiático se acopla a la idea europea de establecer algún tipo de regulación sobre […]
    Pablo Javier Piacente / T21
  • Escándalo: Elon Musk implanta en la Casa Blanca su servicio de internet satelital Starlink 19 marzo, 2025
    Starlink ha instalado en la Casa Blanca un servicio de Internet satelital paralelo al sistema oficial de telecomunicaciones que suscita dudas sobre su legalidad, abre brechas de seguridad en las comunicaciones secretas y aventaja a las empresas de Elon Musk en el acceso a proyectos oficiales. Polémica.
    EDUARDO MARTÍNEZ DE LA FE/T21