Tendencias21
Crean un buscador multilingüe de imágenes en Internet

Crean un buscador multilingüe de imágenes en Internet

Un nuevo software ideado por informáticos de la universidad de Washington ha permitido crear un buscador capaz de rastrear imágenes en la web usando cientos de lenguas diferentes. El potente cerebro de PanImages, que es como lo han bautizado, escanea 350 diccionarios online y usa un algoritmo para encontrar resultados precisos. Según sus creadores, esta herramienta va a favorecer sobre todo a los internautas de países o regiones del mundo que tengan poca presencia en la web. En la actualidad ya es capaz de buscar imágenes en 300 idiomas diferentes e incluye más de 2,5 millones de palabras. Por Raúl Morales

Crean un buscador multilingüe de imágenes en Internet

Informáticos de la universidad de Washington han desarrollado un buscador de imágenes en Internet multilingüe. Según los creadores de PanImages, esta herramienta hará accesibles las imágenes que circulan por la red a todo el mundo, ya que permite buscar imágenes usando cientos de lenguas.

Desde la caída de la Torre de Babel hasta el Esperanto, uno de los sueños de la humanidad ha sido compartir una misma lengua. Internet parecía que nos iba a situar más cerca de este sueño, pero la realidad es que, por ejemplo, millones de fotografías en Internet no se pueden encontrar porque nadie las ha traducido.

“Las imágenes son universales, pero los buscadores de imágenes no”, dice Oren Etzoni, profesor de informática en la universidad de Washington que ha estado al frente de este proyecto. “Una persona que teclea su búsqueda en inglés, evidentemente, no va a encontrar fotografías clasificadas en chino y un alemán no podrá encontrar imágenes etiquetadas en inglés. Lo que hemos hecho es crear una herramienta colaborativa para resolver este problema”, afirma en un comunicado de la universidad.

Los buscadores como Google buscan imágenes detectando el término de búsqueda en los pies de foto o en otros textos cercanos. Dado que el proceso busca series de letras, los resultados están limitados a la lengua materna de quien busca la imagen.

PanImage (“pan” significa en griego “todo”) es capaz de traducir automáticamente un término de búsqueda en unas 300 lenguas diferentes, sugiriendo algunas que pueden estar más acordes a la búsqueda y mostrando las imágenes a partir de Google y la base de datos fotográfica Flickr.

Esta herramienta sobre todo ayudará a internautas que hablan lenguas minoritarias y que tienen una limitada presencia en la web. Por ejemplo, si un hablante zulú busca una imagen de un frigorífico en un buscador y teclea “ifriji”, que es cómo se dice en su lengua, sólo obtendrá dos resultados. Sin embargo, si lo introduce en PanImage, tendrá 472.000 fotografías a su disposición. En un texto de una lengua minoritaria, PanImage es capaz de encontrar 57 veces más resultados que el buscador de imágenes de Google.

“Queremos servir al gran número de internautas que no habla una lengua mayoritaria”, comenta Etzioni. “Internet es cada vez más accesible en muchos países que no forman parte de las naciones industrializadas, por eso es cada vez más importante dar este tipo de servicios a personas que no hablan inglés, francés o chino”.

Escanear diccionarios

El potente cerebro de PanImages fue creado escaneando más de 350 diccionarios online. Algunos de ellos eran “wikidiccionarios”, diccionarios multilingües escritos por voluntarios.

El software de PanImages escanea estos diccionarios y usa un algoritmo para encontrar los resultados más precisos. Después, el sistema ensambla los resultados en una matriz que permite la traducción en combinaciones que nunca han sido intentadas antes, por ejemplo del lituano.

“Es un recurso léxico que no tiene precedentes. Lo que distingue este buscador de otros es su habilidad para escalar tal cantidad de lenguas. Nuestro último objetivo es cubrir finalmente todas las lenguas en las que la gente esté interesada”, comenta Etzioni.

Para todos

Incluso las personas que hablan estas lenguas mayoritarias se pueden beneficiar de PanImage. Las palabras que tienen más de un significado inevitablemente producen resultados no deseados cuando son buscadas. Por ejemplo, si buscamos “spring” en inglés obtendremos resultados muy diversos: un prado, un rollo de metal e imágenes de una ciudad norteamericana llamada Silver Spring. En este caso, y si queremos buscar el significado “rollo de metal”, sería posible introducir en PanImage la palabra francesa “ressort”, que es mucho más precisa.

Los experimentos hechos con lenguas más comunes han puesto de manifiesto que PanImage dobla el número de imágenes correctas en las quince primeras páginas de resultados.

Los servicios de traducción online gratuitos usados por Yahoo y Google incorporan únicamente dos docenas de lenguas. Y se dan situaciones como que en los Estados Unidos, si usamos un traductor, la tendencia es que se centre en lenguas que tienen una relevancia militar, como el chino o el árabe.

PanImages tenía 50 lenguas a principios de año y en junio ya había alcanzado las 100. Ahora mismo incluye unas 300 y 2,5 millones de palabras.

Sus creadores seguirán desarrollando esta herramienta rastreando más diccionarios online para aumentar el número de palabras y lenguas que puede manejar. Asimismo, quieren traducir las palabras usadas en páginas que etiquetan palabras, tipo del.icio.us, donde los usuarios utilizan una única palabra para describir el contenido de una página web.

Los resultados de las investigaciones y pruebas hechas con PanImages fueron presentados recientemente en el Machina Translation Summit que se celebró en Copenhague.

Hacer un comentario

RSS Lo último de Tendencias21

  • Sudáfrica y China logran una conexión cuántica satelital récord de casi 13.000 kilómetros 20 marzo, 2025
    Un equipo internacional de científicos ha establecido una conexión satelital cuántica histórica entre Sudáfrica y China, cubriendo una distancia récord de 12.900 kilómetros. Gracias al fenómeno del entrelazamiento cuántico, esta tecnología garantiza comunicaciones absolutamente seguras frente a cualquier intento de espionaje.
    Redacción T21
  • Los tribunales no reconocen derechos de autor a la Inteligencia Artificial 20 marzo, 2025
    Un tribunal de apelaciones en Estados Unidos ha puesto límites a la creatividad de las máquinas: las obras generadas exclusivamente por inteligencia artificial no pueden ser protegidas por derechos de autor. El fallo reafirma que la ley actual requiere la participación humana para garantizar la protección legal de una obra.
    Redacción T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21
  • Microsoft e Inait revolucionan la Inteligencia Artificial con cerebros digitales casi humanos 20 marzo, 2025
    Microsoft ha unido fuerzas con la startup suiza Inait para desarrollar sistemas de IA inspirados en el cerebro humano. Esta colaboración busca crear modelos que no solo aprenden de datos, sino que también razonan como el cerebro humano.
    Redacción T21
  • Una prueba de consciencia corporal desafía las visiones tradicionales sobre la cognición animal 19 marzo, 2025
    Los gorilas pueden ser tan conscientes de sí mismos como los chimpancés, según ha comprobado una nueva investigación: luego de realizar una prueba de autoconsciencia corporal bajo parámetros diferentes a las tradicionales, los científicos verificaron que las capacidades cognitivas de estos simios se habían menospreciado hasta hoy.
    Pablo Javier Piacente / T21
  • China plantea la necesidad de etiquetar el contenido generado con IA 19 marzo, 2025
    En colaboración con varios ministerios gubernamentales, la Administración China de Control del Ciberespacio (CAC) ha anunciado que todo el contenido generado por IA en Internet tendrá que ser etiquetado como tal. Sería la forma a través de la cual el gigante asiático se acopla a la idea europea de establecer algún tipo de regulación sobre […]
    Pablo Javier Piacente / T21
  • Escándalo: Elon Musk regala a la Casa Blanca acceso a su servicio de internet satelital Starlink 19 marzo, 2025
    Starlink ha instalado en la Casa Blanca un servicio de Internet satelital paralelo al sistema oficial de telecomunicaciones que suscita dudas sobre su legalidad, abre brechas de seguridad en las comunicaciones secretas y aventaja a las empresas de Elon Musk en el acceso a proyectos oficiales. Polémica.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Los recortes en salud de Trump podrían derivar en 1.400 bebés contagiados con SIDA cada día 19 marzo, 2025
    Los datos de una encuesta internacional sugieren que más de un tercio de las organizaciones que dependían de los fondos de Estados Unidos para combatir el virus de la inmunodeficiencia humana (VIH) ya habían cerrado en febrero: el recorte podría producir que alrededor de 1.400 bebés al día se contagien de SIDA en los sitios […]
    Redacción T21
  • Oxígeno oscuro: un enigmático proceso desafía la fotosíntesis en las profundidades del océano 19 marzo, 2025
    Los científicos han descubierto un proceso biológico completamente nuevo en las profundidades del océano. Conocido como 'producción de oxígeno oscuro', permite a ciertas bacterias generar oxígeno sin necesidad de luz ni aire, desafiando los principios establecidos sobre la fotosíntesis.
    Redacción T21
  • Desvelan qué hace única a la consciencia humana 18 marzo, 2025
    Se ha descubierto por primera vez que las neuronas individuales representan los conceptos que aprendemos, independientemente del contexto. Esto permite a los humanos, a diferencia de otros animales, establecer relaciones más elevadas y abstractas.
    Pablo Javier Piacente / T21