Tendencias21
Crean un buscador multilingüe de imágenes en Internet

Crean un buscador multilingüe de imágenes en Internet

Un nuevo software ideado por informáticos de la universidad de Washington ha permitido crear un buscador capaz de rastrear imágenes en la web usando cientos de lenguas diferentes. El potente cerebro de PanImages, que es como lo han bautizado, escanea 350 diccionarios online y usa un algoritmo para encontrar resultados precisos. Según sus creadores, esta herramienta va a favorecer sobre todo a los internautas de países o regiones del mundo que tengan poca presencia en la web. En la actualidad ya es capaz de buscar imágenes en 300 idiomas diferentes e incluye más de 2,5 millones de palabras. Por Raúl Morales

Crean un buscador multilingüe de imágenes en Internet

Informáticos de la universidad de Washington han desarrollado un buscador de imágenes en Internet multilingüe. Según los creadores de PanImages, esta herramienta hará accesibles las imágenes que circulan por la red a todo el mundo, ya que permite buscar imágenes usando cientos de lenguas.

Desde la caída de la Torre de Babel hasta el Esperanto, uno de los sueños de la humanidad ha sido compartir una misma lengua. Internet parecía que nos iba a situar más cerca de este sueño, pero la realidad es que, por ejemplo, millones de fotografías en Internet no se pueden encontrar porque nadie las ha traducido.

“Las imágenes son universales, pero los buscadores de imágenes no”, dice Oren Etzoni, profesor de informática en la universidad de Washington que ha estado al frente de este proyecto. “Una persona que teclea su búsqueda en inglés, evidentemente, no va a encontrar fotografías clasificadas en chino y un alemán no podrá encontrar imágenes etiquetadas en inglés. Lo que hemos hecho es crear una herramienta colaborativa para resolver este problema”, afirma en un comunicado de la universidad.

Los buscadores como Google buscan imágenes detectando el término de búsqueda en los pies de foto o en otros textos cercanos. Dado que el proceso busca series de letras, los resultados están limitados a la lengua materna de quien busca la imagen.

PanImage (“pan” significa en griego “todo”) es capaz de traducir automáticamente un término de búsqueda en unas 300 lenguas diferentes, sugiriendo algunas que pueden estar más acordes a la búsqueda y mostrando las imágenes a partir de Google y la base de datos fotográfica Flickr.

Esta herramienta sobre todo ayudará a internautas que hablan lenguas minoritarias y que tienen una limitada presencia en la web. Por ejemplo, si un hablante zulú busca una imagen de un frigorífico en un buscador y teclea “ifriji”, que es cómo se dice en su lengua, sólo obtendrá dos resultados. Sin embargo, si lo introduce en PanImage, tendrá 472.000 fotografías a su disposición. En un texto de una lengua minoritaria, PanImage es capaz de encontrar 57 veces más resultados que el buscador de imágenes de Google.

“Queremos servir al gran número de internautas que no habla una lengua mayoritaria”, comenta Etzioni. “Internet es cada vez más accesible en muchos países que no forman parte de las naciones industrializadas, por eso es cada vez más importante dar este tipo de servicios a personas que no hablan inglés, francés o chino”.

Escanear diccionarios

El potente cerebro de PanImages fue creado escaneando más de 350 diccionarios online. Algunos de ellos eran “wikidiccionarios”, diccionarios multilingües escritos por voluntarios.

El software de PanImages escanea estos diccionarios y usa un algoritmo para encontrar los resultados más precisos. Después, el sistema ensambla los resultados en una matriz que permite la traducción en combinaciones que nunca han sido intentadas antes, por ejemplo del lituano.

“Es un recurso léxico que no tiene precedentes. Lo que distingue este buscador de otros es su habilidad para escalar tal cantidad de lenguas. Nuestro último objetivo es cubrir finalmente todas las lenguas en las que la gente esté interesada”, comenta Etzioni.

Para todos

Incluso las personas que hablan estas lenguas mayoritarias se pueden beneficiar de PanImage. Las palabras que tienen más de un significado inevitablemente producen resultados no deseados cuando son buscadas. Por ejemplo, si buscamos “spring” en inglés obtendremos resultados muy diversos: un prado, un rollo de metal e imágenes de una ciudad norteamericana llamada Silver Spring. En este caso, y si queremos buscar el significado “rollo de metal”, sería posible introducir en PanImage la palabra francesa “ressort”, que es mucho más precisa.

Los experimentos hechos con lenguas más comunes han puesto de manifiesto que PanImage dobla el número de imágenes correctas en las quince primeras páginas de resultados.

Los servicios de traducción online gratuitos usados por Yahoo y Google incorporan únicamente dos docenas de lenguas. Y se dan situaciones como que en los Estados Unidos, si usamos un traductor, la tendencia es que se centre en lenguas que tienen una relevancia militar, como el chino o el árabe.

PanImages tenía 50 lenguas a principios de año y en junio ya había alcanzado las 100. Ahora mismo incluye unas 300 y 2,5 millones de palabras.

Sus creadores seguirán desarrollando esta herramienta rastreando más diccionarios online para aumentar el número de palabras y lenguas que puede manejar. Asimismo, quieren traducir las palabras usadas en páginas que etiquetan palabras, tipo del.icio.us, donde los usuarios utilizan una única palabra para describir el contenido de una página web.

Los resultados de las investigaciones y pruebas hechas con PanImages fueron presentados recientemente en el Machina Translation Summit que se celebró en Copenhague.

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren cómo Plutón consiguió su corazón 16 abril, 2024
    El misterio de cómo Plutón consiguió una característica gigante en forma de corazón en su superficie finalmente ha sido resuelto: los científicos lograron reproducir con éxito la forma inusual con simulaciones numéricas, atribuyéndola a un impacto gigante y lento en ángulo oblicuo. Se trató de una colisión con un cuerpo planetario de unos 700 kilómetros […]
    Pablo Javier Piacente
  • La vida podría existir desde los inicios del Universo 16 abril, 2024
    El físico Avi Loeb sostiene en un reciente artículo que los elementos para el desarrollo de la vida tal como la conocemos podrían estar presentes en el cosmos desde la formación de las primeras estrellas, unos 100 millones de años después del Big Bang. También postula que esta hipótesis podría comprobarse si la misión Dragonfly […]
    Pablo Javier Piacente
  • Crean un acelerador de partículas en miniatura con aplicaciones médicas 16 abril, 2024
    Investigadores alemanes han desarrollado un acelerador de electrones que mide poco menos de medio milímetro de largo y 0,2 micrómetros de ancho, es decir, menos de una milésima de milímetro. Tiene aplicaciones en la investigación básica y permitirá crear nuevas herramientas de radioterapia. Entrevista con sus protagonistas, Peter Hommelhoff y Stefanie Kraus.
    Oscar William Murzewitz (Welt der Physik)/T21
  • Revelan la primera molécula fractal en la naturaleza 15 abril, 2024
    Los científicos han descubierto una molécula en la naturaleza que sigue un patrón geométrico de autosimilitud, conocido como fractal. La enzima microbiana denominada citrato sintasa es la primera estructura fractal molecular ensamblada directamente en la naturaleza que ha logrado identificarse hasta el momento. Los especialistas creen que este fractal puede representar un accidente evolutivo.
    Pablo Javier Piacente
  • El cambio climático podría estar relacionado con el aumento de los accidentes cerebrovasculares 15 abril, 2024
    Una nueva investigación ha demostrado que el número de muertes ligadas a accidentes cerebrovasculares y otras patologías relacionadas ha ido creciendo desde 1990, a la par del aumento de las temperaturas extremas. Durante 2019, el último año analizado, más de 500.000 muertes por accidentes cerebrovasculares se vincularon con temperaturas "no óptimas", provocadas por el calentamiento […]
    Pablo Javier Piacente
  • La globalización está fracturando a la humanidad 15 abril, 2024
    La globalización no está conduciendo a una civilización universal con valores compartidos, sino que está creando una brecha creciente entre los países occidentales de altos ingresos y el resto del mundo, en cuanto a valores como la tolerancia, la diversidad y la libertad.
    Eduardo Martínez de la Fe
  • En el caso de los caracoles, el huevo fue lo primero 14 abril, 2024
    Un caracol marino que primero fue ovíparo y evolucionó hacia la viviparidad revela que los saltos evolutivos ocurren gradualmente, a través de una serie de pequeños cambios.
    Redacción T21
  • Revelan el misterio del árbol tropical que camina 13 abril, 2024
    La denominada "palma caminante" o Socratea exorrhiza es un árbol de América Central y del Sur que según distintas versiones podría "caminar" y erguirse en determinadas situaciones: ahora, este mito parece haber sido resuelto bajo criterios científicos. Según los investigadores, aunque el árbol puede crecer rápidamente y crear nuevas raíces para lidiar con la pérdida […]
    Pablo Javier Piacente
  • Descubren 50 especies desconocidas para la ciencia en la exótica Isla de Pascua 12 abril, 2024
    Una expedición a la Cordillera de Salas y Gómez, frente a Rapa Nui, en el Océano Pacífico, documentó 160 especies animales que no se sabía que habitaban esta región de la misteriosa Isla de Pascua, en Chile. Además, descubrieron 50 criaturas que son absolutamente nuevas para la ciencia.
    Pablo Javier Piacente
  • El clima espacial podría generar un caos satelital sin precedentes 12 abril, 2024
    Los satélites en órbita terrestre baja (LEO) pueden perder su brújula cuando el clima espacial ofrece situaciones inesperadas. El problema afecta a la Estación Espacial Internacional, la estación espacial Tiangong de China y muchos satélites de observación de la Tierra. Los expertos sostienen que esta incertidumbre de posicionamiento aumenta el riesgo de colisiones orbitales peligrosas, […]
    Pablo Javier Piacente