Tendencias21

Wikipedia crea un sistema que multiplica la creación de artículos en las diversas lenguas

Investigadores de Stanford (EE.UU.) y la Fundación Wikimedia han desarrollado un sistema automático que recomienda a los editores de las diversas ediciones de la Wikipedia artículos que faltan en sus propias lenguas, pero que están en lenguas que conocen y que por tanto pueden tomar como referencia. Con ese sistema se duplica o incluso triplica la velocidad de creación de artículos. Por Carlos Gómez Abajo.

Wikipedia crea un sistema que multiplica la creación de artículos en las diversas lenguas

Cada día, gente de todo el mundo visita alguna de las cerca de 300 ediciones de Wikipedia, buscando a través de millones de artículos escritos por decenas de miles de editores voluntarios que construyen y mantienen esta enciclopedia libre.

La mayoría de los visitantes buscan artículos escritos en inglés o alguna de las otras lenguas habladas que dan cuenta de la gran mayoría de los 36 millones de entradas de Wikipedia. Pero dado que más de la mitad de la población mundial es monolingüe, existen lagunas en el conocimiento de una versión en idioma local a otra.

Para ayudar a los editores de diferentes comunidades lingüísticas a identificar importantes artículos que faltan, científicos de la computación de la Universidad Stanford (California, EE.UU.) y la Fundación Wikimedia han creado una herramienta de recomendación que identifica los artículos más importantes que aún no están disponibles en un determinado idioma.

Los editores pueden utilizar estas recomendaciones y, si son multilingües, buscar un artículo en una segunda lengua que les sea familiar u otro tipo de ayuda con el fin de traducir el artículo para los lectores locales de Wikipedia.

De este modo, el sistema primero identifica a un editor en Madagascar que se interesa por la climatología y lee y escribe en malgache y francés, y luego le recomienda trabajar en un artículo sobre El Niño, que está ausente de la Wikipedia malgache. De esta manera el editor puede crear un artículo para personas de este país insular que explica cómo puede influir El Niño en las precipitaciones, lo cual a su vez afecta a la agricultura y las inundaciones.

«Como investigadores universitarios, buscamos proyectos con impacto en el mundo real», dice Jure Leskovec, profesor asistente de ciencias de la computación en Stanford, en la información de ésta. «¿Qué podría tener más impacto que la democratización del acceso al conocimiento?»

Los científicos de la Fundación Wikimedia Ellery Wulczyn y Leila Zia y el estudiante de posgrado de Stanford Robert West completan el equipo de colaboradores.

«Wikipedia tiene enormes cantidades de datos sobre artículos en diferentes idiomas y las relaciones entre ellos», dijo West, doctorando en ciencias de la computación. «Nuestro objetivo era utilizar esos datos para diseñar un sistema que animara a los editores a crear los artículos más importantes que faltan.»

El proceso

Los investigadores comenzaron mediante la creación de listas de todos los artículo de cada idioma, y ​​luego cruzaron estas listas para determinar cuáles son los artículos que faltaban en qué idiomas. Luego, los investigadores estimaron la importancia de cada artículo faltante basándose en la relevancia cultural y geográfica. La idea era clasificar el valor de la creación de cualquier artículo dado que falta en ese idioma en relación con todos los demás artículos que faltan.

«Tuvimos que crear un sistema de clasificación que fuera significativo para los editores de diferentes comunidades culturales y lingüísticas porque Wikipedia está conformada por las opciones de los editores», dice Zia.

Los investigadores plantearon la hipótesis de que un sistema que predijera con exactitud la popularidad de los artículos que faltan atraería a los editores sugiriéndoles que sus esfuerzos voluntarios podrían ofrecer mayor valor a sus comunidades lingüísticas y, presumiblemente, darles mayor satisfacción personal.

Para probar esta premisa, los investigadores diseñaron un complejo experimento. Comenzaron con los 4,9 millones de artículos que existían en la Wikipedia en inglés, y encontraron aquellos que faltaban con respecto a los 1,6 millones de artículos de la Wikipedia en francés.

Luego, los investigadores eligieron los 300.000 artículos más importantes que estaban en la inglesa y faltaban en la francesa. Estos artículos fueron divididos aleatoriamente en tres grupos de 100.000 artículos cada uno y distribuidos a los editores seleccionados.

El quid del experimento incluyó dos grupos de 6.000 editores que habían hecho al menos una edición en las Wikipedias inglesa y francesa en los 12 meses anteriores al experimento. El 25 de junio de 2015, cada uno de estos editores recibió un correo electrónico que le informaba de que faltaban cinco artículos importantes y le sugería que sería un servicio a la comunidad que tradujera uno del inglés al francés.

En un grupo, las cinco opciones fueron asignadas al azar de la lista maestra de artículos importantes que faltaban de la Wikipedia francesa.

Para el segundo grupo, las cinco opciones también fueron extraídas de una lista separada de importantes artículos que faltaban, pero también estaban en sintonía con los presuntos intereses de cada editor, basándose en los artículos que cada uno había editado en el pasado.

Un mes después de enviar sus mensajes de correo electrónico, los investigadores evaluaron la creación de artículos, y encontraron que simplemente podían duplicar la tasa de creación de artículos recomendando artículos al azar. En el segundo grupo se triplicó.

Sobre la base de estos resultados, la Fundación Wikimedia ha desarrollado una herramienta experimental donde los editores pueden encontrar lagunas en la Wikipedia de su idioma local y obtener referencias en otro idioma que les sea familiar.

Arte

Mientras, ha dado comienzo una competición para traducir y publicar artículos en Wikipedia sobre historia del arte europea, organizado por Europeana, la biblioteca digital europea de acceso libre.

Los Ministerios de Cultura de cada nación de la Unión Europea han seleccionado 10 obras de arte de gran valor de los museos de su país, informa la Fundación Wikimedia en su blog. Estas 300 obras van desde la escultura contemporánea irlandesa al arte de cueva español, pasando por pinturas de paisajes de Letonia y manuscritos iluminados de Bulgaria.

Referencia bibliográfica:

Ashwin Paranjape, Robert West, Leila Zia, Jure Leskovec: Improving Website Hyperlink Structure Using Server Logs. arXiv:1512.07258

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Las células de nuestro cerebro se resisten a morir 3 julio, 2024
    Un análisis comparativo de tejido cerebral post mortem y muestras tomadas de pacientes vivos ha revelado por primera vez diferencias significativas en la forma en que se modifican las hebras de ARN (ácido ribonucleico) durante la vida y al momento de morir, exponiendo nuevos objetivos potenciales para el diagnóstico y tratamiento de enfermedades.
    Pablo Javier Piacente
  • Descubren un antiguo mundo perdido en las profundidades de la Antártida 3 julio, 2024
    Un gigantesco sistema fluvial que existió hace millones de años en las profundidades del hielo antártico conformó un verdadero mundo hoy ya extinto: los científicos identificaron restos de un enorme río que existió hace aproximadamente 34 millones de años y dio vida a una zona que actualmente está dominada por grandes masas de hielo.
    Pablo Javier Piacente
  • Jocelyn Bell Burnell, ignorada por el Nobel, reconocida por el mundo científico 3 julio, 2024
    Jocelyn Bell Burnell, descubridora del primer púlsar, quedó excluida del Premio Nobel de Física en 1974, concedido a los científicos con los que había realizado el hallazgo.  Más de 50 años después, fue galardonada con el Premio Breakthrough Especial en Física Fundamental, por toda una vida de liderazgo científico inspirador. El importe del premio lo […]
    Alicia Domínguez, Eduardo Costas (*).
  • Descubierto el ritual más antiguo del mundo, transmitido durante 500 generaciones 2 julio, 2024
    Un ritual ancestral en una cueva de Australia podría ser el más antiguo del mundo: practicado durante 500 generaciones por indígenas australianos, se desarrolla sin interrupciones desde hace 12.000 años hasta la actualidad, aunque fue documentado inicialmente en el siglo XIX. Identificado a partir de restos de viejas fogatas, los científicos creen que podría ser […]
    Pablo Javier Piacente
  • Revelan un nuevo paraíso hidrotermal en las profundidades del océano 2 julio, 2024
    Frente a la costa de Svalbard, en Noruega, a más de 3.000 metros de profundidad, los científicos han descubierto un campo de fuentes hidrotermales a lo largo de la cresta Knipovich, una cadena montañosa submarina. El sitio esconde un oasis de extrañas formas de vida, capaces de prosperar en los ambientes más extremos de la […]
    Pablo Javier Piacente
  • El camino a los viajes espaciales de larga duración empieza a abrirse gracias a la criónica 2 julio, 2024
    La criónica ha conseguido revivir a gusanos y ampliar la ralentización biológica en operaciones a corazón abierto. El siguiente paso será la criopreservación de órganos y organismos enteros de forma reversible a temperaturas bajo cero. Entonces será posible viajar durante cientos de años a planetas lejanos.
    Alejandro Sacristán
  • Una sola molécula podría revertir el envejecimiento en los músculos y el cerebro 1 julio, 2024
    Un nuevo estudio en ratones y células humanas sugiere que una molécula especialmente seleccionada por los investigadores puede ayudar a revertir los signos del envejecimiento en los músculos y el cerebro, al extender los telómeros y modular genes de vital importancia. En concreto, la molécula inyecta dinamismo a una proteína denominada TERT, que es un engranaje […]
    Pablo Javier Piacente
  • El Telescopio Web detecta extrañas formas brillantes sobre Júpiter 1 julio, 2024
    En lo alto de la atmósfera de Júpiter, específicamente en la ionosfera, los astrónomos han identificado con la ayuda del Telescopio Espacial James Webb (JWST), nuevas características extrañas y brillantes. Se ubican en la región situada encima de la tempestuosa Gran Mancha Roja, y serían un reflejo de las potentes tormentas que se desatan en […]
    Pablo Javier Piacente
  • Fabrizio Gagliardi: la IA Generativa está provocando un giro copernicano en cómo hacemos ciencia 1 julio, 2024
    La comunidad científica se ha unido en un consorcio para alumbrar la IA de la ciencia, cuyo lanzamiento europeo tuvo lugar recientemente en Barcelona. Fabrizio Gagliardi, representante del BSC-CNS en ese consorcio, advierte que Europa está lejos de alcanzar el nivel de desarrollo de la IA Generativa que vemos en Estados Unidos.
    Eduardo Martínez de la Fe
  • Una revolucionaria mano biónica se fusiona directamente con el cuerpo humano 30 junio, 2024
    Una nueva mano biónica desarrollada por un grupo de investigadores se basa en una tecnología revolucionaria, capaz de conectar directamente la prótesis robótica a los huesos, músculos y nervios del usuario. Esto permite crear una interfaz humano-máquina, que facilita a la Inteligencia Artificial (IA) la traducción de señales cerebrales en movimientos simples pero precisos.
    Pablo Javier Piacente