Tendencias21

Wikipedia crea un sistema que multiplica la creación de artículos en las diversas lenguas

Investigadores de Stanford (EE.UU.) y la Fundación Wikimedia han desarrollado un sistema automático que recomienda a los editores de las diversas ediciones de la Wikipedia artículos que faltan en sus propias lenguas, pero que están en lenguas que conocen y que por tanto pueden tomar como referencia. Con ese sistema se duplica o incluso triplica la velocidad de creación de artículos. Por Carlos Gómez Abajo.

Wikipedia crea un sistema que multiplica la creación de artículos en las diversas lenguas

Cada día, gente de todo el mundo visita alguna de las cerca de 300 ediciones de Wikipedia, buscando a través de millones de artículos escritos por decenas de miles de editores voluntarios que construyen y mantienen esta enciclopedia libre.

La mayoría de los visitantes buscan artículos escritos en inglés o alguna de las otras lenguas habladas que dan cuenta de la gran mayoría de los 36 millones de entradas de Wikipedia. Pero dado que más de la mitad de la población mundial es monolingüe, existen lagunas en el conocimiento de una versión en idioma local a otra.

Para ayudar a los editores de diferentes comunidades lingüísticas a identificar importantes artículos que faltan, científicos de la computación de la Universidad Stanford (California, EE.UU.) y la Fundación Wikimedia han creado una herramienta de recomendación que identifica los artículos más importantes que aún no están disponibles en un determinado idioma.

Los editores pueden utilizar estas recomendaciones y, si son multilingües, buscar un artículo en una segunda lengua que les sea familiar u otro tipo de ayuda con el fin de traducir el artículo para los lectores locales de Wikipedia.

De este modo, el sistema primero identifica a un editor en Madagascar que se interesa por la climatología y lee y escribe en malgache y francés, y luego le recomienda trabajar en un artículo sobre El Niño, que está ausente de la Wikipedia malgache. De esta manera el editor puede crear un artículo para personas de este país insular que explica cómo puede influir El Niño en las precipitaciones, lo cual a su vez afecta a la agricultura y las inundaciones.

«Como investigadores universitarios, buscamos proyectos con impacto en el mundo real», dice Jure Leskovec, profesor asistente de ciencias de la computación en Stanford, en la información de ésta. «¿Qué podría tener más impacto que la democratización del acceso al conocimiento?»

Los científicos de la Fundación Wikimedia Ellery Wulczyn y Leila Zia y el estudiante de posgrado de Stanford Robert West completan el equipo de colaboradores.

«Wikipedia tiene enormes cantidades de datos sobre artículos en diferentes idiomas y las relaciones entre ellos», dijo West, doctorando en ciencias de la computación. «Nuestro objetivo era utilizar esos datos para diseñar un sistema que animara a los editores a crear los artículos más importantes que faltan.»

El proceso

Los investigadores comenzaron mediante la creación de listas de todos los artículo de cada idioma, y ​​luego cruzaron estas listas para determinar cuáles son los artículos que faltaban en qué idiomas. Luego, los investigadores estimaron la importancia de cada artículo faltante basándose en la relevancia cultural y geográfica. La idea era clasificar el valor de la creación de cualquier artículo dado que falta en ese idioma en relación con todos los demás artículos que faltan.

«Tuvimos que crear un sistema de clasificación que fuera significativo para los editores de diferentes comunidades culturales y lingüísticas porque Wikipedia está conformada por las opciones de los editores», dice Zia.

Los investigadores plantearon la hipótesis de que un sistema que predijera con exactitud la popularidad de los artículos que faltan atraería a los editores sugiriéndoles que sus esfuerzos voluntarios podrían ofrecer mayor valor a sus comunidades lingüísticas y, presumiblemente, darles mayor satisfacción personal.

Para probar esta premisa, los investigadores diseñaron un complejo experimento. Comenzaron con los 4,9 millones de artículos que existían en la Wikipedia en inglés, y encontraron aquellos que faltaban con respecto a los 1,6 millones de artículos de la Wikipedia en francés.

Luego, los investigadores eligieron los 300.000 artículos más importantes que estaban en la inglesa y faltaban en la francesa. Estos artículos fueron divididos aleatoriamente en tres grupos de 100.000 artículos cada uno y distribuidos a los editores seleccionados.

El quid del experimento incluyó dos grupos de 6.000 editores que habían hecho al menos una edición en las Wikipedias inglesa y francesa en los 12 meses anteriores al experimento. El 25 de junio de 2015, cada uno de estos editores recibió un correo electrónico que le informaba de que faltaban cinco artículos importantes y le sugería que sería un servicio a la comunidad que tradujera uno del inglés al francés.

En un grupo, las cinco opciones fueron asignadas al azar de la lista maestra de artículos importantes que faltaban de la Wikipedia francesa.

Para el segundo grupo, las cinco opciones también fueron extraídas de una lista separada de importantes artículos que faltaban, pero también estaban en sintonía con los presuntos intereses de cada editor, basándose en los artículos que cada uno había editado en el pasado.

Un mes después de enviar sus mensajes de correo electrónico, los investigadores evaluaron la creación de artículos, y encontraron que simplemente podían duplicar la tasa de creación de artículos recomendando artículos al azar. En el segundo grupo se triplicó.

Sobre la base de estos resultados, la Fundación Wikimedia ha desarrollado una herramienta experimental donde los editores pueden encontrar lagunas en la Wikipedia de su idioma local y obtener referencias en otro idioma que les sea familiar.

Arte

Mientras, ha dado comienzo una competición para traducir y publicar artículos en Wikipedia sobre historia del arte europea, organizado por Europeana, la biblioteca digital europea de acceso libre.

Los Ministerios de Cultura de cada nación de la Unión Europea han seleccionado 10 obras de arte de gran valor de los museos de su país, informa la Fundación Wikimedia en su blog. Estas 300 obras van desde la escultura contemporánea irlandesa al arte de cueva español, pasando por pinturas de paisajes de Letonia y manuscritos iluminados de Bulgaria.

Referencia bibliográfica:

Ashwin Paranjape, Robert West, Leila Zia, Jure Leskovec: Improving Website Hyperlink Structure Using Server Logs. arXiv:1512.07258

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Detectan extraños pulsos de radio procedentes de un magnetar que desconciertan a los científicos 10 abril, 2024
    Los astrónomos han detectado señales de radio inusuales procedentes de XTE J1810-197, un radiomagnetar o estrella de neutrones ultramagnética situada a 8.100 años luz de distancia de la Tierra, en la constelación de Sagitario. Los resultados son inesperados y sin precedentes: a diferencia de las señales de radio que se han detectado en otros magnetares, […]
    Pablo Javier Piacente
  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente
  • Un lejano mundo deja ver una increíble explosión de luz en sus cielos "metálicos" 8 abril, 2024
    Utilizando datos del Telescopio Espacial CHEOPS de la Agencia Espacial Europea (ESA), cuyo centro de operaciones científicas se localiza en la Universidad de Ginebra, en Suiza, un equipo internacional de científicos logró detectar por primera vez un extraño fenómeno lumínico denominado “gloria” en un exoplaneta: el estallido de luz se apreció en WASP-76b, un mundo […]
    Pablo Javier Piacente
  • El ordenador cuántico desembarca en el mundo universitario 8 abril, 2024
    La última computadora cuántica System One de IBM se ha instalado en el Instituto Politécnico Rensselaer (RPI) en Nueva York. Es la primera máquina cuántica de IBM instalada en un campus universitario de Estados Unidos. Una revolución en el mundo académico que impulsa la formación de un ecosistema cuántico global.
    Eduardo Martínez de la Fe
  • Los cocodrilos imitan a las ballenas antes de aparearse 7 abril, 2024
    Los cocodrilos cortejan a las hembras lanzando un chorro de agua al aire, tal como hacen las ballenas cuando salen a la superficie. A ellas les encantan también los silbidos y las burbujas que les dedican sus parejas antes de aparearse. Se está elaborando un diccionario de cocodrilos.
    Redacción T21