Tendencias21
Una herramienta automática frena el vandalismo en Wikipedia

Una herramienta automática frena el vandalismo en Wikipedia

Investigadores de la Universidad de Alabama en Birmingham (EE.UU.) han creado una herramienta capaz de detectar identidades falsas entre los usuarios que escriben en la Wikipedia. Estas cuentas suelen usarse para escribir a favor de una empresa que paga o para realizar actos de vandalismo contra la información. Por Carlos Gómez Abajo.

Una herramienta automática frena el vandalismo en Wikipedia

Cada vez hay más personas que utilizan varias identidades falsas para escribir textos en la Wikipedia. Las reglas de esta enciclopedia colaborativa estipulan que cada persona puede tener sólo una cuenta, pero la realidad es que Wikipedia no utiliza medios técnicos para que la regla se cumpla.

Estas identidades se pueden utilizar tanto para escribir a favor de una empresa determinada, a cambio de dinero, como para saltarse un bloqueo (en el caso de que la persona haya sido bloqueada por los administradores por vandalismo o mal uso de la Wikipedia); como para crear una opinión mayoritaria fraudulenta sobre algún tema polémico en general, o en el contexto de la edición de Wikipedia.

Actualmente, el proceso para la detección de estas identidades falsas es manual y depende de la experiencia de los administradores, es decir, de que sepan detectar estilos similares de escritura entre varios usuarios aparentemente distintos.

El proceso se complica porque los textos de la Wikipedia suelen ser demasiado cortos como para observar un estilo determinado. Así que la única manera de detectarlas es acceder a las direcciones IP de los usuarios, a las que solo tienen acceso unos pocos administradores, lo que además viola la privacidad de la que presume la propia web.

Llega una solución

Ahora, investigadores de la Universidad de Alabama en Birmingham (EE.UU.) han desarrollado una herramienta automática, que utiliza una base de datos de identidades falsas y los textos escritos por ellas, procedente de investigaciones anteriores realizadas por los administradores de Wikipedia, y que es capaz de detectar a los farsantes sin violar su privacidad.

En un artículo publicado en arxiv.org, Thamar Solorio, Ragib Hasan y Mainul Mizan explican que su herramienta también podrá aplicarse en otros problemas de atribución de autoría de textos cortos, como en la identificación de terroristas en foros web, mensajes de teléfono, tuits y otros ámbitos donde las comunicaciones suelen ser muy breves.

Los investigadores recolectaron datos de 700 investigaciones sobre identidades falsas realizadas por administradores de la Wikipedia. En un ejemplo que citan en su artículo, muestran las similitudes estilísticas de las distintas identidades uno de los autores fraudulentos: no deja un espacio después de cada punto y seguido, sino que empieza directamente con la siguiente frase.

Con este material elaboraron un algoritmo que analiza unas 230 características de escritura, y que logra determinar qué cuentas son falsas con una tasa de acierto, es decir, de concordancia con la decisión de los administradores de la Wikipedia, del 75%.

Mor Naamán, de la universidad Cornell Tech en Nueva York, declara en New Scientist que le gusta el trabajo, y que aún hay mucho margen para mejorar, puesto que el algoritmo utiliza sobre todo rasgos sintácticos y muy pocos marcadores lingüísticos de otro tipo.

En un post reciente publicado en el blog de la Fundación Wikimedia, a la que pertenece la Wikipedia, su directora ejecutiva, Sue Gardner, explica que han bloqueado más de 250 cuentas de usuario por este problema. En el texto, Gardner es especialmente crítica con las empresas que pagan o que encargan a gente escribir artículos o comentarios favorables a ellas en la enciclopedia online por excelencia.

Referencia bibliográfica:

Thamar Solorio, Ragib Hasan, Mainul Mizan: Sockpuppet Detection in Wikipedia: A Corpus of Real-World Deceptive Writing for Linking Identities. arXiv:1310.6772.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Ya es posible transmitir el tacto a través de Internet 26 junio, 2024
    Un nuevo estándar para la compresión y transmisión del sentido del tacto mediante Internet sienta las bases para la telecirugía, la teleconducción y nuevas experiencias de juego en línea, entre otras aplicaciones. El flamante estándar HCTI (Haptic Codecs for the Tactile Internet) es para el “tacto digital” lo que son JPEG, MP3 y MPEG para […]
    Pablo Javier Piacente
  • Las primeras muestras de la cara oculta de la Luna ya están en la Tierra 26 junio, 2024
    La cápsula de reingreso de la sonda Chang'e-6 de China, que transporta hasta dos kilogramos de materiales extraídos y perforados de la cuenca más antigua de la Luna ubicada en su lado oscuro, aterrizó este martes 25 de junio en la región de Mongolia Interior y fue rápidamente recuperada, según informó la Administración Nacional del […]
    Pablo Javier Piacente
  • La Tierra tendrá dos soles dentro de 1,3 millones de años y durante 60.000 años 26 junio, 2024
    Dentro de 1,3 millones de años, la Tierra tendrá una especie de segundo sol porque la estrella Gliese 710 se acercará a 1,1 años luz de la Tierra y la veríamos del mismo tamaño que Júpiter. Lo malo es que esa alteración cósmica puede provocar un episodio en nuestro planeta como el que acabó con […]
    Eduardo Martínez de la Fe
  • China descubre grafeno natural en la Luna 25 junio, 2024
    Investigadores chinos han descubierto recientemente grafeno natural de escasas capas por primera vez en la Luna, a partir de las muestras traídas a la Tierra por la sonda Chang'e 5. El hallazgo proporciona nuevos conocimientos sobre las actividades geológicas, la historia evolutiva y las características ambientales de la Luna.
    Pablo Javier Piacente
  • Los incendios forestales extremos se duplicaron en los últimos 20 años en todo el planeta 25 junio, 2024
    Una nueva investigación concluye que la frecuencia e intensidad de los incendios forestales extremos se ha más que duplicado en todo el mundo en las últimas dos décadas, debido al calentamiento global antropogénico y otros factores relacionados. Se trata de la primera ocasión en la cual los científicos pudieron trazar una tendencia global para los […]
    Pablo Javier Piacente
  • Detectado en el Mediterráneo el neutrino más energético del universo 25 junio, 2024
    El neutrino más potente jamás observado ha dejado su huella en las profundidades del Mediterráneo, aunque todavía se desconoce de qué rincón del universo procede. Los neutrinos cosmogénicos son los mensajeros de algunos de los eventos más cataclísmicos del cosmos.
    Eduardo Martínez de la Fe
  • La IA identifica seis formas diferentes de depresión 24 junio, 2024
    Los científicos han identificado seis formas biológicamente distintas de depresión gracias a la aplicación de la Inteligencia Artificial (IA) en estudios cerebrales. El hallazgo podría explicar por qué algunas personas no responden a los tratamientos tradicionales para la afección, como los antidepresivos y la terapia psicológica.
    Pablo Javier Piacente
  • La NASA pondrá en órbita una estrella artificial que revolucionará el estudio del Universo 24 junio, 2024
    La NASA encarará un ambicioso proyecto para colocar en órbita una estrella artificial: permitirá la calibración de telescopios a niveles previamente inalcanzables. El proyecto tiene como objetivo mejorar significativamente las mediciones de la luminosidad estelar y abordar varios otros desafíos que dificultan la astrofísica moderna.
    Pablo Javier Piacente
  • Los macacos nos enseñan cómo sobrevivir a un desastre natural 24 junio, 2024
    Los macacos de la isla caribeña de Puerto Rico se volvieron más tolerantes y menos agresivos después del huracán María, que los obligó a compartir la sombra de los árboles para sobrevivir al intenso calor.
    Redacción T21
  • Extrañas formas de vida se ocultan en antiguas cuevas de lava de Hawai 23 junio, 2024
    Científicos estadounidenses han logrado identificar una gran diversidad de especies microbianas únicas, que se han desarrollado en cuevas geotérmicas, tubos de lava y fumarolas volcánicas de la isla de Hawái. Estas estructuras subterráneas se formaron hace entre 65 y 800 años y reciben poca o ninguna luz solar, en ambientes similares a los que pueden encontrarse […]
    Pablo Javier Piacente