Tendencias21
Una herramienta automática frena el vandalismo en Wikipedia

Una herramienta automática frena el vandalismo en Wikipedia

Investigadores de la Universidad de Alabama en Birmingham (EE.UU.) han creado una herramienta capaz de detectar identidades falsas entre los usuarios que escriben en la Wikipedia. Estas cuentas suelen usarse para escribir a favor de una empresa que paga o para realizar actos de vandalismo contra la información. Por Carlos Gómez Abajo.

Una herramienta automática frena el vandalismo en Wikipedia

Cada vez hay más personas que utilizan varias identidades falsas para escribir textos en la Wikipedia. Las reglas de esta enciclopedia colaborativa estipulan que cada persona puede tener sólo una cuenta, pero la realidad es que Wikipedia no utiliza medios técnicos para que la regla se cumpla.

Estas identidades se pueden utilizar tanto para escribir a favor de una empresa determinada, a cambio de dinero, como para saltarse un bloqueo (en el caso de que la persona haya sido bloqueada por los administradores por vandalismo o mal uso de la Wikipedia); como para crear una opinión mayoritaria fraudulenta sobre algún tema polémico en general, o en el contexto de la edición de Wikipedia.

Actualmente, el proceso para la detección de estas identidades falsas es manual y depende de la experiencia de los administradores, es decir, de que sepan detectar estilos similares de escritura entre varios usuarios aparentemente distintos.

El proceso se complica porque los textos de la Wikipedia suelen ser demasiado cortos como para observar un estilo determinado. Así que la única manera de detectarlas es acceder a las direcciones IP de los usuarios, a las que solo tienen acceso unos pocos administradores, lo que además viola la privacidad de la que presume la propia web.

Llega una solución

Ahora, investigadores de la Universidad de Alabama en Birmingham (EE.UU.) han desarrollado una herramienta automática, que utiliza una base de datos de identidades falsas y los textos escritos por ellas, procedente de investigaciones anteriores realizadas por los administradores de Wikipedia, y que es capaz de detectar a los farsantes sin violar su privacidad.

En un artículo publicado en arxiv.org, Thamar Solorio, Ragib Hasan y Mainul Mizan explican que su herramienta también podrá aplicarse en otros problemas de atribución de autoría de textos cortos, como en la identificación de terroristas en foros web, mensajes de teléfono, tuits y otros ámbitos donde las comunicaciones suelen ser muy breves.

Los investigadores recolectaron datos de 700 investigaciones sobre identidades falsas realizadas por administradores de la Wikipedia. En un ejemplo que citan en su artículo, muestran las similitudes estilísticas de las distintas identidades uno de los autores fraudulentos: no deja un espacio después de cada punto y seguido, sino que empieza directamente con la siguiente frase.

Con este material elaboraron un algoritmo que analiza unas 230 características de escritura, y que logra determinar qué cuentas son falsas con una tasa de acierto, es decir, de concordancia con la decisión de los administradores de la Wikipedia, del 75%.

Mor Naamán, de la universidad Cornell Tech en Nueva York, declara en New Scientist que le gusta el trabajo, y que aún hay mucho margen para mejorar, puesto que el algoritmo utiliza sobre todo rasgos sintácticos y muy pocos marcadores lingüísticos de otro tipo.

En un post reciente publicado en el blog de la Fundación Wikimedia, a la que pertenece la Wikipedia, su directora ejecutiva, Sue Gardner, explica que han bloqueado más de 250 cuentas de usuario por este problema. En el texto, Gardner es especialmente crítica con las empresas que pagan o que encargan a gente escribir artículos o comentarios favorables a ellas en la enciclopedia online por excelencia.

Referencia bibliográfica:

Thamar Solorio, Ragib Hasan, Mainul Mizan: Sockpuppet Detection in Wikipedia: A Corpus of Real-World Deceptive Writing for Linking Identities. arXiv:1310.6772.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Un árbol fosilizado hace 350 millones de años sorprende a los científicos: parece alienígena 11 febrero, 2024
    Un fósil tridimensional de árboles más antiguos que los dinosaurios revela que los bosques de hace 350 millones de años eran extraños y alienígenas. Formaban parte de un bosquecillo que fue sepultado después de un terremoto.
    Redacción T21
  • El meteorito de Berlín resultó ser un raro objeto de origen ígneo 11 febrero, 2024
    El asteroide que se desintegró sobre Berlín a mediados de enero pertenece a un tipo raro de meteorito de origen ígneo. Se compone principalmente de silicatos de magnesio, enstatita y forsterita, además casi no contiene hierro y tiene una corteza vítrea translúcida.
    Redacción T21
  • Descubren un helecho tropical que transforma sus hojas muertas en nuevas raíces 9 febrero, 2024
    Para sobrevivir en el suelo anegado y bajo en nutrientes del bosque de Quebrada Chorro, en el oeste de Panamá, una especie de helecho tropical arborescente reutiliza sus hojas muertas, convirtiéndolas en nuevas raíces. Los científicos descubrieron que el helecho reconfigura estas “hojas zombis”, invirtiendo el flujo de agua para atraer nutrientes de regreso a […]
    Pablo Javier Piacente
  • Descubren una extraña combinación de minerales en las muestras lunares de la misión Chang'e-5 de China 9 febrero, 2024
    Los minerales antiguos y nuevos identificados en las muestras lunares traídas por la misión Chang'e-5 de China están ayudando a los científicos a comprender mejor la historia de la Luna: ahora, los especialistas han descubierto más propiedades del sexto nuevo mineral lunar, llamado Changesite-(Y). Además, otros compuestos hallados, la seifertita y la stishovita, pueden coexistir […]
    Pablo Javier Piacente
  • Los robots que atienden a pacientes llegan a los hospitales 9 febrero, 2024
    Robots diseñados para brindar comodidad a los pacientes de edad avanzada y aliviar su ansiedad, han sido probados con éxito en un hospital de París: saludan, responden a preguntas, comprenden conversaciones grupales y apoyan las tareas de enfermería.
    Redacción T21
  • Una pequeña luna de Saturno parecida a la “Estrella de la Muerte” de Star Wars contiene un océano oculto 8 febrero, 2024
    Por debajo de la superficie repleta de cráteres de Mimas, una de las lunas más pequeñas de Saturno, se esconde un océano global de agua líquida de reciente formación. El satélite posee tan sólo unos 400 kilómetros de diámetro y presenta un notable parecido con la “Estrella de la Muerte”, una estación espacial imperial que […]
    Pablo Javier Piacente
  • Logran controlar un objeto virtual con la mente durante un sueño lúcido 8 febrero, 2024
    Un grupo de participantes en un nuevo estudio científico logró manejar un vehículo virtual a través de un avatar únicamente con su mente, mientras sus cerebros permanecían en la fase REM del sueño. Además de profundizar en los misterios de la consciencia humana, la innovación podría facilitar el acceso a nuevos desarrollos tecnológicos, como un […]
    Pablo Javier Piacente
  • Un proyecto global trabaja para crear de forma colaborativa un cerebro robótico general 8 febrero, 2024
    El auge de la inteligencia artificial generativa impulsa un proyecto global que trabaja para crear un cerebro robótico general, capaz de generar androides como los que hemos visto hasta ahora solo en la ciencia ficción. Pero es cuestión de tiempo que convivamos con ellos en perfecta armonía. Ya no es una utopía.
    Eduardo Martínez de la Fe
  • La IA está capacitada para resolver dilemas morales cuando conduce vehículos autónomos 8 febrero, 2024
    Los sistemas de IA muestran significativas similitudes éticas con las reacciones humanas ante dilemas morales, lo que los acreditan para conducir vehículos autónomos tal como lo harían las personas.
    Redacción T21
  • Los huracanes se están volviendo tan fuertes que ya no existen categorías para clasificarlos 7 febrero, 2024
    Cinco tormentas en la última década tuvieron velocidades de viento que pertenecen a una hipotética categoría 6 en la escala de huracanes Saffir-Simpson: el fenómeno obligaría a los científicos a crear una nueva clasificación, capaz de reflejar la virulencia de los huracanes en la actualidad. Las causas principales del fenómeno tienen su origen en el […]
    Pablo Javier Piacente