Crean una herramienta que detecta noticias falsas

En respuesta a la rápida difusión de las las noticias falsas, investigadores del Instituto Fraunhofer para la comunicación, el procesamiento de la información y la ergonomía (FKIE), en Alemania, han desarrollado un sistema que analiza automáticamente las publicaciones en las redes sociales, filtrando deliberadamente las noticias falsas y la desinformación.

La herramienta analiza el contenido y los metadatos, clasificándolos usando técnicas de aprendizaje automático y aprovechando la interacción del usuario para optimizar los resultados a medida que avanza.

Tanto los organismos públicos como las empresas pueden usar la herramienta para identificar y combatir noticias falsas. “Nuestro software puede ser personalizado y capacitado para satisfacer las necesidades de cualquier cliente. Para los organismos públicos, puede ser un sistema útil de alerta temprana”, explica el profesor lingüista y matemático Ulrich Schade, de Fraunhofer FKIE, en un comunicado.

Lucha contr la desinformación

Las noticias falsas están diseñadas para provocar una respuesta específica o incitar a la agitación contra un individuo o un grupo de personas. Su objetivo es influir y manipular la opinión pública sobre temas específicos del día. Estas noticias falsas pueden propagarse muy rápidamente a través de Internet, particularmente en las redes sociales como Facebook o Twitter. Además, identificarlo puede ser una tarea difícil.

Aquí es donde entra en juego esta nueva herramienta de clasificación, que analiza automáticamente las publicaciones en las redes sociales y procesa grandes cantidades de datos. Además de procesar el texto, también incluye los metadatos (datos sobre datos) en su análisis y ofrece sus hallazgos de forma visual.

“Nuestro software se centra en Twitter y otros sitios web. En los tweets se encuentran los enlaces de las páginas web que contienen las verdaderas noticias falsas”, explica Schade. “Las noticias falsas a menudo se alojan en sitios web diseñados para imitar la presencia en la web de las agencias de noticias y pueden ser difíciles de distinguir de los sitios reales. En muchos casos, se basarán en noticias oficiales en las que se modificó la redacción”.

Software de aprendizaje automático

Schade y su equipo comenzaron el proceso construyendo bibliotecas compuestas por noticias serias y también textos que los usuarios han identificado como noticias falsas. Estos forman los conjuntos de aprendizaje utilizados para entrenar el sistema.

Para filtrar las noticias falsas, los investigadores emplean técnicas de aprendizaje automático que buscan marcadores específicos en textos y metadatos. Por ejemplo, en un contexto político, podría tratarse de formulaciones o combinaciones de palabras que raramente aparecen en el lenguaje cotidiano o en los informes periodísticos, como «el actual canciller de Alemania».

Los errores lingüísticos también son un objetivo. Esto es particularmente común cuando el autor de las noticias falsas estaba escribiendo en un idioma diferente al de su lengua materna. En tales casos, la puntuación incorrecta, la ortografía, las formas verbales o la estructura de la oración son advertencias de una posible noticia falsa.

“Cuando suministramos al sistema una serie de marcadores, la herramienta aprende por sí misma a seleccionar los marcadores que funcionan. Otro factor decisivo es elegir el enfoque de aprendizaje automático que proporcionará los mejores resultados. Es un proceso que consume mucho tiempo, ya que tiene que ejecutar los distintos algoritmos con diferentes combinaciones de marcadores ”, explica Schade.

Los metadatos dan pistas vitales

Los metadatos desempeñan un papel crucial en la diferenciación entre fuentes de información auténticas y noticias falsas. El momento y la frecuencia de las publicaciones pueden ser muy reveladores.

Una alta frecuencia de envío sugiere el uso de bots, lo que aumenta la probabilidad de una noticia falsa. Los robots sociales envían sus enlaces a una gran cantidad de usuarios, por ejemplo, para difundir la incertidumbre entre el público. Las conexiones y los seguidores de una cuenta también pueden ser un terreno fértil para los analistas.

Estos datos permiten a los investigadores crear mapas de calor y gráficos de envío de datos, frecuencia de envío y redes de seguidores. Estas estructuras de red y sus nodos individuales se pueden usar para calcular qué nodo de la red hizo circular un artículo de noticias falsas o inició una campaña de desinformación.

Contra a intolerancia

Otra característica de la herramienta automatizada es su capacidad para detectar discursos de odio. Las publicaciones que se hacen pasar por noticias, pero también incluyen discursos de odio, a menudo se vinculan con noticias falsas. “Lo importante es desarrollar un marcador capaz de identificar casos claros de discurso de odio. Los ejemplos incluyen expresiones tales como ‘escoria política’ o ‘nigger’ (insulto racista en inglés)”, explica Schade. Los investigadores pueden adaptar su sistema a varios tipos de texto para clasificarlos.