Tendencias21
El ritmo de publicación en Twitter permite detectar cuentas robot o spam

El ritmo de publicación en Twitter permite detectar cuentas robot o spam

El ritmo de publicación de tuits, es decir, las horas del día a las que se publican, y su cantidad, permiten distinguir si una cuenta de Twitter está gestionada por una persona, un robot, o se trata de una cuenta corporativa. Así lo demuestra un método diseñado por investigadores del Imperial College de Londres, que en lugar de analizar el contenido de los tuits en busca de spam, como es habitual, propone analizar los tiempos de publicación. Por Carlos Gómez Abajo.

El ritmo de publicación en Twitter permite detectar cuentas robot o spam

El ritmo de publicación de tuits puede diferenciar si la controla una persona, una cuenta corporativa, o un robot. Así lo demuestra una investigación del Imperial College de Londres (Reino Unido), publicada en PloS ONE la semana pasada.

Los investigadores analizaron más de 160.000 tuits de cuentas tanto personales, como pertenecientes a grandes corporaciones, como controladas por robots. Los períodos de actividad alta o baja en Twitter y el tiempo entre tuits sucesivos permiten distinguir los tres tipos de cuentas entre sí, con aproximadamente un 83% de precisión.

Además, los investigadores también han desarrollado un método para predecir cuándo se publicará un nuevo tuit, sabiendo cuándo se publicó el último.

Como era de esperar, informa SINC, el estudio comprobó que las cuentas corporativas tuitean más durante las horas de trabajo, las cuentas personales son más activas en las tardes y noches, y las cuentas robot o bien tuiteataban a intervalos regulares durante el día, o tenían arrebatos repentinos de actividad en una o unas pocas horas específicas.

El autor principal, Aldo Faisal, concluye: «La identificación y clasificación de los tipos específicos de usuarios de Twitter pueden ser útiles para una variedad de propósitos, desde las ciencias sociales computacionales, las campañas publicitarias y las políticas, hasta el filtrado de spam, la persecución de los robos de identidad y la detección de cuentas maliciosas.»

El ritmo de publicación en Twitter permite detectar cuentas robot o spam

Ventajas

La principal ventaja de este método para la detección de spam es, según los investigadores, que abarata y acelera el proceso, en comparación con otros métodos, que se basan en el análisis de contenido.

En la detección de propaganda también es más ventajoso, al no centrarse en el texto sino simplemente en los tiempos de publicación.

Uno de los métodos desarrollados para perseguir el spam en Twitter es el de Juan Martínez-Romo y su equipo, de la Universidad Nacional de Educación a Distancia (UNED).

La herramienta clasifica correctamente el 93,7% de los mensajes maliciosos y el 89,3% de los mensajes válidos. Solo el 6,3% de tuits válidos fueron clasificados erróneamente como basura en el experimento.

La investigación utiliza modelos del lenguaje para detectar el spam y no analiza perfiles de usuarios sino tuits. El método analiza también las páginas webs que se enlazan en los tuits. Por ejemplo, si un tema popular es David Bowie, y el enlace de la página web de un tuit lleva a un portal de productos farmacéuticos, ese mensaje sería clasificado como spam.

Referencia bibliográfica:

Gabriela Tavares, Aldo Faisal. Scaling-Laws of Human Broadcast Communication Enable Distinction between Human, Corporate and Robot Twitter Users. PLoS ONE.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Los recuerdos imborrables se adhieren a algunas neuronas 28 junio, 2024
    Los científicos han descubierto una explicación biológica para los recuerdos a largo plazo, esos que acompañan a una persona prácticamente durante toda la vida. Revelaron que una molécula, KIBRA, sirve como “pegamento” para otras moléculas, consolidando así la formación de la memoria al activar y mantener una etiqueta sináptica persistente, que queda adherida a un […]
    Pablo Javier Piacente
  • Descubren un boquete de seguridad que afecta a todos los dispositivos y conexiones a Internet 28 junio, 2024
    Una vulnerabilidad de seguridad, que afecta a todas las conexiones y dispositivos de Internet, puede eludir firewalls, VPN y otras herramientas de seguridad y permite espiar a cualquier persona, sin necesidad de código malicioso o acceso al dispositivo. No existe una manera fácil de solucionar este problema de seguridad.
    Redacción T21
  • Crean bebés digitales para mejorar la atención sanitaria 27 junio, 2024
    Un equipo de investigadores desarrolló modelos informáticos que simulan los procesos metabólicos únicos de cada bebé: los “gemelos digitales” pueden ayudar a comprender mejor las enfermedades metabólicas raras y otros desafíos que enfrentan los bebés humanos durante los primeros 6 meses de vida, que son críticos para su crecimiento posterior.
    Pablo Javier Piacente
  • La similitud de los vientos espaciales con los de la Tierra 27 junio, 2024
    Los científicos han descubierto corrientes en el espacio que reflejan de manera inquietante los vientos que giran cerca de la superficie de la Tierra, lo que sugiere fuerzas ocultas que los conectan. Este nuevo conocimiento podría proporcionarnos una mejor comprensión de los sistemas ambientales que circulan alrededor del globo y mejorar los pronósticos meteorológicos espaciales […]
    Pablo Javier Piacente
  • Los archivos geológicos anticipan nuestro futuro climático 27 junio, 2024
    Hace 56 millones de años, la erosión del suelo se cuadruplicó en el planeta debido a las fuertes lluvias y las inundaciones de los ríos provocadas por un calentamiento global muy similar al que conocemos hoy.
    Eduardo Martínez de la Fe
  • Ya es posible transmitir el tacto a través de Internet 26 junio, 2024
    Un nuevo estándar para la compresión y transmisión del sentido del tacto mediante Internet sienta las bases para la telecirugía, la teleconducción y nuevas experiencias de juego en línea, entre otras aplicaciones. El flamante estándar HCTI (Haptic Codecs for the Tactile Internet) es para el “tacto digital” lo que son JPEG, MP3 y MPEG para […]
    Pablo Javier Piacente
  • Las primeras muestras de la cara oculta de la Luna ya están en la Tierra 26 junio, 2024
    La cápsula de reingreso de la sonda Chang'e-6 de China, que transporta hasta dos kilogramos de materiales extraídos y perforados de la cuenca más antigua de la Luna ubicada en su lado oscuro, aterrizó este martes 25 de junio en la región de Mongolia Interior y fue rápidamente recuperada, según informó la Administración Nacional del […]
    Pablo Javier Piacente
  • La Tierra tendrá dos soles dentro de 1,3 millones de años y durante 60.000 años 26 junio, 2024
    Dentro de 1,3 millones de años, la Tierra tendrá una especie de segundo sol porque la estrella Gliese 710 se acercará a 1,1 años luz de la Tierra y la veríamos del mismo tamaño que Júpiter. Lo malo es que esa alteración cósmica puede provocar un episodio en nuestro planeta como el que acabó con […]
    Eduardo Martínez de la Fe
  • China descubre grafeno natural en la Luna 25 junio, 2024
    Investigadores chinos han descubierto recientemente grafeno natural de escasas capas por primera vez en la Luna, a partir de las muestras traídas a la Tierra por la sonda Chang'e 5. El hallazgo proporciona nuevos conocimientos sobre las actividades geológicas, la historia evolutiva y las características ambientales de la Luna.
    Pablo Javier Piacente
  • Los incendios forestales extremos se duplicaron en los últimos 20 años en todo el planeta 25 junio, 2024
    Una nueva investigación concluye que la frecuencia e intensidad de los incendios forestales extremos se ha más que duplicado en todo el mundo en las últimas dos décadas, debido al calentamiento global antropogénico y otros factores relacionados. Se trata de la primera ocasión en la cual los científicos pudieron trazar una tendencia global para los […]
    Pablo Javier Piacente