Tendencias21
Twitter revela dónde vives, incluso con la geolocalización desactivada

Twitter revela dónde vives, incluso con la geolocalización desactivada

Investigadores de IBM Research han demostrado la capacidad de Twitter para desvelar la localización de sus usuarios, a pesar de no geoetiquetar los mensajes. Para hacerlo, han presentado un algoritmo capaz de determinar la región, zona horaria, ciudad o incluso dirección exacta con una precisión de casi el 70 por ciento, valiéndose únicamente del contenido de los últimos tuits. La herramienta podría ser especialmente útil para investigadores, periodistas o publicistas. Por Patricia Pérez.

Twitter revela dónde vives, incluso con la geolocalización desactivada

Una de las opciones extra que permite configurar la red de microblog Twitter es la posibilidad de etiquetar cada tuit con los datos de localización del usuario. Resulta útil cuando se quiere hacer pública la ubicación o para recordar posteriormente dónde se posteó determinado mensaje. Además, se trata de una herramienta valiosa para los investigadores interesados en el estudio de la distribución geográfica de los tuits desde diferentes perspectivas.

Sin embargo, también plantea problemas de privacidad, sobre todo cuando los usuarios no son conscientes u olvidan que sus tuits son geoetiquetados. Es lo que ha ocurrido a varias celebridades, que han ofrecido sus direcciones particulares de esta manera de forma inconsciente. En 2007, cuatro helicópteros Apache pertenecientes al Ejército de EEUU cayeron en un bombardeo con proyectiles de mortero en Irak cuando insurgentes calcularon su ubicación utilizando imágenes georeferenciadas publicadas por los soldados estadounidenses.

Preocupaciones como estas son las que tal vez motivan que se geoetiqueten tan pocos tuits. De hecho, varios estudios han demostrado que menos del uno por ciento de los mensajes en la popular red social contiene metadatos de ubicación. Sin embargo, la ausencia de datos de geolocalización no significa que la ubicación sea secreta.

Eso es lo que ha demostrado un equipo de investigadores de IBM Research, en Estados Unidos, al desarrollar un algoritmo capaz de determinar la ublicación en la ciudad e incluso la dirección exacta de un usuario con una precisión de casi el 70 por ciento, analizando los 200 últimos tuits.

La herramienta podría ser de gran utilidad para investigadores, periodistas o publicistas que quieran identifican el origen de los tuits, aunque al mismo tiempo plantea problemas de privacidad para aquellos que prefieren resguardar su privacidad.

Twitter revela dónde vives, incluso con la geolocalización desactivada

Clasificación jerárquica

A diferencia de estudios anteriores, este algoritmo utiliza un enfoque de clasificación jerárquica, donde la zona horaria, estado o región geográfica se prevé primero y, a partir de ahí, se calcula la ciudad para mejorar la precisión de la predicción. Para conseguirlo, el equipo liderado por Jalal Mahmud ha utilizado un método relativamente sencillo.

Según un artículo publicado por el Instituto Tecnológico de Massachusetts (MIT), el trabajo comenzó con el filtrado de tuits geolocalizados entre julio y agosto de 2011 en cualquiera de las 100 ciudades más grandes de EEUU, hasta encontrar 100 usuarios diferentes en cada lugar.

Una vez seleccionados descargaron los 200 últimos mensajes publicados por cada uno, a excepción de los privados. El resultado fue más de 1,5 millones de tuits con etiquetas geográficas de casi 10.000 personas. El siguiente paso fue dividir este conjunto en dos, utilizando el 90 por ciento para entrenar al algoritmo y el 10 restante para probarlo en contra.

La idea básica que sustenta el algoritmo es que los tuits contienen información relevante sobre la posible ubicación del usuario. Por ejemplo, más de 100.000 mensajes procedían directamente de la red social de localización Foursquare, por lo que contenían un enlace exacto a la ubicación. Casi 300.000 incluían el nombre de ciudades, y otros tantos pistas sobre la ubicación, con frases como «Vamos Red Sox», en referencia al equipo de béisbol de Boston.

Mahmud y su equipo comprobó que la distribución de tuits durante el día es más o menos constante, lo que puede dar una buena indicación de la zona horaria en la que se incluye cada uno. Con toda esta información se propusieron averiguar la dirección real de un usuario, comparándola con los metadatos etiquetados por el mismo.

Para ello utilizaron un algoritmo conocido como Naive Bayes Multimonial, todo un devorador de números. Tras entrenarlo con los datos recogidos con la geolocalización, lo pusieron a prueba con el 10 por ciento restante para comprobar si era capaz de predecir la ubicación.

Aplicaciones

Según las conclusiones del estudio, publicadas en arXiv, la evidencia experimental sugiere un buen funcionamiento en la práctica, superando los mejores algoritmos existentes hasta el momento para predecir la ubicación exacta de los usuarios de Twitter. En concreto, el algoritmo predice correctamente la ciudad el 68 por ciento de las veces, el estado el 70 por ciento, y la zona horaria el 80 por ciento. Y todo ello en menos de un segundo.

Comprobados los resultados, las aplicaciones podrían ser diversas. Los periodistas podrían utilizarlo para determinar los tuits procedentes de una región en crisis, afectada por ejemplo por un terremoto. Los vendedores para calcular la popularidad de sus productos en determinadas ciudades. Y también sugiere una forma de que la gente proteja su privacidad: no mencionando su localización, evidentemente.

Con todo, el equipo de IBM espera mejorar su algoritmo en el futuro. Por ejemplo, piensan que pueden afinar aún más la localización mediante la búsqueda en los tuits de menciones a monumentos o emblemas locales. Habrá que esperar a ver si es posible.

De momento su hallazgo abre un abanico de posibilidades para unos mientras muestra la fragilidad de la vida privada para el resto, pues queda expuesta en las redes sociales incluso de forma inconsciente. Cómo protegerla debería ser tema de un debate público importante.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Los recuerdos imborrables se adhieren a algunas neuronas 28 junio, 2024
    Los científicos han descubierto una explicación biológica para los recuerdos a largo plazo, esos que acompañan a una persona prácticamente durante toda la vida. Revelaron que una molécula, KIBRA, sirve como “pegamento” para otras moléculas, consolidando así la formación de la memoria al activar y mantener una etiqueta sináptica persistente, que queda adherida a un […]
    Pablo Javier Piacente
  • Descubren un boquete de seguridad que afecta a todos los dispositivos y conexiones a Internet 28 junio, 2024
    Una vulnerabilidad de seguridad, que afecta a todas las conexiones y dispositivos de Internet, puede eludir firewalls, VPN y otras herramientas de seguridad y permite espiar a cualquier persona, sin necesidad de código malicioso o acceso al dispositivo. No existe una manera fácil de solucionar este problema de seguridad.
    Redacción T21
  • Crean bebés digitales para mejorar la atención sanitaria 27 junio, 2024
    Un equipo de investigadores desarrolló modelos informáticos que simulan los procesos metabólicos únicos de cada bebé: los “gemelos digitales” pueden ayudar a comprender mejor las enfermedades metabólicas raras y otros desafíos que enfrentan los bebés humanos durante los primeros 6 meses de vida, que son críticos para su crecimiento posterior.
    Pablo Javier Piacente
  • La similitud de los vientos espaciales con los de la Tierra 27 junio, 2024
    Los científicos han descubierto corrientes en el espacio que reflejan de manera inquietante los vientos que giran cerca de la superficie de la Tierra, lo que sugiere fuerzas ocultas que los conectan. Este nuevo conocimiento podría proporcionarnos una mejor comprensión de los sistemas ambientales que circulan alrededor del globo y mejorar los pronósticos meteorológicos espaciales […]
    Pablo Javier Piacente
  • Los archivos geológicos anticipan nuestro futuro climático 27 junio, 2024
    Hace 56 millones de años, la erosión del suelo se cuadruplicó en el planeta debido a las fuertes lluvias y las inundaciones de los ríos provocadas por un calentamiento global muy similar al que conocemos hoy.
    Eduardo Martínez de la Fe
  • Ya es posible transmitir el tacto a través de Internet 26 junio, 2024
    Un nuevo estándar para la compresión y transmisión del sentido del tacto mediante Internet sienta las bases para la telecirugía, la teleconducción y nuevas experiencias de juego en línea, entre otras aplicaciones. El flamante estándar HCTI (Haptic Codecs for the Tactile Internet) es para el “tacto digital” lo que son JPEG, MP3 y MPEG para […]
    Pablo Javier Piacente
  • Las primeras muestras de la cara oculta de la Luna ya están en la Tierra 26 junio, 2024
    La cápsula de reingreso de la sonda Chang'e-6 de China, que transporta hasta dos kilogramos de materiales extraídos y perforados de la cuenca más antigua de la Luna ubicada en su lado oscuro, aterrizó este martes 25 de junio en la región de Mongolia Interior y fue rápidamente recuperada, según informó la Administración Nacional del […]
    Pablo Javier Piacente
  • La Tierra tendrá dos soles dentro de 1,3 millones de años y durante 60.000 años 26 junio, 2024
    Dentro de 1,3 millones de años, la Tierra tendrá una especie de segundo sol porque la estrella Gliese 710 se acercará a 1,1 años luz de la Tierra y la veríamos del mismo tamaño que Júpiter. Lo malo es que esa alteración cósmica puede provocar un episodio en nuestro planeta como el que acabó con […]
    Eduardo Martínez de la Fe
  • China descubre grafeno natural en la Luna 25 junio, 2024
    Investigadores chinos han descubierto recientemente grafeno natural de escasas capas por primera vez en la Luna, a partir de las muestras traídas a la Tierra por la sonda Chang'e 5. El hallazgo proporciona nuevos conocimientos sobre las actividades geológicas, la historia evolutiva y las características ambientales de la Luna.
    Pablo Javier Piacente
  • Los incendios forestales extremos se duplicaron en los últimos 20 años en todo el planeta 25 junio, 2024
    Una nueva investigación concluye que la frecuencia e intensidad de los incendios forestales extremos se ha más que duplicado en todo el mundo en las últimas dos décadas, debido al calentamiento global antropogénico y otros factores relacionados. Se trata de la primera ocasión en la cual los científicos pudieron trazar una tendencia global para los […]
    Pablo Javier Piacente