Tendencias21
Falta privacidad en los documentos PDF

Falta privacidad en los documentos PDF

Una investigación internacional en la que han participado ingenieros españoles ha detectado fallos en la privacidad y seguridad de los documentos PDF, según explican en la revista Journal of Systems and Software. Los documentos PDF llevan asociados datos relacionados con el nombre de usuario, la localización del documento en su máquina o incluso partes del documento que se eliminaron antes de su publicación. Parte de esta información podría dar lugar a violaciones de la intimidad. Además, hay otra información confidencial que se puede filtrar por el mal diseño del formato del documento. La investigación propone medidas preventivas.

Falta privacidad en los documentos PDF

La publicación de documentos digitales a través de Internet plantea graves amenazas de seguridad y privacidad, tanto para el autor como para el lector. Actualmente, el estándar de facto para el intercambio de documentos digitales es el formato PDF, y se estima que miles de millones de documentos son publicados o descargados cada día en este formato.

Después de estudiar las filtraciones de información en los documentos de Microsoft Office, investigadores del Laboratorio de Sistemas Distribuidos de la Facultad de Informática de la Universidad Politécnica de Madrid, se han centrado ahora en las asociadas al formato de documentos PDF. Su objetivo es hacer que el usuario sea consciente de los riesgos que corre cada vez que un documento ha sido publicado a través de Internet, así como proporcionar directrices eficaces para minimizar las fugas de información sensible. Los resultados de esta investigación han sido publicados en el Journal of Systems and Software, según informa la citada Facultad en un comunicado.

Desde el punto de vista del autor, los documentos publicados pueden llevar asociados datos relacionados con su nombre de usuario, la localización del documento en su máquina o incluso partes del documento que se eliminaron antes de su publicación.

Parte de esta información, como el nombre de usuario o el último día en el que el documento fue editado, se denomina meta-datos, y se utilizan por una aplicación del lector o del autor para mejorar la experiencia del usuario. Sin embargo, podría dar lugar a violaciones de la intimidad, sobre todo porque muchos autores no son conscientes de su divulgación junto con la publicación del documento.

Además, hay otra información confidencial que se puede filtrar por el mal diseño del formato del documento. Por ejemplo, cuando un párrafo de un documento es eliminado, las aplicaciones de edición de PDF no quitan el párrafo, sino que lo marcan como «invisible», de manera que la aplicación del lector no lo visualiza cuando el documento se abre para su lectura.

Por lo tanto, los datos eliminados se mantienen junto con el documento y cualquier usuario malintencionado que sepa dónde y cómo buscarlos puede leerlos. Para evitarlo, los investigadores de la UPM han desarrollado varias herramientas para extraer información de documentos PDF que no son accesibles con lectores de documentos estándar.

Minimizar las fugas de información

Hay incidentes famosos, donde la publicación de un documento ha puesto de manifiesto mucha más información que la que se estaba dispuesto a comunicar. Por ejemplo, en mayo de 2005, la Autoridad Provisional de la Coalición en Irak publicó un documento PDF sobre el rescate de la periodista italiana Giuliana Sgrena. Se utilizaron cuadros negros para ocultar los nombres de algunas personas involucradas en el incidente, pero todos ellos se dieron a conocer fácilmente al copiar el texto del documento original en un editor.

Este tipo de sucesos ha llevado a empresas e instituciones a dar directrices para evitar la fuga de información en los documentos publicados, después de que los medios de comunicación publicaran noticias a partir de documentos editados en la web, con información sensible que no debería hacerse pública.

Desde el punto de vista del lector, la apertura de un documento PDF descargado de Internet también puede exponer información sensible como la dirección IP de su máquina, su nombre de usuario y, potencialmente, cualquier otra información que se almacena en la máquina donde se abre el documento. Esto se debe a las características interactivas de las aplicaciones PDF.

Cada vez que un PDF se abre para su lectura, acciones como la conexión a un sitio web o la lectura de datos desde el disco pueden ser activadas automáticamente. En teoría, el usuario debería ser advertido de la acción que se realiza y se le debería pedir confirmación. Esta investigación ha puesto de manifiesto que en muchos lugares, especialmente al abrir documentos PDF dentro de un navegador de Internet, las acciones descritas se realizan sin notificación al usuario y sin su consentimiento. El trabajo de la UPM también detalla cómo evitar esta vulneración de los datos del usuario al descargar el documento.

El formato de documentos PDF es un medio poderoso para el intercambio de documentos. Sin embargo el usuario debe ser consciente de los riesgos que corre cada vez que un documento se publica a través de Internet y para ello, los investigadores proporcionan directrices eficaces para minimizar las fugas de información sensible.

Hacer un comentario

RSS Lo último de Tendencias21

  • Estados Unidos abre una nueva ontología militar con el lanzamiento del avión F-47 22 marzo, 2025
    El F-47 que desarrollará Boeing para el Pentágono redefine el concepto de superioridad aérea, fusionando avances en inteligencia artificial, sistemas furtivos de vanguardia y capacidades de combate colaborativo con drones autónomos.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Descubren por qué algunas personas no pueden imaginar prácticamente nada 22 marzo, 2025
    La capacidad de visualizar un lugar, objeto o situación a pedido varía significativamente entre individuos. Pero algunas personas no pueden evocar imágenes mentales en absoluto: este rasgo se conoce como afantasía, literalmente "un defecto de la imaginación". Ahora, un nuevo estudio revela que estas personas tienen la capacidad de asociar un concepto con su representación […]
    Pablo Javier Piacente
  • Las montañas esconden los mayores reservorios de energía limpia 21 marzo, 2025
    Una nueva investigación sugiere que podrían existir reservas masivas de gas de hidrógeno natural escondiéndose en las cadenas montañosas del planeta: estos recursos podrían darnos acceso a una enorme fuente de energía limpia, capaz de solucionar la crisis energética actual.
    Pablo Javier Piacente / T21
  • Un anillo con IA optimiza la comunicación de personas con problemas auditivos 21 marzo, 2025
    Investigadores de la Universidad de Cornell, en Estados Unidos, han desarrollado un innovador dispositivo llamado SpellRing: se trata de un anillo potenciado por Inteligencia Artificial (IA) que utiliza tecnología de microsonar para rastrear en tiempo real el deletreo manual en el Lenguaje de Señas Americano (ASL). Este avance podría transformar la forma en que las […]
    Pablo Javier Piacente / T21
  • Identifican la vía química que regula cómo tienen sexo los ratones 21 marzo, 2025
    Una aceitada maquinaria química marca el ritmo sexual de los ratones machos: la dopamina y la acetilcolina van cumpliendo diferentes papeles desde antes del coito y hasta la eyaculación. Los descubrimientos podrían habilitar nuevas instancias terapéuticas para trastornos sexuales en humanos, como por ejemplo la eyaculación precoz.
    Redacción T21
  • Un nuevo mapa revela el paisaje oculto bajo el hielo de la Antártida y la vulnerabilidad del continente helado 21 marzo, 2025
    Un nuevo mapa elaborado por científicos británicos revela por primera vez con precisión milimétrica las sorprendentes características del paisaje oculto bajo el hielo antártico y confirma el enorme riesgo climático que supone el deshielo acelerado en la región.
    Redacción T21
  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21