Tendencias21
Desarrollan un software para reparar enlaces rotos en la web

Desarrollan un software para reparar enlaces rotos en la web

Investigadores iraníes han desarrollado un software que puede resolver el 90 por ciento de los enlaces rotos en la web, suponiendo que los recursos están todavía en el servidor del sitio. Para ello crean una base de datos superior e inferior que les permite diseñar un exclusivo gráfico de datos controlable a lo largo del tiempo, de forma que se puedan identificar los cambios y atrapar tanto enlaces perdidos como recursos desvinculados. Por Patricia Pérez

Desarrollan un software para reparar enlaces rotos en la web

Cualquier usuario de Internet habrá sentido en algún momento la frustración que supone seguir un enlace a un sitio web interesante para descubrir finalmente que la página de destino ya no está ahí, obteniendo por contra la temida página de error. Además de crear mala imagen, estos sitios son penalizados por los buscadores a la hora de valorar una página web.

Sin embargo, más frustrante y con mayores consecuencias para la ciencia, la salud, la industria y otras áreas resulta cuando las máquinas se comunican en busca de recursos específicos que o bien se han perdido o desplazado de su identificador. Esto puede causar problemas cuando un equipo está procesando grandes cantidades de datos, por ejemplo en un análisis financiero o científico.

Si el recurso está todavía en los servidores, sería recuperable mediante un algoritmo lo suficientemente eficaz como para poder recrear los enlaces perdidos. Es lo que han conseguido los ingenieros informáticos Mohammad Pourzaferani y Mohammad Ali Nematbakhsh de la Universidad de Isfahan en Irán, a través de un software capaz de recuperar el 90 por ciento de los enlaces rotos.

Los detalles de la investigación se presentan este mes en la revista International Journal of Web Engineering and Technology (IJWET), especializada en ingeniería y tecnología web.

Gráfico de datos

Según explican los investigadores en un artículo publicado en la web Phys.org, la mayoría de los esfuerzos para resolver el problema se ha centrado hasta ahora en el intento de arreglar los enlaces rotos en el punto de destino.

Este enfoque tiene dos limitaciones inherentes. En primer lugar, se dirige a un único punto de fallo, mientras se pueden encontrar más resultados a través de una base de datos. En segundo lugar, se basa en el conocimiento de la fuente de datos de destino, cosa que no siempre ocurre.

Por contra, el equipo iraní ha introducido un método para arreglar enlaces rotos que se basa en el punto de origen de los vínculos, aportando un sistema para descubrir la nueva dirección de la entidad digital que se ha desvinculado. Para ello crean una base de datos superior e inferior que les permite diseñar un exclusivo gráfico de datos controlable a lo largo del tiempo, de forma que se puedan identificar los cambios y atrapar tanto enlaces perdidos como recursos desvinculados.

Esta investigación se basa en el principio de que las entidades -ya sean personas, organizaciones, lugares, etc-, mantienen su estructura a pesar de moverse a otra dirección. Por lo tanto, «el algoritmo crea una estructura gráfica de cada entidad», señala Pourzaferani. Este gráfico está compuesto por dos tipos de entidades que los ingenieros han denominado «superior» e «inferior».

Cuando se detecta un enlace roto, el algoritmo comienza su tarea para encontrar la nueva ubicación para la entidad desvinculada o aquella similar que mejor encaje con el perfil. Para ello se acciona el módulo rastreador, que busca los superiores de cada entidad en la base de datos inferior y viceversa. Poco a poco se va estrechando el espacio de búsqueda hasta elegir el mejor candidato.

Eficacia probada

Los investigadores probaron el algoritmo con dos imágenes de DBpedia que contenían casi 300.000 entidades personales, de las cuales se identificaron casi 5.000. La herramienta demostró además su destreza en la reubicación de nueve de cada diez de los enlaces rotos.

Hasta tanto no estén disponibles en el mercado herramientas como ésta, los creadores web deben estar atentos para evitar en sus sitios enlaces rotos o perdidos. Para ello existen recursos como el que propone el Consorcio World Wide Web (W3C), una comunidad internacional donde las organizaciones miembro y el público en general trabajan conjuntamente para desarrollar estándares Web.

Liderado por Tim Berners-Lee, creador original de las tecnologías sobre las que se basa la web, como son URL, HTTP y HTML, la misión del W3C es guiar la web hacia su máximo potencial. Entre otras, cuenta con una herramienta útil para localizar enlaces rotos de una web. No sólo se limita a identificarlos, sino que valora la calidad de los textos ancla y analiza las redirecciones, entre otras opciones, por lo que resulta un recurso muy valioso.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Crean bebés digitales para mejorar la atención sanitaria infantil 27 junio, 2024
    Un equipo de investigadores desarrolló modelos informáticos que simulan los procesos metabólicos únicos de cada bebé: los “gemelos digitales” pueden ayudar a comprender mejor las enfermedades metabólicas raras y otros desafíos que enfrentan los bebés humanos durante los primeros 6 meses de vida, que son críticos para su crecimiento posterior.
    Pablo Javier Piacente
  • Los vientos espaciales son similares a los que soplan en la Tierra 27 junio, 2024
    Los científicos han descubierto corrientes en el espacio que reflejan de manera inquietante los vientos que giran cerca de la superficie de la Tierra, lo que sugiere fuerzas ocultas que los conectan. Este nuevo conocimiento podría proporcionarnos una mejor comprensión de los sistemas ambientales que circulan alrededor del globo y mejorar los pronósticos meteorológicos espaciales […]
    Pablo Javier Piacente
  • Los archivos geológicos anticipan nuestro futuro climático 27 junio, 2024
    Hace 56 millones de años, la erosión del suelo se cuadruplicó en el planeta debido a las fuertes lluvias y las inundaciones de los ríos provocadas por un calentamiento global muy similar al que conocemos hoy.
    Eduardo Martínez de la Fe
  • Ya es posible transmitir el tacto a través de Internet 26 junio, 2024
    Un nuevo estándar para la compresión y transmisión del sentido del tacto mediante Internet sienta las bases para la telecirugía, la teleconducción y nuevas experiencias de juego en línea, entre otras aplicaciones. El flamante estándar HCTI (Haptic Codecs for the Tactile Internet) es para el “tacto digital” lo que son JPEG, MP3 y MPEG para […]
    Pablo Javier Piacente
  • Las primeras muestras de la cara oculta de la Luna ya están en la Tierra 26 junio, 2024
    La cápsula de reingreso de la sonda Chang'e-6 de China, que transporta hasta dos kilogramos de materiales extraídos y perforados de la cuenca más antigua de la Luna ubicada en su lado oscuro, aterrizó este martes 25 de junio en la región de Mongolia Interior y fue rápidamente recuperada, según informó la Administración Nacional del […]
    Pablo Javier Piacente
  • La Tierra tendrá dos soles dentro de 1,3 millones de años y durante 60.000 años 26 junio, 2024
    Dentro de 1,3 millones de años, la Tierra tendrá una especie de segundo sol porque la estrella Gliese 710 se acercará a 1,1 años luz de la Tierra y la veríamos del mismo tamaño que Júpiter. Lo malo es que esa alteración cósmica puede provocar un episodio en nuestro planeta como el que acabó con […]
    Eduardo Martínez de la Fe
  • China descubre grafeno natural en la Luna 25 junio, 2024
    Investigadores chinos han descubierto recientemente grafeno natural de escasas capas por primera vez en la Luna, a partir de las muestras traídas a la Tierra por la sonda Chang'e 5. El hallazgo proporciona nuevos conocimientos sobre las actividades geológicas, la historia evolutiva y las características ambientales de la Luna.
    Pablo Javier Piacente
  • Los incendios forestales extremos se duplicaron en los últimos 20 años en todo el planeta 25 junio, 2024
    Una nueva investigación concluye que la frecuencia e intensidad de los incendios forestales extremos se ha más que duplicado en todo el mundo en las últimas dos décadas, debido al calentamiento global antropogénico y otros factores relacionados. Se trata de la primera ocasión en la cual los científicos pudieron trazar una tendencia global para los […]
    Pablo Javier Piacente
  • Detectado en el Mediterráneo el neutrino más energético del universo 25 junio, 2024
    El neutrino más potente jamás observado ha dejado su huella en las profundidades del Mediterráneo, aunque todavía se desconoce de qué rincón del universo procede. Los neutrinos cosmogénicos son los mensajeros de algunos de los eventos más cataclísmicos del cosmos.
    Eduardo Martínez de la Fe
  • La IA identifica seis formas diferentes de depresión 24 junio, 2024
    Los científicos han identificado seis formas biológicamente distintas de depresión gracias a la aplicación de la Inteligencia Artificial (IA) en estudios cerebrales. El hallazgo podría explicar por qué algunas personas no responden a los tratamientos tradicionales para la afección, como los antidepresivos y la terapia psicológica.
    Pablo Javier Piacente