Tendencias21
Desarrollan un software para reparar enlaces rotos en la web

Desarrollan un software para reparar enlaces rotos en la web

Investigadores iraníes han desarrollado un software que puede resolver el 90 por ciento de los enlaces rotos en la web, suponiendo que los recursos están todavía en el servidor del sitio. Para ello crean una base de datos superior e inferior que les permite diseñar un exclusivo gráfico de datos controlable a lo largo del tiempo, de forma que se puedan identificar los cambios y atrapar tanto enlaces perdidos como recursos desvinculados. Por Patricia Pérez

Desarrollan un software para reparar enlaces rotos en la web

Cualquier usuario de Internet habrá sentido en algún momento la frustración que supone seguir un enlace a un sitio web interesante para descubrir finalmente que la página de destino ya no está ahí, obteniendo por contra la temida página de error. Además de crear mala imagen, estos sitios son penalizados por los buscadores a la hora de valorar una página web.

Sin embargo, más frustrante y con mayores consecuencias para la ciencia, la salud, la industria y otras áreas resulta cuando las máquinas se comunican en busca de recursos específicos que o bien se han perdido o desplazado de su identificador. Esto puede causar problemas cuando un equipo está procesando grandes cantidades de datos, por ejemplo en un análisis financiero o científico.

Si el recurso está todavía en los servidores, sería recuperable mediante un algoritmo lo suficientemente eficaz como para poder recrear los enlaces perdidos. Es lo que han conseguido los ingenieros informáticos Mohammad Pourzaferani y Mohammad Ali Nematbakhsh de la Universidad de Isfahan en Irán, a través de un software capaz de recuperar el 90 por ciento de los enlaces rotos.

Los detalles de la investigación se presentan este mes en la revista International Journal of Web Engineering and Technology (IJWET), especializada en ingeniería y tecnología web.

Gráfico de datos

Según explican los investigadores en un artículo publicado en la web Phys.org, la mayoría de los esfuerzos para resolver el problema se ha centrado hasta ahora en el intento de arreglar los enlaces rotos en el punto de destino.

Este enfoque tiene dos limitaciones inherentes. En primer lugar, se dirige a un único punto de fallo, mientras se pueden encontrar más resultados a través de una base de datos. En segundo lugar, se basa en el conocimiento de la fuente de datos de destino, cosa que no siempre ocurre.

Por contra, el equipo iraní ha introducido un método para arreglar enlaces rotos que se basa en el punto de origen de los vínculos, aportando un sistema para descubrir la nueva dirección de la entidad digital que se ha desvinculado. Para ello crean una base de datos superior e inferior que les permite diseñar un exclusivo gráfico de datos controlable a lo largo del tiempo, de forma que se puedan identificar los cambios y atrapar tanto enlaces perdidos como recursos desvinculados.

Esta investigación se basa en el principio de que las entidades -ya sean personas, organizaciones, lugares, etc-, mantienen su estructura a pesar de moverse a otra dirección. Por lo tanto, «el algoritmo crea una estructura gráfica de cada entidad», señala Pourzaferani. Este gráfico está compuesto por dos tipos de entidades que los ingenieros han denominado «superior» e «inferior».

Cuando se detecta un enlace roto, el algoritmo comienza su tarea para encontrar la nueva ubicación para la entidad desvinculada o aquella similar que mejor encaje con el perfil. Para ello se acciona el módulo rastreador, que busca los superiores de cada entidad en la base de datos inferior y viceversa. Poco a poco se va estrechando el espacio de búsqueda hasta elegir el mejor candidato.

Eficacia probada

Los investigadores probaron el algoritmo con dos imágenes de DBpedia que contenían casi 300.000 entidades personales, de las cuales se identificaron casi 5.000. La herramienta demostró además su destreza en la reubicación de nueve de cada diez de los enlaces rotos.

Hasta tanto no estén disponibles en el mercado herramientas como ésta, los creadores web deben estar atentos para evitar en sus sitios enlaces rotos o perdidos. Para ello existen recursos como el que propone el Consorcio World Wide Web (W3C), una comunidad internacional donde las organizaciones miembro y el público en general trabajan conjuntamente para desarrollar estándares Web.

Liderado por Tim Berners-Lee, creador original de las tecnologías sobre las que se basa la web, como son URL, HTTP y HTML, la misión del W3C es guiar la web hacia su máximo potencial. Entre otras, cuenta con una herramienta útil para localizar enlaces rotos de una web. No sólo se limita a identificarlos, sino que valora la calidad de los textos ancla y analiza las redirecciones, entre otras opciones, por lo que resulta un recurso muy valioso.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren cómo Plutón consiguió su corazón 16 abril, 2024
    El misterio de cómo Plutón consiguió una característica gigante en forma de corazón en su superficie finalmente ha sido resuelto: los científicos lograron reproducir con éxito la forma inusual con simulaciones numéricas, atribuyéndola a un impacto gigante y lento en ángulo oblicuo. Se trató de una colisión con un cuerpo planetario de unos 700 kilómetros […]
    Pablo Javier Piacente
  • La vida podría existir desde los inicios del Universo 16 abril, 2024
    El físico Avi Loeb sostiene en un reciente artículo que los elementos para el desarrollo de la vida tal como la conocemos podrían estar presentes en el cosmos desde la formación de las primeras estrellas, unos 100 millones de años después del Big Bang. También postula que esta hipótesis podría comprobarse si la misión Dragonfly […]
    Pablo Javier Piacente
  • Crean un acelerador de partículas en miniatura con aplicaciones médicas 16 abril, 2024
    Investigadores alemanes han desarrollado un acelerador de electrones que mide poco menos de medio milímetro de largo y 0,2 micrómetros de ancho, es decir, menos de una milésima de milímetro. Tiene aplicaciones en la investigación básica y permitirá crear nuevas herramientas de radioterapia. Entrevista con sus protagonistas, Peter Hommelhoff y Stefanie Kraus.
    Oscar William Murzewitz (Welt der Physik)/T21
  • Revelan la primera molécula fractal en la naturaleza 15 abril, 2024
    Los científicos han descubierto una molécula en la naturaleza que sigue un patrón geométrico de autosimilitud, conocido como fractal. La enzima microbiana denominada citrato sintasa es la primera estructura fractal molecular ensamblada directamente en la naturaleza que ha logrado identificarse hasta el momento. Los especialistas creen que este fractal puede representar un accidente evolutivo.
    Pablo Javier Piacente
  • El cambio climático podría estar relacionado con el aumento de los accidentes cerebrovasculares 15 abril, 2024
    Una nueva investigación ha demostrado que el número de muertes ligadas a accidentes cerebrovasculares y otras patologías relacionadas ha ido creciendo desde 1990, a la par del aumento de las temperaturas extremas. Durante 2019, el último año analizado, más de 500.000 muertes por accidentes cerebrovasculares se vincularon con temperaturas "no óptimas", provocadas por el calentamiento […]
    Pablo Javier Piacente
  • La globalización está fracturando a la humanidad 15 abril, 2024
    La globalización no está conduciendo a una civilización universal con valores compartidos, sino que está creando una brecha creciente entre los países occidentales de altos ingresos y el resto del mundo, en cuanto a valores como la tolerancia, la diversidad y la libertad.
    Eduardo Martínez de la Fe
  • En el caso de los caracoles, el huevo fue lo primero 14 abril, 2024
    Un caracol marino que primero fue ovíparo y evolucionó hacia la viviparidad revela que los saltos evolutivos ocurren gradualmente, a través de una serie de pequeños cambios.
    Redacción T21
  • Revelan el misterio del árbol tropical que camina 13 abril, 2024
    La denominada "palma caminante" o Socratea exorrhiza es un árbol de América Central y del Sur que según distintas versiones podría "caminar" y erguirse en determinadas situaciones: ahora, este mito parece haber sido resuelto bajo criterios científicos. Según los investigadores, aunque el árbol puede crecer rápidamente y crear nuevas raíces para lidiar con la pérdida […]
    Pablo Javier Piacente
  • Descubren 50 especies desconocidas para la ciencia en la exótica Isla de Pascua 12 abril, 2024
    Una expedición a la Cordillera de Salas y Gómez, frente a Rapa Nui, en el Océano Pacífico, documentó 160 especies animales que no se sabía que habitaban esta región de la misteriosa Isla de Pascua, en Chile. Además, descubrieron 50 criaturas que son absolutamente nuevas para la ciencia.
    Pablo Javier Piacente
  • El clima espacial podría generar un caos satelital sin precedentes 12 abril, 2024
    Los satélites en órbita terrestre baja (LEO) pueden perder su brújula cuando el clima espacial ofrece situaciones inesperadas. El problema afecta a la Estación Espacial Internacional, la estación espacial Tiangong de China y muchos satélites de observación de la Tierra. Los expertos sostienen que esta incertidumbre de posicionamiento aumenta el riesgo de colisiones orbitales peligrosas, […]
    Pablo Javier Piacente