Tendencias21

Descubren un sistema para desentrañar redes complejas

La minería de datos, es decir, la extracción no trivial de información que reside de manera implícita en los datos, es uno de los campos de la ciencia que están adquiriendo más relevancia en nuestro tiempo. Seguramente debido al hecho de que cada vez disponemos de más información acerca de todo. Porque es entonces cuando surge el problema de que, pese a tener tanta información, seguimos sin saber datos esenciales sobre cómo se comportan todos esos datos como grupo, y además cada vez es más complicado monitorizar la actividad individual de cada elemento.

Entender sistemas de redes complejas

Pongamos como ejemplo un banco de peces. Con la tecnología actual seríamos capaces de tomar imágenes de alta resolución, en las que podríamos ver desde el conjunto entero de peces, hasta la última escama de cualquier pez en concreto. Nosotros queremos saber cómo funciona ese banco de peces como conjunto, para poder predecir cómo se moverá. Entonces tenemos el problema de que su movimiento depende del movimiento individual de cada pez y de las relaciones de cada pez con sus vecinos. Un pequeño giro de uno de los peces puede pasar totalmente desapercibido, o puede provocar que todo el banco de peces cambie de dirección. Para poder extraer toda la información referente al grupo a partir de todos los datos que tenemos sobre cada uno de los peces usamos las técnicas de minería de datos.

En este caso, el banco de peces podría considerarse como una red en la que cada pez es un nodo, y cada nodo interactúa con los otros nodos a su alrededor. Esto mismo se puede aplicar a multitud de sistemas de los que disponemos mucha información hoy en día. A internet y a las redes sociales, por supuesto, pero también a las redes de transporte, de comercio, a los ecosistemas, el clima, las migraciones, la economía, la bolsa…

Una nueva herramienta

Marta Sales-Pardo y Roger Guimerà, ambos titulados en la Universitat de Barcelona, y ahora investigadores de la Northwestern University de EEUU, han colaborado en el desarrollo de un nuevo método de estudio de redes capaz de extraer información detallada de la jerarquía real subyacente existente en los millones de conexiones entre los nodos de una red. Es decir, que con ese método pueden conocer la influencia real que tienen ciertos nodos o grupos de nodos de una red sobre el resto de la red. Según afirma el propio estudio: «mostramos un método que identifica los niveles en la organización de sistemas complejos y extrae la información relevante a cada nivel».

«Separa el trigo de la paja»

«La forma en que se extiende la gripe, por ejemplo, está basada en una red subyacente, y es importante entender los patrones críticos», afirma Roger Guimerà. «Usando los datos disponibles, nuestro método intenta encontrar la mejor descripción de la red analizada, sin importar el tipo de red que sea.»

Además se puede extraer información sobre la conexión o la influencia existente entre dos elementos individuales de la misma red. En las redes sociales esto puede ser muy útil para conocer el entorno social virtual de cada individuo. Pero hay conexiones que, pese a existir, no son realmente activas. O puede haber elementos cuya conexión es muy activa, pero se lleva a cabo por vías indirectas.

«Nuestro método separa el trigo de la paja, la señal del ruido», comenta Marta Sales-Pardo, «Hay muchas maneras de mapear nodos en una red, no sólo una. Nosotros consideramos todas las maneras posibles. Tomando la suma de todas ellas, podemos identificar las conexiones que faltan y también las conexiones inactivas, sin efecto real».

Gran espectro de aplicaciones

El método desarrollado es además no supervisado. Es decir, que al algoritmo no se le da más información que la propia red, sin indicaciones de ningún tipo sobre la función o el tipo de red en cuestión. Esto, unido al elevado rendimiento mostrado, hace factible su aplicación en muchos y variados campos que requieren del estudio de redes de cualquier tipo.

En su estudio muestran cómo el método funciona con precisión con redes de transporte aéreo, circuitos electrónicos, redes de intercambio de email, y redes metabólicas. Pero caben muchas más aplicaciones: » la flexibilidad de nuestro enfoque, junto con su generalidad y su rendimiento, lo hará aplicable a muchas áreas donde la confiabilidad de los datos de una red es una fuente de preocupación».