Tendencias21

El big data y la nube unen sus fuerzas para revolucionar la sociedad

Un proyecto de la Comunidad de Madrid y otro de la National Science Foundation estadounidense pretenden combinar la computación en la nube con el procesamiento de ‘big data’ para revolucionar la informática, la práctica empresarial, la educación… y la mayoría de las áreas del conocimiento en las que uno pueda pensar. Por Carlos Gómez Abajo.

El big data y la nube unen sus fuerzas para revolucionar la sociedad

Dos iniciativas TIC están copando los titulares sobre tecnología en los últimos tiempos, con la promesa de revolucionar la informática, la práctica empresarial, la educación y la mayoría de las áreas del conocimiento en las que uno pueda pensar.

Por un lado, explica en su web Imdea Networks Institute, instituto de investigación de la Comunidad de Madrid, los datos masivos o datos a gran escala (Big Data) son un paradigma emergente para la gestión de cantidades ingentes de información más allá de las capacidades de la tecnología que soporta las bases de datos tradicionales.

Por otro lado, la computación en la nube (Cloud Computing) surge como paradigma en los sistemas de computación distribuida, cuya meta es ofrecer el software como un servicio a través de Internet. La computación en la nube ofrece un modelo de entrega ágil y una infraestructura altamente escalable para soportar las demandas de almacenamiento y cómputo de las tecnologías de grandes datos.

Ambas tecnologías convergen para ofrecer un inmenso surtido de datos que explorar y de los que obtener análisis significativos, así como una creciente gama de servicios y recursos con aplicaciones en cualquier campo que se vea afectado por la innovación y el desarrollo de las TIC.

Tanto el cloud computing como el Big Data maduran rápidamente y su uso se está generalizando, pero se necesita, explica Imdea, un esfuerzo decidido para crear un entorno holístico en el que ambos puedan prosperar y desarrollar todo su potencial. El ambicioso objetivo científico del proyecto Cloud4BigData – puesto en marcha recientemente por Imdea, la Universidad Politécnica de Madrid y la Universidad Rey Juan Carlos – es facilitar la convergencia de las tecnologías Big Data con su infraestructura cloud subyacente, para lograr altos niveles de eficiencia, flexibilidad, escalabilidad, alta disponibilidad, calidad de servicio, facilidad de uso, seguridad y privacidad.

Combinación

Cloud4BigData abordará sin ambages los actuales inconvenientes y deficiencias del Big Data y del Cloud Computing, sacando partido también de sus fortalezas. Desde la gestión segura al procesamiento eficiente de los datos, el proyecto tiene como objetivo combinar e integrar tecnologías diferenciadas y especializadas en una sola plataforma unificada.

El proyecto también demostrará su competencia en áreas de aplicación emergente con requisitos muy exigentes que demandan tecnologías cloud y Big Data, tales como las tecnologías máquina a máquina (machine-to-machine), el Internet de las cosas (IoT – Internet of Things), las tecnologías inteligentes o smart (como la red eléctrica inteligente, Smart Grid; las ciudades inteligentes, Smart cities; el transporte inteligente, Smart transport; etc.), así como en áreas tradicionales de aplicación, tales como la banca, la telefonía, la comunicación multimedia, las simulaciones distribuidas, etc., que demandan funcionalidades más allá de las capacidades actuales de las tecnologías Big Data.

Cloud4BigData está financiado por la Comunidad de Madrid, a través del Programa de Actividades de I+D entre grupos de investigación en Tecnologías 2013, cofinanciado con Fondos Estructurales de la Unión Europea. Comenzó el pasado octubre del 2014 y concluirá en septiembre de 2018.

‘Big data’ y ciencia

Otro proyecto de big data, SciServer, apoyado por la National Science Foundation (NSF) estadounidense, tiene como objetivo construir un ecosistema flexible y a largo plazo que proporcione a los científicos acceso a los enormes conjuntos de datos de observaciones y simulaciones.

Alex Szalay, de la Universidad Johns Hopkins, es el investigador principal del proyecto, de cinco años previstos de duración, y el arquitecto del Archivo Científico del Sloan Digital Sky Survey (SDSS), un proyecto que pretende cartografiar el universo entero. De éste último es de donde surgió la idea SciServer, explica Szalay.

«Cuando el SDSS se inició en 1998, los astrónomos tenían datos de menos de 200.000 galaxias», explica Ani Thakar, astrónomo de la Universidad Johns Hopkins, que es parte del equipo SciServer. «Cinco años después de comenzar SDSS, teníamos cerca de 200 millones de galaxias en nuestra base de datos. Hoy en día, los datos de SDSS supera los 70 terabytes, que cubren más de 220 millones de galaxias y 260 millones de estrellas.»

El equipo de la Johns Hopkins creó varias herramientas en línea para acceder a los datos de SDSS. Por ejemplo, en el sitio SkyServer, cualquier persona puede navegar a través del cielo, obtener información detallada acerca de las estrellas o buscar objetos utilizando múltiples criterios. El sitio también incluye actividades educativas listas para hacer en clase que permiten a los estudiantes aprender ciencia a partir de datos de última generación.

Para análisis más avanzados, crearon Casjobs, donde se pueden ejecutar consultas de hasta ocho horas y almacenar los resultados en una base de datos personal. Con cada nueva herramienta, la comunidad de usuarios creció, lo que llevó a realizar nuevos descubrimientos científicos.

Problemas

Sin embargo, para que todos estos datos sean analizables hace falta que los formatos, los metadatos y el acceso a los mismos tenga cierto mantenimiento, algo que se complica cuando los investigadores se van retirando y los formatos se quedan obsoletos. El equipo SciServer ha pasado las últimas dos décadas abordando estos problemas, primero en astronomía y luego en otras áreas de la ciencia.

Liderados por Szalay, el equipo comenzó a trabajar en SciServer en 2013 con financiación de la NSF. Previsto para ser lanzado al mercado en varias etapas durante los próximos cuatro años, SciServer ofrecerá importantes beneficios a la comunidad científica mediante la ampliación de la infraestructura desarrollada para los datos de SDSS a muchas otras áreas de la ciencia.

«Nuestro enfoque en el diseño de SciServer es llevar el análisis a los datos. Esto significa que los científicos puedan buscar y analizar grandes volúmenes de datos sin necesidad de descargar terabytes de datos, lo que resulta en tiempos de procesamiento mucho más rápidos», explica Szalay en la nota de prensa de la NSF. «Eso también hace que sea mucho más fácil comparar y combinar conjuntos de datos, permitiendo a los investigadores descubrir nuevas y sorprendentes conexiones entre ellos.»

Szalay y su equipo están trabajando en estrecha colaboración con colegas investigadores para concretar casos de uso en el mundo real para asegurarse de que el sistema sea lo más útil posible para los científicos sobre el terreno. De hecho, ya se han logrado avances significativos en dos campos: la ecología del suelo y la dinámica de fluidos.

Para ayudar a aliviar la carga de los investigadores, el equipo desarrolló SciDrive, un sistema de almacenamiento de datos en la nube para datos científicos que permite a los científicos subir y compartir datos utilizando una interfaz similar a Dropbox. La interfaz lee automáticamente los datos en una base de datos, y uno puede buscar en línea y hacer una correlación cruzada con otras fuentes de datos.

Ciencia ciudadana

SciServer ampliará esta capacidad a un nuevo proyecto de ciencia ciudadana llamada Gluseen (Red Global Urbana Educacional y Ecológica sobre el Suelo), cuyo objetivo es recopilar datos en todo el mundo sobre la ecología del suelo en una variedad de condiciones climáticas. «Nuestro enfoque será útil para muchas otras áreas de la ciencia, donde los conjuntos de datos gestionados por investigadores individuales deberán combinarse con grandes conjuntos de datos disponibles para el público», explica Szalay.

SciServer también tiene una importante iniciativa en marcha para desarrollar un «laboratorio numérico abierto» para el acceso y procesamiento de grandes bases de datos de simulación. En colaboración con el grupo de Simulación de Turbulencias en de Universidad Johns Hopkins, están desarrollando un sistema piloto para integrar conjuntos de datos y procesos de trabajo de de simulación de turbulencias en SciServer.

En el futuro, el proyecto se extenderá a la genómica – donde los investigadores deben correlacionar de forma cruzada petabytes de datos para entender genomas enteros – y la conectómica – la exploración de las conexiones celulares a través de toda la estructura del cerebro-. Estas colaboraciones se extenderán por un período de cinco años, hasta 2018.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Revelan una lengua secreta perdida desde hace 3.000 años 21 septiembre, 2024
    Los arqueólogos han descubierto un texto secreto en Turquía, disperso entre decenas de miles de antiguas tablillas de arcilla, que fue escrito en la época del Imperio hitita, durante el segundo milenio antes de Cristo. Nadie sabe todavía qué dice la curiosa escritura cuneiforme, pero parece ser una lengua perdida hace más de 3.000 años.
    Pablo Javier Piacente
  • Una interfaz cerebro-ordenador permite a un paciente con ELA manejar una tableta solamente con sus pensamientos 20 septiembre, 2024
    La colocación de un pequeño implante de chip en un vaso sanguíneo en la superficie del cerebro permite a un paciente con esclerosis lateral amiotrófica (ELA) mover iconos en una tableta y comunicarse con el asistente virtual de la misma, únicamente a través de su mente, y aprovechando las ventajas de una interfaz cerebro-ordenador (BCI). 
    Pablo Javier Piacente
  • Concretada la primera impresión 3D con metal directamente en el espacio 20 septiembre, 2024
    La Agencia Espacial Europea (ESA) ha logrado un hito importante al lograr producir a bordo de la Estación Espacial Internacional (ISS) el primer componente de metal jamás creado directamente en el espacio, mediante impresión 3D. Esta tecnología podría revolucionar las operaciones en Órbita Terrestre Baja (LEO), al garantizar que las piezas de repuesto se puedan […]
    Pablo Javier Piacente
  • Mandato por el Clima: más que un paquete pedagógico sobre la crisis climática 20 septiembre, 2024
    Hoy día 16 y el próximo lunes 23 de septiembre los diputados y senadores están convocados a participar en un programa de formación, impartido por científicos de vanguardia, para dar a conocer la gravedad de la crisis climática y posibles medidas a adoptar para contenerla.
    Alejandro Sacristán
  • Descubren componentes básicos que podrían revolucionar la informática 20 septiembre, 2024
    Un dispositivo neuromórfico compuesto por moléculas que pueden alterar sus propiedades eléctricas cuando se les aplica una carga, permite manipular materiales para integrarlos en sistemas eléctricos. Inspirado en el funcionamiento del cerebro humano, alcanza un rendimiento sin precedentes de 4.1 tera-operaciones por segundo y vatio.
    Redacción T21
  • El dióxido de carbono ha influenciado al clima terrestre en los últimos millones de años 19 septiembre, 2024
    Empleando un enfoque innovador, un nuevo estudio ha logrado determinar que la temperatura media global y el clima de la Tierra han variado de una forma mucho más pronunciada que la estimada hasta hoy desde el eón Fanerozoico, o sea en los últimos 485 millones de años. Los resultados confirman la intensa influencia del dióxido […]
    Pablo Javier Piacente
  • La próxima pandemia podría llegar desde el cielo según diversos investigadores 19 septiembre, 2024
    Una nueva investigación ha revelado que el aire a gran altitud en la atmósfera terrestre está lleno de organismos vivos: desde los 1.000 a los 3.000 metros de altura se detectaron varios patógenos humanos potencialmente peligrosos, revelando su capacidad para viajar a grandes distancias y provocando nuevas preocupaciones sobre su impacto en la salud y […]
    Pablo Javier Piacente
  • Construir un mandato por el clima: nuestro parlamento está con la ciencia 19 septiembre, 2024
    Casi todos los partidos políticos presentes en el Congreso de la Diputados, a excepción de Vox, Junts y UPN, han firmado esta semana una declaración conjunta ante el desafío climático, en el marco del programa de formación climática orientado a una gobernanza basada en la ciencia. Francia ha ido mucho más lejos: más de 25.000 […]
    Rafael Jiménez Aybar y Agnès Delage Amat (*)
  • Así es la red cerebral que duplica su tamaño en las personas con depresión 18 septiembre, 2024
    La red de prominencia frontostriatal, cuyas funciones aún no están del todo claras pero parece estar relacionada con el procesamiento y filtrado de estímulos externos, duplica su tamaño en la mayoría de los pacientes con depresión, según ha descubierto un nuevo estudio. Los hallazgos podrían ayudar en el desarrollo de futuros tratamientos, enfocados en esta […]
    Pablo Javier Piacente
  • La Tierra tuvo anillos como Saturno hace menos de 500 millones de años 18 septiembre, 2024
    El análisis de cráteres antiguos sugiere que nuestro planeta puede haber tenido un sistema de anillos de rocas espaciales como Saturno hace aproximadamente 466 millones de años: el mismo puede haber contribuido a un evento de enfriamiento global al bloquear la luz solar, mientras bombardeaba la superficie terrestre con meteoritos. Se habría producido luego del […]
    Pablo Javier Piacente