Tendencias21

Recurren a la memoria Flash como alternativa a la RAM para almacenar Big Data

Investigadores del MIT han diseñado un nuevo sistema de almacenamiento para adaptarse a la era del Big Data, poniendo en valor las potencialidades de la memoria Flash. El resultado es BlueDBM, una red de servidores compuesta por unidades Flash controladas por un sistema FPGA, lo que aporta rapidez para recuperar datos y un incremento de la eficiencia con el preprocesamiento. Más que desbancar a la memoria RAM, pretenden aunarlas para preservar su potencia pero ahorrando costes. Por Patricia Pérez

Recurren a la memoria Flash como alternativa a la RAM para almacenar Big Data

La memoria de acceso aleatorio, o RAM, es donde el procesador almacena los datos temporales con los que está trabajando el ordenador. Cuanta más memoria RAM tiene una máquina, más rápido puede el procesador recuperar los datos que había almacenado previamente. Sin embargo, en la era del Big Data, la cantidad de información es a menudo demasiado grande para la memoria de un solo equipo. Para hacernos una idea, la secuencia que describe un solo genoma humano ocuparía la RAM de entre 40 y 100 ordenadores tradicionales.

Por el contrario, la memoria flash, aquella que utiliza la mayoría de los dispositivos portátiles, consume diez veces menos energía y es, por tanto, significativamente más barata. El problema es que resulta más lenta que la RAM. Sin embargo, investigadores del Instituto Tecnológico de Massachusetts (MIT), en Estados Unidos, parecen haber encontrado una solución.

En el reciente Simposio Internacional de Arquitectura Computacional, el equipo presentó Blue Database Machine (BlueDBM), un nuevo sistema que demuestra como varias aplicaciones de Big Data compartidas hacen a aquellos servidores que utilicen memoria flash tan eficientes como los que se decanten por la RAM convencional, preservando su potencia y ahorrando costes.

Según explica el MIT en un comunicado, los investigadores presentaron una evidencia experimental que demuestra que, si los servidores que ejecutan una computación distribuida deben acceder al disco para los datos aunque sea un cinco por ciento del tiempo, su rendimiento cae a un nivel similar al del sistema Flash de todos modos.

La clave, preprocesar

En otras palabras, incluso diseñando nuevas técnicas para acelerar la recuperación de datos de la memoria flash, 40 servidores con 10 terabytes de RAM no podrían procesar un conjunto de datos de 10,5 TB más rápido que 20 servidores con 20 TB de Flash, sin contar con el ahorro energético que supondría.

«No se trata de pasarnos a la DRAM [RAM dinámica] ni nada de eso», apunta Arvind, profesor de Informática e Ingeniería del MIT que coordina el grupo de investigación Johnson, artífice del estudio. «Pero puede haber muchas aplicaciones que saquen provecho a este nuevo estilo de arquitectura”, añade. De hecho, no serían los primeros que experimentan con el potencial de la memoria Flash.

En este caso, los investigadores fueron capaces de crear una red competitiva de servidores basados en Flash con una red de servidores RAM pasando parte de la potencia de los servidores a los chips que controlan las unidades Flash. Preprocesando algunos datos de las unidades Flash antes de volver a los servidores, los chips pueden conseguir una computación distribuida mucho más eficiente.

Y puesto que los algoritmos de preprocesamiento están conectados a los chips, se encargan de distribuir la sobrecarga computacional asociada para mejorar el funcionamiento del sistema operativo, el mantenimiento del sistema de archivos o similar.

Ventajas del FPGA

Para crear el prototipo de red de BlueDBM utilizaron 20 servidores, con el hardware aportado por algunos de sus patrocinadores -Quanta, Samsung y Xilinx-. Cada servidor se conectó a un FPGA (por las siglas en inglés de Field-Programmable Gate Array), un tipo de chip que puede reprogramarse para imitar diferentes tipos de circuitos eléctricos. Y a su vez, cada FPGA se volvió a conectar a dos chips de Flash de medio terabyte, o 500 gigabytes, y a los dos FPGA más cercanos.

Gracias a que los FPGA se conectan entre sí, consiguieron una red muy rápida que permite a cualquier servidor recuperar datos de cualquier unidad Flash. También controlan las unidades Flash, lo cual no es tarea sencilla; los controladores de las unidades Flash comerciales tienen hasta ocho procesadores diferentes y un gigabyte de memoria de trabajo.

Otra de las bondades de los FPGA es que ejecutan los algoritmos que preprocesan los datos almacenados en las unidades Flash. Los investigadores probaron tres de esos algoritmos en aplicaciones de Big Data populares. La primera fue un buscador de imágenes, intentando encontrar coincidencias a una imagen dada en una enorme base de datos. La segunda fue una implementación del PageRank de Google, algoritmo que evalúa la importancia de los resultados de búsqueda para darles un orden. Y la tercera fue la aplicación Memcached, que utilizan webs con grandes bases de datos para el almacenamiento en caché de información de acceso frecuente.

En definitiva, BlueDBM supone un nuevo uso para el FPGA, del cual se podrían beneficiar muchas aplicaciones como las tres en las que se puso a prueba. Y dado que son reprogramables, se podrían cargar con diferentes aceleradores dependiendo de la aplicación. Esto daría lugar a sistemas de procesamiento distribuido que pierden poca versatilidad, ganando en costes y ahorro energético.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Estados Unidos abre una nueva ontología militar con el lanzamiento del avión F-47 22 marzo, 2025
    El F-47 que desarrollará Boeing para el Pentágono redefine el concepto de superioridad aérea, fusionando avances en inteligencia artificial, sistemas furtivos de vanguardia y capacidades de combate colaborativo con drones autónomos.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Descubren por qué algunas personas no pueden imaginar prácticamente nada 22 marzo, 2025
    La capacidad de visualizar un lugar, objeto o situación a pedido varía significativamente entre individuos. Pero algunas personas no pueden evocar imágenes mentales en absoluto: este rasgo se conoce como afantasía, literalmente "un defecto de la imaginación". Ahora, un nuevo estudio revela que estas personas tienen la capacidad de asociar un concepto con su representación […]
    Pablo Javier Piacente
  • Las montañas esconden los mayores reservorios de energía limpia 21 marzo, 2025
    Una nueva investigación sugiere que podrían existir reservas masivas de gas de hidrógeno natural escondiéndose en las cadenas montañosas del planeta: estos recursos podrían darnos acceso a una enorme fuente de energía limpia, capaz de solucionar la crisis energética actual.
    Pablo Javier Piacente / T21
  • Un anillo con IA optimiza la comunicación de personas con problemas auditivos 21 marzo, 2025
    Investigadores de la Universidad de Cornell, en Estados Unidos, han desarrollado un innovador dispositivo llamado SpellRing: se trata de un anillo potenciado por Inteligencia Artificial (IA) que utiliza tecnología de microsonar para rastrear en tiempo real el deletreo manual en el Lenguaje de Señas Americano (ASL). Este avance podría transformar la forma en que las […]
    Pablo Javier Piacente / T21
  • Identifican la vía química que regula cómo tienen sexo los ratones 21 marzo, 2025
    Una aceitada maquinaria química marca el ritmo sexual de los ratones machos: la dopamina y la acetilcolina van cumpliendo diferentes papeles desde antes del coito y hasta la eyaculación. Los descubrimientos podrían habilitar nuevas instancias terapéuticas para trastornos sexuales en humanos, como por ejemplo la eyaculación precoz.
    Redacción T21
  • Un nuevo mapa revela el paisaje oculto bajo el hielo de la Antártida y la vulnerabilidad del continente helado 21 marzo, 2025
    Un nuevo mapa elaborado por científicos británicos revela por primera vez con precisión milimétrica las sorprendentes características del paisaje oculto bajo el hielo antártico y confirma el enorme riesgo climático que supone el deshielo acelerado en la región.
    Redacción T21
  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21