Tendencias21

Una herramienta web democratizará el uso científico de los superordenadores

El Centro de Supercomputación de San Diego y la universidad de California han puesto en marcha una herramienta web que facilitará a los científicos reservar su tiempo de trabajo en los superordenadores. Por el momento está funcionando en los sistemas TeraGrid y DataStar.

Cada vez hay más superordenadores en el mundo y cada vez son más rápidos, llegando a alcanzar ya la potencia de cálculo de 250.000 ordenadores portátiles juntos. Mientras este proceso es imparable, el acceso de los informáticos a estas herramientas para llevar a cabo sus investigaciones no es ni tan rápido ni tan satisfactorio. En muchas ocasiones, tienen que esperar horas o días haciendo cola para poder utilizarlos y llegar a los resultados que necesitan para seguir con la investigación en la que están involucrados.

Para paliar este problema, el Centro de Supercomputación de San Diego (SDSC) y la universidad de California han presentado la primera versión de un portal de usuarios que incorpora un innovador sistema de reserva que permite a los investigadores tener más control sobre cuándo podrán hacer su trabajo en los centro de supercomputación. El portal se probará en primer lugar en el sistema DataStar en el TeraGrid

TeraGrid es un proyecto estadounidense, llevado a cabo por la Fundación Nacional de Ciencias (NSF). Está dedicado a la investigación científica abierta y su es objetivo interconectar instalaciones y centros de investigación académica en puntos distantes geográficamente. Está considerado como una de las infraestructuras informáticas más grandes y más rápidas del mundo.

TeraGrid es una infraestructura científica que combina grandes recursos informáticos, incluidos superordenadores y sistemas de visualización científica, en el que están integrados nueve socios. El desarrollo de TeraGrid se completó en 2004, pero desde 2006 proporciona una potencia de computación de 100 teraflops. En la actualidad se utiliza para diversas disciplinas científicas, entre las que destaca la física, la investigación de materiales, las ciencias atmosféricas o la investigación computacional.

Gran demanda

“Las encuestas nos decían que los usuarios pedían rotaciones más rápidas en la utilización de estos supercomputadores”, dice Anke Kamrath, director de los servicios al usuario del SDSC en un comunicado. “Aunque no podemos eliminar las listas de espera, sobre todo en máquinas tan populares como DataStar, nos dimos cuenta de que un servicio que les permitiera programar y reservar a ellos mismos su tiempo facilitaría mucho el que completaran su trabajo”.

El sistema de reserva puede hacer los trabajos de computación más eficientes en varias situaciones. Por ejemplo, si un informático dispone de un día de trabajo con toda la máquina y tiene un pequeño problema, hasta ahora se veía obligado a solucionar ese problema y volver a entrar en la lista de espera para poder seguir con su trabajo. Con esta nueva herramienta, esta situación sería distinta ya que el usuario puede seleccionar una reserva que le asegure que va a terminar su trabajo, incluso si tiene un problema, por pequeño que sea.

Trabajos seguidos

En otros casos, un grupo de investigadores tiene que depurar un nuevo código. Para hacer este trabajo es necesario hacer muchos pequeños trabajos en sucesión para resolver los problemas que en cada uno de ellos se planteen y volver a probar. Ahora mismo, cada vez que quieren reiniciar el código se ven a obligados a guardar cola. Haciendo la reserva en el nuevo portal, los usuarios pueden programar varias horas de trabajo en la máquina para hacer múltiples depuraciones.

“El nuevo portal ofrece un interfaz limpio. Como el sistema de reserva de una compañía aérea, que hace complicados ajustes en unos minutos, nuestro sistema puede hacer tareas complejas para ordenar las reservas de trabajo en un supercomputador asegurándose, en todo momento, que se siguen las políticas establecidas, respetando el trabajo de los informáticos sin interrumpirlo y programando eventuales trabajos de mantenimiento de la máquina”, comenta Diana Dile, que está al frente del grupo de documentación y portales del SDSC.

Antes, los usuarios se veían obligados a reservar su tiempo de forma manual. El proceso era lento y pesado. El nuevo sistema “democratiza” el acceso a una computación totalmente fiable, permitiendo a cualquier usuario entrar en su cuenta de TeraGrid y SDSC y reservar fácilmente su tiempo.

Por otro lado, el sistema ha sido diseñado para proporcionar reservas que cuadran con los trabajos existentes en la lista de espera.

El portal está basado en la tecnología de licencia libre GridSphere. Esta tecnología ofrece un interfaz web capaz de acoplar diferentes tareas, como trasladar datos, una tarea que antes era mucho más problemática.