Marenostrum 4: El superordenador español encerrado en una capilla amplía su capacidad

Marenostrum 4: El superordenador español encerrado en una capilla

El conserje pide disculpas porque en la capilla hay un solo baño. “Al final del pasillo”, señala. Lo que no dice es que al atravesar ese pasillo nos encontraremos de repente con una galería de ordenadores antiguos, como inmensos muebles. Uno tras otro hablan calladamente de los pasos de gigante que ha dado la computación en estos últimos años: el teléfono que llevo en el bolsillo tiene hoy una capacidad de procesamiento equivalente a varios de estos superordenadores, que eran los más potentes hace 20 años.

Estoy en el Centro Nacional de Supercomputación de Barcelona (BSC por sus siglas en inglés), dentro del edificio que alberga el Marenostrum 4. Este es el supercomputador más potente de España, uno de los más poderosos de Europa, y está íntegramente destinado a la generación de conocimiento científico. Es conocido porque además de inteligente, es bello: se encuentra colocado en una urna de cristal dentro de una capilla, donde la austeridad de la piedra contrasta con los cables y los racks.

Al entrar, el cubo de cristal resplandece en la penumbra de la capilla y deja ver los 48 racks (o torres de máquinas) alineados en su interior, llenos de lucecitas titilantes. Dentro de ellos hay más de 3.400 nodos equipados con chips Intel Xeon y una memoria central de 390 Terabytes. Debajo del suelo se ven las tuberías de la refrigeración y los gruesos manojos de cables de la fibra óptica. Desde arriba entra la luz filtrada por los vitrales de la capilla.

El juego entre historia y futuro ha fascinado a muchos y es desde luego uno de los principales reclamos para dar a conocer la ciencia al gran público. Justamente en estos días está participando en un concurso para ser elegido “el centro de datos más bonito del mundo”.

Cualquier persona puede pedir una visita guiada y ya han desfilado por allí mas de 50.000 visitantes, “muchos de ellos sin bautizar”, bromea Mateo Valero, su director. Uno de ellos es Dan Brown, el autor de El Código Da Vinci, quien hace unos años al pasar por el BSC pensó que esto merecía un libro y ha terminado metiendo en su última novela, Origen, al Marenostrum, a la capilla y al mismo Valero como personaje.

Mateo Valero, doctor y profesor, fue el primer catedrático en informática en España. Es director del BSC

En junio de este año se ha desmantelado el anterior, el Marenostrum 3, instalado entre 2012 y 2013, para montar el Marenostrum 4, que ha costado 34 millones de euros y ya está en funcionamiento. Tiene una potencia pico de más de 11,1 Petaflop por segundo, lo que quiere decir que realiza más de 11.100 billones de operaciones por segundo, diez veces más que el Marenostrum 3. En computación, los FLOPS (floating point operations per second, operaciones de coma flotante por segundo, traducido del inglés) son una medida del rendimiento de una computadora, especialmente en cálculos científicos. Una forma de hacer entrar estos números en nuestra cabeza es pensar que un supercomputador es capaz de hacer en una hora lo que un ordenador común necesitaría años para procesar.

El reto no sólo es aumentar en velocidad sino también en tener una mayor eficiencia energética. Con esa potencia diez veces mayor este año por parte del Marenostrum 4, su consumo de electricidad sólo aumenta un 30 %, es decir que gasta 1,3 megavatios-hora al año.

El Marenostrum 4 es el tercer computador más rápido de Europa y el decimotercero del mundo, según el ranking Top500, que es una lista que se basa en la rapidez de los superordenadores para ejecutar un programa llamado linpack. El primero en la lista es un chino, el Sunway TaihuLight, que tiene más de 10 millones de procesadores y gasta unos 20 megavatios-hora al año, unos 20 millones de factura de electricidad. Cincuenta máquinas como la china se comerían toda la electricidad nuclear que produce una central como Vandellós.

Ranking de supercomputadores mundiales

Como en todos los rankings, aquí también parece haber un gran componente de ego y hype. “Nosotros, con el dinero que nos ha dado el ministerio, podríamos haber sido terceros en esa lista si hubiéramos querido”, afirma Valero. Explica que pueden ponerse aceleradores específicos para que esta prueba salga bien, “pero al día siguiente muy pocas personas podrían usarlo, y lo que hay que tener es una máquina a la que los investigadores le saquen provecho”. Sergio Girona, director de operaciones, explica la diferencia entre pico -aquellos 13,7 Petaflop por segundo- y rendimiento con una imagen: “El pico es cuánto puede correr mi Ferrari; el rendimiento es cuánto corre pilotada por un piloto experto”.

Proyectos de investigación de toda Europa concursan para obtener horas de procesador y son evaluados en función de su calidad por comités ajenos al BSC, consorcio público participado por el Ministerio de Economía (60%), la Generalitat de Catalunya (30%) y la Universidad Politécnica de Cataluña (10%).

Lo normal es que la máquina esté al total de ocupación por parte de la comunidad científica. La distribución es de 80 % para proyectos europeos de la red de computación más avanzada de Europa (Partnership for Advancing Computing in Europe, PRACE), 16 % para científicos españoles de la Red Española de Supercomputación y un 4 % que se reservan para investigadores del BSC. El tiempo de procesador que se otorga es gratuito y está garantizado, aunque también confiesan hacer overbooking para aprovechar imprevistos.

Para qué sirve un supercomputador

Mucha de los avances en torno a la Inteligencia Artificial actual son resultado de teorías que se conocían hace tiempo pero no podían ser aplicadas por falta de poder de cálculo. Toda esta potencia computacional es necesaria para crear modelos, ejecutar simulaciones complejas y tratar grandes cantidades de información de estudios científicos. “Siempre que aparece un nuevo instrumento, como telescopios, microscopios, los aceleradores de partículas o las plataformas de secuenciación de genomas, por ejemplo, la ciencia o la ingeniería que usan ese instrumento avanzan”, dice Valero.

La comparación de la teoría con lo que se mide es fundamental para el avance de la ciencia, y en eso los computadores son la última pieza evolutiva del paradigma de la investigación. La simulación de modelos numéricos y el análisis de datos ha ayudado a reducir costos, evitar sufrimiento y hacer experimentos que no podrían realizarse en el mundo real por ser demasiado caros, demasiado peligrosos o simplemente imposibles.

Uno de los 3.400 nodos con dos CPUs y 48 núcleos que tiene el superprocesador

Marenostrum ha colaborado con más de 16 millones de horas de procesador a la detección de ondas gravitacionales, con datos procedentes de los interferómetros LIGO. También trabaja con proyectos de ADN, y es capaz de detectar genes alterados en el genoma de la célula cancerosa, información que puede servir para trabajar en tratamientos de medicina personalizada. Otro de sus proyectos en marcha es el de estudiar el cambio climático. “En este campo, la previsión es la única herramienta que tenemos para intentar predecir algo”, dice Valero. ú

Contra el cambio climático

Estas máquinas de computación son complejas y también lo son los modelos que se construyen para analizar los datos. Por esto gran parte del éxito del BSC está en la colaboración entre científicos -que tienen el conocimiento en clima, en meteorología, en composición atmosférica-, con ingenieros informáticos.

Kim Serradell es uno de ellos, es responsable de Ciencias de la Tierra en el BSC, y lo primero que me dice es que no se va a meter a opinar si hay cambio climático, que él sólo dará datos. En su equipo trabajan con la predicción climática y aunque son especialistas en el medio plazo, también tienen modelos para predecir qué pasará en una escala de centenares de años.

El equipo de composición atmosférica investiga lo que está pasando en la atmósfera con todos los contaminantes que generamos en ciudades y con modelos de dispersión de polvo en suspensión, como el que se distribuye y llega desde el Sahara. En el BSC son responsables de la previsión de partículas en el aire hasta 48 horas antes para ciudades como Madrid o Barcelona, que han permitido a los ayuntamientos tomar medidas para bajar esos niveles. Este mismo sistema, que se llama Caliope, ha sido implantado en México, y está siendo aplicado en un índice de calidad del aire que se muestra en apps para Android y iOS.

Sin una máquina como el Marenostrum no se podría modelizar el clima. Además de trabajar en todas las escalas temporales, se necesita validar los modelos, analizar los datos de millones de sensores que tienen en todo el mundo, y hacerlo en un plazo razonable de tiempo.

Modelo para la predicción climática

Para el estudio del cambio climático se utiliza un modelo llamado EC-EARTH conjuntamente con 15 instituciones en Europa. En un modelo climático es importante ver qué pasa con la atmósfera (capa gris) pero también es necesario usar información de lo que pasa en los océanos y en los polos, con el hielo. Cuando estos tres modelos están corriendo a la vez, usan un acoplador. “Os lo podéis imaginar como un camarero que va distribuyendo los datos y va pasando la temperatura del océano a la atmósfera, y de la misma forma, los vientos los pasan al océano”.

Lo que describe Serradell son tres sistemas complejos de correr, ya que cada uno está programado de manera distinta. Además, el gran reto para poder obtener mejores resultados es reducir el tamaño de los cuadrados en esa rejilla: si tenemos cuadrados de menos de 10 km podremos ver más procesos -por ejemplo las perturbaciones en la dinámica de corrientes en el mar. Más detalle a costa de más recursos computacionales.

Para esto sirven los superordenadores como el Marenostrum, cuya arquitectura computacional le ha valido el título de “el más diverso e interesante del mundo”, según expertos internacionales. Quizás dentro de unas semanas también pueda ganar el concurso de belleza, si los chinos se olvidan de votar al suyo.

Este artículo fue publicado originalmente en Vozpópuli el 13/11/2017 [Archivo] BSC

The nerd factor

Computers are so fascinating, in and of themselves, that it is easy to get so absorbed in the minutia of their operation that you forget what you started to use the computer for in the first place.

[…]

The seductive thing about the computer is that it presents many interesting puzzles for which there is always an answer. And if you work with it long enough and hard enough, it will always reward you. Most of life is not that way. Rewards are uncertain; you never have complete control. And so it becomes tempting to concentrate on the area where you do have control, the computer and its contents, to the exclusion of everything else. Neither academics nor journalists can afford to become that narrow. The computer needs to be kept in its place: as a tool to help you toward a goal, not as the goal itself.

From «Precision Journalism: A Reporter’s Introduction to Social Science Methods», by Philip Meyer