L'analyse d'ensembles de données massifs à partir d'expériences de physique nucléaire peut prendre des heures ou des jours à traiter, mais les chercheurs travaillent à réduire radicalement ce temps en quelques secondes en utilisant des logiciels spéciaux en cours de développement aux laboratoires de Lawrence Berkeley et Oak Ridge du ministère de l'Énergie.
DeLeria – Short pour la lecture de l'expérience au niveau de l'événement distribué et l'analyse intégrée – est une nouvelle plate-forme logicielle conçue spécifiquement pour soutenir le spectromètre Greta, un instrument de pointe pour les expériences de physique nucléaire. Le tableau de suivi de l'énergie Gamma Ray (GRETA) est actuellement en construction au Berkeley Lab et devrait être installé en 2026 à l'installation de rares poutres d'isotopes (FRIB), à la Michigan State University.
Le logiciel permettra à Greta de diffuser des données directement vers les principaux centres informatiques du pays dans le but d'analyser de grands ensembles de données en quelques secondes. Les données seront envoyées via le réseau Energy Sciences, ou ESNET. Cette analyse en temps réel permettra aux chercheurs de faire des ajustements critiques à l'expérience au fur et à mesure de sa présence, conduisant à une productivité scientifique accrue avec des résultats plus rapides et plus précis.
« Notre objectif principal est d'établir un pipeline de données pour de futurs besoins expérimentaux sans avoir à construire une infrastructure informatique locale. Le pipeline nous permettra également d'augmenter la quantité d'analyse qui est effectuée en ligne », a déclaré Gustav Jansen, un physicien nucléaire informatique ORNL qui a développé Deleria depuis deux ans. « Mais nous avons également l'intention de montrer que Deleria peut être mise à l'échelle pour travailler avec d'autres installations de recherche et un éventail plus large d'applications scientifiques. »
Greta est un réseau sphérique de 120 cristaux de germanium hyper-pure. Des échantillons expérimentaux sont placés à l'intérieur de l'instrument et bombardés de particules chargées de l'accélérateur d'ions radioactifs à l'installation FRIB.
Les collisions émettent des centaines de milliers de photons chaque seconde. Chaque fois qu'un photon frappe un cristal, l'interaction est enregistrée et transmise sur le pipeline pour analyse. Ce processus est finalement utilisé pour révéler comment les protons et les neutrons dans les noyaux d'un échantillon sont disposés et comment ils se comportent.
Des ressources informatiques importantes sont nécessaires pour calculer les énergies et les coordonnées des photons et traiter les informations d'une manière qui a un sens pour les chercheurs.
« L'établissement d'un pipeline de données nous permet de décharger l'informatique lourde vers les centres de données des laboratoires nationaux. Donc, au lieu de construire un tout nouveau système informatique pour une mise à niveau potentielle vers Greta, nous pouvons simplement nous connecter à un », a déclaré Jansen. « Et du point de vue de la physique nucléaire, cela nous présente des options de mise à niveau de Greta, ainsi que des instruments d'autres installations qui pourront également tirer parti de la plate-forme logicielle Deleria. »

Test, test
Ensemble, Jansen et ses collègues de l'Oak Ridge Leadership Computing Facility, un Office of Science User Facility situé à ORNL, et Berkeley Lab ont construit un banc d'essai du pipeline de données Greta. À Berkeley Lab, une version virtuelle du tableau de détecteur Greta simule des événements de collision photon et transmet les données via ESNET vers un cluster informatique à l'OLCF à plus de 2 000 miles.
« Les cristaux à l'intérieur du détecteur ont de nombreux contacts électriques qui y sont connectés. Lorsqu'un photon frappe l'un des cristaux, un signal électrique sort sur chaque point de contact », a déclaré Jansen. « Nous devons comprendre où à l'intérieur du cristal les photons frappent – les coordonnées X, Y, Z
La puissance de traitement du pipeline est fournie par Deviant d'OLCF, un cluster informatique accéléré par GPU de 36 nœuds. Le travail de Deviant est de faire le craquement du nombre pour déterminer les coordonnées x, y, z des collisions de photons et renvoyer les données traitées au laboratoire de Berkeley pour le stockage ou une analyse supplémentaire. Deleria réduit également considérablement le volume de données stockées de 97,5%, ce qui est un facteur de 40.
Le banc d'essai peut générer et analyser environ 480 000 événements de collision de photons chaque seconde. Les données doivent parcourir plus de 4 000 miles là-bas et revenir à nouveau et être traitées en 10 secondes ou moins.
Le banc d'essai de Greta fait partie de l'écosystème informatique avancé de l'OLCF (ACE), un banc d'essai qui fournit des ressources informatiques et de données pour un large éventail d'architectures système.
Temps de ralentissement
Dans une série de démonstrations, l'équipe a été en mesure de traiter jusqu'à 35 gigabits (Gbps) de données par seconde, et de transmettre des données à un taux de 35 gigabits par seconde, ce qui dépasse en fait le taux maximal requis de Greta et est facilement adapté par le réseau ESNET6 d'Esnet, qui a plusieurs trajets GBPS de 400 GBP entre Berkeley Lab et ORNL. L'équipe a l'intention d'atteindre des taux encore plus élevés. Selon Jansen, le gros problème du déplacement des données à travers le pays est la latence.
Actuellement, leur système peut traiter un seul événement de collision de photons en 5 millisecondes, soit 0,005 seconde. Mais, en voyageant à une vitesse lumineuse, il faut 120 millisecondes (0,12 seconde) pour transmettre des données de Berkeley Lab à OLCF et vers le dos – plus d'un ordre de grandeur plus long qu'il ne le faut pour traiter un seul événement.
« Bien sûr, ce n'est que dans la science-fiction que vous pouvez contourner la vitesse de la lumière », a déclaré Jansen. « Ce sur quoi nous travaillons actuellement, c'est d'obtenir une accélération de 10 fois en trompant la latence, pour ainsi dire. Au lieu d'exécuter un événement à la fois, la solution consiste à exécuter des événements en parallèle afin que nous puissions traiter un événement tandis que d'autres sont transférés. En trouvant le bon équilibre, nous pouvons nous assurer que le cluster informatique est toujours occupé. Sinon, notre analyse prendra 10 fois plus de plus qu'elle ne devrait. »
Quand il s'agit de se déplacer plus vite que la vitesse de la lumière, « seul Gustav peut le faire », a déclaré Tom Beck, en plaisantant. Beck est le chef de la section de l'engagement scientifique au Centre national des sciences de calcul de l'ORNL. En plus de soutenir Jansen, Beck travaille également sur d'autres projets IRI qui connectent les principales installations de recherche DOE aux ressources informatiques de classe de leadership à l'OLCF.
« Il s'agit vraiment d'un travail pionnier dans le thème IRI qui établit les normes pour la façon dont nous réseautons les principaux centres de recherche du pays. Et plus nous avons de cas d'utilisation, mieux nous allons obtenir », a déclaré Beck. « Un cas à la fois. Et jusqu'à présent, c'est vraiment le premier cas qui est en place et qui fonctionne à ce niveau de maturité dont je suis au courant, ce qui signifie que nous sommes très bien partis. »
En plus de Jansen, les membres de l'équipe de projet incluent Mario Cromaz (Berkeley Lab), Eli Dart, Eric Pouyoul, Ezra Kissel, Kiran Vasu, Seyoung Yu (ESNET) et Ross Miller (OLCF).


