Le bibliothécaire des pétaoctets

L’upgrade prévu de la Source de Lumière Suisse SLS doit être préparé dès maintenant. Pour relever les défis de la recherche de l’avenir, Alun Ashton estime la quantité de données que les futures expériences produiront. Car lorsque les pétaoctets seront quotidiennement à l’ordre du jour, il faudra disposer de nouvelles solutions.

Alun Ashton, chef ad intérim du projet partiel Controls & Science IT, dans une salle de serveurs du PSI
(Photo: Institut Paul Scherrer/Mahir Dzambegovic)

Alun Ashton en est convaincu: l’avenir de la recherche produira d’importantes quantités de données. Ce spécialiste a lui-même travaillé comme scientifique, mais il est passé dans l’analyse de données, puis dans l’informatique scientifique il y a de nombreuses années. Au PSI, il dirige le groupe Science IT; et il est également chef ad intérim du projet partiel Controls & Science IT.

En décembre de cet année, le Parlement suisse se prononce sur le financement du projet d’upgrade SLS 2.0 du PSI. Si sa décision est positive, comme on l’espère à l’institut, la phase d’exécution, c’est-à-dire la transformation de la Source de Lumière Suisse SLS, devrait démarrer en 2021. La phase de planification est déjà en route, entre autres pour que le Parlement dispose d’un plan de projet solide, soit bien informé et sache précisément sur quoi il vote.

Le travail d’Alun Ashton et de son groupe fait partie intégrante de ces préparatifs. Et il précise encore: «Tout ce que nous faisons en ce moment est important aussi bien pour la SLS 2.0 que pour le SwissFEL, dont la construction s’est achevée en 2016.» Le SwissFEL est le laser à rayons X à électrons libres du PSI.

De nouveaux composants, de nouvelles expériences et beaucoup plus de données

Plusieurs collaborateurs du PSI investissent déjà une partie de leur temps dans la préparation de la SLS 2.0. Le groupe de Markus Jörg, chef du projet partiel SLS 2.0 Infrastructure et logistique, installe sur ordinateur des modèles 3D des nouveaux composants à leur futur emplacement. Alun Ashton, lui, est en train d’estimer la quantité de pétaoctets de données que les expériences pourront produire: «Après l’upgrade, la SLS devrait avoir un faisceau nettement plus intense, rappelle-t-il. Les expériences pourront alors fournir beaucoup plus de données.»

Et alors que Philip Willmott, coordinateur scientifique et chef du projet partiel Programme scientifique Science photonique, dispose depuis l’été 2020 du rapport définitif qui précise les modalités de réalisation de l’upgrade pour chaque ligne de faisceau aux différentes stations expérimentales, Alun Ashton planifie pour sa part des modalités réalistes pour le stockage de ces futurs jeux de données. En effet, «le stockage de données représente une partie importante de l’activité scientifique, souligne-t-il. Si on le prend en compte dès le début dans le concept, on est gagnant sur toute la ligne».

Réduire et comprimer

Pour Alun Ashton, la réduction et la compression des données constituent des thématiques décisives. Pour mieux comprendre la réduction des données, on peut imaginer la photo portrait d’une personne. D’un point de vue artistique, l’arrière-plan de l’image est peut-être intéressant. Mais si ce sont juste les traits du visage de la personne qui nous intéressent, nous n’avons pas besoin de tous les bits et les octets nécessaires pour faire apparaître l’arrière-plan.

Les choses se présentent de manière similaire dans le cas des expériences qui fournissent de très importantes quantités de données. Toutes les parties qui ne sont pas définitivement nécessaires ne sont pas stockées, explique Alun Ashton: «Le stockage des données est un important facteur de coûts, rappelle-t-il. Si nous réussissons par exemple à n’utiliser qu’un dixième de l’espace de stockage, nous économisons beaucoup d’argent.» Pour obtenir une réduction adéquate et de qualité, Alun Ashton et son équipe étudient aussi le «machine learning», c’est-à-dire l’utilisation de l’intelligence artificielle, qui peut automatiser ce processus et améliorer la qualité des données stockées.

Trouver chaque fois le bon vélo

Alun Ashton et son équipe misent également sur la compression des données: «Nous développons du matériel spécial, capable d’effectuer cette compression, explique-t-il. Pour ce faire, nous collaborons avec succès avec IBM, entre autres.». Ce faisant, l’équipe planifie plusieurs solutions pour que différents jeux de données puissent être traités au mieux. «C’est comme si j’avais trois vélos, poursuit Alun Ashton pour illustrer son propos. Un VTT pour les terrains accidentés, un vélo de course pour parcourir rapidement de longues distances, et un vélo électrique qui me permet une moindre dépense d’énergie. De manière analogue, les expériences présentent des différences et il est judicieux de disposer en fonction du bon matériel et du bon algorithme.»

Si cela permet de réduire les quantités de données stockées, mais que ces dernières restent quand même importantes, une autre thématique entre en jeu, qui relève aussi du domaine d’Alun Ashton: le libre-accès aux données. «Dans les lignes directrices du PSI, nous nous sommes engagés à rendre les données de nos expériences accessibles au public en fin de projet, rappelle-t-il. Cela permet par exemple à d’autres groupes de recherche d’y accéder et d’y découvrir peut-être encore quelque chose d’autre.» Dans ce contexte, il sera fondamental de pourvoir retrouver les données: comme dans une bibliothèque, leur collecte va nécessiter la mise en place d’une espèce de catalogue, pour que des tiers puissent retrouver ce qu’ils cherchent.

Progresser dans l’échange

Sur toutes ces thématiques, Alun Ashton et son équipe collaborent avec des centres de données en Suisse: le Centre suisse de calcul scientifique (Centro Svizzero di Calcolo Scientifico, CSCS) et le Swiss Data Science Center (centre national de la science des données) de l’EPFL et de l’ETH Zurich. Ils échangent par ailleurs à l’international: «Nous collaborons avec d’autres grandes installations de recherche en Europe, surtout avec la source européenne de spallation ESS dans le sud de la Suède et le Diamond Light Source en Angleterre», détaille Alun Ashton. Originaire du Pays de Galles, il a lui-même travaillé au Diamond Light Source avant de venir au PSI. «Nous exploitons cette collaboration au maximum; nous tenons à tirer le plus d’enseignements possible de l’expérience des autres.» Inversement, le PSI transmet aussi ses propres connaissances à ses partenaires.

Dans tout cela, ce qu’Alun Ashton garde sans cesse à l’esprit, c’est l’opportunité bien particulière qui s’offre actuellement à la SLS: «Quand on transforme une grande installation de recherche de la manière dont les choses sont planifiées pour la SLS, cela représente une occasion qui ne s’offre peut-être que tous les 20 ans.» Evidemment, lorsque l’installation est en fonctionnement, modifier des processus est tout sauf simple. C’est pour cette raison qu’Alun Ashton et son équipe prennent maintenant certaines décisions fondamentale sur la manière dont les gens travailleront et feront de la recherche après l’upgrade. «Si nous faisons bien les choses dès maintenant, les chercheurs du PSI en profiteront largement lors des prochaines décennies, dit-il. Nous pouvons leur ouvrir la voie, et leur faire ainsi gagner beaucoup de temps en leur épargnant bien des efforts.»

Texte: Institut Paul Scherrer/Laura Hennemann

Informations supplémentaires

SLS 2.0: l’upgrade de la Source de Lumière Suisse SLS

Droit à l'utilisation

Le PSI fournit gratuitement des images et/ou du matériel vidéo pour la couverture médiatique du contenu du texte ci-dessus. L'utilisation de ce matériel à d'autres fins n'est pas autorisée. Cela inclut également le transfert des images et du matériel vidéo dans des bases de données ainsi que la vente par des tiers.