Der Bibliothekar der Petabytes

Das geplante Upgrade der Synchrotron Lichtquelle Schweiz SLS muss schon jetzt vorbereitet werden. Um der künftigen Forschung gerecht zu werden, schätzt Alun Ashton die Datenmenge ab, die die kommenden Experimente produzieren werden. Denn wenn Petabytes zum Alltag werden, braucht es grundlegende, neue Lösungen.

Alun Ashton, Leiter ad interim des Teilprojekts Controls & Science IT, in einem Serverraum des PSI
(Foto: Paul Scherrer Institut/Mahir Dzambegovic)

Die Zukunft der Forschung, da ist sich Alun Ashton sicher, wird grosse Mengen an Daten bringen. Ashton hat einst selbst als Wissenschaftler gearbeitet, ist aber vor vielen Jahren erst in die Datenanalyse und schliesslich in die Wissenschafts-IT gewechselt. Am PSI leitet er nun die Gruppe Science IT; zusätzlich ist er im Rahmen der SLS 2.0 Leiter ad interim des Teilprojekts Controls & Science IT.

Im jetzigen Dezember stimmt das Schweizer Parlament über die Finanzierung des Upgrade-Projekts SLS 2.0 des PSI ab. Bei einem hoffentlich positiven Beschluss würde die Ausführungsphase, also der Umbau der Synchrotron Lichtquelle Schweiz SLS, dann 2021 beginnen. Die Planungsphase läuft aber schon jetzt; unter anderem, damit das Parlament einen soliden Projektplan hat und gut informiert ist, worüber genau es abstimmt.

Die Arbeit von Alun Ashton und seiner Gruppe ist Teil dieser Vorbereitungen. Und er stellt klar: «Alles, was wir derzeit tun, ist relevant sowohl für die SLS 2.0 als auch für den 2016 fertiggestellten SwissFEL», also den Freie-Elektronen-Röntgenlaser des PSI.

Neue Komponenten, neue Experimente – und viel mehr Daten

Etliche PSI-Mitarbeitende investieren bereits einen Teil ihrer Zeit in die Vorbereitung der SLS 2.0. In der Gruppe von Markus Jörg, Leiter des SLS-2.0-Teilprojekts Infrastruktur und Logistik werden 3-D-Modelle der neuen Komponenten im Computer an ihre zukünftige Stelle gesetzt. Alun Ashton schätzt derweil die Petabytes an Daten ab, die die neuen Experimente liefern können: «Weil die SLS nach dem Upgrade einen deutlich intensiveren Strahl bekommen soll, können die Experimente deutlich mehr Daten pro Zeiteinheit liefern.»

Und während Philip Willmott, wissenschaftlicher Koordinator und Leiter des Teilprojekts Wissenschaftsprogramm Photon Science seit Sommer 2020 den fertigen Konzeptbericht in Händen hält, in dem für jede Strahllinie aufgeschrieben ist, wie das Upgrade an den einzelnen Experimentierplätzen umgesetzt wird, plant Alun Ashton, wie diese zukünftigen Datensätze realistisch abgespeichert werden können. Denn: «Datenspeicherung ist ein wichtiger Teil der Wissenschaft. Wenn man das von Anfang an in das Konzept mit einbezieht, wird man auf der ganzen Linie gewinnen.»

Reduzieren und Komprimieren

Ein entscheidendes Thema für Ashton ist die Datenreduktion und -kompression. Um Datenreduktion zu verstehen, kann man sich das Porträtfoto eines Menschen vorstellen. Aus künstlerischer Sicht mag auch der Bildhintergrund interessant sein. Doch wenn es nur um die Gesichtszüge der abgebildeten Person geht, braucht es all die Bits und Bytes, die für die Darstellung des Hintergrunds nötig sind, nicht.

Ähnlich verhält es sich mit jenen wissenschaftlichen Experimenten, die sehr grosse Datensätze liefern. Die Teile, die definitiv nicht benötigt werden, sollten dann nicht gespeichert werden, so Alun Ashton: «Datenspeicherung ist ein relevanter Kostenfaktor. Wenn wir es also beispielsweise schaffen, nur ein Zehntel des Speicherplatzes zu benötigen, sparen wir viel Geld.» Damit die Datenreduktion gut und sinnvoll gelingt, untersuchen Ashton und sein Team auch das machine learning, also den Einsatz künstlicher Intelligenz, die diesen Prozess automatisieren kann und die Qualität der gespeicherten Daten verbessert.

Das jeweils passende Fahrrad

Zusätzlich setzen Ashton und sein Team auch auf Datenkompression: «Wir entwickeln spezielle Hardware, die diese Datenkompression vornehmen kann. Unter anderem haben wir dafür eine erfolgreiche Zusammenarbeit mit IBM», berichtet Ashton. Dabei plant das Team mehrere Lösungen, damit verschiedene Datensätze bestmöglich verarbeitet werden können. «Ich habe beispielsweise drei Fahrräder», vergleicht Ashton die Situation. «Ein Mountainbike für unebenes Terrain, ein Rennrad, mit dem ich weite Strecken schnell zurücklegen kann, und ein E-Bike, bei dem ich selbst weniger Energie aufwenden muss. Ähnlich sind auch Experimente verschieden und es ist sinnvoll, die jeweils passende Hardware und den passenden Algorithmus bereitzuhalten.»

Wenn dadurch schliesslich weniger, aber immer noch grosse Mengen Daten abgespeichert werden, kommt ein weiteres Thema zum Tragen, das ebenfalls in Ashtons Bereich fällt: freier Zugang zu den Daten. «In den PSI-Leitlinien haben wir uns verpflichtet, die Daten unserer Experimente am Ende auch öffentlich zugänglich zu machen. So können beispielsweise andere Forschungsgruppen darauf zugreifen und noch etwas anderes darin entdecken.» Dabei wird es auch um Auffindbarkeit gehen: Ähnlich wie in einer Bibliothek ist auch bei der Datensammlung eine Art Katalog nötig, damit Dritte das Gesuchte auch finden können.

Fortschritt im Austausch

Zu all diesen Themen arbeiten Ashton und sein Team innerhalb der Schweiz mit Datenzentren zusammen: dem Swiss National Supercomputing Centre (Centro Svizzero di Calcolo Scientifico, CSCS) sowie dem Swiss Data Science Center von ETH Zürich und ETH Lausanne EPFL. Zusätzlich stehen sie international im Austausch: «Wir arbeiten mit anderen Grossforschungsanlagen in Europa zusammen, vor allem mit der Europäischen Spallationsquelle ESS in Südschweden und der Diamond Light Source in England», erklärt Ashton. Er selbst, der ursprünglich aus Wales stammt, hat an der Diamond Light Source gearbeitet, bevor er ans PSI kam. «Wir holen aus dieser Zusammenarbeit das Maximum heraus; wir wollen so viel wie möglich aus der Erfahrung der anderen lernen.» Umgekehrt gibt auch das PSI die eigenen Erkenntnisse an die Kollaborationspartner weiter.

Was Ashton bei all dem stets vor Augen hat, ist die besondere Chance, die sich jetzt an der SLS bietet: «Wenn man eine Grossforschungsanlage so umbaut, wie wir es für die SLS planen, ist das eine Gelegenheit, die vielleicht nur alle 20 Jahre kommt.» Klar: Im laufenden Betrieb lassen sich Abläufe längst nicht so einfach ändern. Darum treffen Ashton und sein Team jetzt grundlegende Entscheidungen, wie die Menschen nach dem Upgrade arbeiten und forschen werden. «Wenn wir es jetzt richtigmachen, werden die PSI-Forschenden in den kommenden Jahrzehnten sehr profitieren. Wir können ihnen den Weg ebnen, um sehr viel Zeit und Mühe zu sparen.»

Text: Paul Scherrer Institut/Laura Hennemann

Weiterführende Informationen

SLS 2.0 - Das Upgrade der Synchrotron Lichtquelle Schweiz SLS

Nutzungsrechte

Das PSI stellt Bild- und/oder Videomaterial für eine Berichterstattung über den Inhalt des obigen Textes in den Medien kostenfrei zur Verfügung. Eine Verwendung dieses Materials für andere Zwecke ist nicht gestattet. Dazu gehören auch die Übernahme des Bild- und Videomaterials in Datenbanken sowie ein Verkauf durch Dritte.