Abkühlung für Supercomputer der nächsten Generation
Mit Exa-Supercomputern könnte die wissenschaftliche Arbeit mit unvergleichbarer Rechenleistung (von bis zu einer Milliarde Berechnungen pro Sekunde) beschleunigt werden. Gleichzeitig wird dafür eine enorme Menge Energie verbraucht – und dabei viel Wärme erzeugt. „Einige technologische Hürden müssen noch überwunden werden“, erklärt der Projektkoordinator von TEXTAROSSA, Massimo Celino von der italienischen nationalen Agentur für neue Technologien, Energie und nachhaltige wirtschaftliche Entwicklung (ENEA). „Diese Hürden sind mehr Energieeffizienz und Wärmeregulierung sowie Recheneffizienz. Auch werden neue Methoden und Werkzeuge für die nahtlose Integration von Beschleunigern in die Multiknoten-Plattformen für Hochleistungsrechnen gebraucht.“
Superkühlung von Supercomputern
Anders als bei normalen Computern werden Aufgaben bei Multiknoten-Exa-Systemen auf mehrere unabhängige Knoten verteilt, von denen jeder einzelne selbst ein vollständiger Computer sein kann. Diese Architektur ist auf optimale Leistung, Skalierbarkeit und Verfügbarkeit von Diensten und Anwendungen ausgelegt. Im Projekt TEXTAROSSA wurden verschiedene Werkzeuge und Technologien entwickelt, die in diese Exa-Plattformen integriert werden können. Das Projekt wurde mit Unterstützung des Gemeinsamen Unternehmens für europäisches Hochleistungsrechnen (GU EuroHPC) durchgeführt, einer Initiative, die zur Entwicklung eines Ökosystems für Hochleistungsrechnen von Weltrang in Europa gegründet wurde. „Eine Schlüsseltechnologie ist ein innovatives Kühlsystem“, sagt Celino. Durch die immense Anzahl an Schaltkreisen in Tausenden Zentraleinheiten (CPU), wird durch Systeme zum Hochleistungsrechnen (HPC) sehr viel Wärme erzeugt. Ohne eine geeignete Wärmeableitung – zum Beispiel die Computer in klimatisierten Räumen aufzustellen – werden sie so heiß, dass sie letztendlich abstürzen. Diese Kühlstrategien können selbst sehr energieintensiv sein. Bei handelsüblichen Computern werden Chips meist mit Lüftern gekühlt, doch bei TEXTAROSSA wurden effizientere Materialien verwendet. „Wir haben eine effiziente Zweiphasen-Kühltechnologie entwickelt, bei der eine Spezialflüssigkeit durch einen geschlossenen Kreislauf gepumpt wird, der um die CPU verläuft“, erklärt Celino. Wie bei einem Kühlschrank durchläuft die Flüssigkeit Zustandsveränderungen von flüssig zu gasförmig und zurück, damit die Abwärme der CPU aufgenommen und sicher abgeleitet werden kann. Je höher der Computer belastet wird, desto mehr Wärme wird generiert. Daher wurde die Kühltechnologie mit einer automatisierten Wärmeregulierungsstrategie gekoppelt, mit der die Intensität der Kühlung je nach Leistung der CPU reguliert wird.
Kleiner ist besser
Das Projektteam hat auch neue Systemsoftware entwickelt, um die Verarbeitungsaufgaben besser zu verwalten und mehr Betriebseffizienz zu erreichen. „Mit der Software wird mehr Geschwindigkeit bei der Datenverwaltung und -übertragung erreicht. Außerdem werden die Aufgaben nahtlos verwaltet, um die Verteilung über die CPU zu optimieren“, ergänzt Celino. „So können Nutzende beeindruckende Rechenleistung in parallelen Verarbeitungen nutzen.“ Als nächstes wurden im Projekt zwei unterschiedliche Architekturen der Rechenknoten konzipiert, die in künftigen HPC-Infrastrukturen eingesetzt werden können. Die zwei Prototypen wurden mit unterschiedlichen Arten modernster CPU erstellt, wobei jeweils die Werkzeuge aus dem TEXTAROSSA-Projekt ausgenutzt wurden. Auf diesen Prototypen wurden mehrere Anwendungen durchgeführt, unter anderem KI-Anwendungen und Hochleistungsdatenanalysen. So konnte das Team die Effizienzgewinne bei Rechenleistung und Energie messen. „Wir wollten prüfen, ob unsere Methoden eingesetzt werden können, um die Überhitzung von Supercomputern zu verhindern, ohne Abstriche bei der Rechenkapazität für reale Anwendungen hinzunehmen“, so Celino. Bei den Tests wurde die Machbarkeit beider Prototypsysteme, die Effizienz der einzelnen Software-Werkzeuge und die Wirksamkeit der Kühltechnologie nachgewiesen. „Die Universität Turin hat um eine Prototyp-Plattform gebeten, sodass wir jetzt sogar drei haben“, berichtet Celino. „Jetzt müssen diese Prototypen weiterentwickelt und die Technologie miniaturisiert und technisch ausgereift werden.“
Schlüsselbegriffe
TEXTAROSSA, GU EuroHPC, Informatik, Wärme, Effizienz, Kühlung, Flüssigkeit, Zustandswechsel, Exascale, Supercomputer, HPC, CPU