Pomoc w chłodzeniu superkomputerów nowej generacji
Z jednej strony superkomputery eksaskalowe, dzięki swojej wyjątkowej mocy obliczeniowej (ponad miliard miliardów obliczeń na sekundę), mogą przyspieszyć tempo, w jakim dokonują się odkrycia naukowe, jednak z drugiej strony szacuje się, że będą zużywać kolosalne ilości energii – i wytwarzać przy tym dużo ciepła. „Wciąż istnieją pewne luki technologiczne, które wymagają uzupełnienia”, wyjaśnia koordynator projektu TEXTAROSSA Massimo Celino z Włoskiej Narodowej Agencji Nowych Technologii, Energii i Zrównoważonego Rozwoju Gospodarczego (ENEA). „Na wspomniane luki składa się konieczność osiągnięcia efektywności energetycznej i kontroli termicznej, a także wydajności obliczeniowej. Potrzebujemy również nowych metod i narzędzi, które zapewnią płynną integrację akceleratorów w wielowęzłowych platformach obliczeń wielkiej skali”.
Superchłodzenie superkomputerów
W przeciwieństwie do domowego komputera, wielowęzłowe systemy eksaskalowe rozdzielają zadania na wiele niezależnych węzłów, z których każdy może być sam w sobie kompletnym komputerem. Tak zaprojektowana architektura ma zapewniać optymalizację wydajności, skalowalności i dostępności usług i aplikacji. W ramach projektu TEXTAROSSA opracowano cały wachlarz narzędzi i technologii, które można zintegrować z tymi platformami eksaskalowymi. Projekt został zrealizowany przy wsparciu Wspólnego Przedsięwzięcia w dziedzinie Europejskich Obliczeń Wielkiej Skali (EuroHPC), które powstało w celu rozwoju światowej klasy ekosystemu superkomputerów w Europie. „Kluczową technologią, którą opracowaliśmy, był innowacyjny system chłodzenia”, mówi Celino. Ze względu na ogromne zagęszczenie obwodów w tysiącach procesorów (CPU) systemy obliczeń wielkiej skali (HPC) generują olbrzymie ilości ciepła. Bez odpowiednich środków podejmowanych w celu odprowadzania tego ciepła – takich jak trzymanie komputerów w klimatyzowanych pomieszczeniach – mogą się rozgrzać do tego stopnia, że koniec końców ulegną poważnej awarii. Wadą tych strategii chłodzenia jest niestety ich wysoka energochłonność. Podczas gdy komputery osobiste do chłodzenia układów scalonych zazwyczaj wykorzystują wentylatory, w projekcie TEXTAROSSA postawiono na bardziej wydajny materiał. „Opracowaliśmy wydajną technologię chłodzenia dwufazowego, w której specjalna ciecz jest pompowana przez zamknięty obwód otaczający procesor”, wyjaśnia Celino. Działając na zasadzie lodówki, mechanizm ten polega na przemianach fazowych cieczy – parowaniu i skraplaniu – aby w ten sposób skutecznie pochłaniać ciepło z procesorów i bezpiecznie je odprowadzać. Im intensywniejsza praca komputera, tym więcej ciepła zaczyna on wytwarzać, w związku z tym nowa technologia chłodzenia została połączona z automatyczną kontrolą termiczną, która reguluje stopień chłodzenia w zależności od stanu procesorów.
Mniejszy znaczy lepszy
Zespół projektu opracował również nowe oprogramowanie systemowe umożliwiające lepsze zarządzanie zadaniami obliczeniowymi i osiągnięcie większej wydajności operacyjnej. „Oprogramowanie to oferuje większą szybkość w obszarze zarządzania danymi i przenoszenia danych, a także płynne zarządzanie zadaniami obliczeniowymi, pozwalając na optymalizację procesu rozdzielania ich na poszczególne procesory”, dodaje Celino. „Umożliwia to użytkownikom wykorzystanie imponującej mocy obliczeniowej w ramach rozległych obliczeń równoległych”. Kolejnym krokiem w projekcie było opracowanie dwóch różnych architektur węzłów obliczeniowych, które mają być wykorzystywane w przyszłych infrastrukturach HPC. Powstały dwa prototypy wyposażone w różne rodzaje nowoczesnych procesorów, przy czym w obu zastosowano narzędzia opracowane w ramach projektu TEXTAROSSA. Następnie na tychże prototypach uruchomiono szereg aplikacji, między innymi opartych na sztucznej inteligencji i wysokowydajnej analizie danych. Dzięki temu zespół projektu był w stanie zmierzyć wszelkie parametry wskazujące na zwiększoną wydajność obliczeniową i efektywność energetyczną. „Chcieliśmy sprawdzić, czy nasze techniki mogłyby stanowić użyteczną metodę zapobiegania przegrzewaniu się superkomputerów, a jednocześnie zapewniania mocy obliczeniowej wymaganej w przypadku rzeczywistych zastosowań”, wyjaśnia Celino. Wyniki potwierdziły działanie obu prototypowych systemów, jak również skuteczność poszczególnych narzędzi oprogramowania oraz efektywność technologii chłodzenia. „Uniwersytet w Turynie poprosił o zbudowanie prototypu platformy, więc obecnie mamy już trzy”, mówi Celino. „Dzisiejszym wyzwaniem jest dalsze doskonalenie tych prototypów i prace związane z miniaturyzacją i inżynierią technologii”.
Słowa kluczowe
TEXTAROSSA, Wspólne Przedsięwzięcie EuroHPC, obliczenia, ciepło, efektywność, chłodzenie, ciecz, przemiana fazowa, eksaskala, superkomputery, HPC, CPU