Opis projektu
Zaawansowany system pamięci może sprawić, że obliczenia eksaskalowe staną się bliższe rzeczywistości
Zespół finansowanego przez UE projektu IO-SEA planuje przygotowanie nowatorskiej platformy do zarządzania danymi i ich przechowywania na potrzeby obliczeń eksaskalowych. Platforma będzie korzystać z magazynów obiektów, hierarchicznego zarządzania pamięcią masową i udostępniania usług pamięci masowej na żądanie. Będzie ona efektywnie wykorzystywać warstwy pamięci masowej, w tym specyfikację NVM Express (NVMe) i nieulotną pamięć o dostępie swobodnym (NVRAM), łącznie z technologiami taśmowymi. Wykorzystanie efemerycznych węzłów danych i akcesorów danych powinno umożliwić użytkownikom elastyczne korzystanie z systemu przy użyciu różnych dobrze znanych paradygmatów dostępu do danych. Zastosowanie efemerycznych zasobów wyeliminuje problem statycznego podejścia do zasobów pamięci masowej i komponentów systemu. Nowo opracowane metody zarządzania danymi znajdą zastosowanie w aplikacjach intensywnie korzystających z danych na platformach eksaskalowych.
Cel
IO-SEA aims to provide a novel data management and storage platform for exascale computing based on hierarchical storage management (HSM) and on-demand provisioning of storage services. The platform will efficiently make use of storage tiers spanning NVMe and NVRAM at the top all the way down to tape-based technologies. System requirements are driven by data intensive use-cases, in a very strict co-design approach. The concept of ephemeral data nodes and data accessors is introduced that allow users to flexibly operate the system, using various well-known data access paradigms, such as POSIX namespaces, S3/Swift Interfaces, MPI-IO and other data formats and protocols. These ephemeral resources eliminate the problem of treating storage resources as static and unchanging system components – which is not a tenable proposition for data intensive exascale environments. The methods and techniques are applicable to exascale class data intensive applications and workflows that need to be deployed in highly heterogeneous computing environments.
Critical aspects of intelligent data placement are considered for extreme volumes of data. This ensures that the right resources among the storage tiers are used and accessed by data nodes as close as possible to compute nodes – optimising performance, cost, and energy at extreme scale. Advanced IO instrumentation and monitoring features will be developed to that effect leveraging the latest advancements in AI and machine learning to systematically analyse the telemetry records to make smart decisions on data placement. These ideas coupled with in-storage-computation remove unnecessary data movements within the system.
The IO-SEA project (EuroHPC-2019-1 topic b) has connections to the DEEP-SEA (topic d) and RED-SEA (topic c) project. It leverages technologies developed by the SAGE, SAGE2 and NextGEN-IO projects, and strengthens the TLR of the developed products and technologies.
Dziedzina nauki
Not validated
Not validated
Słowa kluczowe
Program(-y)
Zaproszenie do składania wniosków
Zobacz inne projekty w ramach tego zaproszeniaSystem finansowania
RIA - Research and Innovation actionKoordynator
75015 PARIS 15
Francja