Lepsze oprogramowanie dla lepszej nauki
Obecnie dla większości sektorów publicznych i prywatnych przetwarzanie danych w chmurze to coś naturalnego: stanowi integralną część współczesnej „Infrastruktury jako usługi” (ang. Infrastructure as a Service, IaaS). Jednak jego wykorzystanie nie zostało jeszcze w pełni zaakceptowane przez środowisko naukowe, szczególnie na poziomie „Platformy jako usługi” (ang. Platform as a Service, PaaS) i „Oprogramowania jako usługi” (ang. Software as a Service, SaaS). Rozumiejąc, że środowisko to może czerpać korzyści z przetwarzania danych w chmurze, naukowcy opracowali w ramach projektu INDIGO-DATACLOUD platformę danych i sprzętu specjalnie dla społeczności naukowych. „Celem tego projektu było zapewnienie europejskiemu środowisku naukowemu narzędzi, potrzebnych do bardziej efektywnego prowadzenia badań.” - mówi koordynator projektu, Davide Salomoni. „Dlatego stworzyliśmy platformę, która może jednoczesnego reagować na potrzeby naukowców z bardzo różnych dziedzin w zakresie obliczania, przetwarzania i przechowywania danych.” Realne rozwiązania rozwiązujące realne problemy Aby stworzyć oprogramowanie INDIGO, zespół badawczy musiał sięgnąć do kluczowego europejskiego know-how i ponownie wykorzystać i rozszerzyć oprogramowanie typu open source. Określono rygorystyczne procesy opracowywania i zarządzania oprogramowaniem, opracowano wewnętrzne rozproszone środowisko testowe w celu opracowania oprogramowania i aplikacji oraz przygotowania do produkcji. „Rozpoczęliśmy projekt, świetnie zdając sobie sprawę, że aby skutecznie korzystać z rozproszonych zasobów, społeczności naukowe muszą przejść przez złożone procedury.” - mówi Salomoni. „Czasami w ogóle nie było możliwe wykorzystanie dostępnych zasobów.” Zdaniem Salomoniego wyzwania związane były przede wszystkim ze znalezieniem właściwych zasobów, a także zapewnieniem elastyczności uwierzytelniania i autoryzacji w celu ich wykorzystania. Inne wyzwania obejmowały przenoszenie tradycyjnych aplikacji do rozproszonych środowisk i efektywne ich stosowanie, integracja obliczeń i danych ponad granicami oraz określenie surowych wymogów, które ostatecznie mogłyby zostać przekształcone w rozwiązania bez potrzeby posiadania szerokiej wiedzy informatycznej. „Punktem wyjściowym były rzeczywiste problemy zgłaszane nam przez wiele społeczności naukowych. Stworzyliśmy otwarte komponenty oprogramowania, które można łączyć, integrować i wdrażać w e-infrastrukturę, mające na celu rozwiązanie tych problemów.” - wyjaśnia Salomoni. „Dzięki temu procesowi natychmiast dostrzegliśmy potrzebę radykalnego uproszczenia i rozszerzenia narzędzi i metod informatycznych, aby naukowcy mogli wykorzystać zasoby do rozwiązania swoich problemów bez konieczności posiadania szerokiej wiedzy informatycznej.” Stworzona architektura INDIGO składa się z dwóch głównych wersji oprogramowania i 14 drobnych aktualizacji, udostępnianych nieodpłatnie z licencją open source. Pierwsza wersja, o nazwie „Midnight Blue”, stanowi elastyczną platformę, która może działać w ramach publicznej i prywatnej infrastruktury chmury. Druga, „ElectricIndigo”, opiera się na pierwszej wersji i stanowi jej rozszerzenie, zwiększając stabilność i zapewniając większą programowalność, skalowalność, automatyzację i elastyczność. Wersje oprogramowania INDIGO można pobrać z tutaj. Integracja świata nauki Badania w Europie są sfragmentaryzowane, co doprowadziło do braku efektywności i nieoptymalnego wykorzystania zasobów finansowych i know-how. Ale dzięki projektom takim jak INDIGO-DATACLOUD, który wspiera inicjatywę UE w zakresie europejskiej otwartej chmury obliczeniowej (ang. European Open Science Cloud, EOSC), wszystkie elementy zaczynają się integrować. „Udowodniliśmy, że dziedziny naukowe tak różnorodne, jak dziedzictwo kulturowe, fizyka, bioinformatyka, obrazowanie medyczne, astronomia, klimatologia i wiele innych, mogą łatwo i efektywnie korzystać ze swoich aplikacji w publicznych lub prywatnych środowiskach rozproszonych poprzez zintegrowanie elementów INDIGO.” - podsumowuje Salomoni.
Słowa kluczowe
INDIGO-DATACLOUD, przetwarzanie danych w chmurze, środowiska naukowe, badania, oprogramowanie open source