Platforma w chmurze upraszcza dostęp do danych z obserwacji Ziemi dla każdego
Gwałtowny wzrost ilości danych obserwacyjnych (Ziemi i ) środowiska wymaga innowacyjnych rozwiązań, aby zapewnić do nich dostęp i ich efektywniejsze wykorzystanie. Zwykłe pobieranie a następnie przetwarzanie tej ogromnej ilości danych na ograniczonych zasobach lokalnych jest nieefektywne i sprzeczne z nowoczesną filozofią big data. Utrzymujące się wyzwania, takie jak identyfikacja, dostęp i pełne wykorzystanie tych zbiorów danych, zmniejszają ich potencjalny wpływ. Odpowiedzi na te kwestie poszukuje finansowany ze środków UE projekt FAIRiCUBE, udostępniając dane gridowe i algorytmy szerszemu gronu odbiorców, rozszerzając dostęp poza tradycyjne społeczności obserwacji Ziemi. Jego misją jest dostarczanie danych, które są możliwe do znalezienia, dostępne, interoperacyjne i nadają się do ponownego wykorzystania (FAIR) oraz które można udostępniać w sposób zaufany. W tym celu naukowcy opracowują FAIRiCUBE HUB — przekrojową platformę przeznaczoną do pozyskiwania, dostarczania i analizy danych oraz ich przetwarzania i rozpowszechniania. Aby pokazać, w jaki sposób wspomniany Hub pomaga rozwiązać te kwestie, zespół projektu FAIRiCUBE opracował pięć przypadków użycia (niektóre z nich to adaptacja miast do zmian klimatu oraz powiązanie różnorodności biologicznej i rolnictwa), koncentrując się na różnych wymiarach działań priorytetowych Europejskiego Zielonego Ładu (EGD).
Pokonywanie odizolowania danych i usprawnianie procesu decyzyjnego
„Nasza główna innowacja, FAIRiCUBE HUB, płynnie łączy różnorodne zbiory danych z obserwacji środowiska oraz przepływy pracy w nauce o danych, aby umożliwić łatwy dostęp do krytycznych informacji, ich analizę i wizualizację” — zauważa Stefan Jetschny, koordynator projektu. Łącząc najnowocześniejsze narzędzia do analizy danych i przepływy pracy, kostki danych geoprzestrzennych i aplikacje do uczenia maszynowego, Hub upraszcza złożone analizy i etapy przetwarzania, co zmniejsza potrzebę dostosowywania technicznego. Wspólne przepływy pracy i skrypty istniejących przypadków użycia dokumentują potencjał i użyteczność Hubu dla przyszłych użytkowników, takich jak badacze i naukowcy zajmujący się danymi. Infrastruktura chmurowa zapewnia skalowalne i łatwe w zarządzaniu zasoby oraz informacje gotowe do wykorzystania przy podejmowaniu decyzji, oferując przydatne spostrzeżenia dostosowane właśnie do tego celu. Konfigurowalne interaktywne pulpity nawigacyjne i narzędzia do wizualizacji pomagają użytkownikom skutecznie prezentować wyniki, dzięki czemu platforma jest nieoceniona dla decydentów, dziennikarzy, badaczy, jak i organizacji pozarządowych.
Pokonywanie przeszkód w zarządzaniu danymi klimatycznymi i środowiskowymi
„Kostki danych, które organizują duże zbiory danych w przestrzeni i czasie, są niezbędne dla nauki o środowisku. Jednak ich rozmiar, złożoność, kompletność i niespójność często prowadzą do wyzwań, które ograniczają zastosowania uczenia maszynowego” — wyjaśnia Kathi Schleidt, koordynatorka techniczna FAIRiCUBE. „FAIRiCUBE odpowiada na te wyzwania, opracowując rozproszone techniki uczenia maszynowego dostosowane do kostek danych. Metody te skutecznie przetwarzają złożone zbiory danych, rekonstruują brakujące dane poprzez wypełnianie luk i zwiększają precyzję skalowania w dół”. Fragmentaryczność katalogów danych geoprzestrzennych stanowi kolejne wyzwanie, ponieważ komplikuje wyszukiwanie danych, dostęp do nich i ich wykorzystanie. Zespół projektu FAIRiCUBE prezentuje za pomocą własnego katalogu danych, w jaki sposób użytkownicy mogą skorzystać z ulepszonego opisu metadanych, a tym samym znormalizowanych i zharmonizowanych danych FAIR. Wreszcie, naukowcy z różnych dziedzin i środowisk wnoszą wkład do bazy wiedzy FAIRiCUBE — wspólnej biblioteki, która opisuje, w jaki sposób FAIRiCUBE HUB rozwiązuje złożone pytania badawcze przy użyciu najnowocześniejszych algorytmów przetwarzania danych i uczenia maszynowego do analizy złożonych zbiorów danych.
Użytkownicy innowacyjnych narzędzi danych
Zespół projektu FAIRiCUBE pracuje nad modelami biznesowymi, aby udostępnić FAIRiCUBE Hub użytkownikom nietechnicznym i specjalistom z branży w dziedzinach takich jak rolnictwo, różnorodność biologiczna i infrastruktura miejska, aby dać im dostęp do dostosowanych rozwiązań w zakresie danych z obserwacji Ziemi, które optymalizują planowanie operacyjne i podejmowanie decyzji. „Dostawcy usług mogliby wykorzystać scentralizowane zbiory danych i przygotowane wstępnie narzędzia analityczne w celu usprawnienia przepływu pracy i dostarczania usług klientom” — podkreśla Jetschny. „Hub mógłby również przynieść korzyści biurom ekologicznym w przeprowadzaniu ocen środowiskowych, zapewnianiu zgodności z przepisami i monitorowaniu ekologicznym, podczas gdy analitycy polityczni mogliby wykorzystać przetworzone dane w zaleceniach opartych na dowodach”. Użytkownikom pośrednim, takim jak urbaniści i organizacje pozarządowe, Hub może dostarczać informacje gotowe do wsparcia procesów decyzyjnych. „Administratorzy miejscy i planiści regionalni mogliby uzyskać geoprzestrzenne informacje, które posłużyłyby im w kierowaniu inicjatywami planowania urbanistycznego i zrównoważonego rozwoju. Decydentom Hub dostarcza danych umożliwiających kształtowanie strategii ryzyka klimatycznego i polityk środowiskowych” — podsumowują Jetschny i Schleidt.
Słowa kluczowe
FAIRiCUBE, obserwacja Ziemi, platforma, podejmowanie decyzji, uczenie maszynowe, scentralizowane repozytorium