Nowe podejście do przechowywania treści cyfrowych
Postępująca cyfryzacja treści ma swoje wady i zalety. Przede wszystkim zapewnia natychmiastowy dostęp do oszałamiającej ilości informacji. Jednak koszt takiego rozwiązania jest bardzo wysoki: w przeciwieństwie do książek cykl życia treści cyfrowych jest bardzo krótki. Cyfrowy ekosystem rozwija się tak szybko – zwłaszcza w kontekście zmieniających się polityk, ram prawnych, praktyk, oczekiwań i zachowań użytkowników czy semantyki – że zagwarantowanie długoterminowego dostępu do tych treści nie zawsze jest możliwe. I tu właśnie wkracza koncepcja „preservation by design” opracowana w ramach projektu PERICLES (Promoting and Enhancing Reuse of Information throughout the Content Lifecycle taking account of Evolving Semantics). „»Preservation by design« oznacza, że idea zachowania danych nie jest ani »spóźnioną refleksją«, ani działaniem podejmowanym dopiero na końcu »aktywnego cyklu życia« obiektu cyfrowego” – mów dr Marc Hedges, starszy wykładowca wydziału Digital Humanities King's College w Londynie, koordynator projektu PERICLES. „Podejście, zgodnie z którym zasoby pozostają pod opieką ich twórcy, wiąże się z proaktywnym, a nie tylko reaktywnym zarządzaniem zasobami cyfrowymi, gdzie przechowywanie danych jest częścią aktywnego cyklu życia obiektu”. Przy takim podejściu obiekt jest uważany za „żyjący”, czyli przechodzący przez kolejny etap cyklu życia, lub za posiadający wiele żyć, tak długo, aż zostanie bezpowrotnie skasowany. „Koncepcja »preservation by design« stanie się nieodłączną częścią całego cyklu życia danych, od momentu ich utworzenia aż do usunięcia” – stwierdza dr Hedges. Więcej niż tylko techniczne przechowywanie danych Istniejące podejścia do przechowywania danych zwykle skupiają się tylko na środowisku technicznym niezbędnym do długoterminowej archiwizacji danych. Mimo iż w wielu publikacjach i standardach podkreśla się, że archiwa takie oprócz zadań technicznych mają również zadania organizacyjne, instytucje nadal przykładają nadmierną wagę do kwestii technicznych. W ramach projektu PERICLES postąpiono zupełnie inaczej: zbadano, jak zmiany poszczególnych elementów środowiska – czy to społeczności użytkowników, samej instytucji, czy też kontekstu społecznego bądź kulturowego – wpływają na przydatność i interpretację obiektu cyfrowego oraz jak można zarządzać tymi zmianami. „Celem projektu PERICLES było zbadanie hipotezy, że jeśli uda nam się określić zależności danych obiektów w określonym ekosystemie i wprowadzić uzyskane na tej podstawie modele i ontologie do warstwy infrastrukturalnej, będziemy w stanie przeanalizować wpływ zmian na dostęp i ponowne wykorzystanie obiektów oraz podjąć odpowiednie działania” – mówi dr Hedges. Jak dotąd zespół opracował program ramy integracji oraz niezbędną architekturę. Celem tych działań jest zaprezentowanie przepływu pracy i elementów umożliwiających wprowadzenie warstwy „zarządzania zmianami” do istniejących systemów repozytoryjnych. Opracowano specjalne systemy testowe, których zadaniem jest sprawdzenie poprawności przyjętego podejścia w różnych scenariuszach. „Elementy, których nie znaleźliśmy na rynku, stworzyliśmy własnymi siłami” – wyjaśnia dr Hedges. „Należą do nich m.in. ontologie dziedzinowe i modele ekosystemów, rozbudowane narzędzie do pozyskiwania danych oraz inne narzędzia do tworzenia ontologii, rejestr podmiotów połączony z repozytoriów modeli, kompilator procesów, narzędzie do zatwierdzania, edytor polityk itd.” W projekcie PERICLES uwzględnione zostaną również inne elementy spełniające role zdefiniowane w programie ramowym integracji. Do sprawdzenia prawidłowości swojej hipotezy dr Hedges i jego zespół użyli danych złożonych i skupili się na dwóch ontologiach dziedzinowych: sztuka i media cyfrowe oraz badania kosmosu. „Instytucje zarządzające tymi danymi wydają się mieć całkowicie odmienne poglądy. Galeria TATE chce zachować swoją kolekcję sztuki cyfrowej i podzielić się ze światem swoimi wyjątkowymi osiągnieciami w zakresie konserwacji dzieł sztuki, podczas gdy dla Centrum Operacji Kosmicznych B.USOC przechowywanie danych wiąże się przede wszystkim z chronionymi magazynami danych. Z drugiej jednak strony koncepcja »ponownego wykorzystania« nie jest zbytnio ceniona w sztuce, zaś w dziedzinie nauk ścisłych takie podejście jest niezwykle popularne” – mówi dr Hedges. Jako jedno z najbardziej ekscytujących osiągnięć dr Hedges wymienia fakt uświadomienia sobie, że wiedza dotycząca zależności między obiektem a jego ekosystemem została uzyskana w wyniku połączenia wielu różnych specjalistycznych dziedzin. Przekształcenie tej wiedzy na modele semantyczne i ontologie zrozumiałe zarówno dla ludzi, jak i maszyn pozwoli opracować nowy sposób współpracy między nimi. „Wymaga to stworzenia nowego sojuszu człowieka i systemu technologicznego, w którym to człowiek będzie stroną aktywną, wprowadzającą dane do modeli i podejmującą decyzje w oparciu o dane dostarczone przez system” – z entuzjazmem opowiada dr Hedges. „Naszą wizją nie jest technologia, której boimy się zaufać, ani magiczna różdżka, która wszystko zrobi za nas”. Spojrzenie w przyszłość Mimo że projekt PERICLES nadal znajduje się w fazie eksperymentalnej, z pewnością jego wynikami zainteresują się linie lotnicze, szpitale, instytucje finansowe i rządowe, które posiadają wiele zasobów cyfrowych i chcą zapewnić sobie pełen dostęp do nich przez długi czas. W kwietniu zespół opublikuje raport opisujący działania mające na celu dotarcie do organizacji, które, mimo że nie są bezpośrednio zaangażowane w proces przechowywania danych, muszą mierzyć się z problemami z tym związanymi. „Równocześnie pracujemy nad stworzeniem portalu o nazwie PRESERVEWARE – centrum do przechowywania danych cyfrowych – który pomoże użytkownikom znaleźć odpowiednie narzędzia do przechowywania danych, w tym te opracowane w ramach projektu PERICLES” – wyjaśnia dr Hedges. „Przyjrzeliśmy się istniejącym repozytoriom i, mimo że są one wspaniałe, uważamy, że im większy jest zasób dostępnych materiałów, tym większa szansa, że specjaliści poszukujący niezbędnych im narzędzi rzeczywiście je znajdą”.
Słowa kluczowe
PERICLES, treści cyfrowe, przechowywanie danych, koncepcja „preservation by design”, semantyka, sztuka cyfrowa, badanie kosmosu, repozytorium, PRESERVEWARE