Datenaufbewahrung auf lange Sicht
Daten sind König, heißt es. Aber das EU-finanzierte Projekt ARCHIVER meint: „Ganz so einfach ist es nicht.“ „Daten sind nur dann König, wenn ihre digitale Aufbewahrung gewährleisten kann, dass so lange wie nötig auf die Forschung zugegriffen und die intellektuelle Kontrolle über sie gewahrt werden kann“, so João Fernandes, Projektleiter bei der Europäischen Organisation für Kernforschung [CERN] und Projektkoordinator von ARCHIVER. „Bedauerlicherweise haben die meisten Forschungsprojekte aufgrund mangelhafter Kostenplanung und Lösungen damit zu kämpfen, ihre Daten auf lange Sicht angemessen zu erhalten.“ Damit Daten ihren gebührenden Platz auf dem Thron wiedererlangen können, entwickelte das Projekt ARCHIVER innovative Lösungen für die langfristige digitale Aufbewahrung wissenschaftlicher Datensätze und erprobte in Pilotversuchen entsprechende Prototypen.
Tatsächliche Lösungen sind bereits verfügbar
Die Arbeit des Projekts orientierte sich an den tatsächlichen Bedürfnisse in der echten Welt verschiedener Interessengruppen, darunter CERN, DESY, EMBL-EBI und PIC. „Wir begannen damit, die aktuellen Lücken in bestehenden Aufbewahrungslösungen auszumachen, die dem öffentlichen Forschungssektor zur Verfügung stehen, indem wir aus früheren Initiativen Lehren zogen“, erklärt Fernandes. „Dann wendeten wir ein agiles F&E-Modell auf verschiedene wissenschaftliche Disziplinen an und entwickelten unsere Lösungen sowohl für öffentliche Forschungsorganisationen als auch Expertinnen und Experten für Datenaufbewahrung.“ Ein Ergebnis dieser Arbeit ist die Software-as-a-Service-Lösung Arkivum für die langfristige digitale Aufbewahrung. Die Lösung unterstützt die Archivierung, die Aufbewahrung und den Zugriff auf umfangreiche und äußerst wertvolle wissenschaftliche Datensätze und ist besonders gut für Disziplinen wie die Astronomie, Teilchenphysik und Genomik geeignet. „Dieser Service ist insofern bemerkenswert, als dass er Datensätze in Petabytegröße auf erschwingliche und umweltfreundliche Weise archivieren und aufbewahren kann“, merkt Fernandes an. Eine weitere Lösung für die langfristige digitale Aufbewahrung, die im Rahmen des Projekts entwickelt wurde, ist LIBNOVA LABDRIVE. „Vor LIBNOVA LABDRIVE wendeten viele Organisationen einen Silo-Ansatz für die Datenaufbewahrung an, wobei jeder Datensatz, jede Fakultät bzw. jede Abteilung auf mehrere, getrennte Systeme zugreifen musste“, fügt Fernandes hinzu. „Dieses neue Produkt ermöglicht allen, ihre Inhalte in einer einzigen Datenbank aufzubewahren, die sich leicht den spezifischen Eigenschaften des Datensatzes anpassen lässt, sodass alle Daten auf einer Plattform zusammengeführt werden.“ Sowohl Arkivum als auch LABDRIVE sind über die Plattform der Europäischen Cloud für offene Wissenschaft (EOSC) verfügbar.
Eine bahnbrechende Innovation
Laut Fernandes werden die Dienstleistungen, die aus dem Projekt ARCHIVER erwachsen, außerordentliche Ergebnisse abliefern. Sie werden außerdem womöglich bedeutende Auswirkungen auf mindestens 18 europaweite Infrastrukturen haben, die insgesamt 1,7 Millionen europäischen Forschenden dienlich sind. Dazu kommen die geschätzten 70 Millionen wissenschaftlichen, informationstechnischen und anderen Fachkräfte, die über die EOSC auf sie zugreifen werden.
Das sind sehr viele Menschen – und noch mehr Daten.
„ARCHIVER stellt für den Ansatz der langfristigen Verwaltung von Forschungsdaten eine wahrhaft bahnbrechende Innovation dar.“ „Außerdem stellt es sicher, dass die Daten entsprechend der Prinzipien Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit gespeichert werden.“ Dank der effizienten F&E-Methodologieverfahren, der erschwinglichen Technologien, der ökologischen Nachhaltigkeit und der sinnvollen Einsparungen an Ressourcen bei der Archivierung und Aufbewahrung großer Datenmengen des Projekts sind Daten nun erneut König. Aber nicht nur die Daten tragen wieder eine Krone. Auch das Projekt ARCHIVER selbst wurde mit dem digitalen Aufbewahrungspreis für Zusammenarbeit und Kooperation 2022 gekrönt. Der Preis ehrt die bedeutende Kooperation über institutionelle, professionelle, sektorale und geografische Grenzen hinweg sowie die nachweislichen Auswirkungen dieser Zusammenarbeit auf die digitale Aufbewahrung.
Schlüsselbegriffe
ARCHIVER, Daten, digitale Aufbewahrung, Forschung, Archivierung, wissenschaftliche Datensätze, langfristige digitale Verwahrung, Software-as-a-Service, Europäische Cloud für offene Wissenschaft