Markieren von sensiblen Daten in der Biowissenschaftsforschung
Vom Klimawandel bis hin zu globalen Pandemien steht die Welt vor großen umwelt- und gesundheitsbezogenen Herausforderungen, die biowissenschaftliche Forschungseinrichtungen dazu zwingen, ihre Daten und digitalen Ressourcen auf der Suche nach Lösungen zu bündeln. Viele der durch biologische und medizinische Forschung generierten Daten sind jedoch sensibel, entweder aufgrund ihrer persönlichen Natur oder aufgrund von Regelungen zum geistigen Eigentum, Bedenken hinsichtlich biologischer Gefahren oder wegen des Nagoya-Protokolls.
Ein Instrumentarium für sensible Daten
Das EU-finanzierte Projekt EOSC-Life bringt Forschungsinfrastrukturen zusammen, um einen offenen, digitalen und kollaborativen Raum für die biowissenschaftliche Forschung zu schaffen, in dem Daten, Instrumente und Analysearbeitsabläufe besser auffindbar, zugänglich, interoperabel und wiederverwendbar sind. Um diesen Prozess zu unterstützen, wurde ein Instrumentarium entwickelt, das Informationen für Forschende bereitstellt, die beabsichtigen, sensible Daten in einer Cloud-Umgebung wie der Europäischen Cloud für offene Wissenschaft zu teilen und/oder zu verwenden. Das Instrumentarium wird in einem wissenschaftlichen Artikel beschrieben, der in der Fachzeitschrift „Scientific Reports“ veröffentlicht wurde. Es basiert auf einem Kategorisierungs- oder Markierungssystem, das in einem Cluster von sechs am Projekt EOSC-Life beteiligten Biowissenschaftsforschungsinfrastrukturen ausgearbeitet und harmonisiert wurde. Es werden dabei keine neuen Inhalte erstellt, sondern Forschenden die Möglichkeit geboten, Ressourcen zu finden, die für den Austausch sensibler Daten über alle beteiligten Forschungsinfrastrukturen hinweg relevant sind. Das Instrumentarium enthält Links zu digitalen Objekten, die sich auf sensible Daten beziehen, wie Vorschriften, Richtlinien, bewährte Praktiken und Software, um die gemeinsame Nutzung und Wiederverwendung von Daten zu unterstützen.
Dreistufige Entwicklung
Das Kategorisierungssystem des Instrumentariums ermöglicht eine einheitliche Kennzeichnung und Verschlagwortung von Ressourcen. Es wurden drei verschiedene Versionen des Kategorisierungssystems konzipiert, die jeweils in einer anschließenden Pilotstudie getestet wurden. Dies führte letztendlich zu einem System mit sieben Hauptkategorien: sensibler Datentyp; Ressourcentyp; Forschungsfeld; Datentyp; Phase im Lebenszyklus der gemeinsamen Nutzung von Daten; geografischer Geltungsbereich; und spezifische Themen. Die dritte Version des Kategorisierungssystems wurde in Pilotstudie 3 mit 110 Ressourcen getestet, von denen bei einer Daten fehlte. Insgesamt 109 in dieser Pilotstudie markierte Ressourcen wurden daher als anfänglicher Inhalt für den Instrumentarium-Demonstrator verwendet. Der Demonstrator ist ein Softwareinstrument, mit dem Forschende digitale Objekte durchsuchen können, die mit sensiblen Daten verknüpft sind, wobei eine Filterung auf der Grundlage des Kategorisierungssystems erfolgt. Die Studienautorenschaft erläutert weiter: „Das Instrument erlaubt die Vorfilterung von Ressourcen, die mit sensiblen Daten verknüpft sind, mit Freitext im Titel, nach DOI oder nach Autorenschaft. Eine weitere Filterung ist in Bezug auf den Artikeltyp (z. B. Fachzeitschriftenartikel, Webinar, Bericht, Software) und die Auswahl einer der vorab aufgelisteten Markierungen aus den verschiedenen Kategorien der Systemversion 3 möglich. Das Suchergebnis kann als PDF oder JSON gespeichert werden.“ Laut der Autorenschaft umfassen die nächsten wichtigen Schritte die Bewertung der Nutzbarkeit und Benutzerfreundlichkeit des Instrumentarium-Demonstrators, die Erweiterung des Instrumentariums, um mehr Ressourcen abzudecken, und die Förderung seiner breiteren Akzeptanz durch verschiedene Biowissenschaftsgemeinschaften und die Entwicklung einer langfristigen Vision für Instandhaltung und Nachhaltigkeit. Das Projekt EOSC-Life (Providing an Open Collaboration Space for Digital Biology in Europe) endet im August 2023. Weitere Informationen: EOSC-Life-Projektwebsite
Schlüsselbegriffe
EOSC-Life, Biowissenschaften, Daten, Instrumentarium, Kategorisierungssystem, Forschung, Forschungsinfrastruktur