Feature Stories - Kommunikation mit der Zukunft
Hassen Sie es auch, wenn Sie versuchen eine Computerdatei zu öffnen und es öffnet sich eine Box mit der Aussage "Ungültiges Dateiformat"? Oder, wenn Anbieter von Software und Betriebssystemen bekanntgeben, dass sie ältere Systeme nicht länger unterstützen und aktualisieren werden? Datenformate, IKT-Hardware, Software und Protokolle entwickeln sich nun einmal ständig weiter. Wir sammeln und manipulieren jedoch heutzutage so viele Daten. Die Frage ist: Könnten diese verloren gehen, nur weil ihr Format veraltet ist oder sich die Hardware verändert hat? Erfolg und Wohlstand zukünftiger Generationen stützen sich durchaus auf den Zugang zu den Informationen aus der Vergangenheit. Befinden sich also unsere Nachkommen in der Gefahr, ohne Wissen dazustehen, weil sich alles, was wir heute wissen, in Computersystemen und -codes verbirgt, die eines Tages niemand mehr knacken kann? Ein Rahmen für die Weiterentwicklung muss her Das von der EU geförderte SHAMAN-Projekt (1) hat ein Framework entwickelt, das "Digital Preservation" (DP), d. h. die digitale Langzeitarchivierung und Bewahrung, für nahezu jedes Datenformat ermöglicht. Die Menschen wollen digitale Objekte und Informationen in dem Vertrauen speichern und archivieren, dass sie in der Zukunft in vollem Umfang zugänglich und nutzbar sind, ganz egal, was die Zukunft auch immer bringen mag. "SHAMAN hat neue Technologien entwickelt, die es uns ermöglichen können, mit der Zukunft zu kommunizieren und die wertvollen digitalen Dinge zu sichern, die wir heute erschaffen. Sie werden für die kommenden Generationen lesbar, zugänglich und nutzbar sein", zeigt sich Projektkoordinator Ruben Riestra überzeugt. Er fährt dazu fort: "Entgegen der allgemeinen Vorstellung, dass 'digital ewig hält', sollte man die Risiken des Verlusts digitaler Inhalte im Zusammenhang mit der Obsoleszenz von Hard- und Software nicht unterschätzen; hier könnten erhebliche Schäden an wertvollen Informationen auftreten. Das schnelle Entwicklungstempo bei digitalen Informationen spiegelt sich nicht zwangsläufig auch in anderen Bereichen wider; der Airbus A380 wird zum Beispiel einige Jahrzehnte im Betrieb bleiben und deshalb muss die digitale Dokumentation der Flugzeugwartung für die nächsten 40 bis 50 Jahre gespeichert, gesichert und leicht zugänglich sein." Eine ganzheitliche Lösung Die "SHAMAN-Referenzarchitektur" (SRA) bietet eine vereinheitlichte Sicht auf die digitale Langzeitarchivierung, wobei man sich dem Problem aus einer ganzheitlichen Perspektive annähert. Eine nahtlos in die Gesamtarchitektur einer Einrichtung integrierbare digitale Langzeitarchivierung wird durch die SHAMAN-Referenzarchitektur ermöglicht. Bei der Entwicklung des Frameworks mussten die Projektpartner aktuelle Praktiken der digitalen Langzeitarchivierung erforschen und eine Architektur erschaffen, die nicht durch die Grenzen einer speziellen Methodik für digitale Langzeitarchivierung eingeschlossen ist. Unter Beachtung der von derzeitigen Nutzern aktueller Methoden zur digitalen Langzeitarchivierung in einer Vielzahl von Einrichtungen vorgebrachten speziellen Belange konnte das SHAMAN-Team eine Lösung erstellen. Diese ermöglicht den Einrichtungen eine unkomplizierte digitale Langzeitarchivierung, für die die Bewahrung von Inhalten nicht unbedingt zu den primären geschäftlichen Anforderung zählt, aber dennoch für den zukünftigen Erfolg Bedeutung besitzt. Zu dem SHAMAN-Framework zählen Tools zur Analyse, zur Verwaltung, zur Wiederverwendung von Informationsobjekten und Daten in verschiedenen Bibliotheken und Archiven sowie zum Zugriff auf diese. Es unterstützt die Archivierung von Informationen sowie spezieller Anwendungen und Dienste, auf die Daten angewendet werden könnten, und das alles auf eine Weise, dass zukünftige Technologien und Systeme in der Lage sein werden, sie zu verstehen und auszuführen. Sollen zum Beispiel Animationsdateien archiviert werden, so kann man nicht einfach ein Video speichern. Es ist gleichermaßen wichtig, dass man Nachbearbeitungsprozesse (wie etwa Farbtransformationen) auf individuelle Frames des Videos anwenden oder erneut anwenden kann. Und die SHAMAN-Referenzarchitektur macht dies möglich. Mehr als Clouds Die Architektur geht außerdem über einfache Speicherlösungen in der Cloud hinaus. In Ruben Riestras Worten: "Der wichtigste Unterschied ist der Zeitrahmen: Zwischenspeichern in der Cloud ist vor allem für kurzfristige Anwendungen gedacht, während die digitale Langzeitarchivierung Fragen wie mehrfache Umstellungen bzw. Migrationen im Laufe der Zeit sowie die Veralterung von Hard- und hauptsächlich Software berücksichtigt." Die Cloud besteht derzeit aus einer Vielzahl von Dienstleistungen, Lösungen, Plattformen und Technologien, die sich alle noch in eher frühen Stadien befinden. "Digitale Inhalte in die Cloud zu geben, ist immer noch risikobehaftet", schätzt Riestra ein. "Wir brauchen stattdessen robuste Langzeitlösungen, die Daten und Metadaten in vielerlei Formaten für die Zukunft sichern und bewahren können." Prototypanwendungen Das SHAMAN-Projekt erstellte drei Prototypanwendungen, die dazu dienen, die Validität des Frameworks zu demonstrieren und einige unter Einsatz der Referenzarchitektur entwickelte exemplarische Tools zu präsentieren. Der in Zusammenarbeit mit der Deutschen Nationalbibliothek entwickelte erste Prototyp konnte mit Erfolg unter Beweis stellen, dass der komplette digitale Lebenszyklus (Erstellung, Assembly, Archivierung/Sicherung, Annahme und Wiederverwendung) auf Bücher und zugehörige Materialien (wie etwa Dokumente, Dias und Videos) angewandt werden könnte. Das Projekt führte vor, wie sämtliche Informationen einschließlich der Metadaten zur Struktur und Daten über Kontext der Erstellung zum Einsatz gebracht werden könnten. Überdies konnten bestimmte archivarische Funktionalitäten wie zum Beispiel die Migration von Bildformaten von TIFF zu JPEG mit hoher Qualitätssicherung durchgeführt werden. Beim zweiten Prototyp wurden die Konzepte des SHAMAN-Frameworks auf die Industrie angewendet, wobei man die Ziele im Blick hatte, die Effizienz zu steigern, rechtliche Vorschriften einzuhalten und die Back-up-Zeiten zu verbessern. "Im Bereich der Industrie ist digitalen Langzeitarchivierung immer noch nicht allgemein akzeptiert und unterliegt anderen Anforderungen, die oftmals durch gesetzliche Bestimmungen beeinflusst werden. Vertrauen, Authentizität und Zugriffsrechte prägen außerdem die Lösungen, die derzeit im Angebot und in der Entwicklung sind", wie Ruben Riestra erläutert. "Unser Prototyp demonstriert die erfolgreiche Integration eines Produktlebenszyklus-Managementsystems mit eingebauter digitaler Langzeitarchivierung, das auf einem Testfall aus der Unterhaltungselektronik basiert." Der dritte Prototyp ist für den Wissenschaftssektor bestimmt, wobei in diesem Bereich kontinuierlich große Datenmengen erzeugt und verwaltet werden müssen. "Wir verfolgten drei Szenarien und wollten nachweisen, wie es möglich ist, Sensordaten aus den Bauingenieurwissenschaften (Staudammsicherheit), wissenschaftliche Arbeitsabläufen und experimentelle Daten aus der Teilchenphysik zu erfassen und zu archivieren", sagt Riestra. "In diesen Bereichen müssen gewaltige Mengen komplizierter Daten in vielen verschiedenen Formaten gespeichert, verwaltet und erneut verwendet werden und die SHAMAN-Infrastruktur konnte dies auf effektive Weise meistern, was wiederum ihre Flexibilität demonstrierte." Das SHAMAN-Projekt konnte bereits zur Erhaltung und Archivierung digitaler Daten zwecks zukünftiger Referenz in vielen Einrichtungen, auch Universitäten, Ingenieurbüros, Technologie-Spin-Out-Firmen und Nationalbibliotheken, beitragen. SHAMAN hat durch die Entwicklung einer ganzheitlichen Lösung, die in ihrem Entwurf vielfältige Vorteile für diverse Einrichtungen zu bieten hat, eine Architektur vorgelegt, welche die digitale Langzeitarchivierung einfach und attraktiv gestaltet. So werden jene ärgerlichen Fehlermeldungen hoffentlich schon bald der Vergangenheit angehören und wahrscheinlich eines der wenigen Dinge sein, die wir auf gar keinen Fall archivieren wollen. Das SHAMAN-Projekt erhielt 8,4 Mio. EUR des Gesamtprojektbudgets in Höhe von 12,29 Mio. EUR in Form von Forschungsmitteln aus dem Bereich "Digital libraries and technology-enhanced learning" des Siebten EU-Rahmenprogramms (RP7). (1) "Sustaining heritage access through multivalent archiving" Nützliche Links: - Website "Sustaining heritage access through multivalent archiving" - SHAMAN-Projektfactsheet auf CORDIS