Eine bessere Software für eine bessere Wissenschaft
In großen Teilen des öffentlichen und privaten Sektors ist das mittlerweile allgegenwärtige Cloud-Computing ein integraler Bestandteil der heutigen „Infrastructure as a Service“ (IaaS). Das Potenzial des Cloud-Computing wird von der Wissenschafts-Community allerdings noch nicht vollständig ausgeschöpft, dies betrifft insbesondere die „Platform as a Service“ (PaaS)- und die „Software as a Service“ (SaaS)-Ebene. In Anbetracht dessen, dass das Cloud-Computing für die Community einen Vorteil bedeuten könnte, wurde im Rahmen von Projekt INDIGO-DATACLOUD eine Daten- und Rechenplattform entwickelt, die speziell auf die Wissenschaftsgemeinden ausgerichtet ist. „Das Ziel dieses Projekts war es, der Wissenschaftsgemeinde Europas die Werkzeuge an die Hand zu geben, die gebraucht werden, um noch effektiver forschen zu können“, sagt Projektkoordinator Davide Salomoni. „Hierzu entwickelten wir eine Plattform, die gleichzeitig auf den Rechen-, Verarbeitungs- und Datenspeicherbedarf von Forschern aus sehr unterschiedlichen Disziplinen reagieren kann.“ Echte Lösungen für echte Probleme Zur Erstellung der INDIGO-Software musste das Forschungsteam auf wichtiges europäisches Know-how zurückgreifen sowie „Open Source“-Software wiederverwenden und erweitern. Es wurden stringente Softwareentwicklungs- und -managementprozesse definiert und interne Prüfstände für Software- und Anwendungsentwicklung sowie Vorproduktion eingerichtet. „Zu Beginn des Projekts war uns bereits sehr bewusst, dass die Wissenschaftsgemeinden zur effektiven Nutzung verteilter Ressourcen komplexe Prozeduren durchlaufen müssten“, sagt Salomoni. „Mitunter war es sogar überhaupt nicht möglich, verfügbare Ressourcen zu nutzen.“ Laut Salomoni reichten die Herausforderungen vom Finden der richtigen Ausgangsressourcen bis zur Gewährleistung, dass sich die Authentifizierung und Autorisierung in Bezug auf deren Nutzung flexibel gestaltete. Zu weiteren Herausforderungen zählten die Portierung bisheriger Anwendungen auf verteilte Umgebungen und deren effizienter Betrieb, die grenzübergreifende Vereinigung von Rechenleistung und Daten sowie die Formulierung hoher Anforderungen, die letztlich, in Lösungen verwandelt werden könnten, ohne dass umfassende IT-Kenntnisse erforderlich wären. „Wir setzten bei den eigentlichen Problemen an, die viele Wissenschaftsgemeinden für uns kenntlich gemacht hatten und schrieben ,Open Software‘-Komponenten, die in E-Infrastrukturen kombiniert, integriert und implementiert werden können, um diese Probleme zu lösen“, erklärt Salomoni. „Dieser Prozess verdeutlichte umgehend den Bedarf für eine drastische Vereinfachung und Erweiterung von IT-Tools und -Methoden, damit Wissenschaftler die Ressourcen zur Lösung eigener Probleme nutzen könnten, ohne erst zum IT-Experten werden zu müssen.“ Die hieraus resultierende INDIGO-Architektur setzt sich aus zwei großen Softwareversionen und 14 kleineren Updates zusammen, die allesamt durch eine kostenfreie „Open Source“-Lizenz veröffentlicht worden sind. Die erste Version mit der Bezeichnung „Midnight Blue“ stellt eine flexible Plattform zur Verfügung, die sowohl in öffentlichen als auch in privaten Cloud-Infrastrukturen funktioniert. Die zweite Version, ElectricIndigo, baut auf der ersten Version auf und erweitert diese, um die Stabilität zu verbessern und mehr Programmierbarkeit, Skalierbarkeit, Automatisierung und Flexibilität zu ermöglichen. Die INDIGO-Software-Releases können hier heruntergeladen werden. Forscher zusammenführen Die Forschung in Europa ist fragmentiert, eine Situation die zu Ineffizienzen und zu einer suboptimalen Nutzung von geförderten Ressourcen und Fachwissen geführt hat. Dank Projekten wie INDIGO-DATACLOUD, das die EU-Initiative „Europäische Cloud für offene Wissenschaft“ (European Open Science Cloud, EOSC) unterstützt, fügen sich die Mosaiksteine langsam zusammen. „Wir haben bewiesen, dass sehr unterschiedliche wissenschaftliche Gebiete, die neben vielen anderen [Gebieten] das kulturelle Erbe, die Physik, die Bioinformatik, die medizinische Bildgebung, die Astronomie und die Klimaforschung betreffen, durch Integration der INDIGO-Komponenten mühelos und effektiv ihre Anwendungen in öffentlichen oder privaten verteilten Umgebungen ausführen können“, lautet die Schlussfolgerung von Salomoni.
Schlüsselbegriffe
INDIGO-DATACLOUD, Cloud-Computing, Wissenschafts-Communitys, Forschung, Open Source