Feature Stories - Eine Menge Daten zu Ihren Diensten
Hinter dem Konzept der "offene Daten" steht die Idee, dass bestimmte Daten für jedermann frei zugänglich sein sollen, um sie nach Belieben verwenden und veröffentlichen zu können, ohne Einschränkung durch Urheberrechte, Patente oder andere Kontrollmechanismen. Inspiriert von Open-Source-Software (nichtproprietär) und offenem Zugang (wissenschaftliche Veröffentlichungen) ist mit dem Konzept der offenen Daten im Großen und Ganzen gemeint, dass Daten frei bewegt, genutzt, wiederverwendet oder elektronisch verbreitet werden können. Ein wichtiger Aspekt dabei ist die Nutzung von nicht-personenbezogenen Informationen, die Bürger an die Behörden und öffentlichen Dienstleistungen weitergeben, zum Vorteil der Gesellschaft. Freie Behördendaten sind eine enorme Ressource, die noch voll ausgeschöpft werden muss. "Die Behörden sammeln im Zuge ihrer normalen Aufgaben eine riesige Menge an qualitativ hochwertigen Daten. Eine Freigabe dieser Daten könnten möglicherweise große Vorteile haben", heißt es auf der Website Open Government Data (OGD) der Arbeitsgruppe Open Government. Rufus Pollock von der Open Knowledge Foundation zufolge könnte eine Freigabe der Daten es Unternehmen, Einzelpersonen und dem gemeinnützigen Sektor ermöglichen, nützliche Anwendungen (Apps) und Dienstleistungen zu schaffen; außerdem würden damit Demokratie, Beteiligung, Transparenz und Rechenschaftspflicht gefördert werden: "Warum soll man die Daten, die bereits vorhanden sind und gesammelt werden, nicht freigeben?" Doch gibt es zahlreiche Herausforderungen - rechtliche, technische, soziale und wirtschaftliche -, die es zu bewältigen gilt, bevor die vielen Vorteile freier (behördlicher) Daten für die Bürger effektiv erschlossen werden können. Hier geht es zur Zukunft ... Von der jüngsten Future Internet Assembly (FIA) in Aalborg, Dänemark, wurde festgehalten, dass "Trends wie 'Big Data' und das 'Internet der Dinge' (Internet of Things, IoT), einschließlich der Idee der 'Menschen als Sensoren', zeigen, wie Bürger, Unternehmer oder Innovatoren neue Dienste und Anwendungen zum Nutzen intelligenter Städte entwickeln." FIA-Moderator Reinhard Scholl von der International Telecommunication Union (ITU) nannte als gute Beispiele die Open-Data-Initiative in New York, Amsterdams Programm "Smart City", "Open Data Gencat" der katalanischen Regierung und den Wettbewerb "Open Cities Challenge" der Europäischen Kommission. Bewährte Praktiken aus den USA, so Reinhard Scholl, umfassen das Experiment "Track Trash" am MIT, in dem mithilfe von Sensoren überwacht wurde, wo der Müll landet. Und in Oakland trägt die datengesteuerte Dienstleistung "Crime Spotting" dazu bei, die Sicherheit in der Stadt zu verbessern. Informationen des öffentlichen Sektors (public-sector information, PSI) ist laut der Generaldirektion Kommunikationsnetze, Inhalte und Technologien (DG Connect) die größte Einzelquelle von Informationen und umfasst digitale Karten, Wetter-, Rechts-, Verkehrs-, Finanz-, Wirtschafts- und andere Daten. Die meisten dieser Rohdaten könnten wiederverwendet oder in neue Produkte und Dienstleistungen für den täglichen Gebrauch integriert werden, zum Beispiel für Navigationssysteme, Wettervorhersagen, Finanz- und Versicherungsdienstleistungen. "Bei der Wiederverwendung von Informationen des öffentlichen Sektors geht es darum, sie auf neue Art und mit Mehrwert zu nutzen, indem man Informationen aus verschiedenen Quellen kombiniert und dabei sogenannte Mash-ups und neue Anwendungen sowohl für kommerzielle als auch nichtkommerzielle Zwecke schafft. Informationen des öffentlichen Sektors haben ein großes wirtschaftliches Potenzial", erklärt die Kommission auf ihrer Website zum Thema PSI . EU-Forschung im Wandel Die Forschungslandschaft reagiert auch auf die rasanten Veränderungen in Sachen Erhebung, Verarbeitung und Handhabung von Daten. Finanziert durch RP7-Maßnahmen zu "Technologien für das Informationsmanagement" im Rahmen des Bereichs "Inhalt und Wissen" haben sich verschiedene Projekte mit einer Reihe von Forschungsthemen wie Onlineinhalte, interaktive und soziale Medien, Argumentation und Informationsnutzung sowie Wissenserschließung und -management befasst. Das EU-finanzierte Projekt Weknowit ("Emerging, collective intelligence for personal, organisational and social use") hat eine Plattform entwickelt, mit der Unmengen von nutzergenerierten Inhalten von einem Problem des Informationsüberflusses in eine neue, "kollektive Intelligenz" überführt werden. Die möglichen Anwendungsbereiche reichen dabei von Notfalleinsätzen bis hin zum Städtetourismus. Im Rahmen des Projekts konnten mehrere Patente eingereicht werden, und eine Handvoll Produkte und Ergebnisse sind zur Veröffentlichung und Kommerzialisierung vorgesehen. "Mit einer Vielzahl von Werkzeugen sortiert die Weknowit-Plattform umfangreiche und schlecht strukturierte Informationen nach sinnvollen Themen, Organisationen, Orten von Interesse, sozialen Verbindungen und Veranstaltungen", erklärt Projektkoordinator Yiannis Kompatsiaris vom Multimedia Knowledge Lab am Informatics and Telematics Institute (ITI-CERTH ) in Griechenland. Zu diesem Zweck entwickelten die Partner eine Middleware-Anwendung, die auf Servern bereitgestellt werden kann, um eingehende Daten zu verarbeiten und effektiv weiterzuleiten. Darüber hinaus entstanden im Rahmen der Projektfallstudien mehrere Werkzeuge wie etwa ein Notfallszenario und ein Szenario für Verbrauchergruppe sowie ein Dutzend weiterer Werkzeuge für spezielle Aufgaben. Währenddessen arbeiten das CERTH-ITI, Yahoo! und die Universität Koblenz weiter zusammen an Echtzeit-Aspekten der Informationsextraktion aus sozialen Medien sowie an Anwendungen im Nachrichtenbereich und für große Veranstaltungen wie zum Beispiel Filmfestivals. Offene Daten auch für die Wissenschaft Dank der Fortschritte im Cloud- und Grid-Computing, oder Supercomputing, kommen besser genutzte strukturierte Daten auch der wissenschaftlichen Forschung direkt zugute. Europäische Investitionen in elektronische Infrastrukturen zur Ausbeutung "ungenutzter" Kapazitäten von auf der ganzen Welt verteilten Computern ermöglichen es Forschern, größere Datenmengen als je zuvor zu verarbeiten und zu analysieren. So lassen sich möglicherweise einige der größten Rätsel der Wissenschaft lösen, von der Quantenphysik bis hin zur Klimaforschung. Zum Beispiel könnten Biologen bei der Erforschung eines bestimmten Problems eine "virtuelle Forschungsumgebung" (virtual research environment, VRE) für die Zusammenarbeit über ein Grid erzeugen. Dabei lassen sich Informationen aus einer Quelle in Estland verarbeiten und mit Data-Mining-Software-Tools etwa in Portugal analysieren. Das EU-finanzierte Projekt D4Science-II ("Data infrastructures ecosystem for science") ging einen Schritt weiter und schuf einen Rahmen für interoperable E-Infrastrukturen. Dieser bildet so etwas wie ein Ökosystem, in dem Daten, Rechner- und Softwareressourcen aus verschiedenen E-Infrastrukturen unabhängig vom Standort, Technologie, Format, Sprache, Protokoll oder Workflow gemeinsam genutzt werden können. Damit wurden VRE in Bereichen wie Hochenergiephysik, Biodiversität, Fischerei und Aquakultur unterstützt und Forschungsfelder wurden neu miteinander verbunden. Zum Beispiel unterstützte D4Science-II die Mapping-Studie zu marinen Spezies Aquamaps. Mithilfe von Aquamaps können Wissenschaftler Querverweise zwischen der biologischen Vielfalt in den Meeren und Aufzeichnungen zum Fischfang herstellen, um so ein klareres Bild davon zu erhalten, wo die Fischbestände am meisten gefährdet sind. Diese enorme Daten- und Zahlenfresserei wurde möglich durch europäische Fördermittel für E-Infrastrukturen sowie Strategien und Forschungsinitiativen zum Thema offene Daten. "Die Zusammenarbeit über E-Infrastrukturen eröffnet völlig neue Möglichkeiten und Forschungsbereiche. Wir können nun zum Beispiel wissenschaftliche Daten vor dem Hintergrund ökonomischer Statistiken analysieren, um eine komplett neue Perspektive zu gewinnen, die bisher nicht verfügbar war", betont Donatella Castelli, D4Science-II-Partnerin vom Institute of Information Science and Technology (Alessandro Faedo) des nationalen Forschungsrats Italiens. Veröffentlichung über Open Access Während öffentliche Einrichtungen ihre Daten für Forscher öffnen, wäre es als ironisch anzusehen, wenn die Ergebnisse dieser Forschungen am Ende unzugänglich in teuren Zeitschriften veröffentlicht werden. In dem Bemühen, mehr Online-Veröffentlichungen über Open-Access zu fördern - insbesondere für öffentlich finanzierte Forschungen - hat die Europäische Kommission einen solchen Veröffentlichungsweg für rund 20% der RP7-Projekte zur Pflicht gemacht. Wenn Projekte ihre Ergebnisse darüber hinaus in einer Reihe von traditionellen Zeitschriften sowie einige in Open-Access-Publikationen veröffentlichen, wird Wissen fragmentiert und es ist schwerer, das Gesamtergebnis eines Projekts zu messen. Das EU-geförderte Projekt OpenAIRE ("Open access infrastructure for research in Europe") wollte das ändern und hatte die Vision, alles für jeden zugänglich zu machen. Das Team von Openaire erkannte früh, dass eine bessere Technologie nur die halbe Miete für die Überwindung der Fragmentierung von Forschung und Daten ist: "Ein wesentlicher Teil des Projekts konzentriert sich auf die Förderung von Open Access in der RP7-Gemeinde", sagt Projektleiterin Natalia Manila. "Auf diese Weise können Projekte vollständig zu Europas Wissensinfrastruktur beitragen." Manola zufolge könne Open Access mithilfe von Projekten wie Openaire und seinem Nachfolger Openaireplus die europäische Wirtschaft ankurbeln und Innovation fördern. Für Angestellte einer kleinen Firma oder für Lehrer können Abonnements für hochwertige wissenschaftliche Zeitschriften unerschwinglich sein, was bedeutet, dass wertvolle Forschungsergebnisse wie in Silos weggesperrt werden. "Mit Open Access können diese von jedem beliebig genutzt werden - es ist der beste Weg, um aus öffentlich geförderter Forschung das Maximum herauszuholen", fügt sie hinzu. In diesem Zusammenhang hat die Kernforschungsorganisation CERN das EU-geförderte Projekt SOAP ("Study of Open Access Publishing") geleitet, um nachhaltige Geschäftsmodelle für die Förderung wissenschaftlicher Publikationen zu entwickeln. Das Team dokumentierte über 4.000 Zeitschriften und konnte nach einigen Analysen feststellen, dass rund 8% der weltweit veröffentlichten wissenschaftlichen Arbeiten, also rund 120.000 von schätzungsweise 1,5 Millionen Artikeln pro Jahr, derzeit über Open Access veröffentlicht werden. Sie folgerten, dass ein "hybrides Open-Access"-Modell (teilweise auf Abonnementbasis) die praktikabelste Option vor allem für Veröffentlichungen aus Wissenschaft und Forschung ist. "Wenn praktikable OA-Modelle gefördert werden, können europäische Forscher - und im Grunde die ganze Welt - vom Wissensaustausch profitieren und Zugang zu umfangreichen Materialien erhalten", heißt es in dem CORDIS-Artikel "Open-Access zu Unmengen an Daten" über SOAP. Datensprache Während die Öffnung von Daten aus öffentlich-rechtlicher Hand, das Kombinieren von Datensätzen und das Veröffentlichen von Ergebnissen über Open-Access klare Vorteile für die Wissenschaft bringen, stellt die Frage, wie man strukturierte Daten kommerziell nutzen und daran verdienen kann, eine komplexe Herausforderung dar. Mit diesem Problem befassen sich einige neu ins Leben gerufene EU-Projekte. Das EU-geförderte Projekt CODE ("Commercially empowered linked open data ecosystems in research") ist ein KMU-geführte Initiative zur Seite der digitalen Inhalte und Sprachen in diesem Datenberg. Das CODE-Team ist überzeugt, dass "Linked Open Data", kurz LOD, enormes Potenzial als die nächste große Evolutionsstufe des Internets birgt. Allerdings bleibt diese Potenzial größtenteils ungenutzt, weil Nutzungs- und Vermarktungsstrategien fehlen. CODE hat erst dieses Jahr die Arbeit aufgenommen und entwickelt ein stabiles Ökosystem für die Kommerzialisierung von LOD basierend auf einer Wertschöpfungskette mit traditionellen (z.B. Datenanbieter und Verbraucher) und nicht-traditionellen (z.B. Datenanalytiker) Rollen auf den Datenmärkten. Die ersten Ergebnisse sind vielversprechend. Angesichts der Erkenntnis, dass wir unser Leben mehr und mehr online führen, wollen die Partner des durch die EU geförderten Projekts Limosine ("Linguistically motivated semantic aggregation engines") unterdessen Sprache und semantische Suchtechnologie fördern, um diese Onlineerfahrung zu verbessern. "Informationen werden zu den unterschiedlichsten menschlichen Aktivitäten angehäuft, von der Wissenschaft und Fakten bis hin zu persönlichen Inhalten, Meinungen und Trends", erklärt das Projektteam. Das von Limosine entwickelte mehrsprachige Data-Mining-System für Meinungen im Web bedeutet, dass das Internet die aktuelle dokumentenzentrierte Suche zugunsten einer mehr semantischen Ordnung überwinden kann. Mit anderen Worten: mithilfe intelligenterer Tools, die besser verstehen und sogar vorhersagen können, was man sucht, gelangt man einfacher an hochwertige Suchergebnisse. Wenn Sie zum Beispiel mit den heutigen Suchstandards nach "Dog's Breakfast" suchen, erhalten Sie Ergebnisse zu einer britischen Redensart oder einer kanadische Filmkomödie, während jemand mit weniger guten Englischkenntnissen tatsächlich nach einem Frühstück für sein Haustier gesucht haben könnte! Semantische Suchtools könnten die Abfrage in einen Kontext mit Ihren früheren Suchen oder anderen Hinweisen stellen. In der Zwischenzeit befassen sich Projekte wie LIVE+GOV ("Reality sensing, mining and augmentation for mobile citizen-government dialogue") mit Realitätserkennung, Mining und Augmentation für den mobilen Dialog zwischen Bürger und Behörden. In dem Projekt wird unter der Bezeichnung "m-Government" ein Konzept entwickelt, das Bürgern ermöglichen soll, sich mithilfe von mobilen Sensortechnologien in Smartphones in Zusammenarbeit mit etablierten mobilen Partizipationsformaten an Behörden wenden zu können. Die europäische Wirtschaft ölen Schließlich sollten öffentliche Daten, die von allen Behörden in Europa generiert werden, automatisch wiederverwendbar gemacht werden und so Innovation und Unternehmergeist fördern, das würde wiederum zu neuen sowohl stationären als auch mobilen Anwendungen und Diensten führen. "So wie Öl als schwarzes Gold bezeichnet wurde, so erlangen Daten im digitalen Zeitalter neue Bedeutung und enormen Wert", kommentierte Neelie Kroes, Vizepräsidentin der Europäischen Kommission und zuständig für die Digitale Agenda, bei der Präsentation der EU-Strategie für Open Data im Dezember. Auf dieser Strategie baut die neue PSI-Richtlinie auf, die an den Europäischen Rat und das Parlament weitergeleitet wurde. Informationen des öffentlichen Sektors erzeugen bereits rund 32 Mrd. EUR Wirtschaftsleistung jedes Jahr. Mit der neuen Strategie soll dieser Wert auf rund 70 Mrd. EUR mehr als verdoppelt werden. Laut Neelie Kroes ein "dringend benötigter Impulse für unsere Wirtschaft". Sie gratulierte dem Vereinigten Königreich, Dänemark und Frankreich für ihre Initiativen zu offenen Daten und sagte, die neue Strategie werde die Art und Weise, wie EU-Institutionen und die meisten Behörden in Europa Daten austauschen, "radikal auf den Kopf stellen". Frau Kroes rief die Regierungen dazu auf, nicht erst darauf zu warten, dass diese Strategie in Gesetzen festgelegt wird: "Sie können Ihre Daten jetzt freigeben und so Umsatz und Arbeitsplätze schaffen. Auch werden bessere Informationen und Entscheidungen gefördert und dadurch Geld gespart." Auch den privaten Sektor ermutigte sie, seine Daten zu öffnen, um neue Dienstleistungen entstehen zu lassen. "Daten sind Gold... Fangen wir an, dieses abzubauen!", fordert sie. --- Alle in diesem Bericht beschriebenen Projekte wurden finanziell innerhalb des Siebten Rahmenprogramms für Forschung (RP7) oder über andere europäische Initiativen unterstützt. Nützliche Links: - Europe 2020 - FIA - IKT-Programm des RP7 - Das RP7 auf CORDIS - Informationen des öffentlichen Sektors auf Europa - Open Government Data - NTC Open Data - Amsterdam Smart City - Open Data Gencat - Open Cities - Science Commons - Weknowit - CODE - Limosine - Openaire - SOAP - D4Science-II - LIVE+Gov Weiterführende Artikel: - Data mining 3.0: von Informationen zu "kollektiver Intelligenz" - Open access: EU-Projektergebnisse gehen an die Öffentlichkeit - Open access zu Unmengen an Daten - Wie offene Daten und E-Infrastrukturen Ökosysteme schützen - Data is new gold, Rede von Neelie Kroes zur Open Data Strategie, Dezember 2011