Feature Stories - Data-Mining 3.0: von Informationen zu "kollektiver Intelligenz"
Man spricht nicht umsonst oft von Datenflut: Informationen und Wissen nehmen tatsächlich rasch zu. Unsere Kapazitäten zum Speichern, Übertragen und Bearbeiten von Informationen sind seit 1986 mit einer jährlichen Rate von 23% angewachsen. 2007 übertrug der durchschnittliche Internetnutzer täglich Informationen im Umfang von mehr als sechs Zeitungen und empfing eine Datenmenge, die 174 Zeitungen entspricht, so die Aussage einer im letzten Februar in Science veröffentlichte Studie. Außerdem tragen Social-Media-Sharing-Websites zu der Überlastung mit Informationen bei. Die Bereitstellung von Speicherplatz für Milliarden von Bildern und Videos, von denen die meisten mit Anmerkungen versehen sind und unter Freunden herumgezeigt werden, oder die in Gruppen veröffentlicht werden, die sich mit einem bestimmten interessierenden Thema befassen, fordert ihren Tribut. Die Daten überrollen uns in Größenordnungen, die unsere Kapazität, sie zu organisieren, überschreiten. "Für Nutzer und Unternehmen ist es dank moderner Kommunikationsgeräte wie Laptops, Tablet-PCs und Smartphones kinderleicht, Inhalte individuell oder in Gemeinschaften zu generieren und miteinander zu teilen", erklärt Yiannis Kompatsiaris, Koordinator des EU-finanzierten WeKnowIt-Projekts . Nach Aussage von Dr. Kompatsiaris machen diese Mengen von Inhalten das Extrahieren nützlicher Informationen zu einer äußerst komplexen und teuren Angelegenheit. Derzeitige Anwendungen unterstützten nicht vollständig die intelligente Verarbeitung und Verwaltung der Daten. "Die Nutzer können Informationen nicht effizient verarbeiten und können auch das zugrunde liegende Wissen nicht ausnutzen", erläutert er. Das integrierte Projekt WeKnowIt sollte all dies nun verändern und verfolgte eine Vision, die die verschiedenen Formen von Daten, denen wir täglich begegnen, in Begriffe fasst und sie als in sich geschlossene, umsetzbare Informationen erfasst - in etwas, was das WeKnowIt-Team dann als "kollektive Intelligenz" bezeichnet. Das Projekt konzentrierte sich größtenteils auf die Gewinnung des Typs von Daten, der durch Social Bookmarking, Verschlagwortung (Tagging) und Vernetzung (Networking) generiert wird, wobei kollektive Meinungen und Dateneingaben einen höchstdetaillierten Datensatz erzeugen. "Es gibt verschiedene Typen von Intelligenz, die wir täglich empfangen und verarbeiten", sagt Dr. Kompatsiaris. "Da gibt es digitale Inhalte und kontextabhängige Informationen, die wir als 'Media Intelligence' bezeichnen. Breites Nutzerfeedback bildet "Mass Intelligence", während die persönlichen Interaktionen zu "Social Intelligence" hinführen, die alle dem Vorteil der Endnutzer (Personal Intelligence) und Unternehmen (Organisational Intelligence) dienen." Die WeKnowIt Vision folgte der Überzeugung, dass durch das Zusammenfügen dieser verschiedenen Informationsquellen eine emergente "kollektive Intelligenz" erzeugt werden könnte, die die Fähigkeit von Einzelpersonen und Unternehmen, relevante Informationen zum richtigen Zeitpunkt zu finden und entsprechend diesen zu handeln, stark verbessern sollte. Was 2008 beim Start von WeKnowIt noch als ein äußerst ehrgeiziges visionäres Ziel galt, ist jetzt schon ein großes Stück nähergerückt. Das Projekt rekrutierte einige der weltweit führenden Namen aus dem Bereich Datenmanagement und Integration, wie etwa die Technische Universität Brno in der Tschechischen Republik, die Universität Koblenz-Landau in Deutschland, Yahoo! in Spanien sowie Vodafone und das Zentrum für Forschung und Technologie Hellas (CERTH) in Griechenland. Das Unternehmen Software Mind aus Polen sorgte für Softwareentwicklung und -integration, während die Universität Sheffield und der Stadtrat Sheffield im Vereinigten Königreich die wichtigsten Tools für Anwenderszenarien entwickelten. Insgesamt verbrachten die zehn Partnereinrichtungen aus Tschechien, Deutschland, Spanien, Griechenland, Polen und dem Vereinigten Königreich drei Jahre mit der Entwicklung einer Plattform und einer Reihe dazugehöriger Tools, die die Handhabung vieler verschiedener Typen und Quellen von Informationen auf zusammenhängende Weise zu unterstützen. 5,37 Mio. EUR des Gesamtbudgets in Höhe von 7,5 Mio. EUR stammten von der EU. Kernplattform "Die WeKnowIt-Plattform wandelt unter Einsatz einer Vielzahl von Werkzeugen umfangreiche und schlecht strukturierte Informationsmengen in sinnvolle Themen, Einheiten, Interessensschwerpunkte, soziale Verbindungen und Ereignisse um", merkt Dr. Kompatsiaris an. Dazu entwickelte das Projekt eine zentrale Plattform in Form einer Middleware-Anwendung, die auf Servern zum Einsatz gebracht werden kann, um eingehende Daten zu verarbeiten und diese effektiv weiterzuleiten. Die einzelnen Partner des Projekts entwickelten im Weiteren sehr viele Tools - insgesamt über 20 -, die auf verschiedene Weise, entweder direkt oder über die WeKnowIt-Kernplattform eingesetzt und kombiniert werden können. "Wir entwickelten sieben Tools für die Fallstudien - ein Notfallszenario und ein Szenario für soziale Verbrauchergruppen - und die Partner erstellten weitere 13 für spezielle Aufgaben", erklärt Dr. Kompatsiaris. ClustTour - "City exploration by use of hybrid clustering" - ist ein Beispiel eines von CERTH-ITI für eine spezielle Aufgabe entwickelten eigenständigen Tools. Es handelt sich um eine Online-Explorationsanwendung, die den Nutzern hilft, mit Hilfe von Fotogruppen, sogenannten Clustern, die Sehenswürdigkeiten und Veranstaltungen entsprechen, interessante Orte zu finden. ClustTour nutzt sowohl visuelle als auch gekennzeichnete Informationen mit einer "Cluster-Klassifizierung" und einem "Verschmelzungsmodul", um zusammengehörende Fotos zu identifizieren, und platziert dann das Objekt auf einer Karte. Die Nutzer können nun einfach das Foto anklicken, um zu sehen, was sich dort befindet. Wie Dr. Kompatsiaris erklärt, können auf diese Weise die Informationen, die den Leuten zur Erforschung einer Stadt zur Verfügung stehen, drastisch erweitert werden. Ein üblicher Reiseführer würde das Nationale Archäologische Museum Athen als "Sehenswürdigkeit" (point of interest, POI) markieren. Aber ClustTour bietet weitaus mehr Details: Es werden interessante Fotos passend zu Ausstellungsstücken dieses Museums, so etwa von der Inschrift von Arkhagetas, von der Sammlung frühkykladischer Kunst, von einer Sammlung bekannter Skulpturen und sogar von einer Sammlung goldener Schätze, die der deutsche Archäologe Schliemann entdeckte, ausfindig gemacht. "Es springt ins Auge, dass das innerhalb von WeKnowIt entwickelte ClustTour-Tool ein detailgenaues und medienbetontes Entdeckungs- und Reisevorbereitungserlebnis zu bieten hat", vermerkt Dr. Kompatsiaris. Und hier handelt es sich nur um eines von vielen Werkzeugen. Überdies können die Tools auch kombiniert werden. Mit der Fallstudie für soziale Verbrauchergruppen wollte man zum Beispiel ermöglichen, dass Interessierte einen Tagesausflug an einem PC planen und dann per Mobiltelefon während der Tour geführt werden können. Eine Vielzahl von WeKnowIt-Werkzeugen einschließlich ClustTour, Fannr (Flickr-Kommentator) und VIRaL, einem visuellen Abruf- und Lokalisierungs-Tool, kamen zum Einsatz, um dies zu realisieren. Auch im Notfallszenario werden verschiedene WeKnowIt-Tools kombiniert, um relevante, aktuelle Informationen für Rettungsdienste bereitzustellen. So spielt ein intelligenter Ladevorgang eine Rolle, der zum Beispiel einen Ort auf Grundlage eines von einem Nutzer gesendeten Fotos identifizieren kann. Das System beurteilt sogar die Dringlichkeitsstufe, indem der Schweregrad eines Vorfalls über Fotos bewertet wird. Beide Fallstudien wurden erfolgreich abgeschlossen, wobei die formale Phase des Projekts Anfang dieses Jahres fertiggestellt werden konnte. Seitdem hat das Projekt allerdings ein richtiges Eigenleben entwickelt. "Viele der Partner entwickeln weiterhin Software und Tools rund um das erstellte Modell und die Architektur, die WeKnowIt vorgibt. Die Partner bleiben in Kontakt und tauschen kontinuierlich Informationen aus", verrät Dr. Kompatsiaris. Zum Beispiel setzen CERTH-ITI, Yahoo! und die Universität Koblenz ihre Forschungsaktivitäten und die Zusammenarbeit zu Echtzeitaspekten der Informationsextraktion aus sozialen Medien fort. Sie suchen außerdem nach neuen Anwendungsbereichen - so auch in der Nachrichtensparte und bei großen Veranstaltungen wie etwa Musik- und Filmfestivals. Gleichzeitig erörtern die Universität Sheffield und der Stadtrat Sheffield aktualisierte Notfallversionen des Projekts. CERTH-ITI ist Teil einer neuen Unternehmensausgründung - Veribin -, die in verschiedenen Branchen und Geschäftsfeldern als Inhaltsaggregator agieren soll. Hauptzielpunkte sind die Märkte in den Bereichen Nachrichten und E-Learning. CERTH-ITI will die innerhalb von WeKnowIt erarbeiteten Social-Media-Clustering-Techniken weiterentwickeln. Veribin ist eine Ausgründung der ATC S.A. Information Technology Company und erhielt kürzlich eine Anschubfinanzierung vom griechischen Sekretariat für Forschung und Entwicklung bewilligt, berichtet Dr. Kompatsiaris. Inzwischen entwickelt Software Mind neue semantische Web-Tools für die Telekommunikations- und Finanzbranche. Vodafone wird die in dem Projekt gewonnenen Erkenntnisse nutzen, um Netzwerkinfrastrukturen für neue Dienstleistungen zu erschließen. Die Universität Koblenz hat ein Spin-Off-Unternehmen mit dem Namen Kreuzverweis gegründet, das WeKnowIt-Projektresultate auf der Ebene Unternehmensintelligenz verwertet. Das Projekt hinterlässt neun Patentanmeldungen. Und das ist gerade mal eine Handvoll der Produkte und Ergebnisse, die zur Veröffentlichung vorgesehen sind. Andere werden sich im Laufe der Zeit herauskristallisieren, vor allem dann, wenn WeKnowIt-Nutzergruppen eingerichtet werden, die Interessenten zu den neuesten Entwicklungen in Bezug auf das Projekt auf dem Laufenden halten. Dem WeKnowIt-Projekt wurde innerhalb des Unterprogramms "Intelligent content and semantics" des Siebten EU-Rahmenprogramms (RP7) Forschungsfinanzierung zuteil. Nützliche Links: - 'Emerging, collective intelligence for personal, organisational and social use' - WeKnowIt-Projektdatensatz auf CORDIS Weiterführende Artikel: - EU-Projekt ebnet Weg durch datenintensive Umgebungen - EU-Projekt hilft überlasteten Polizeibeamten - Solving the crisis of choice online - The search - computers dig deeper for meaning