Un défi informatique important résolu
Après avoir accompli un défi concernant les données en matière d'extraction des caractéristiques d'images, le projet DILIGENT (prototype d'une infrastructure des bibliothèques numériques) financé par l'UE a permis l'exploitation de la plus grande quantité de métadonnées multimédia au monde à toute fin de recherche. Au cours de ce défi sur la collection de données, 37 millions d'images issues de la base de données de photographies publiques en ligne Flickr ont été traitées pendant 16 semaines à l'aide de la grille informatique EGEE (Enabling Grids for E-sciencE), un projet cofinancé par la Commission européenne qui offre des ressources informatiques aux universités et au secteur de l'industrie. La capacité moyenne de traitement atteignait les 300000 images par jour, soit environ cinq téraoctets de données (112 millions de textes et d'objets images ainsi que plus de 150 millions de caractéristiques extraites) qui ont été générés durant le processus. Pour extraire les données de la base de données Flickr, les chercheurs ont associé une application Java aux scripts Perl et à une application en C: l'application Java a permis de contacter la base de données, de télécharger un ensemble d'utilisateurs de Flickr ainsi que les images que ces utilisateurs se partageaient. Les scripts Perl et l'application en C ont ensuite permis d'extraire les caractéristiques des images, de créer des vignettes («thumbnails») et de stocker les résultats. Les données extraites seront désormais utilisées par le projet européen SAPIR, dont l'objectif consiste à développer des architectures de recherche web qui permettent à l'utilisateur de rechercher par exemple un contenu audiovisuel. Une image prise par un téléphone portable permettrait ainsi de trouver des informations sur le monument photographié lors d'une visite en vacances; de même, chanter une mélodie permettrait de chercher le titre exact de la chanson. Financé au titre du sixième programme-cadre (6e PC), le principal objectif du projet DILIGENT consistait à créer un banc d'essai avancé permettant aux membres d'organismes virtuels d'e-sciences de faciliter le partage des connaissances et la collaboration avec un bon rapport coût-efficacité. Le coût total du projet a atteint les neuf millions d'euros; deux tiers de cette somme ont été alloués par l'UE. Quelque 14 partenaires originaires d'Allemagne, de Grèce, de France, d'Italie, de Hongrie, de Norvège d'Autriche, de Suisse et du Royaume-Uni y ont participé.