Création par un projet TSI d'un système d'archivage et de récupération de contenu audiovisuel
Dès lors que des quantités croissantes d'informations sont stockées en formats vidéo, image et audio, la nécessité d'un procédé efficace de recherche et de récupération du contenu audiovisuel se fait de plus en plus pressante. Une solution a peut-être été trouvée dans le cadre d'un projet de recherche européen récemment achevé. Bénéficiant d'un financement d'un million d'euros au titre de l'axe TSI du Cinquième programme-cadre, le projet CIMWOS de repérage combiné d'images et de mots a mis au point un nouveau système de classification et de récupération de contenu multimédia. Le premier défi auquel s'est attelé le consortium du projet CIMWOS était l'élaboration d'algorithmes de recherche spécialement conçus pour la classification de supports audiovisuels. En ce qui concerne le contenu audio, des technologies de reconnaissance de la parole continue doivent être utilisées afin de produire des transcriptions des propos, des personnes qui les ont prononcés et des thèmes abordés. Les algorithmes de traitement des images du système extraient quant à eux des détails tels que des paysages, des logos, des objets et notamment, des visages, ainsi que les légendes et les sous-titres qui peuvent les accompagner, afin de former la base des futures recherches. Le consortium CIMWOS réunit des partenaires en Belgique, en France, en Autriche et en Suisse. Il a été coordonné par le docteur Athanassios Protopapas, de l'Institut de traitement du langage et de la parole d'Athènes (Grèce), qui a déclaré à CORDIS Nouvelles: "La synthèse des documents revêt une grande importance pour passer en revue des quantités substantielles de contenu audiovisuel sans avoir à les visionner chaque instant. CIMWOS représente un progrès considérable par rapport aux projets de recherche précédents car il intègre une technologie de traitement extrêmement sophistiquée." Après la conception d'une méthode de synthèse et de classification des informations, le défi suivant résidait dans la création d'une interface conviviale permettant de les consulter et de les récupérer efficacement. Une base de données des sujets d'actualité et des documentaires diffusés, dans trois langues européennes (anglais, grec et français), a servi de fondement pour cette interface, et l'équipe a imaginé un système en ligne grâce auquel les utilisateurs peuvent effectuer une recherche à partir d'une description du média, de métadonnées du contenu ou de texte libre. Une vidéo de haute qualité pouvant exiger une grande quantité de mémoire et de largeur de bande, l'équipe CIMWOS a en outre réalisé un système permettant aux utilisateurs de consulter de riches bases de données audiovisuelles à partir de leur poste de travail et qui fournit les résultats dans un format de prévisualisation compact. Les utilisateurs peuvent ensuite télécharger uniquement les résultats qu'ils ont sélectionnés pour leur pertinence, économisant ainsi à la fois du temps et des coûts d'infrastructure. M. Protopapas pense que CIMWOS constituera une ressource essentielle pour promouvoir la réutilisation de contenus audiovisuels existants et réduire en conséquence les budgets des nouvelles productions. Il espère par ailleurs que les méthodologies définies par le consortium favoriseront la normalisation et l'uniformisation des bases de données audiovisuelles afin d'ouvrir la voie à des bibliothèques numériques européennes à grande échelle. Les membres du consortium admettent que quelques perfectionnements s'imposent encore, mais ils soulignent que le système approche un niveau susceptible d'être exploité concrètement et qu'il offre des caractéristiques qui ne sont pas encore disponibles dans les applications commerciales. Ainsi qu'un évaluateur extérieur spécialisé l'a conclu, en effet: "Dans le domaine de l'archivage, la BBC possède une norme pour l'indexation de ses productions internes: huit heures de travail documentaire pour une seule heure de programme produit. A l'aide des outils CIMWOS, j'estime que cette tâche pourrait être réduite à quatre heures. Ce chiffre pourrait à mes yeux suffire à persuader un directeur général qui doit numériser 120 000 heures [de programmes] que ce projet présente une importance stratégique."
Pays
Grèce