Une nouvelle approche de la préservation du contenu numérique
La numérisation croissante du contenu est une arme à double tranchant. Bien sûr, elle permet un accès instantané à une quantité vertigineuse d'informations. Mais, revers de la médaille, cet accès a un coût: à la différence des livres, le contenu numérique est le plus souvent à durée limitée. Du fait de l'évolution d'éléments tels que les politiques, les cadres juridiques, les pratiques professionnelles, les attentes et les comportements des utilisateurs, ou les questions de sémantique, l'écosystème numérique évolue si vite que l'accès au contenu ne peut pas toujours être garanti sur le long terme. C'est ici qu'entre en scène le concept de «préservation par la conception» prôné par le projet PERICLES (Promoting and Enhancing Reuse of Information throughout the Content Lifecycle taking account of Evolving Semantics). «La préservation par la conception signifie que la préservation n'est pas pensée 'après coup' ou comme une action prenant place après la fin de la 'vie active' d'un objet numérique», déclare le Dr Marc Hedges, conférencier principal au département des humanités numériques du King's College de Londres et coordinateur de PERICLES. «Cette approche nécessite une gestion proactive et non simplement réactive des biens numériques, dans laquelle la préservation fait partie intégrante de la vie active d'un objet.» Dans le cadre de cette approche, un objet est considéré comme étant «vivant» et passant par différentes phases, ou ayant plusieurs vies, aussi longtemps qu'il n'aura pas été complètement supprimé. «La préservation par la conception fera partie intégrante de la durée de vie des données, depuis leur création jusqu'à leur suppression», souligne le Dr Hedges. Au-delà de la préservation technique Les approches actuelles de la préservation s'intéressent essentiellement à l'environnement technique nécessaire à un archivage sur le long terme. Si la littérature et les normes soulignent que la finalité de ces archives n'est pas seulement technique mais également organisationnelle, les institutions ont trop tendance à insister sur les aspects techniques. PERICLES procède différemment: il étudie comment les changements apportés à tout élément de l'environnement - qu'il s'agisse des communautés d'utilisateurs, de l'institution elle-même, ou du contexte social et culturel plus large - affectent l'utilité et l'interprétation de l'objet numérique, et comment ces changements peuvent être gérés. «Un des objectifs de PERICLES était d'étudier l'hypothèse selon laquelle, si nous pouvions capturer les dépendances d'un objet spécifique dans son écosystème et implémenter dans une couche d'infrastructure les modèles et ontologies qui en résultent, nous pourrions analyser l'impact du changement sur l'accès et la réutilisation d'un objet et prendre les mesures d'atténuation appropriées», déclare le Dr Hedges. À cette fin, l'équipe a développé un cadre et une architecture d'intégration. Son but est de démontrer les flux de travail et les composants qui permettraient l'introduction d'une couche de «gestion du changement» dans les systèmes de stockage existants. Le projet a mis au point des bancs d'essai pour vérifier la validité de l'approche dans différents scénarios. «Nous avons développé nous-mêmes les composants que nous n'avons pas pu trouver sur le marché», explique le Dr Hedges. «Il s'agit par exemple d'ontologies de domaine et des modèles d'écosystèmes, d'un important extracteur d'informations sur l'environnement et d'autres outils pour alimenter les ontologies, d'un registre d'entités combiné à un référentiel de modèles, d'un compilateur de processus, d'un outil d'évaluation, d'un éditeur de règles, etc.» D'autres composants peuvent être envisagés, dans la mesure où ils remplissent les missions définies par le cadre d'intégration de PERICLES. Pour valider leur approche, le Dr Hedges et son équipe ont dû utiliser des données complexes et se concentrer sur deux ontologies de domaine: l'art et les médias numériques, et les sciences spatiales. «En termes de responsabilités, les institutions gérant ces données semblent se situer à des extrémités opposées. La Tate cherche à préserver ses collections d'art numérique et apporte une expertise exceptionnelle en termes de conservation, alors que le centre d'exploration spatiale B.USOC représente un secteur où la préservation est essentiellement restreinte au stockage. D'autre part, la 'réutilisation' n'est pas un concept courant en art, alors que cette notion s'est rapidement développée dans le domaine scientifique», déclare le Dr Hedges. Parmi les résultats les plus intéressants du projet, le Dr Hedges mentionne la compréhension du fait que les connaissances relatives aux dépendances d'un objet à son écosystème résultent de la combinaison de diverses expertises. Le fait de traduire ces connaissances en modèles et ontologies sémantiques, compréhensibles à la fois par les humains et les machines, permet d'établir une nouvelle forme de collaboration entre les deux. «Cela appelle à une nouvelle alliance entre le professionnel humain et le système technologique, l'acteur humain jouant un rôle actif, consistant par exemple à renseigner les modèles et à prendre des décisions basées sur le système», fait remarquer le Dr Hedges avec enthousiasme. «Nous sommes loin de la vision d'une technologie considérée comme un ami dont il faut se méfier ou comme une baguette magique qui fait tout par elle-même.» Regarder vers l'avenir Bien que cette recherche soit encore à un stade très expérimental, les compagnies aériennes, les hôpitaux, les organisations financières et gouvernementales gérant des biens numériques variés et désirant qu'ils restent accessibles pendant une longue période seront certainement intéressées par les travaux de PERICLES. En avril, l'équipe publiera un libre blanc définissant son approche à l'égard des organisations dont le but premier n'est pas la préservation, mais qui sont néanmoins confrontées à des défis dans ce domaine. «En parallèle, nous avons travaillé à la création d'un portail appelé PRESERVEWARE, un centre de préservation numérique, qui pourrait aider les individus à trouver des outils de préservation appropriés, y compris ceux produits par PERICLES», explique le Dr Hedges. «Nous avons examiné les catalogues existants et, bien qu'ils soient excellents, nous pensons que plus le terrain sera couvert, plus il y aura de chances que les professionnels trouvent les outils dont ils ont besoin.»
Mots‑clés
PERICLES, contenu numérique, préservation des données, préservation par la conception, sémantique, art numérique, sciences spatiales, dépôt, PRESERVEWARE