Préserver les données à long terme
On dit que les données sont reines. Mais le projet ARCHIVER, financé par l’UE, tempère: «en fait, c’est compliqué». «Les données sont reines lorsque la conservation des données numériques garantit aux chercheurs un accès continu à ces informations aussi longtemps que nécessaire tout en maintenant un contrôle intellectuel», explique João Fernandes, chef de projet au sein de l’Organisation européenne pour la recherche nucléaire (CERN) et coordinateur du projet ARCHIVER. «Malheureusement, en raison d’un manque de planification des coûts et de l’insuffisance des solutions, la plupart des projets de recherche peinent à préserver correctement leurs données sur le long terme.» Pour remettre les données sur leur trône, le projet ARCHIVER a conçu, prototypé et piloté des solutions innovantes pour la conservation numérique à long terme (LTDP) des ensembles de données scientifiques.
Des solutions réelles disponibles maintenant
Les travaux du projet ont été motivés par les besoins réels et concrets d’un large éventail de parties prenantes, notamment le CERN, le DESY, l’EMBL-EBI et le PIC. «Nous avons commencé par identifier les lacunes actuelles des services de conservations proposés au secteur de la recherche publique, en tirant les leçons des initiatives passées», explique João Fernandes. «Nous avons ensuite mis en pratique un modèle agile de R&D pour de multiples disciplines scientifiques, conçu à la fois pour les organismes de recherche publics et les experts en conservation des données.» L’un des résultats de ce travail est la solution logicielle Arkivum en tant que service pour la LTDP. Capable de prendre en charge l’archivage, la conservation et l’accès à de vastes ensembles de données scientifiques de grande valeur, cette solution est particulièrement bien adaptée à des disciplines telles que l’astronomie, la physique des particules et la génomique. «Le service est remarquable en ce sens qu’il peut archiver et conserver des ensembles de données allant jusqu’au pétaoctet d’une manière à la fois rentable et durable d’un point de vue écologique», fait remarquer João Fernandes. LIBNOVA LABDRIVE constitue une autre solution LTDP développée au cours du projet. «Avant LIBNOVA LABDRIVE, de nombreuses organisations s’appuyaient sur une approche cloisonnée de la conservation des données, c’est-à-dire que chaque ensemble de données, département ou unité utilisait des systèmes multiples et désagrégés», ajoute João Fernandes. «Ce nouveau produit permet à chacun de conserver son contenu dans un référentiel unique qui peut être facilement adapté aux spécificités de chaque ensemble de données, rassemblant ainsi toutes les informations sur une seule plateforme.» Les solutions Arkivum et LABDRIVE sont toutes deux accessibles via la plateforme du nuage européen pour la science ouverte (EOSC)
Une véritable révolution
Selon João Fernandes, les services issus du projet ARCHIVER donneront des résultats exceptionnels. Ils auront également un impact immédiat potentiellement significatif sur au moins 18 infrastructures paneuropéennes qui servent un collectif de 1,7 million de chercheurs européens. Et puis, il y a les 70 millions de scientifiques, professionnels de l’informatique et autres qui devraient être amenés à les utiliser via le nuage européen pour la science ouverte.
Cela fait beaucoup de monde, et encore plus de données.
«ARCHIVER ne représente rien de moins qu’une véritable révolution dans la façon d’aborder la gestion des données de recherche à long terme», conclut João Fernandes. «Il garantit également que les données répondent aux principes FAIR de facilité de recherche, d’accessibilité, d’interopérabilité et de réutilisation.» Grâce aux processus méthodologiques efficaces de R&D du projet, à l’utilisation de technologies abordables, à la durabilité environnementale et à la réduction sensible des ressources nécessaires à l’archivage et à la conservation de grandes quantités d’informations, les données sont à nouveau reines. Mais il n’y a pas que les données qui portent une couronne. Le projet ARCHIVER lui-même a été couronné par le Digital Preservation Award for Collaboration and Cooperation 2022. Ce prix récompense l’importante collaboration du projet au-delà des frontières institutionnelles, professionnelles, sectorielles et géographiques, ainsi que l’impact démontrable de cette collaboration sur la conservation numérique.
Mots‑clés
ARCHIVER, données, conservation numérique, recherche, archivage, ensembles de données scientifiques, conservation numérique à long terme, logiciel en tant que service, nuage européen pour la science ouverte