Preservar los datos a largo plazo
Dicen que los datos son los reyes. Sin embargo, el equipo del proyecto ARCHIVER, financiado con fondos europeos, afirma que «en realidad, es complicado». «Los datos son los reyes cuando la preservación digital puede garantizar el acceso continuado a la investigación durante todo el tiempo que sea necesario, a la vez que se mantiene su control intelectual», afirma João Fernandes, director del proyecto en la Organización Europea de Investigación Nuclear (CERN) y coordinador del proyecto ARCHIVER. «Por desgracia, debido a la falta de planificación de costes y a que las soluciones se quedan cortas, la mayoría de los proyectos de investigación tienen dificultades para conservar adecuadamente sus datos a largo plazo». Para volver a poner los datos en su sitio, el equipo del proyecto ARCHIVER diseñó, creó prototipos y puso a prueba soluciones innovadoras piloto para la preservación digital a largo plazo (PDLP) de conjuntos de datos científicos.
Soluciones reales disponibles ahora
La labor del equipo del proyecto se basó en las necesidades reales de una serie de partes interesadas, como el CERN, DESY, EMBL-EBI y PIC. «Empezamos por identificar las lagunas actuales en los servicios de preservación ofrecidos al sector público de la investigación, aprovechando las lecciones aprendidas de iniciativas anteriores», explica Fernandes. «A continuación, aplicamos un modelo ágil de investigación y desarrollo destinado a múltiples disciplinas científicas y diseñado tanto para organismos públicos de investigación como para expertos en preservación de datos». Uno de los resultados de esta iniciativa es la solución de «software» como servicio Arkivum para la PDLP. Dicha solución, que permite archivar, preservar y acceder a grandes conjuntos de datos científicos de gran valor, es especialmente adecuada para disciplinas como la astronomía, la física de partículas y la genómica. «El servicio destaca por su capacidad para archivar y preservar conjuntos de datos en la escala del petabyte de manera rentable y sostenible desde el punto de vista del medio ambiente», señala Fernandes. Otra solución para la PDLP desarrollada durante el proyecto es LIBNOVA LABDRIVE. «Antes de LIBNOVA LABDRIVE, muchas organizaciones utilizaban un enfoque aislado para la conservación de los datos, y cada conjunto de datos, departamento o unidad utilizaba sistemas múltiples y desagregados», añade Fernandes. «Este nuevo producto permite a todo el mundo guardar sus contenidos en un único repositorio que puede adaptarse fácilmente a las particularidades de cada conjunto de datos, unificando así todos los datos en una misma plataforma». Se puede acceder a las soluciones Arkivum y LABDRIVE a través de la plataforma de la Nube Europea de la Ciencia Abierta (EOSC, por sus siglas en inglés).
Nada menos que una revolución
Según Fernandes, los servicios derivados del proyecto ARCHIVER ofrecerán resultados excepcionales. También tendrán una posible repercusión inmediata y significativa en al menos 18 infraestructuras paneuropeas que sirven a un colectivo de 1,7 millones de investigadores europeos. Asimismo, están los 70 millones de profesionales científicos, informáticos y de otros ámbitos que deberían utilizarlos a través de la EOSC.
Muchas personas y aún más datos
«ARCHIVER representa nada menos que un cambio en la forma de enfocar la gestión de los datos de investigación a largo plazo», concluye Fernandes. «También garantiza que los datos cumplen los principios FAIR de facilidad de búsqueda, accesibilidad, interoperabilidad y reutilización». Gracias a los procesos eficaces de la metodología de investigación y desarrollo del proyecto, el uso de tecnologías asequibles, la sostenibilidad medioambiental y la sensible reducción de los recursos necesarios para archivar y preservar grandes cantidades de información, los datos vuelven a ser los reyes. Pero los datos no son los únicos que llevan corona. El propio proyecto ARCHIVER fue coronado con el premio Premio a la Colaboración y Cooperación para la Preservación Digital de 2022. El premio reconoce la importante colaboración del proyecto a través de las fronteras institucionales, profesionales, sectoriales y geográficas, así como la repercusión demostrable que esta colaboración ha tenido en la preservación digital.
Palabras clave
ARCHIVER, datos, preservación digital, investigación, archivar, conjuntos de datos científicos, preservación digital a largo plazo, «software» como servicio, Nube Europea de la Ciencia Abierta