Conservare i dati a lungo termine
Si dice che i dati siano i protagonisti di questi tempi ma secondo il progetto ARCHIVER, finanziato dall’UE, le cose sono in realtà più complicate. «I dati sono i protagonisti quando la conservazione digitale può garantire l’accesso continuo alla ricerca per tutto il tempo necessario, mantenendone il controllo intellettuale», afferma João Fernandes, responsabile del progetto presso l’Organizzazione europea per la ricerca nucleare (CERN) e coordinatore del progetto ARCHIVER. «Purtroppo, a causa della mancanza di una pianificazione dei costi e di soluzioni insufficienti, la maggior parte dei progetti di ricerca fatica a conservare correttamente i propri dati nel lungo termine.» Per ridare ai dati la loro giusta importanza, il progetto ARCHIVER ha progettato, prototipato e sperimentato soluzioni innovative per la conservazione digitale a lungo termine (LTDP) dei set di dati scientifici.
Soluzioni reali finalmente disponibili
Il lavoro del progetto è stato guidato dalle esigenze reali di una serie di organizzazioni interessate, tra cui il CERN, il DESY, l’EMBL-EBI e il PIC. «Abbiamo iniziato identificando le attuali lacune nei servizi di conservazione offerti al settore della ricerca pubblica, traendo insegnamento dalle iniziative passate», spiega Fernandes. «Abbiamo quindi messo in pratica un modello agile di R&S per molteplici discipline scientifiche, progettato sia per le organizzazioni di ricerca pubbliche che per gli esperti di conservazione dei dati.» Uno dei risultati di questo lavoro è la soluzione Arkivum di software come servizio per LTDP. La soluzione, che è in grado di supportare l’archiviazione, la conservazione e l’accesso di vasti set di dati scientifici di alto valore, è particolarmente adatta a discipline come l’astronomia, la fisica delle particelle e la genomica. «Il servizio è straordinario in quanto consente di archiviare e conservare set di dati fino a petabyte in modo economico ed ecologicamente sostenibile», osserva Fernandes. Un’altra soluzione LTDP sviluppata durante il progetto è LIBNOVA LABDRIVE. «Prima di LIBNOVA LABDRIVE, molte organizzazioni utilizzavano un approccio alla conservazione dei dati a compartimenti stagni: ogni set di dati, dipartimento o unità utilizzava sistemi multipli e disaggregati», aggiunge Fernandes. «Questo nuovo prodotto consente a tutti di conservare i propri contenuti in un unico archivio che può essere facilmente adattato alle specificità di ciascun set di dati, riunendo così tutti i dati in un’unica piattaforma.» Entrambe le soluzioni Arkivum e LABDRIVE sono accessibili tramite la piattaforma European Open Science Cloud (EOSC).
Una vera e propria svolta
Secondo Fernandes, i servizi scaturiti dal progetto ARCHIVER forniranno risultati eccezionali. Avranno inoltre un impatto immediato potenzialmente significativo su almeno 18 infrastrutture paneuropee che servono complessivamente 1,7 milioni di ricercatori europei. Ci sono poi i 70 milioni di professionisti del settore scientifico, informatico e di altro tipo che dovrebbero utilizzarli attraverso l’EOSC.
Sono molte persone, e tantissimi dati
«ARCHIVER rappresenta una vera e propria svolta nell’approccio alla gestione dei dati di ricerca a lungo termine», conclude Fernandes. «Garantisce inoltre che i dati soddisfino i principi FAIR di reperibilità, accessibilità, interoperabilità e riusabilità.» Grazie agli efficienti processi metodologici di R&S del progetto, all’uso di tecnologie accessibili, alla sostenibilità ambientale e alla sensibile riduzione delle risorse necessarie per archiviare e conservare grandi quantità di informazioni, i dati sono di nuovo al centro della ribalta. Ma non sono solo i dati a essere protagonisti. Lo stesso progetto ARCHIVER è stato premiato con il Digital Preservation Award for Collaboration and Cooperation 2022. Il premio celebra la collaborazione significativa del progetto al di là dei confini istituzionali, professionali, settoriali e geografici e l’impatto dimostrabile che questa collaborazione ha avuto sulla conservazione digitale.
Parole chiave
ARCHIVER, dati, conservazione digitale, ricerca, archiviazione, set di dati scientifici, conservazione digitale a lungo termine, software come servizio, European Open Science Cloud