Skip to main content
European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Article Category

Contenuto archiviato il 2024-04-18

Article available in the following languages:

Una nuova piattaforma di analisi dei dati riduce le preoccupazioni sulla privacy dei titolari

Nell’era digitale, le attività commerciali fanno sempre più affidamento sull’analisi dei dati per sopravvivere e crescere. Ma ciò significa che si debba necessariamente sacrificare la propria privacy? Non necessariamente. Il progetto PAPAYA, finanziato dall’UE, ha sviluppato una nuova piattaforma che promette di ripristinare la fiducia tra proprietari dei dati e responsabili esterni del trattamento.

Le violazioni dei dati hanno reso i consumatori sempre più diffidenti rispetto alla sicurezza dei dati personali sui server cloud. Ora che il regolamento generale sulla protezione dei dati (GDPR) è in vigore, il progetto PAPAYA (PlAtform for PrivAcY preserving data Analytics) si propone di raggiungere un delicato equilibrio tra privacy e analisi di dati preziosi. La tecnologia del progetto è in fase di collaudo in cinque casi d’uso reali, che vanno dal rilevamento dell’aritmia cardiaca all’analisi dell’utilizzo del telefono cellulare. Melek Önen, professoressa associata presso il dipartimento di sicurezza digitale di EURECOM e coordinatrice del progetto PAPAYA, espone i risultati finora raggiunti e le ambizioni del progetto.

Quali lacune nella privacy dei dati avete mirato a colmare con questo progetto?

Melek Önen: Il progetto PAPAYA intende affrontare le preoccupazioni in merito alla privacy dei dati che emergono quando la loro analisi viene esternalizzata a server cloud potenti ma non attendibili. L’analisi dei dati è in grado di contribuire all’utilizzo dei dati raccolti affinché le parti coinvolte possano ricavare informazioni rilevanti e assumere decisioni migliori. Ad esempio, un’agenzia sanitaria potrebbe utilizzare l’analisi dei dati per prevedere o individuare il rischio di pandemie. L’analisi dei dati può anche aiutare aziende commerciali o di marketing nel loro processo decisionale. Ma c’è un aspetto fondamentale: le serie di dati, nonostante l’elevato valore che rappresentano per le entità da cui sono raccolte, contengono anche informazioni altamente sensibili sulle persone da cui provengono. La riservatezza dei dati e la privacy degli interessati sono realmente a rischio. Adottando un approccio di «privacy fin dalla progettazione», il nostro progetto punta a ideare e sviluppare una piattaforma di moduli per la tutela della privacy in grado di proteggere la privacy degli utenti su una base da punto a punto, senza sacrificare le funzionalità di analisi dei dati.

Come spiega l’attuale mancanza di misure previe finalizzate a raggiungere questo equilibrio?

La società si trova ad affrontare un numero sempre maggiore di violazioni dei dati che provocano danni rilevanti. Molte persone hanno perso la fiducia nelle soluzioni di sicurezza dei dati delle organizzazioni e sono sempre più preoccupate circa la sicurezza delle loro informazioni personali. Il regolamento generale sulla protezione dei dati (GDPR) può invertire questa tendenza, ma ciò significa anche che le aziende sono ora in cerca di pratiche sicure di gestione dei dati. Oggi più che mai è necessaria un’analisi dei dati in grado di tutelare la privacy, che consenta alle aziende di operare su dati protetti e mantenerne la significatività e l’utilità, garantendo nel contempo la privacy dei clienti. Le consuete tecniche di protezione dei dati (ovvero le tecniche di crittografia standard come AES) sono purtroppo inadatte a questo nuovo contesto, in quanto impediscono ai server esterni di operare su dati crittografati. I proprietari dei dati dovrebbero prima scaricare i dati crittografati, decriptarli e svolgere operazioni sui dati in chiaro. Ciò non è possibile se il proprietario dei dati non dispone delle risorse computazionali in grado di eseguire operazioni su volumi di dati così elevati o nel caso in cui l’algoritmo da eseguire sia di proprietà di server esterni. Una soluzione potrebbe essere quella di fornire al server esterno la chiave per decriptare i dati, ma così facendo la riservatezza non sarebbe più garantita.

In che modo il vostro approccio aiuta a superare tutti questi problemi?

PAPAYA sviluppa tecnologie di rafforzamento della privacy che consentono l’analisi di dati protetti, che vanno dalle semplici operazioni statistiche fino a più sofisticate tecniche di apprendimento automatico, quali le reti neurali. Tali tecnologie forniscono protezioni significative alle parti coinvolte i cui dati sono in fase di elaborazione e forniscono nel contempo servizi per titolari dei dati/titolari del trattamento. La nostra soluzione è in linea con la protezione dei dati richiesta dal GDPR sin dalla progettazione. Inoltre, il progetto sviluppa strumenti specifici che agevolano la conformità normativa al GDPR e alla relativa legislazione sulla protezione della privacy e dei dati, per le organizzazioni che impiegano analisi di tutela della privacy. Gli strumenti sono incentrati sui diritti delle persone i cui dati sono in corso di trattamento, definiti come «interessati» nel GDPR.

Come funziona esattamente la vostra piattaforma?

La struttura di PAPAYA ruota attorno a due gruppi principali di componenti: in primo luogo, i componenti lato piattaforma che verranno eseguiti sul server cloud non attendibile; poi, i componenti lato cliente che verranno eseguiti in un ambiente client attendibile (ad esempio uno smartphone). La piattaforma riorganizza moduli di analisi a tutela della privacy per le seguenti operazioni: classificazione di reti neurali, formazione collaborativa per reti neurali, raggruppamento di traiettorie e statistiche di base. Ad alto livello, le piattaforme client, ovvero le parti coinvolte, inviano le loro richieste di conduzione di analisi necessarie con una modalità che tutela la privacy e ricevono il risultato corrispondente senza alcuna perdita di informazione sensibile ai fini della privacy. La struttura include anche un kit di strumenti per l’interessato e fornisce strumenti versatili per la protezione dei dati appositamente sviluppati dalla piattaforma client verso gli interessati, i cui dati personali sono elaborati nei loro servizi. Ad esempio, gli interessati possono ricevere maggiori informazioni sui servizi alla base dell’analisi di tutela della privacy o sulla divulgazione dei propri dati.

È possibile fornire qualche esempio concreto di casi d’uso?

PAPAYA indica cinque casi d’uso, ognuno rivolto a una diversa impostazione: uno di questi, rivolto alle applicazioni sanitarie (condotto da MediaClinics Italia, una PMI italiana), consiste nel rilevamento dell’aritmia cardiaca con modalità di tutela della privacy. In questo caso d’uso vengono raccolti dati sanitari sensibili sotto forma di elettrocardiogrammi provenienti dal paziente. La piattaforma PAPAYA rileva l’aritmia avvalendosi di reti neurali, senza avere accesso agli elettrocardiogrammi. Un altro caso d’uso, rivolto agli operatori delle telecomunicazioni (condotto da Orange, l’azienda di telecomunicazioni francese), aiuta le parti coinvolte a estrarre schemi di mobilità impiegando alcuni algoritmi di raggruppamento delle traiettorie, il tutto senza identificare le singole traiettorie.

Quali sono secondo lei i principali risultati del progetto raggiunti finora?

Il progetto ha sviluppato varianti per la tutela della privacy di un gruppo di quattro analisi: reti neurali (classificazione, formazione collaborativa), raggruppamento di traiettorie, conteggio e statistiche di base. Tali moduli utilizzano diversi strumenti avanzati di crittografia, quali la crittografia omomorfica, la privacy differenziale o la crittografia funzionale. Inoltre, sono state sviluppate varie interfacce utente per migliorare la trasparenza per gli interessati e le altre parti coinvolte. Tra queste vi è un’estensione dello strumento di Valutazione dell’impatto sulla privacy di CNIL, che supporta le parti coinvolte nel progetto PAPAYA nella valutazione dell’impatto delle analisi a tutela della privacy sugli obiettivi di privacy e sicurezza. Lo strumento risulta inoltre molto più trasparente per gli interessati. Le nostre interfacce utente spiegano il funzionamento delle analisi per la tutela della privacy di PAPAYA e il nostro strumento di configurazione della privacy tiene conto delle preferenze e dei diritti di privacy degli interessati.

Quali obiettivi dovete ancora raggiungere?

Ora il progetto è in fase di validazione. Il nostro obiettivo è la configurazione di prototipi per dimostrare i cinque casi d’uso, oltre a realizzare una guida per la piattaforma al fine di agevolarne l’utilizzo da parte degli utenti.

Parole chiave

PAPAYA, analisi dei dati, cloud, GDPR, aritmia, telecomunicazioni

Articoli correlati