Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Phyton: nuovo tool per la gestione della privacy da Google

Google e OpenMined lanciano una nuova libreria che introduce la privacy differenziale nel data processing in Python
Phyton: nuovo tool per la gestione della privacy da Google
Google e OpenMined lanciano una nuova libreria che introduce la privacy differenziale nel data processing in Python
Link copiato negli appunti

Dopo un lavoro di coding durato circa due anni, Google e la community di OpenMined hanno reso disponibile un nuovo tool grazie al quale gli sviluppatori Python hanno la possibilità di processare dati tramite un approccio basato sulla privacy differenziale. Il progetto è dedicato a qualsiasi organizzazione, sia essa una software house, un'istituzione, un centro di ricerca, un'azienda o un'ONG, che debba gestire una grande quantità di dati ma abbia la necessità di garantire la riservatezza dei soggetti coinvolti.

Cos'è la privacy differenziale

Il trattamento dei dati basato sulla privacy differenziale risponde nel contempo a due esigenze spesso rappresentate in contrapposizione: disporre di insight caratterizzati da un elevato livello di accuratezza, quindi in grado di restituire una fotografia quanto più attinente possibile alla realtà dei fatti, e salvaguardare la privacy dei singoli.

Sviluppato per ambiti applicativi squisitamente data driven come per esempio il training dei modelli di Machine Learning, questo approccio è stato concepito a partire dalla considerazione che con il crescere del volume di dati raccolti aumentano anche i rischi per la tutela della privacy in fase di analisi.

Per ovviare a questo problema, che ha anche delle implicazioni relative alla compliance dei processi di elaborazione dei dati con normative quali il GDPR, la privacy differenziale prevede che tutti i riferimenti che potrebbero portare all'identificazione di un utente diventino inaccessibili tramite l'applicazione di un "rumore di fondo" o attraverso una loro disposizione randomica.

Le proprietà dei dati non vengono così perdute ed è salvaguardata la loro utilità nella costruzione dei modelli, contestualmente viene a mancare in modo più o meno efficace la possibilità che essi siano associati a delle identità.

Privacy differenziale e Python

L'iniziativa di Google e OpenMined nasce da un interesse di Mountain View per la privacy differenziale già dimostrato a partire dal 2019, quando l'azienda californiana ha deciso di definire nuove modalità di profilazione non più basate sui singoli ma su insiemi di utenti caratterizzati da interessi comuni.

Sempre nel 2019 la libreria di Google per la privacy differenziale venne implementata per diversi linguaggi di programmazione tra cui C++, Java e Go. Mancava però Python che nel corso degli ultimi anni è divenuto una delle maggiori soluzioni di riferimento per lo sviluppo dedicato a Machine Learning e Deep Learning.

La collaborazione con OpenMined mette fine a questa assenza e permette di condividere dati pseudonimizzati anche in ambiti particolarmente attenti alla gestione di dati sensibili come per esempio quelli della sanità e della ricerca scientifica.

Pensata per progetti che riguardano la gestione di petabyte di dati, questa libreria può essere utilizzata con i maggiori framework per il data processing e la data analysis, basti pensare a Apache Spark e Beam, ed è stata già impiegata in alcune piattaforme di Big G come Google Maps.

Ti consigliamo anche