Cos'è la pseudonimizzazione?

La pseudonimizzazione sostituisce le informazioni personali con alias per rendere i set di dati più privati. I dati pseudonimi non possono essere associati a una persona identificabile, a meno che non vengano combinati con un set di informazioni separato.

Obiettivi di apprendimento

Dopo aver letto questo articolo sarai in grado di:

  • Definire la pseudonimizzazione
  • Spiegare come funziona la pseudonimizzazione
  • Descrivere perché la pseudonimizzazione non è richiesta dal GDPR
  • Confrontare pseudonimizzazione e anonimizzazione

Argomenti correlati


Vuoi saperne di più?

Abbonati a theNET, il riepilogo mensile di Cloudflare sulle tematiche più discusse in Internet.

Fai riferimento all'Informativa sulla privacy di Cloudflare per scoprire come raccogliamo ed elaboriamo i tuoi dati personali.

Copia link dell'articolo

Cos'è la pseudonimizzazione?

La pseudonimizzazione è il processo di rimozione degli identificatori personali dai dati e di sostituzione di tali identificatori con valori segnaposto. A volte viene utilizzato per proteggere la privacy personale o migliorare la sicurezza dei dati. In combinazione con altre importanti misure di tutela della privacy, come la crittografia, la pseudonimizzazione può aiutare a mantenere la privacy degli utenti.

In genere, uno "pseudonimo" è un nome falso utilizzato per nascondere la propria identità. Ad esempio, molti autori di libri usano uno pseudonimo o "pseudonimo". La pseudonimizzazione dei dati è in qualche modo simile a questo concetto, ma i valori dello pseudonimo di solito non vengono utilizzati pubblicamente. È anche importante notare che qualsiasi informazione personale, non solo il nome di una persona, può essere pseudonimizzata.

Come funziona la pseudonimizzazione?

Immagina che Alice crei un account su un servizio di streaming. Come parte del processo di registrazione, il servizio di streaming memorizza il suo nome nel proprio database. Tuttavia, il servizio non la registra nel suo database di record personali (chiamiamolo Database 1) come "Alice", ma utilizza invece lo pseudonimo per cambiare "Alice" in "Persona 17332".

Database 1:

Name Tipo di account
Persona 17332 Abbonamento completo
Persona 12348 periodo di valutazione gratuito
Persona 74738 Abbonamento VIP
Persona 78383 Abbonamento completo

Un elenco di nomi e il loro pseudonimo corrispondente è conservato in un database separato (chiamiamolo Database 2). Qualcuno che avesse accesso solo al Database 1 sarebbe in grado di visualizzare i dati pseudonimi ma non sarebbe in grado di abbinare tali dati a un individuo specifico, come Alice. Per fare ciò, avrebbero anche bisogno di accedere a Database 2, l'elenco di nomi e pseudonimi.

Database 2:

Name Pseudonimo
Alice Persona 17332
Bob Persona 12348
Carlos Persona 74738
David Persona 78383

Ora immagina che Chuck, un dipendente canaglia del servizio di streaming, rubi Database 1. Analizza i dati, ma non può verificare l'identità di alcun utente, perché l'elenco degli pseudonimi viene archiviato separatamente. Non può fare molto con i suoi dati rubati a meno che non rubi anche Database 2.

In questo modo, la pseudonimizzazione aiuta a proteggere la privacy e a migliorare la sicurezza. Tuttavia, identificare qualcuno è ancora possibile in diversi modi. Se i dati identificativi non vengono archiviati separatamente, è possibile identificare le persone: ad esempio, se Chuck ruba anche il Database 2, può facilmente identificare Alice per nome. Inoltre, è spesso possibile identificare le persone in dati pseudonimizzati combinando i dati con altre fonti di dati esterne (immagina se Alice avesse pubblicato sui social media di avere un abbonamento completo al servizio di streaming).

La pseudonimizzazione deve quindi essere combinata con altri processi e tecnologie per mantenere i dati privati. Ad esempio: immagina che il servizio di streaming utilizzi la crittografia per proteggere i database 1 e 2, non solo la pseudonimizzazione. Se Chuck ruba entrambi i database, ora tutto ciò che può vedere è:

Database 1:

Name Tipo di account
P0kOFAw20PHbOnT7oXXvlm4
lfOkGbahX+1XCv1VECrE=
nm+nauwi7eePi7ZKJH0sIeV
LbxBJgixIdL1sOXvsUnw=
88X5ceFkvcYjG+WxROkAT6X
Lh8wuqc3NctBP7mkIAYM=
w+1iufZv3OrLPb7sESpeNIu
5kzX4IVaNYz7DhpSeFKo=
Zh3MZza5QM0Q+BtNGBx7eel
MafyehzZBv5I2zdodp8E=
CGDoLDA7X/poEyTI+UWa8mu
C9bjmbMfAmwhrNZbjUbc=
WbAJpSq+GRuaVK5Qogdfa2t
WYQq2Ge2GiS1zJsmUOG8=
nm+nauwi7eePi7ZKJH0sIeV
LbxBJgixIdL1sOXvsUnw=

Database 2:

Name Pseudonimo
lenaV3sVToJ8FdDHNwLIMed
0AN5I+P7KSrN3nKj8WN8=
P0kOFAw20PHbOnT7oXXvlm4
lfOkGbahX+1XCv1VECrE=
srS9OH6GK4qa33jgZx+24ZJ
ghF1BZE9Agc825l1c0lA=
88X5ceFkvcYjG+WxROkAT6X
Lh8wuqc3NctBP7mkIAYM=
ddbqSa7o561pBZzFHebo2LZ
vKrgWCKj7XM1n10/waw8=
Zh3MZza5QM0Q+BtNGBx7eel
MafyehzZBv5I2zdodp8E=
TKtTr4dDNRd+yb6f4DzUlrg
hC10OgUXlkR0X8wzkzJw=
WbAJpSq+GRuaVK5Qogdfa2t
WYQq2Ge2GiS1zJsmUOG8=

Per questo motivo, la crittografia fornisce protezioni più forti contro i ficcanaso come Chuck. Scopri di più su privacy e crittografia.

La pseudonimizzazione è richiesta dal GDPR?

Il Regolamento generale sulla protezione dei dati (GDPR) menziona la pseudonimizzazione come un metodo che può essere utilizzato per proteggere i dati personali, ma non ne richiede l'uso. La pseudonimizzazione non garantisce che la privacy venga preservata, né che un'organizzazione eviti di violare il GDPR.

In effetti, il GDPR considera ancora i dati pseudonimi come dati personali perché possono essere associati a una persona aggiungendo ulteriori informazioni. (Nell'esempio precedente, è possibile identificare il livello di appartenenza di Alice nel Database 1 aggiungendo le informazioni dal Database 2.) Il GDPR afferma che:

"I dati personali che hanno subito una pseudonimizzazione, che potrebbero essere attribuiti a una persona fisica mediante l'uso di informazioni aggiuntive, dovrebbero essere considerati informazioni su una persona fisica identificabile."

Pertanto, sebbene la pseudonimizzazione possa essere utile per proteggere i dati, da sola non è sufficiente per mantenere la privacy o per la conformità GDPR.

Qual è la differenza tra pseudonimizzazione e anonimizzazione?

L'anonimizzazione rende i dati completamente anonimi. Le informazioni di identificazione vengono eliminate del tutto e, a differenza della pseudonimizzazione, il processo idealmente non può essere invertito. Se i dati nell'esempio sopra fossero resi anonimi, tutte le informazioni che potrebbero identificare Alice, come il suo nome, verrebbero rimosse dal database invece di essere semplicemente sostituite con uno pseudonimo:

Name Tipo di account
******** Abbonamento completo
******** periodo di valutazione gratuito
******** Abbonamento VIP
******** Abbonamento completo

L'anonimizzazione dei dati aiuta con la privacy ma non è sempre pratica o possibile. Se fosse impossibile per il servizio di streaming di esempio associare account a persone specifiche, non sarebbe affatto in grado di fornire il proprio servizio.

Tuttavia, ci sono casi in cui è preferibile l'anonimizzazione. Ad esempio, i ricercatori medici a volte utilizzano dati sanitari aggregati che sono stati resi anonimi per preservare la privacy. Inoltre, i dati anonimi possono comunque fornire informazioni preziose: alcuni servizi di analisi Web rendono anonimi i propri dati, ad esempio.

Ma anche i dati resi anonimi potrebbero non proteggere completamente la privacy degli utenti. Combinando dati anonimi con altri set di dati, esaminando il contesto per i dati o utilizzando diversi altri metodi, a volte è possibile associare dati anonimi a una persona specifica. Anche i dati personali anonimizzati devono essere protetti con crittografia, controllo degli accessi e altre misure di salvaguardia contro le violazioni della privacy.