O que é pseudonimização?

A pseudonimização substitui as informações pessoais por aliases para tornar os conjuntos de dados mais privados. Dados com pseudônimos não podem ser comparados a uma pessoa identificável, a menos que sejam combinados com um conjunto separado de informações.

Objetivos de aprendizado

Após ler este artigo, você será capaz de:

  • Definir pseudonimização
  • Explicar como funciona a pseudonimização
  • Descrever por que a pseudonimização não é exigida pelo GDPR
  • Comparar pseudonimização com anonimização

Copiar o link do artigo

O que é pseudonimização?

A pseudonimização é o processo de remover identificadores pessoais dos dados e substituir esses identificadores por valores de marcadores de posição. Às vezes, é usada para proteger a privacidade pessoal ou melhorar a segurança dos dados. Em combinação com outras importantes proteções de privacidade, como criptografia, a pseudonimização pode ajudar a manter a privacidade do usuário.

Geralmente, um "pseudônimo" é um nome falso usado para ocultar a identidade de alguém. Por exemplo, muitos autores de livros usam um pseudônimo ou um "nome fictício". A pseudonimização de dados é um pouco parecida com esse conceito, mas os valores de pseudônimo geralmente não são usados publicamente. Também é importante observar que quaisquer informações pessoais, não apenas o nome de uma pessoa, podem ser pseudonimizadas.

Como funciona a pseudonimização?

Imagine que Alice cria uma conta em um serviço streaming. Como parte do processo de inscrição, o serviço de streaming armazena o nome dela em seu banco de dados. No entanto, o serviço não a registra em seu banco de dados de registros pessoais (vamos chamá-lo de Banco de dados 1) como "Alice", em vez disso, usa a pseudonimização para alterar "Alice" para "Pessoa 17332".

Base de dados 1:

Nome Tipo de conta
Pessoa 17332 Afiliação plena
Pessoa 12348 teste gratuito
Pessoa 74738 Associação VIP
Pessoa 78383 Afiliação plena

Uma lista de nomes e seus pseudônimos correspondentes é mantida em um banco de dados separado (vamos chamá-lo de Banco de dados 2). Alguém que tivesse acesso apenas ao Banco de Dados 1 seria capaz de visualizar os dados dos pseudônimos, mas não conseguiria associar esses dados a um indivíduo específico, como Alice. Para isso, eles também precisariam acessar o Banco de Dados 2, a lista de nomes e pseudônimos.

Banco de dados 2:

Nome Pseudônimo
Alice Pessoa 17332
Bob Pessoa 12348
Carlos Pessoa 74738
David Pessoa 78383

Agora imagine Chuck, um funcionário desonesto do serviço de streaming, roubando o Banco de Dados 1. Ele analisa os dados, mas não consegue verificar a identidade de nenhum usuário, pois a lista de pseudônimos é armazenada separadamente. Ele não pode fazer muito com seus dados roubados, a menos que também roube o Banco de Dados 2.

Dessa forma, a pseudonimização ajuda a proteger a privacidade e aumentar a segurança. No entanto, identificar alguém ainda é possível de várias maneiras. Se os dados de identificação não forem armazenados separadamente, os indivíduos podem ser identificados — por exemplo, se Chuck também roubar o Banco de Dados 2, ele poderá identificar facilmente Alice pelo nome. Além disso, muitas vezes é possível identificar indivíduos em dados pseudonimizados combinando os dados com outras fontes de dados externas (imagine se Alice tivesse postado sobre ter uma adesão plena no serviço de streaming nas redes sociais).

A pseudonimização, portanto, precisa ser combinada com outros processos e tecnologias para manter os dados privados. Por exemplo: imagine que o serviço de streaming usa criptografia para proteger os Bancos de Dados 1 e 2, não apenas a pseudonimização. Se Chuck roubar os dois bancos de dados, agora tudo o que ele pode ver é:

Base de dados 1:

Nome Tipo de conta
P0kOFAw20PHbOnT7oXXvlm4
lfOkGbahX+1XCv1VECrE=
nm+nauwi7eePi7ZKJH0sIeV
LbxBJgixIdL1sOXvsUnw=
88X5ceFkvcYjG+WxROkAT6X
Lh8wuqc3NctBP7mkIAYM=
w+1iufZv3OrLPb7sESpeNIu
5kzX4IVaNYz7DhpSeFKo=
Zh3MZza5QM0Q+BtNGBx7eel
MafyehzZBv5I2zdodp8E=
CGDoLDA7X/poEyTI+UWa8mu
C9bjmbMfAmwhrNZbjUbc=
WbAJpSq+GRuaVK5Qogdfa2t
WYQq2Ge2GiS1zJsmUOG8=
nm+nauwi7eePi7ZKJH0sIeV
LbxBJgixIdL1sOXvsUnw=

Banco de dados 2:

Nome Pseudônimo
lenaV3sVToJ8FdDHNwLIMed
0AN5I+P7KSrN3nKj8WN8=
P0kOFAw20PHbOnT7oXXvlm4
lfOkGbahX+1XCv1VECrE=
srS9OH6GK4qa33jgZx+24ZJ
ghF1BZE9Agc825l1c0lA=
88X5ceFkvcYjG+WxROkAT6X
Lh8wuqc3NctBP7mkIAYM=
ddbqSa7o561pBZzFHebo2LZ
vKrgWCKj7XM1n10/waw8=
Zh3MZza5QM0Q+BtNGBx7eel
MafyehzZBv5I2zdodp8E=
TKtTr4dDNRd+yb6f4DzUlrg
hC10OgUXlkR0X8wzkzJw=
WbAJpSq+GRuaVK5Qogdfa2t
WYQq2Ge2GiS1zJsmUOG8=

Por este motivo, a criptografia oferece uma proteção mais forte contra bisbilhoteiros como Chuck. Saiba mais sobre privacidade e criptografia.

A pseudonimização é exigida pelo GDPR?

O Regulamento Geral de Proteção de Dados (GDPR) menciona a pseudonimização como um método que pode ser usado para proteger dados pessoais, mas não exige seu uso. A pseudonimização não garante que a privacidade será preservada, nem garante que uma organização evitará a violação do GDPR.

De fato, o GDPR ainda considera dados pseudônimos como dados pessoais, pois podem ser associados a uma pessoa adicionando informações adicionais. (No exemplo acima, pode-se identificar o nível de associação de Alice no Banco de Dados 1 adicionando as informações do Banco de Dados 2.) O GDPR afirma que:

"Dados pessoais que sofreram pseudonimização, que podem ser atribuída a uma pessoa física pelo uso de informação adicionais devem ser considerados informação sobre uma pessoa física identificável".

Portanto, embora a pseudonimização possa ser útil para proteger os dados, ela não é suficiente por si só para manter a privacidade ou para a conformidade com o GDPR.

Qual é a diferença entre pseudonimização e anonimização?

A anonimização torna os dados completamente anônimos. A identificação de informações é totalmente eliminada e, ao contrário da pseudonimização, o processo, idealmente, não pode ser revertido. Se os dados do exemplo acima fossem anonimizados, todas as informações que pudessem identificar Alice, como o nome dela, seriam removidas do banco de dados em vez de apenas serem substituídas por um pseudônimo:

Nome Tipo de conta
******** Afiliação plena
******** teste gratuito
******** Associação VIP
******** Afiliação plena

A anonimização de dados ajuda na privacidade, mas nem sempre é prática ou possível. Se fosse impossível para o serviço de streaming do exemplo associar contas a pessoas específicas, eles não seriam capazes de fornecer seu serviço.

No entanto, há casos em que a anonimização é preferível. Por exemplo, pesquisadores médicos às vezes usam dados agregados de saúde que foram anonimizados para preservar a privacidade. Além disso, dados anônimos ainda podem fornecer informações valiosas — alguns serviços de análise de dados da web anonimizam seus dados, por exemplo.

Mas mesmo dados anônimos podem não proteger totalmente a privacidade do usuário. Combinando dados anônimos com outros conjuntos de dados, observando o contexto dos dados ou usando vários outros métodos, às vezes é possível associar dados anônimos a uma pessoa específica. Até mesmo dados pessoais anônimos precisam ser protegidos com criptografia, controle de acesso e outras proteções contra violações de privacidade.