La pseudonimización sustituye la información personal por un alias para hacer más privados los conjuntos de datos. Los datos pseudónimos no se pueden relacionar con una persona identificable a menos que se combinen con un conjunto de información independiente.
Después de leer este artículo podrás:
Contenido relacionado
Suscríbete a theNET, el resumen mensual de Cloudflare sobre las ideas más populares de Internet.
Copiar el enlace del artículo
La pseudonimización es el proceso de eliminar los identificadores personales de los datos y sustituirlos por valores comodín. A veces se utiliza para proteger la privacidad personal o para mejorar la seguridad de los datos. En combinación con otras importantes protecciones de la privacidad, como la encriptación, la pseudonimización puede ayudar a mantener la privacidad del usuario.
En general, un "pseudónimo" es un nombre falso que se utiliza para ocultar la identidad. Por ejemplo, muchos autores de libros utilizan un pseudónimo o "nombre artístico." La pseudonimización de datos se parece en cierto modo a este concepto, pero los valores del pseudónimo no suelen utilizarse públicamente. También es importante tener en cuenta que cualquier información personal, no solo el nombre de una persona, puede ser pseudonimizada.
Imaginemos que Alice crea una cuenta en un servicio de transmisión. Como parte del proceso de registro, el servicio de transmisión almacena su nombre en su base de datos. Sin embargo, el servicio no la registra en su base de datos de registros personales (llamémosla Base de datos 1) como "Alice," en su lugar utiliza la pseudonimización para cambiar "Alice" por "Persona 17332."
Base de datos 1:
nombre | Tipo de cuenta |
---|---|
Persona 17332 | Suscripción completa |
Persona 12348 | prueba gratuita |
Persona 74738 | Suscripción VIP |
Persona 78383 | Suscripción completa |
Una lista de nombres, y su correspondiente pseudónimo, se guarda en una base de datos separada (llamémosla Base de datos 2). Alguien que solo tuviera acceso a la Base de Datos 1 podría ver los datos de los seudónimos, pero no podría relacionar esos datos con un individuo concreto, como Alice. Para ello, también necesitaría acceder a la Base de datos 2, la lista de nombres y pseudónimos.
Base de datos 2:
nombre | Pseudónimo |
---|---|
Alice | Persona 17332 |
Bob | Persona 12348 |
Carlos | Persona 74738 |
David | Persona 78383 |
Ahora, imaginemos que Chuck, un empleado deshonesto del servicio de transmisión, roba la Base de datos 1. Analiza los datos, pero no puede verificar la identidad de ningún usuario, porque la lista de pseudónimos se almacena por separado. No puede hacer mucho con sus datos robados a menos que también robe la Base de datos 2.
De este modo, la pseudonimización ayuda a proteger la privacidad y a mejorar la seguridad. Sin embargo, sigue siendo posible identificar a alguien de varias maneras. Si los datos identificativos no se almacenan por separado, es posible identificar a las personas; por ejemplo, si Chuck roba también la Base de datos 2, puede identificar fácilmente a Alice por su nombre. Además, a menudo es posible identificar a las personas en los datos pseudonimizados al combinar los datos con otras fuentes de datos externas (imaginemos que Alice hubiera publicado en redes sociales que tiene una suscripción completa en el servicio de transmisión).
Por lo tanto, la pseudonimización debe combinarse con otros procesos y tecnologías para mantener la privacidad de los datos. Por ejemplo: imaginemos que el servicio de transmisión utiliza encriptación para proteger las Bases de datos 1 y 2, y no solo la pseudonimización. Si Chuck robara ambas bases de datos, ahora lo único que podría ver es lo siguiente:
Base de datos 1:
nombre | Tipo de cuenta |
---|---|
P0kOFAw20PHbOnT7oXXvlm4 lfOkGbahX+1XCv1VECrE= |
nm+nauwi7eePi7ZKJH0sIeV LbxBJgixIdL1sOXvsUnw= |
88X5ceFkvcYjG+WxROkAT6X Lh8wuqc3NctBP7mkIAYM= |
w+1iufZv3OrLPb7sESpeNIu 5kzX4IVaNYz7DhpSeFKo= |
Zh3MZza5QM0Q+BtNGBx7eel MafyehzZBv5I2zdodp8E= |
CGDoLDA7X/poEyTI+UWa8mu C9bjmbMfAmwhrNZbjUbc= |
WbAJpSq+GRuaVK5Qogdfa2t WYQq2Ge2GiS1zJsmUOG8= |
nm+nauwi7eePi7ZKJH0sIeV LbxBJgixIdL1sOXvsUnw= |
Base de datos 2:
nombre | Pseudónimo |
---|---|
lenaV3sVToJ8FdDHNwLIMed 0AN5I+P7KSrN3nKj8WN8= |
P0kOFAw20PHbOnT7oXXvlm4 lfOkGbahX+1XCv1VECrE= |
srS9OH6GK4qa33jgZx+24ZJ ghF1BZE9Agc825l1c0lA= |
88X5ceFkvcYjG+WxROkAT6X Lh8wuqc3NctBP7mkIAYM= |
ddbqSa7o561pBZzFHebo2LZ vKrgWCKj7XM1n10/waw8= |
Zh3MZza5QM0Q+BtNGBx7eel MafyehzZBv5I2zdodp8E= |
TKtTr4dDNRd+yb6f4DzUlrg hC10OgUXlkR0X8wzkzJw= |
WbAJpSq+GRuaVK5Qogdfa2t WYQq2Ge2GiS1zJsmUOG8= |
Por esta razón, la encriptación proporciona una mayor protección contra fisgones como Chuck. Más información sobre la privacidad y la encriptación.
El Reglamento general de protección de datos (RGPD) menciona la pseudonimización como un método que puede utilizarse para proteger los datos personales, pero no exige su uso. La pseudonimización no garantiza que se preserve la privacidad, ni que una organización evite infringir el RGPD.
De hecho, el RGPD sigue considerando que los datos pseudónimos son datos personales porque pueden asociarse a una persona añadiendo información adicional. (En el ejemplo anterior, se podría identificar el nivel de suscripción de Alice en la Base de datos 1 si se añade la información de la Base de datos 2). El RGPD establece que:
"Los datos personales que han sido sometidos a una pseudonimización, que podrían atribuirse a una persona física mediante el uso de información adicional, deben considerarse como información sobre una persona física identificable."
Así que aunque la pseudonimización puede ser útil para proteger los datos, no es suficiente por sí sola para mantener la privacidad o para cumplir con el RGPD.
La anonimización hace que los datos sean completamente anónimos. La información identificativa se elimina por completo y, a diferencia de la pseudonimización, el proceso no puede revertirse. Si los datos del ejemplo anterior se anonimizaran, toda la información que pudiera identificar a Alice, como su nombre, se eliminaría de la base de datos en lugar de sustituirla por un pseudónimo:
nombre | Tipo de cuenta |
---|---|
******** | Suscripción completa |
******** | prueba gratuita |
******** | Suscripción VIP |
******** | Suscripción completa |
La anonimización de los datos ayuda a la privacidad, pero esta no siempre es práctica o posible. Por ejemplo, si al servicio de transmisión le resultara imposible asociar las cuentas a personas concretas, no podría prestar su servicio.
No obstante, hay casos en los que es preferible la anonimización. Por ejemplo, los investigadores médicos a veces utilizan datos sanitarios agregados que han sido anonimizados para preservar la privacidad. Además, los datos anónimos pueden seguir proporcionando información valiosa: por ejemplo, algunos servicios de análisis web anonimizan sus datos.
Pero incluso los datos anonimizados pueden no proteger del todo la privacidad del usuario. Al combinar los datos anonimizados con otros conjuntos de datos, observar el contexto de los datos o usar otros métodos, a veces es posible asociar los datos anonimizados con una persona concreta. Incluso los datos personales anonimizados deben protegerse con encriptación, control de acceso, y otras salvaguardas contra la vulneración de la privacidad.