가명 처리하면 개인 정보가 별칭으로 대체되어 데이터 집합이 더욱 비공개적이 됩니다. 가명 데이터는 별도의 정보 집합과 결합하지 않는 한 식별 가능한 개인과 일치시킬 수 없습니다.
이 글을 읽은 후에 다음을 할 수 있습니다:
관련 콘텐츠
인터넷에서 가장 인기 있는 인사이트를 한 달에 한 번 정리하는 Cloudflare의 월간 요약본 theNET를 구독하세요!
글 링크 복사
가명 처리는 데이터에서 개인 식별자를 제거하고 해당 식별자를 자리 표시자 값으로 대체하는 프로세스입니다.이는 개인적인 개인정보 보호 또는 데이터 보안 개선을 위해 사용되기도 합니다.가명 처리는 암호화와 같은 다른 중요한 개인 정보 보호 장치와 함께 사용하면 사용자 개인 정보를 보호하는 데 도움이 될 수 있습니다.
일반적으로 "가명"은 신원을 감추기 위해 사용하는 가짜 이름입니다. 예를 들어, 많은 책의 저자는 가명이나 "필명"을 사용합니다. 데이터 가명 처리도 이 개념과 비슷하지만, 가명 값은 일반적으로 공개적으로 사용되지 않습니다. 또한 사람의 이름뿐만 아니라 모든 개인 정보가 가명 처리될 수 있다는 점도 유의해야 합니다.
Alice가 스트리밍 서비스에서 계정을 만든다고 가정해 보겠습니다. 가입 프로세스의 일부로 스트리밍 서비스에서는 데이터베이스에 Alice의 이름을 저장합니다. 그러나 이 서비스에서는 개인 기록 데이터베이스(이를 데이터베이스 1이라고 부르겠습니다)에 그녀를 "Alice"라고 기록하는 대신 가명 처리하여 "Person 17332"로 변경하여 기록합니다.
데이터베이스 1:
이름 | 계정 유형 |
---|---|
Person 17332 | 정회원 |
Person 12348 | 무료 평가판 |
Person 74738 | VIP 회원 |
Person 78383 | 정회원 |
이름과 해당 가명 목록은 별도의 데이터베이스에 보관됩니다(이를 데이터베이스 2라고 부르겠습니다). 데이터베이스 1에만 액세스 권한이 있는 사람은 가명 데이터를 볼 수 있지만 해당 데이터를 Alice와 같은 특정 개인과 일치시킬 수는 없습니다. 그러려면 이름과 가명 목록인 데이터베이스 2에도 액세스해야 합니다.
데이터베이스 2:
이름 | 가명 |
---|---|
Alice | Person 17332 |
Bob | Person 12348 |
Carlos | Person 74738 |
David | Person 78383 |
이제 스트리밍 서비스의 악의적인 직원인 Chuck가 데이터베이스 1을 훔친다고 가정해 보겠습니다. Chuck는 데이터를 분석하지만, 가명 목록이 별도로 저장되어 있으므로 사용자의 신원을 확인할 수 없습니다. 그는 데이터베이스 2도 훔치지 않는 한 훔친 데이터로 많은 일을 할 수 없습니다.
이러한 방식으로 가명 처리는 개인정보를 보호하고 보안을 강화하는 데 도움이 됩니다. 하지만 여러 가지 방법으로 신원을 확인할 수 있습니다. 식별 데이터가 별도로 저장되지 않으면 개인을 식별할 수 있습니다. 예를 들어 Chuck가 데이터베이스 2도 훔치면 Alice의 이름으로 쉽게 식별할 수 있습니다. 또한 가명 처리된 데이터를 다른 외부 데이터 소스와 결합하여 개인을 식별할 수 있는 경우가 많습니다(Alice가 소셜 미디어에 스트리밍 서비스 정회원 가입 사실을 게시했다고 상상해 보세요).
따라서 가명 처리는 데이터를 비공개로 유지하기 위해 다른 프로세스 및 기술과 결합되어야 합니다. 예를 들어, 스트리밍 서비스에서 가명 처리뿐만 아니라 데이터베이스 1과 2를 보호하기 위해 암호화를 사용한다고 가정해 보겠습니다. Chuck가 두 데이터베이스를 모두 훔쳐도 이제 Chuck가 볼 수 있는 것은 다음과 같은 모습 뿐입니다.
데이터베이스 1:
이름 | 계정 유형 |
---|---|
P0kOFAw20PHbOnT7oXXvlm4 lfOkGbahX+1XCv1VECrE= |
nm+nauwi7eePi7ZKJH0sIeV LbxBJgixIdL1sOXvsUnw= |
88X5ceFkvcYjG+WxROkAT6X Lh8wuqc3NctBP7mkIAYM= |
w+1iufZv3OrLPb7sESpeNIu 5kzX4IVaNYz7DhpSeFKo= |
Zh3MZza5QM0Q+BtNGBx7eel MafyehzZBv5I2zdodp8E= |
CGDoLDA7X/poEyTI+UWa8mu C9bjmbMfAmwhrNZbjUbc= |
WbAJpSq+GRuaVK5Qogdfa2t WYQq2Ge2GiS1zJsmUOG8= |
nm+nauwi7eePi7ZKJH0sIeV LbxBJgixIdL1sOXvsUnw= |
데이터베이스 2:
이름 | 가명 |
---|---|
lenaV3sVToJ8FdDHNwLIMed 0AN5I+P7KSrN3nKj8WN8= |
P0kOFAw20PHbOnT7oXXvlm4 lfOkGbahX+1XCv1VECrE= |
srS9OH6GK4qa33jgZx+24ZJ ghF1BZE9Agc825l1c0lA= |
88X5ceFkvcYjG+WxROkAT6X Lh8wuqc3NctBP7mkIAYM= |
ddbqSa7o561pBZzFHebo2LZ vKrgWCKj7XM1n10/waw8= |
Zh3MZza5QM0Q+BtNGBx7eel MafyehzZBv5I2zdodp8E= |
TKtTr4dDNRd+yb6f4DzUlrg hC10OgUXlkR0X8wzkzJw= |
WbAJpSq+GRuaVK5Qogdfa2t WYQq2Ge2GiS1zJsmUOG8= |
이러한 이유로 암호화는 Chuck와 같은 해커에 대해 더욱 강력한 보호 기능을 제공합니다. 개인정보 보호 및 암호화에 대해 자세히 알아보세요.
일반 데이터 보호 규정(GDPR)에서는 개인 데이터를 보호하기 위해 사용할 수 있는 방법 중 하나로 가명 처리를 언급하고 있지만, 이를 반드시 사용해야 하는 것은 아닙니다. 가명 처리를 한다고 해서 개인정보가 보호된다는 보장은 없으며, 조직에서 가명 처리로 GDPR 위반을 피할 수 있다는 보장도 없습니다.
사실, 가명 데이터는 정보를 추가하여 개인과 연관시킬 수 있기 때문에 GDPR에서는 여전히 개인 데이터로 간주합니다. (위의 예에서는 데이터베이스 2의 정보를 추가하여 데이터베이스 1에서 Alice의 회원 등급을 식별할 수 있습니다.) GDPR에서는 다음과 같이 명시하고 있습니다.
"추가 정보를 사용하여 자연인에게 귀속될 수 있는 가명 처리된 개인 데이터는 식별 가능한 자연인에 대한 정보로 간주해야 합니다."
따라서 가명 처리는 데이터를 보호하는 데는 유용할 수 있지만, 그 자체만으로는 개인정보 보호 또는 GDPR 준수를 위해 충분하지 않습니다.
익명화는 데이터를 완전히 익명으로 처리합니다. 식별 정보가 완전히 제거되며, 가명 처리와 달리 이 프로세스는 이상적으로는 되돌릴 수 없습니다. 위 예시의 데이터가 익명화되면 이름과 같이 Alice를 식별할 수 있는 모든 정보가 가명으로 대체되는 대신 데이터베이스에서 제거됩니다.
이름 | 계정 유형 |
---|---|
******** | 정회원 |
******** | 무료 평가판 |
******** | VIP 회원 |
******** | 정회원 |
데이터 익명화는 개인정보 보호에는 도움이 되지만, 항상 실용적이거나 가능한 것은 아닙니다. 예를 들어 스트리밍 서비스에서 특정 사용자와 계정을 연결할 수 없다면 서비스를 제공할 수 없게 됩니다.
그러나 익명화가 더 바람직한 경우도 있습니다. 예를 들어, 의료 연구자들은 개인정보 보호를 위해 익명 처리된 집계된 의료 데이터를 사용하기도 합니다. 또한, 예를 들어, 일부 웹 분석 서비스에서는 데이터를 익명화합니다.
하지만 익명화된 데이터라 하더라도 사용자 개인정보가 완전히 보호되지는 않을 수 있습니다. 익명화된 데이터를 다른 데이터 세트와 결합하거나, 데이터의 컨텍스트를 살펴보거나, 기타 여러 가지 방법을 사용하여 익명 데이터를 특정인과 연관시킬 수 있습니다. 익명화된 개인 데이터도 암호화, 액세스 제어, 기타 개인 정보 침해에 대한 안전 장치로 보호해야 합니다.