Wikimedia 재단은 Wikipedia와 기타 무료 지식 프로젝트(Wikimedia Commons, Wikiquote, Wiktionary 등)을 운영하는 비영리 단체입니다. 재단은 무료 지식을 위해 헌신하고 있으며, 모든 사람들이 모든 지식의 합을 자유롭게 공유할 수 있는 세상을 만드는 것이 비전입니다.
이 프로젝트는 세계적으로 자원 봉사자들의 커뮤니티에 의해 실행되지만, 재단의 직원들은 이러한 프로젝트의 기술적 근간을 유지하고 자유로운 지식을 지원하는 정책과 보안을 위해 노력하며 언어, 문화, 대륙에 걸쳐 지식을 파악하기 위한 자원 봉사자의 노력을 지원합니다.
과제: 세계적으로 Wikimedia 사이트를 오프라인으로 만든, 대규모 DDoS 공격의 차단
Wikimedia Foundation의 CTO인 Grant Ingersoll은 이렇게 말합니다. “Wikimedia는 무료 지식이라는 생태계의 핵심 인프라가 되고자 합니다. 모든 사람이 우리 콘텐츠에 접속하고 이를 이용하며 자신들의 생활에 반영하고 이를 통해 생활이 풍부해지며 인터넷을 발전시키는 데 도움이 되고 싶습니다."
이러한 목표를 달성하려면, Wikimedia의 사이트는 안정적이고 안전하며 빨라야 합니다. 사이트 안정성 부문 이사 Faidon Liambotis는 이렇게 말합니다. “우리 사이트에 접속할 수 없거나 우리 사이트가 사용하기 어렵거나 봇에 의해 파괴되고 있다면, 콘텐츠를 작성하고 편집하는 자원봉사자들이 일을 할 수 없게 됩니다. 저는 밤에도 웹 사이트가 잘 작동하여 우리 직원들이 안심하고 잘 수 있게 하고 싶어요."
보안 측면에서 Wikimedia는 수년 동안 대형 DDoS 공격을 받지 않았습니다. 하지만 2019년 9월 7일, 이 운도 다하고 강력한 공격으로 인해 사이트에 접속할 수 없는 일이 발생했습니다. 유럽에서 시작하여, 아프리카, 중동으로 퍼지고 이어서 미국과 아시아를 포함한 전 세계가 마비됐습니다. “공격이 절정일 때는 수백Gbps에 달했어요.” 사이트 안정성 스탭 엔지니어 Chris Danis는 이렇게 회고했습니다.
가동이 중단된 초기에 Wikimedia 직원들은 공격을 멈추고 사이트를 온라인으로 복귀시키려고 노력했지만, 허사였습니다. GeoDNS 기반 부하 분산을 다시 매핑하는 등 몇 가지 완화 방법을 써봤고, 트래픽이 피어링 링크를 통해 들어올 때는 트래픽 엔지니어링 대책도 시도했죠." Danis가 말했습니다.
솔루션: Wikimedia에서 신속하게 온라인으로 복귀하기 위해 Magic Transit 이용
Cloudflare가 Wikimedia에 연락해 네트워크 인프라 보호 솔루션인 Magic Transit을 이용해 돕겠다고 제안했습니다. Liambotis의 기억에 의하면, 금요일 밤이었지만 공격이 발생하자마자 Cloudflare가 연락해 왔다고 합니다. "우리에게 연락할 때, 어떤 일이 있는지 이미 알고 있더라고요."
“Cloudflare의 보안 작전 센터와 위협 인텔리전스 팀은 벌써 공격의 신호인 포트 65535의 TCP ACK를 알고 있었던 것 같아요. 뭔가 묻기도 전에 말이에요." Danis가 말했습니다. "Cloudflare가 제시한 공격 추정치는 우리로서는 측정도 할 수 없는 크기였어요. Cloudflare가 Magic Transit을 켜고(다수의 지점에서 다양한 단위로) 공격을 측정했는데, 대역폭이 300Gbps, TCP ACK가 105MPPS, UDP 폭주가 340MPPS였습니다.”
Liambotis는 Magic Transit에 힘입어 자신의 직원들이 라우트 정책을 변경해 이 공격을 멈출 수 있었다고 말합니다. "이야기가 간단하게 들릴 수도 있겠지만요. 공격은 패턴을 바꿔가면서 간헐적으로 이어졌어요. 공격이 변경돼도 Magic Transit은 문제를 해결하더군요."
결과 및 효과: Magic Transit이 Wikimedia의 DDoS 방어 전략의 핵심 요소
Wikimedia는 DDoS 공격 완화를 위해 계속 Magic Transit을 이용하고 있습니다. Liambotis는 필요에 따라 이 도구를 껐다 켤 수 있다는 점을 높이 평가합니다. "우리 IP 공간에 대한 Cloudflare의 안내를 끌 수 있다는 건 뭔가 잘못되었을 때 우리에게 하나의 대안이 됩니다."
Magic Transit이 활성화되어 있더라도 Wikimedia 프로젝트와 사용자 간의 기존 전체적 암호화를 방해하지 않습니다. 이 점이 기술적 역량에 더해져, Magic Transit이 Wikimedia에 적절한 솔루션이 되었습니다. "Cloudflare가 우리의 보안 및 개인정보 보호 필요 사항에 신속하게 대응해줘서 감사합니다. 조직으로서, 우리는 개인 정보 문제에 매우 민감하거든요."
Wikimedia는 Magic Transit이 일부 클라우드 "스크러빙" 벤더들처럼 트래픽을 중앙의 스크러빙 센터로 가져오는 것이 아니라 네트워크 에지에서 트래픽을 필터링한다는 점도 높이 평가합니다. Liambotis는 다음과 같이 설명합니다. "다른 방법들은 중앙집중식 아키텍처를 이용합니다." "에지에서 필터링하지 않고, 멀리 떨어진 소수의 스크러빙 센터에서 필터링하기 때문에 용량과 기능에 대한 우리 요구 사항을 충족하지 못했어요. 스크러빙 센터 중 하나에 문제가 발생했는데, 우리 트래픽이 거기로 우회된다면 대기 시간이라는 문제가 발생하겠죠.
"하나의 중앙집중식 스크러빙 센터를 활성화하기 위해 경로를 변경하면, 사용자 대기 시간과 완화 시간이 영향을 받게 됩니다"라고 Danis가 덧붙입니다. "Magic Transit처럼 세계적으로 에지에서 필터링한다면, 합법적인 트래픽의 대기 시간이 절감됩니다."
Liambotis가 계속합니다. "인프라의 위험이라는 관점에서 DDoS는 매우 우선순위가 높으며 Cloudflare Magic Transit은 우리 DDoS 완화 전략의 기본입니다."
Wikimedia 담당자들은 문제가 발생할 때마다 보여주는 Cloudflare의 대응에 계속 깊은 감명을 받고 있습니다. Danis가 회고합니다. "Magic Transit을 배포한 이후, Cloudflare 팀과 함께할 일이 몇 번 있었어요. Cloudflare 네트워크의 일부분에서 있었던 경로의 루프라는 까다로운 그 중 하나였죠. 그 사람들의 대응 속도와 기술적 완벽성에 감탄하고 있습니다."
Ingersoll이 추가합니다. "Cloudflare는 신뢰할 수 있는 인프라와 역량 및 대응성이 우수한 팀을 갖추고 있습니다. 가장 큰 공격도 막아낼 수 있을 정도로 잘 정비되어 있어요."
막대한 DDoS 공격으로 주기적인 세계적 중단 현상이 발생한 이후, Cloudflare Magic Transit을 이용해 Wikimedia의 데이터 센터가 온라인으로 돌아왔습니다.
출발지에서 가까운 Cloudflare 위치에서 트래픽을 검사하여 DDoS 공격을 받고 있을 때도 Wikimedia의 빠른 트래픽을 보장합니다.
“인프라 위험이라는 관점에서 DDoS는 매우 우선순위가 높 으며 Cloudflare Magic Transit은 당사 DDoS 완화 전략의 기본입니다.”
Faidon Liambotis
사이트 안정성 엔지니어링 담당 이사
“Cloudflare는 신뢰할 수 있는 인프라와 역량 및 대응성이 우수한 팀을 갖추고 있습니다. 가장 큰 공격도 막아낼 수 있는 위치를 확보하고 있습니다.”
Grant Ingersoll
CTO