O Magic Transit da Cloudflare coloca a Wikimedia on-line novamente após um intenso ataque DDoS

A Fundação Wikimedia é a organização sem fins lucrativos que opera a Wikipédia e uma variedade de outros projetos de conhecimento livre, incluindo o Wikimedia Commons, o Wikiquote e o Wiktionary. A Fundação mantém um compromisso com o conhecimento livre e sua visão é criar um mundo no qual todas as pessoas possam compartilhar livremente a soma de todo o conhecimento.

Embora esses projetos sejam tocados por uma comunidade global de voluntários, a equipe da Fundação mantém a infraestrutura tecnológica básica desses projetos, defende políticas e proteções que favorecem o conhecimento livre e apoia os voluntários em seus esforços para capturar conhecimento nos diversos idiomas, culturas e continentes.

Desafio: interromper um intenso ataque DDoS que tirou os sites da Wikimedia do ar em todo o mundo

“A Wikimedia quer se transformar na infraestrutura essencial do ecossistema de conhecimento livre”, explicou Grant Ingersoll, CTO da Fundação Wikimedia. “Queremos que todo mundo possa acessar nosso conteúdo, usá-lo e incorporá-lo ao seu cotidiano, tornar a vida das pessoas mais rica e ajudar a construir uma internet melhor”.

Atingir essa meta significa que os sites da Wikimedia precisam ser confiáveis, seguros e rápidos. “Os voluntários que criam e editam todo o nosso conteúdo não podem fazer seu trabalho se nossos sites não estiverem acessíveis, forem difíceis de usar ou estiverem sendo vandalizados por bots”, disse Faidon Liambotis, diretor de Engenharia de Confiabilidade do Site. “Quero que minha equipe seja capaz de dormir tranquila à noite, com a certeza de que todos os nossos sites estão funcionando”.

No aspecto segurança, a Wikimedia passou muitos anos sem sofrer um grande ataque de DDoS. Infelizmente, a sorte da organização terminou em 7 de setembro de 2019, quando um ataque intenso deixou seus locais inacessíveis — primeiro na Europa, África e Oriente Médio, e em seguida nas outras partes do mundo, incluindo a Ásia e os EUA. “No seu auge, o ataque tinha centenas de Gbps”, lembra Chris Danis, engenheiro da Equipe de Confiabilidade de Sites.

Durante as primeiras horas da indisponibilidade, a equipe da Wikimedia tentou sem sucesso parar os ataques e colocar seus sites de volta on-line. “Tentamos vários tipos de mitigação envolvendo o remapeamento de nosso balanceamento de carga baseado em GeoDNS e tentamos algumas medidas de engenharia de tráfego quando o tráfego estava entrando por meio de nossos links de peering”, explicou Danis.

Solução: a Wikimedia passou a usar o Magic Transit para voltar ao ar rapidamente

A Cloudflare procurou a Wikimedia e ofereceu ajuda com o uso do Magic Transit, uma solução que protege a infraestrutura de rede. Liambotis lembra que foram procurados imediatamente por ocasião do ataque, apesar de ser uma sexta-feira à noite. “Quando a equipe entrou em contato conosco, o pessoal já sabia o que estava acontecendo”, ele disse.

“Acho que o centro de operações de segurança e a equipe de inteligência contra ameaças da Cloudflare já sabiam qual era a assinatura do ataque — TCP ACK da porta 65535 — antes de pedirmos qualquer coisa”, acrescentou Danis. “A Cloudflare nos passou estimativas de ataque que eram significativamente superiores ao que éramos capazes de medir. Assim que o Magic Transit foi ligado, a medição do ataque feita pela Cloudflare (em pontos diferentes e em diferentes unidades) foi de 300 Gbps de largura de banda, 105 MPPS de tráfego TCP ACK e 340 MPPS de inundações UDP”.

Liambotis relata que, com o Magic Transit, sua equipe conseguiu deter o ataque fazendo as alterações necessárias em suas políticas de roteamento. “No entanto”, observou ele, “isso é uma simplificação. O ataque estava intermitente, mudando seus padrões. O Magic Transit resolveu o problema, mesmo enquanto o ataque continuava progredindo”.

Resultados e benefícios: o Magic Transit é parte essencial da estratégia de defesa contra DDoS da Wikimedia

A Wikimedia continua a usar o Magic Transit para mitigar ataques DDoS. Uma das coisas que Liambotis aprecia é que a ferramenta pode ser ligada e desligada conforme necessário. “A capacidade de desligar os comunicados da Cloudflare sobre o nosso espaço de IPs nos oferece opções no caso de algo dar errado”.

Além disso, o Magic Transit não interfere na criptografia de ponta a ponta existente entre os projetos da Wikimedia e seus usuários, mesmo quando está ativado. Somado aos seus recursos técnicos, isso fez do Magic Transit a escolha certa para a equipe. “Ficamos satisfeitos com a responsividade da Cloudflare às nossas necessidades de segurança e privacidade. Como organização, somos muito sensíveis às preocupações com a privacidade”.

A Wikimedia também aprecia o fato de que o Magic Transit filtra o tráfego na borda da rede ao invés de desviá-lo para um centro de inspeção e limpeza de tráfego centralizado, como é o caso de alguns fornecedores de “faxina” na nuvem. "Outras opções usam uma arquitetura mais centralizada ”, disse Liambotis. “Não filtram na borda, mas sim em alguns centros de inspeção e limpeza de tráfego distantes e, por isso, não atenderam aos nossos requisitos de capacidade e recursos. Se tivessem algum problema em um de seus centros de inspeção e limpeza e o nosso tráfego fosse desviado para lá, acabaríamos tendo problemas de latência”.

“As alterações de roteamento necessárias para ativar um centro de depuração centralizado afetam tanto a latência para o usuário quanto o tempo decorrido até a mitigação”, acrescentou Danis. “Filtrar globalmente na borda, como faz o Magic Transit, reduz a latência para o tráfego legítimo”.

Do ponto de vista do risco de infraestrutura, o DDoS ocupa uma posição elevada na nossa lista de prioridades", disse Liambotis, "e o Magic Transit da Cloudflare é fundamental para a nossa estratégia de mitigação de DDoS".

A equipe da Wikimedia continua impressionada com a responsividade da Cloudflare quando surgem problemas. “Tivemos que interagir com a equipe da Cloudflare em diferentes ocasiões desde que implantamos o Magic Transit, incluindo um problema complicado envolvendo loops de roteamento dentro de partes da rede da Cloudflare”, lembrou Danis. "Ficamos impressionados com a velocidade de resposta e a competência técnica do pessoal".

"A Cloudflare tem uma infraestrutura confiável e uma equipe extremamente competente e responsiva. Está bem posicionada para desviar até mesmo o maior dos ataques", acrescentou Ingersoll.