O que é failover de servidor? | Significado de failover

No failover de servidor, um servidor de backup é configurado para assumir o controle se e quando o servidor primário falhar. Saiba como o failover de servidor funciona e por que ele é essencial para a recuperação de desastres.

Objetivos de aprendizado

Após ler este artigo, você será capaz de:

  • Definir failover de servidor
  • Entender por que o failover de servidor é importante para a recuperação de desastres e para aumentar a disponibilidade do site
  • Explicar como funcionam as diferentes configurações de failover de servidor

Copiar o link do artigo

O que é failover de servidor?

O failover de servidor é a prática de ter um servidor (ou servidores) de backup preparado para assumir automaticamente se o servidor primário ficar offline. O failover do servidor funciona como um gerador de backup. Quando a energia acaba em um prédio ou casa, um gerador de backup restaura temporariamente a eletricidade. Da mesma forma, no failover de servidor, um servidor secundário assume quando o servidor primário falha. O objetivo do failover de servidor é melhorar a tolerância a falhas de uma rede ou site, ou sua capacidade de continuar operando quando uma de suas partes falha.

O trabalho principal de um servidor é armazenar conteúdo e dados para compartilhar com outros computadores. Embora existam diferentes tipos de servidores, os servidores web são talvez os mais conhecidos porque mantêm sites e aplicativos operacionais. Quando os servidores web falham, eles não podem processar solicitações, o que significa que não podem fornecer dados aos clientes. Sem failover de servidor, um servidor com falha pode causar um erro de carregamento ou uma interrupção do site.

Os servidores podem falhar por muitas razões, como por exemplo:

  • Quedas de energia
  • Desastres naturais
  • Surtos de tráfego inesperados
  • Ataques cibernéticos (como ataques de Negação de Serviço Distribuída DDoS)
  • Complicações de hardware (como problemas de cabos ou superaquecimento)
  • Problemas do sistema operacional

Embora ninguém possa prever totalmente quando ou como um servidor pode falhar, os líderes de TI sabem que a falha do servidor é inevitável. O failover é um plano de backup que ajuda a evitar uma interrupção completa.

O failover geralmente está ligado a um processo chamado balanceamento de carga. Os balanceadores de carga aumentam a disponibilidade e a performance do aplicativo distribuindo o tráfego em mais de um servidor. Para garantir que as solicitações sejam atribuídas a servidores que podem lidar com o tráfego, muitos balanceadores de carga monitoram a integridade do servidor e implementam o failover.

O que é redundância de servidor?

A redundância do servidor é uma medida de quantos servidores de backup estão instalados para dar suporte a um servidor primário. Por exemplo, um site hospedado em um servidor sem backups não é redundante. A configuração do failover cria redundância de servidor que melhora a disponibilidade e evita interrupções. "Disponibilidade" descreve a quantidade de tempo que um site ou aplicativo está on-line.

Qual é a diferença entre failover e switchover?

Os termos "failover" e "switchover" às vezes são confundidos. No failover, a mudança para um servidor redundante acontece automaticamente. A alternância é um processo semelhante, apenas a mudança para o servidor secundário acontece manualmente, criando um curto período de inatividade. Como o failover acontece automaticamente, geralmente não há tempo de inatividade associado a uma mudança para um servidor secundário.

Como funciona o failover do servidor?

Para que o failover do servidor funcione, os servidores devem estar conectados para que possam detectar problemas e assumir o controle quando necessário. Cabos físicos “heartbeat” podem conectar servidores e permitir o monitoramento, assim como um monitor de batimentos cardíacos rastreia os batimentos cardíacos de uma pessoa. O monitoramento do servidor também pode ocorrer pela internet.

Por exemplo, o Balanceamento de Carga da Cloudflare envia periodicamente solicitações HTTP/HTTPS para pools de servidores para monitorar seu status. Se a verificação HTTP/HTTPS revelar que um servidor não está íntegro ou está offline, a Cloudflare redirecionará o tráfego para um servidor disponível.

Dependendo da configuração, o failover funciona de forma ligeiramente diferente. As configurações de failover do servidor são ativo-ativo ou ativo-em espera.

Ativo-em espera

Ativo-em espera, há um servidor primário e um ou mais servidores secundários. Em uma configuração de dois servidores, o servidor secundário monitora o primário, mas permanece inativo. Se o servidor secundário detectar qualquer alteração no servidor primário, ele assumirá o controle e avisará o data center de que o servidor primário precisa de restauração. Depois que o servidor primário é restaurado, ele assume novamente e o servidor secundário retoma a posição de espera. O ato de um servidor primário retomar as operações é chamado de failback.

Ativo-ativo

Por outro lado, em uma configuração de dois servidores ativo-ativo, ambos os servidores devem permanecer ativos. Uma configuração ativo-ativo geralmente está associada ao balanceamento de carga porque os servidores são configurados da mesma maneira e compartilham a carga de trabalho. Quando um servidor falha em uma configuração ativo-ativo, o tráfego é roteado para o servidor ou servidores operacionais.

Por que o failover do servidor é necessário?

O failover de servidor é importante porque a falha de um único servidor pode fazer com que um site fique offline.

A disponibilidade do servidor pode afetar os setores de maneira diferente. Por exemplo, empresas de comércio eletrônico e jogos são completamente dependentes do funcionamento correto de seu site. Outros setores, como empresas de SaaS B2B, correm o risco de aborrecer seus usuários finais se eles não puderem acessar as informações necessárias para realizar seu trabalho. Ao mesmo tempo, a disponibilidade é inegociável para setores que atendem a necessidades urgentes, como serviços médicos ou de emergência.

Além da disponibilidade, o failover é um componente importante da maioria dos planos de recuperação de desastres. Os planos de recuperação de desastres abrangem cenários como backups com falha, queda de rede ou até falta de energia. A recuperação de desastres ajuda as empresas a manter a continuidade dos negócios e evitar a perda de receita associada ao tempo de inatividade.

O que é um cluster de failover?

Um cluster de failover refere-se a um grupo de dois ou mais servidores que trabalham juntos para possibilitar o failover. Os clusters de failover criam a redundância do servidor que permite alta disponibilidade (HA) ou disponibilidade contínua (CA).

Sistemas que visam o menor tempo de inatividade possível (ou 99,999% de tempo de atividade) são considerados HA. Se um sistema de alta disponibilidade passar por um tempo de inatividade, ele deve durar apenas alguns segundos ou minutos de cada vez. Setores altamente regulamentados, como serviços governamentais, podem precisar atender aos padrões de alta disponibilidade para fins de conformidade.

Os sistemas CA, por outro lado, são criados para evitar qualquer tempo de inatividade. Sem tempo de inatividade significa que os usuários podem permanecer conectados a um site ou aplicativo o tempo todo, mesmo durante a manutenção. Uma área em que a CA pode ser necessária, por exemplo, é na negociação de ações on-line, onde as transações são altamente sensíveis ao tempo. Os sistemas CA são mais complexos de construir e manter porque devem levar em conta cada ponto de falha, desde servidores até o local físico e o acesso à energia.

O que é failover rápido?

Como as configurações de failover podem operar de forma ligeiramente diferente, a velocidade na qual o failover acontece pode variar. Alguns balanceadores de carga oferecem failover rápido, o que significa que o sistema monitora a integridade do servidor e pode fazer failover rapidamente quando necessário. O failover rápido é essencial para obter HA ou CA.

O Balanceamento de Carga da Cloudflare alcança failover rápido ao monitorar servidores ativamente e redirecionar instantaneamente o tráfego quando um problema é detectado, resultando em tempo de inatividade zero. Saiba mais sobre o Balanceamento de Carga da Cloudflare.