Qu'est-ce que le basculement de serveur ? | Signification de Failover

Dans le cas d'un basculement de serveur, un serveur de secours est configuré pour prendre le relais si et quand le serveur principal tombe en panne. Découvrez comment fonctionne le basculement de serveur et pourquoi il est crucial pour la reprise après sinistre.

Objectifs d’apprentissage

Cet article s'articule autour des points suivants :

  • Définir le basculement du serveur
  • Comprendre pourquoi le basculement de serveur est important pour la reprise après sinistre et l'augmentation de la disponibilité du site.
  • Expliquer comment fonctionnent les différentes configurations de basculement de serveur

Copier le lien de l'article

Qu'est-ce que le basculement de serveur ?

Le basculement de serveur consiste à disposer d'un (ou de plusieurs) serveur(s) de secours prêt(s) à prendre automatiquement la relève si le serveur principal est hors ligne. Le basculement de serveur fonctionne comme un générateur de secours. Lorsque le courant est coupé dans un bâtiment ou une maison, un générateur de secours rétablit temporairement l'électricité. De même, dans le cas d'un basculement de serveur, un serveur secondaire prend le relais lorsque le serveur primaire tombe en panne. L'objectif du basculement de serveur est d'améliorer la tolérance aux pannes d'un réseau ou d'un site web, c'est-à-dire sa capacité à continuer à fonctionner lorsqu'une de ses parties tombe en panne.

La tâche principale d'un serveur est de stocker du contenu et des données à partager avec d'autres ordinateurs. Il existe différents types de serveurs, mais les serveurs web sont peut-être les plus connus car ils permettent aux sites web et aux applications de fonctionner. Lorsque les serveurs web tombent en panne, ils ne peuvent pas traiter les demandes, ce qui signifie qu'ils ne peuvent pas servir les données aux clients. Sans basculement du serveur, un serveur défaillant peut provoquer une erreur de chargement ou une interruption du site.

Les serveurs peuvent tomber en panne pour de nombreuses raisons, par exemple :

  • Coupures de courant
  • Catastrophes naturelles
  • Hausse inattendue du trafic
  • Cyberattaques (comme attaques par déni de service distribué (DDoS) )
  • Complications matérielles (comme des problèmes de câbles ou de surchauffe)
  • Problèmes liés au système d'exploitation

Bien que personne ne puisse prédire totalement quand et comment un serveur peut tomber en panne, les responsables informatiques savent qu'une panne de serveur est inévitable. Le basculement est un plan de secours qui permet d'éviter une panne complète.

Le basculement va souvent de pair avec un processus appelé équilibrage de charge. Les équilibreurs de charge augmentent la disponibilité et les performances des applications en distribuant le trafic sur plusieurs serveurs. Pour s'assurer que les demandes sont affectées aux serveurs qui peuvent gérer le trafic, de nombreux équilibreurs de charge surveillent la santé des serveurs et mettent en œuvre le basculement.

Qu'est-ce que la redondance des serveurs ?

La redondance des serveurs est une mesure du nombre de serveurs de secours mis en place pour soutenir un serveur principal. Par exemple, un site hébergé sur un serveur sans sauvegardes n'est pas redondant. La configuration du basculement crée une redondance de serveur qui améliore la disponibilité et empêche les pannes. "Disponibilité" décrit la durée pendant laquelle un site ou une application est en ligne.

Quelle est la différence entre le basculement et la commutation ?

Les termes "failover" et "switchover" sont parfois confondus l'un avec l'autre. Dans le cas du basculement, le passage à un serveur redondant se fait automatiquement. Le basculement est un processus similaire, mais le passage au serveur secondaire se fait manuellement, ce qui entraîne une courte période d'interruption. Comme le basculement se produit automatiquement, il n'y a généralement pas de temps d'arrêt associé au passage à un serveur secondaire.

Comment fonctionne le basculement de serveur ?

Pour que le basculement de serveur fonctionne, les serveurs doivent être connectés de manière à pouvoir détecter les problèmes et prendre le relais si nécessaire. Des câbles physiques de "battement de cœur" peuvent connecter les serveurs et permettre la surveillance, tout comme un moniteur de battement de cœur suit le rythme cardiaque d'une personne. La surveillance des serveurs peut également s'effectuer via l'Internet.

Par exemple, Cloudflare Load Balancing envoie périodiquement des requêtes HTTP/HTTPS aux pools de serveurs pour surveiller leur état. Si la vérification HTTP/HTTPS révèle qu'un serveur est en mauvaise santé ou hors ligne, Cloudflare réachemine le trafic vers un serveur disponible.

Selon la configuration, le basculement fonctionne de manière légèrement différente. Les configurations de basculement de serveur sont soit actif-actif, soit actif-standby.

Active-standby

Dans le cas d'une configuration active-standby, il y a un serveur primaire et un ou plusieurs serveurs secondaires. Dans une configuration à deux serveurs, le serveur secondaire surveille le serveur primaire mais reste inactif. Si le serveur secondaire détecte un changement sur le serveur primaire, il prend le relais et informe le centre de données que le serveur primaire doit être restauré. Une fois que le serveur primaire est rétabli, il prend à nouveau le relais et le serveur secondaire reprend une position d'attente. Le fait qu'un serveur primaire reprenne ses activités est appelé "failback".

Actif-actif

En revanche, dans une configuration active-active à deux serveurs, les deux serveurs doivent rester actifs. Une configuration active-active est généralement associée à l'équilibrage de charge car les serveurs sont configurés de la même manière et partagent la charge de travail. Lorsqu'un serveur tombe en panne dans une configuration active-active, le trafic est acheminé vers le ou les serveurs opérationnels.

Pourquoi le basculement de serveur est-il nécessaire ?

Le basculement de serveur est important car la défaillance d'un seul serveur peut mettre un site hors ligne sans lui.

La disponibilité des serveurs peut avoir un impact différent sur les industries. Par exemple, les entreprises de commerce électronique et de jeux sont totalement dépendantes du bon fonctionnement de leur site. D'autres secteurs, comme les entreprises B2B SaaS, risquent de mécontenter leurs utilisateurs finaux s'ils ne peuvent pas accéder aux informations dont ils ont besoin pour faire leur travail. Dans le même temps, la disponibilité n'est pas négociable pour les secteurs qui répondent à des besoins urgents, comme les services médicaux ou d'urgence.

Outre la disponibilité, le basculement est un élément important de la plupart des plans de reprise après sinistre. Les plans de reprise après sinistre englobent des scénarios tels que l'échec des sauvegardes, la défaillance d'un réseau ou même les pannes de courant. La reprise après sinistre aide les entreprises à maintenir la continuité de leurs activités et à éviter la perte de revenus associée aux temps d'arrêt.

Qu'est-ce qu'un cluster de basculement ?

Un cluster de basculement désigne un groupe de deux serveurs ou plus qui travaillent ensemble pour rendre le basculement possible. Les clusters de basculement créent la redondance des serveurs qui permet la haute disponibilité (HA) ou la disponibilité continue (CA).

Les systèmes qui visent à avoir le moins de temps d'arrêt possible (ou un temps de fonctionnement de 99,999 %) sont considérés comme HA. Si un système HA connaît un temps d'arrêt, celui-ci ne doit durer que quelques secondes ou minutes à la fois. Les secteurs fortement réglementés, comme les services gouvernementaux, peuvent avoir besoin de respecter des normes de haute disponibilité à des fins de conformité.

Les systèmes CA, en revanche, sont créés pour éviter tout temps d'arrêt. L'absence de temps d'arrêt signifie que les utilisateurs peuvent rester connectés à un site ou à une application à tout moment, même pendant la maintenance. Un domaine où l'AC peut être nécessaire, par exemple, est le commerce boursier en ligne, où les transactions sont très sensibles au temps. Les systèmes d'AC sont plus complexes à construire et à maintenir car ils doivent tenir compte de tous les points de défaillance, des serveurs à l'emplacement physique en passant par l'accès à l'alimentation.

Qu'est-ce que le basculement rapide ?

Comme les configurations de basculement peuvent fonctionner de manière légèrement différente, la vitesse à laquelle le basculement se produit peut varier. Certains équilibreurs de charge offrent un basculement rapide, ce qui signifie que le système surveille la santé du serveur et peut rapidement basculer en cas de besoin. Le basculement rapide est essentiel pour réaliser une HA ou une CA.

Cloudflare Load Balancing réalise un basculement rapide en surveillant activement les serveurs et en réacheminant instantanément le trafic lorsqu'un problème est détecté, ce qui permet d'éviter tout temps d'arrêt. En savoir plus sur Cloudflare Load Balancing.