什麼是伺服器容錯移轉?| 容錯移轉含義

在伺服器容錯移轉中,備份伺服器設定為在主要伺服器發生故障時接管。瞭解伺服器容錯移轉的運作方式,以及為何它對災害復原至關重要。

學習目標

閱讀本文後,您將能夠:

  • 定義伺服器容錯移轉
  • 瞭解伺服器容錯移轉對災害復原和增加網站可用性的重要性
  • 說明不同伺服器容錯移轉設定的運作方式

相關內容


想要繼續瞭解嗎?

訂閱 TheNET,這是 Cloudflare 每月對網際網路上最流行見解的總結!

請參閱 Cloudflare 的隱私權政策,了解我們如何收集和處理您的個人資料。

複製文章連結

使用 Cloudflare Pro 方案和我們的速度工具附加元件來提高網站效能

什麼是伺服器容錯移轉?

伺服器容錯移轉是讓一個或多個備用伺服器準備好在主要伺服器離線時自動接管的做法。伺服器容錯移轉就像一個備用發電機。當建築物或家庭停電時,備用發電機會暫時恢復電力。同樣,在伺服器容錯移轉中,當主要伺服器發生故障時,次要伺服器會接管。伺服器容錯移轉的目標是提高網路或網站的容錯能力,或在其中一個部分發生故障時繼續運作的能力。

伺服器的主要工作是儲存內容和資料以與其他電腦共用。雖然有不同類型的伺服器,但 Web 伺服器可能是最著名的,因為它們使網站和應用程式保持運作。當 Web 伺服器出現故障時,它們無法處理請求,這意味著它們無法向用戶端提供資料。如果沒有伺服器容錯移轉,故障伺服器可能會導致載入錯誤或網站服務中斷。

伺服器可能因許多原因而無法運作,例如:

  • 停電
  • 自然災害
  • 意外的流量激增
  • 網路攻擊(如分散式阻斷服務 (DDoS) 攻擊)
  • 硬體併發症(例如電纜問題或過熱)
  • 作業系統問題

雖然沒有人可以完全預測伺服器何時或如何發生故障,但 IT 領導者知道伺服器故障是不可避免的。容錯移轉是一種備份計畫,有助於防止完全服務中斷。

容錯移轉往往與一個稱為負載平衡的過程同時進行。負載平衡器透過在多台伺服器上分配流量來提高應用程式的可用性和效能。為了確保將請求分配給能夠處理流量的伺服器,許多負載平衡器會監控伺服器的健康情況並實作容錯移轉。

什麼是伺服器備援?

伺服器備援用於衡量設定了多少備份伺服器來支援主要伺服器。例如,如果一個網站託管在沒有備份的一台伺服器上,則表示它沒有備援。設定容錯移轉會建立伺服器備援,從而提高可用性並防止服務中斷。「可用性」是指網站或應用程式在線的時間量。

容錯移轉和轉換有什麼區別?

詞彙「容錯移轉」和「轉換」有時會相互混淆。在容錯移轉中,會自動切換到備援伺服器。轉換是一個類似的過程,只是手動切換到次要伺服器,會造成短暫的停機時間。因為容錯移轉是自動發生的,所以通常不會出現與切換到次要伺服器相關的停機時間。

伺服器容錯移轉如何運作?

要使伺服器容錯移轉正常運作,必須連接伺服器,以便它們能夠感知問題並在必要時接管。實體「活動訊號」電纜可以連接伺服器並進行監控,就像心跳監控器追蹤一個人的心跳一樣。伺服器監控也可以透過網際網路進行。

例如,Cloudflare 負載平衡會定期向伺服器池傳送 HTTP/HTTPS 請求以監控其狀態。如果 HTTP/HTTPS 檢查顯示伺服器狀況不良或離線,Cloudflare 會將流量重新路由到可用伺服器。

依據設定,容錯移轉的運作方式稍有不同。伺服器容錯移轉設定可以是作用中/作用中或作用中/待命模式。

作用中/待命

在作用中/待命模式下,有一個主要伺服器和一個或多個次要伺服器。在雙伺服器設定中,次要伺服器監控主要伺服器,但在其他方面保持非作用狀態。如果次要伺服器感知到主伺服器有任何變化,它將接管並通知資料中心主要伺服器需要恢復。一旦主要伺服器還原,它將再次接管,次要伺服器恢復待命位置。主要伺服器恢復運作的行為稱為容錯回復。

作用中/作用中

相比之下,在雙伺服器作用中/作用中設定中,兩個伺服器都必須保持作用中狀態。作用中/作用中設定通常與負載平衡有關,因為伺服器是以相同的方式設定的,並分擔工作負荷。在作用中/作用中設定中,當一台伺服器出現故障時,流量會流向正在運作的伺服器。

為什麼需要進行伺服器容錯移轉?

伺服器容錯移轉很重要,因為單一伺服器的故障可能使網站離線。

伺服器可用性會對行業產生不同的影響。例如,電子商務和遊戲公司完全依賴於他們的網站正常運作。其他行業,如 B2B SaaS 公司,如果無法存取完成工作所需的資訊,則可能會讓終端使用者感到苦惱。同時,對於滿足緊急需求的行業(如醫療或緊急服務)而言,可用性是不可協商的。

除了可用性之外,容錯移轉是大多數災害復原計畫的重要組成部分。災害復原計畫包括備份失敗、網路中斷甚至停電等場景。災害復原可幫助公司保持業務連續性並避免與停機相關的收入損失。

什麼是容錯移轉叢集?

容錯移轉叢集是指一組兩個或多個伺服器一起工作以使容錯移轉成為可能。容錯移轉叢集建立了支援高可用性 (HA) 或連續可用性 (CA) 的伺服器備援。

以盡可能少的停機時間(或 99.999% 的正常運作時間)為目標的系統被視為 HA。如果 HA 系統出現停機,它一次應該只持續幾秒鐘或幾分鐘。政府服務之類高度監管的行業可能需要滿足高可用性標準以達到合規目的。

另一方面,CA 系統的建立是為了完全避免任何停機時間。無停機意味著使用者可以始終保持與網站或應用程式的連線,即使在維護期間也是如此。例如,可能需要 CA 的一個領域是線上股票交易,該領域的交易對時間高度敏感。CA 系統的建置和維護更加複雜,因為它們必須考慮從伺服器到實際位置再到電源存取的每一個故障點。

什麼是快速容錯移轉?

由於容錯移轉設定的運作方式可能略有不同,因此容錯移轉發生的速度可能會有所不同。一些負載平衡器提供快速容錯移轉,這意味著系統會監控伺服器健康情況並在需要時快速進行容錯移轉。快速容錯移轉對於實現 HA 或 CA 至關重要。

Cloudflare 負載平衡透過主動監控伺服器並在偵測到問題時立即重新路由流量來實現快速容錯移轉,從而實現零停機時間。瞭解有關 Cloudflare 負載平衡的更多資訊。