雙機熱備

1、 雙機熱備名詞解釋
  從廣義上講,就是對於重要的服務,使用兩臺服務器,互相備份,共同執行同一服務。當一臺服務器出現故障時,可以由另一臺服務器承擔服務任務,從而在不需要人工干預的情況下,自動保證系統能持續提供服務。 雙機熱備由備用的服務器解決了在主服務器故障時服務不中斷的問題。但在實際應用中,可能會出現多臺服務器的情況,即服務器集羣。 雙機熱備一般情況下需要有共享的存儲設備。但某些情況下也可以使用兩臺獨立的服務器。實現雙機熱備,需要通過專業的集羣軟件或雙機軟件。
  從狹義上講,雙機熱備特指基於active/standby方式的服務器熱備。服務器數據包括數據庫數據同時往兩臺或多臺服務器寫,或者使用一個共享的存儲設備。在同一時間內只有一臺服務器運行。當其中運行着的一臺服務器出現故障無法啓動時,另一臺備份服務器會通過軟件診測(一般是通過心跳診斷)將standby機器激活,保證應用在短時間內完全恢復正常使用。

2、 使用雙機熱備的原因
  爲了使軟硬件系統正常運轉,雙機熱備能做到以下功能:對操作系統的檢測、對網絡的檢測功能、對數據庫的檢測功能、用戶特有程序的熱備、第三方軟件編程能力,熱備軟件一旦檢測到故障後會自動切換到備用服務器,從而實現不停機服務。
 詳解如下:
  服務器的故障可能由各種原因引起,如設備故障、操作系統故障、軟件系統故障等等。一般地講,在技術人員在現場的情況下,恢復服務器正常可能需要至少5分鐘、幾小時甚至幾天。從實際經驗上看,除非是簡單地重啓服務器(可能隱患仍然存在),否則往往需要幾個小時以上。而如果技術人員不在現場,則恢復服務的時間就更長了。
  而對於一些重要系統而言,用戶是很難忍受這樣長時間的服務中斷的。因此,就需要通過雙機熱備,來避免長時間的服務中斷,保證系統長期、可靠的服務。
  決定是否使用雙機熱備,正確的方法是要分析一下系統的重要性以及對服務中斷的容忍程度,以此決定是否使用雙機熱備。即,你的用戶能容忍多長時間恢復服務,如果服務不能恢復會造成多大的影響。
  在考慮雙機熱備時,需要注意,一般意義上的雙機熱備都會有一個切換過程,這個切換過程可能是一分鐘左右。在切換過程中,服務是有可能短時間中斷的。但是,當切換完成後,服務將正常恢復。因此,雙機熱備不是無縫、不中斷的,但它能夠保證在出現系統故障時,能夠很快恢復正常的服務,業務不致受到影響。而如果沒有雙機熱備,則一旦出現服務器故障,可能會出現幾個小時的服務中斷,對業務的影響就可能會很嚴重。
另有一點需要強調,即服務器的故障與交換機、存儲設備的故障不同,其概念要高得多。原因在於服務器是比交換機、存儲設備複雜得多的設備,同時也是既包括硬件、也包括操作系統、應用軟件系統的複雜系統。不僅設備故障可能引起服務中斷,而且軟件方面的問題也可能導致服務器不能正常工作。
  還應指出的是,一些其他的防護措施如磁盤陣列(RAID)、數據備份雖然是非常重要的,但卻不能代替雙機熱備的作用。

3、 雙機主從、互備、多點集羣
  主從模式是最標準、最簡單的雙機熱備,即是目前通常所說的active/standby方式。它使用兩臺服務器,一臺作爲主服務器(Active),運行應用系統來提供服務。另一臺作爲備機,安裝完全一樣的應用系統,但處於待機狀態(Standby)。當active服務器出現故障的時候,通過軟件診測(一般是通過心跳診斷)將standby機器激活,保證應用在短時間內完全恢復正常使用。
  雙機互備,在雙機熱備的基礎上,兩個相對獨立的應用在兩臺機器同時運行,但彼此均設爲備機,當某一臺服務器出現故障時,另一臺服務器可以在短時間內將故障服務器的應用接管過來,從而保證了應用的持續性。這種方式實際上是雙機熱備的一種應用。它避免了兩個應用使用四臺服務器分別實現雙機熱備。
  但雙機互備存在着性能瓶頸,即如果進行切換後,在一臺服務器上就有同時運行兩個應用,有可能負載過大。並且,有些情況下會有不止兩臺服務器對外提供服務。在這種情況上,多點集羣就顯示出了其必要性。
  多點集羣可以理解爲雙機熱備在技術上的提升。多機服務器可以組成一個集羣。根據應用的實際情況,可以靈活地在這些服務器上進行部署,同時可以靈活地設置接管策略。比如,可以由一臺服務器作爲其他所有服務器的備機,也可以設置多重的接管關係,等等。這樣,就可以充分地利用服務器的資源,同時保證系統的高可用性。
PS:雙機熱備軟件(VERITAS VCS/LEGATO AAM/ROSE HA/LIFEKEEPER/PLUSWELL等等)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章