羣集技術:三款主流服務器集羣軟件

羣集技術:三款主流服務器集羣軟件
 
 
1、ROSE HA 服務器集羣軟件
  在雙機熱備的架構中,除了要考慮切換時間外,要根據每個系統的作業環境,包括網路系統是單網或是雙網,數據庫的安裝和作業內容及用戶端的設備是經由廣域網路、區域網路接入不同用戶有不同的需求,而要求有不同的切換模式,所以選擇不同的切換模式,可以使用戶端的改變達到最少的程度。
  ROSE HA根據不同的行業及各行業不同的需求設計多種備援模式以彈性的調適用戶的最佳組合及選擇。

ROSE HA系統運作方式
  在正常的運作情形之下,主機之間透過冗餘偵測線路互相偵測,當任一主機有錯誤產生時,ROSE HA提供嚴謹的判斷與分析,確認主機出錯之後,才完全啓動備援接管動作。

  ※ 支持各種操作系統平臺
  ※ 支持衆多的UNIX平臺(如:IBM、DEC、HP、NCR、SUN、SGI、NEC、SIEMENS等)
  ※ 支持衆多的PC平臺的Unix系統(如:SCO/Unix、Solraris X86等)
  ※ 支持各種數據庫:MS-SQL、Oracle 、Informix、Sysbase、Excheng|、Lotus/Nose、DB2等

接管動作包括
   ※ 文件系統( File System)
  ※ 數據庫( Database)
  ※ 網絡地址( IP Address)
  ※ 應用程序(AP)
  ※ 系統環境(OS)
  ※ 容錯備援運作過程
 自動偵測(Auto-Detect)階段,由主機上的軟件通過冗餘偵測線,經由複雜的監聽程序。邏輯判斷,來相互偵測對方運行的情況,所檢查的項目有:
  ※ 主機硬件(CPU和周邊)
  ※ 主機網絡
  ※ 主機操作系統
  ※ 數據庫引擎及其它應用程序
  ※ 主機與磁盤陣列連線
 爲確保偵測的正確性,而防止錯誤的判斷,可設定安全偵測時間,包括偵測時間間隔,偵測次數以調整安全係數,並且由主機的冗餘通信連線,將所彙集的訊息記錄下來,以供維護參考。
 自動切換(Auto-Switch)階段 某一主機如果確認對方故障,則正常主機除繼續進行原來的任務,還將依據各種容錯備援模式接管預先設定的備援作業程序,並進行後續的程序及服務。
 自動恢復(Auto-Recovery)階段 在正常主機代替故障主機工作後,故障主機可離線進行修復工作。在故障主機修復後,透過冗餘通訊線與原正常主機連線,自動切換回修復完成的主機上。整個回覆過程完成由EDI-HA自動完成,亦可依據預先配置,選擇回覆動作爲半自動或不回覆。
多種容錯備援模式

  1,雙機相互備援模式
  2,主從式備援模式
  3,Hot Standby模式
  4,雙網卡,單網段類型
  5,雙網卡、雙網段模式
  6,多主機備援系統

用戶定製模式
  在雙機熱備的架構中,除了要考慮切換時間外,要根據每個系統的作業環境,包括網路系統是單網或是雙網,數據庫的安裝和作業內容及用戶端的設備是經由廣域網路、區域網路接入不同用戶有不同的需求,而要求有不同的切換模式,所以選擇不同的切換模式,可以使用戶端的改變達到最少的程度。
  ROSE HA根據不同的行業及各行業不同的需求設計多種備援模式以彈性的調適用戶的最佳組合及選擇。
  ※ 雙主機通過一條TCP/IP網絡線以及一條RS-232電纜線相聯
  ※ 雙主機各自通過一條SCSI電纜線與RAID磁盤陣列相聯
  ※ 雙主機各自運行不同的作業,彼此獨立,並相互備援
  ※ 主機A故障後,主機B自動接管主機A運行
  ※ 主機A的作業將在主機B上自動運行
  ※ 主機A的客戶(client)要在主機B上重新登錄
  ※ 主機A修復後,主機B將把A的作業自動交還主機A
  ※ 已經連到主機B上的A的客戶需要在主機A上重新登錄
  ※ 主機B故障時,主機A接管主機B的作業和數據
  ※ 主機B修復時,主機A再將原來接管的作業和數據交還主機B
  ※ 雙主機通過一條TCP/IP網絡線以及一條RS-232電纜線相聯
  ※ 雙主機各自通過一條SCSI電纜線與RAID相聯
  ※ 主機A爲Master,主機B爲Slave
  ※ 主機A處理作業和數據,主機B作爲熱備份機
  ※ 主機A故障後,主機B自動接管主機A的作業和數據
  ※ 主機B同時接管A的主機名(Host)及網絡地址(IP)
  ※ 主機A的作業將在主機B上自動運行
  ※ 主機A的客戶(client)可繼續運行,無需重新登錄
  ※ 主機B現爲Master,主機A修復後作爲Slave,作爲熱備份機
  ※ 2個主機建議使用規格相同的主機

模式3---雙機熱備份(Hot Standby)
  ※ 雙主機通過一條TCP/IP網絡線以及一條RS-232電纜線相聯
  ※ 雙主機各自通過一條SCSI電纜線與RAID相聯
  ※ 主機A爲Master,主機B爲Slave
  ※ 主機A處理作業和數據,主機B作爲熱備份機
  ※ 主機A故障後,主機B自動接管主機A的作業和數據
  ※ 主機B同時接管A的主機名(Host)及網絡地址(IP)
  ※ 主機A的作業將在主機B上自動運行
  ※ 主機A的客戶(client)可繼續運行,無需重新登錄
  ※ 主機A修復後,自動接管原來的作業和數據,主機B繼續作備份機
模式4---雙機雙網絡適配器(Dual Ethernet Adapter)
  ※ 雙主機各自通過一條SCSI電纜線與RAID相聯
  ※ 雙主機各自運行不同的作業
  ※ 每一主機定義第一網口和第二網口
  ※ 主機A上第一網口在故障時由第二網口接管
  ※ 主機B上第一網口在故障時由第二網口接管
  ※ 主機A故障後,主機B自動接管主機A的作業和數據
  ※ 主機B同時接管A的主機名(Host)及網絡地址(IP)
  ※ 主機A的作業將在主機B上自動運行
  ※ 主機A的客戶(client)可繼續運行,無需重新登錄
  ※ 主機A同樣可作B的備份機
  ※ 進行數機雙工備份和網卡的備份
ROSE HA 新功能介紹

  RoseHA for Windows

  增加了對Team 類型網卡的支持。
  增加了對磁盤陣列的硬件鎖功能的支持。
  修改了Volume資源的配置方式,以一個磁盤設備(Disk)作爲基本卷單元進行配置。
  增強了對共享卷的處理,在主機發生卷資源切換不成功時,會主動關機或重新啓動,確保備機接管成功。
  對於NT Server 類型的資源,增加了新的配置方式:除傳統的直接選擇NT Service方式進行配置外,還可以通過指定Start、Stop、Agent三個欄目(的程序)的方式進行配置。
  在Userdefine類型資源中,增加了是否允許Agent程序出現運行窗口的選項。
  增強了資源的修改編輯功能。
  增加了共享盤盤符被佔用的報警機制。
  增加了對Switch或HUB斷電的適應能力。
  增強了對FileShare資源可用共享資源的處理。
  增加了RoseHA界面中將各種配置信息保存到文本文件的功能。
  增加了日誌部分的內容信息。
  重新設計了HOSTID機制,確保重新安裝系統,硬盤重新分區不會改變HOSTID。
  其它管理界面各個方面操作及顯示上的修改完善。
  手冊針對相關功能進行了修改和補充。
RoseHA for Linux
  支持各種主流最新的Linux操作系統,如RedHat 7.x, RedHat 8.x。
  新的基於Java2的GUI管理配置界面。
支持Intel網卡的iANS功能,Intel網卡必須使用Intel提供的e100, e1000的驅動程序。
  配置界面中增加了GroupID的設定功能,可以更加輕鬆直觀的將多個服務指定爲一組,這些組中的服務將同時切換帶入帶出。
  配置界面中提供了多個卷的配置方式,可以爲一個Job配置一個以上的卷資源。
  增加了管理界面的修改功能,可以在管理界面中直接修改處於BringOut狀態的Job,無須刪除後重新配置。
  增加了新的磁盤系統監控機制,可以更加高效,準確,及時的監控磁盤陣列狀態。
  規範統一Agent的返回值,正常時返回0值,異常時非0值。
  增強安全性,修改部分執行文件權限。確保root用戶才能運行HA的相關程序。
RoseHA for UnixWare
  支持UnixWare 7.1.1最新補丁包 uw711m2.ima
  新的基於Java2的GUI管理配置界面。
  增加了新的磁盤系統監控機制,可以更加高效,準確,及時的監控磁盤陣列狀態。
  規範統一Agent的返回值,正常時返回0值,異常時非0值。
  增強安全性,修改部分執行文件權限。確保root用戶才能運行HA的相關程序。
  更新HostID機制。通過安裝RoseHA後,使用RoseHA提供的hostid工具獲得申請License所需的hostid,不再使用UnixWare系統的SystemID作爲hostid。確保重新安裝操作系統,硬盤重新分區不會改變HOSTID
2、LifeKeeper 服務器集羣軟件
  LifeKeeper提供了基於Windows NT (2000),Linux,UNIX多平臺操作系統的容錯軟件並同時支持遠程災難備份LifeKeeper提供數據、應用程序和通信資源的高度可用性。
 LifeKeeper不需要任何特別的容錯硬件。你可以集合使用二到十六個服務器結點.並訪問特定地點的配置數據.然後,LifeKeeper 會自動地提供錯誤檢測和多層現場恢復. 在出現故障的情況,LifeKeeper會將保護資源自動轉換到一個根據優先權而設定的系統.在實際進行切換用戶時,會經歷一個十分短暫的休眠.但是當系統完成了切換操作後, LifeKeeper會在所選擇的系統上自動地恢復操作現用.

  LifeKeeper 2.04 for WindowsNT爲例加以說明:

  LifeKeeper2.04保護起來的資源是:
卷、IP地址、共享文件、LAN(局域網)管理器服務器名稱、應用程序、定義的用戶、MSCS應用程序

  心跳故障檢測Heartbeat:  
  LifeKeeper在集羣節點間保持着間歇的通信信號,也叫做心跳信號,是錯誤檢測的一個機制.即通過每一個通信路徑,在兩個對等系統之間進行週期性的握手,如果連續沒有收到的心跳信號到了一定的數目,LifeKeeper就把這條路徑標示爲失效(紅色),如果你只定義了一條通信路徑當LifeKeeper 把這唯一的一條通信路徑標爲失效時,LifeKeeper便立即開始恢復過程.然而,如果有冗餘路徑.LifeKeeper能夠通過第二條路徑確定是系統故障還是隻是通信路徑有問題。如果LifeKeeper開啓優先級第二的通信路徑並收到了心跳信號,它就不開始failover恢復,只需要把第一條通信路徑標成紅色(失效),作爲信號告訴你需要修理一下有故障的路徑。

  一般情況下LifeKeeper 只在下列事件發生時,啓動系統恢復功能: 
所有的通信路徑故障.如果所有節點都沒能收到心跳信號.把所有通信路徑都標爲失效,Lifekeeper開始安全檢查。安全檢查失敗.當所有通信路徑故障時,LifeKeeper向整個網絡發出安全檢查信號.如果信號指出配對系統還"活"着的時候,LifeKeeper不啓動Failover如果安全檢查沒從配對節點返回信號,LifeKeeper 就開始Failover。 因而,爲了減少由於潛在的通訊錯誤所引起的不必要的系統切換,建議您使用不同介質的多條通信路徑.

通信路徑:
  LifeKeeper支持在節點之間和心跳通訊中,使用如下通訊路徑:
  (1)socket,即套接字。你使用任何的網絡硬件接口,只要它能夠支持TCP/IP的通訊協議。這樣的硬件包括:以太網、快速以網、令牌環網以及FDDI 或CDDI 。
  (2)串行口 在LifeKeeper配置中,你應當配置有一個串行口通信路徑。串口通信路徑需要利用RS232的擬調解線路來與LifeKeeper系統相連接。
  (3)共享磁盤你可以定義一個共享磁盤分區來作爲LifeKeeper的通訊中介。可以只使用小至1MB的分區,當然,也可以使用更大的空間。LifeKeeper假定,當通過心跳信號檢測其它服務器失敗時,則認爲此服務器是關閉的。因此,爲了避免不必要的失效切換,最好建立兩種以上獨立的物理路徑,使用至少兩種心跳。
  例如,如果兩個服務器被一個串口連接起來,並且,從屬服務器來的心跳信號無法被主服務所檢測到,則下面之一是可能引起這一現象的原因: 服務器的RS-232卡或者端口失敗電纜失效主服務器暫時掛起主服務器失敗,失效切換隻可能在最後一種情況下才發生。因此,節點間的多種通信路徑可以幫助避免不必要的失效切換。
注: 1、支持目前所有主流的 DataBase
Landcluster多節點高可用集羣系統
 解決方案描述:
                  
  目前大多行業用戶所面臨和苦惱的問題包括:
  1、關鍵業務的可靠性問題;
  2、系統中多個關鍵業務的維護難度高的問題;
  3、應用數據安全的問題;
  4、業務系統停止服務會造成巨大損失的問題。
  LanderCluster產品系列包括雙節點產品和多節點產品LanderCluster-MN。主要解決用戶關鍵業務系統的高可用性、可管理性、系統整合、系統配置優化的問題。
  聯鼎雙機能有效的解決單一關鍵業務的可用性問題,構建一個高效的雙機集羣環境。而聯鼎多節點集羣方案則能夠將多個關鍵業務整合在一個多節點的集羣環境中,各節點之間實現了靈活的硬件冗餘,在集羣中的一個或多個服務器發生故障時,保證關鍵業務的不間斷服務。
解決方案目標用戶:
  銀行中間業務系統、電信計費、郵政儲蓄、政府、醫院、廠礦企業等具有關鍵業務的行業用戶。
解決方案功能與優勢:
功能描述:

  ● 自主產權軟件產品,支持功能定製;
  ● 集羣配置安裝維護簡單;
  ● 管理員密碼驗證,安全級別高;
  ● 集羣軟件自我監控功能,確保守護進程健康運行;
  ● 對應用程序的靈活監控功能,可以對進程數量、特殊應用進行監控;
  ● 節點和任務的可伸縮性;
  ● 通過集羣管理平臺可以進行集中、遠程的管理、監控;
  ● 理論上支持的節點數無限;
  ● 任務的備援規則可以靈活配置,資源利用更加合理;
  ● 基於系統級的集羣實現應用級的集羣;
  ● 保證了足夠的集羣系統綜合處理性能;
  ● 集羣工作方式靈活多樣,支持多機互備、多備一、多備多等方式;
  ● 完善的日誌記錄和錯誤報警,便於錯誤跟蹤;。
  ● 應用的無關性,支持幾乎所有的數據庫環境(Informix/oracle/Sybase等);

方案優勢:

  ● 節省管理成本,集羣中的節點統一管理,使管理變得輕鬆;
  ● 整合了環境中的應用,使之達到整體高可用;
  ● 方案性價比高,關鍵業務子系統越多、方案的平均投入越低,節省了設備的投資;
  ● 方案伸縮性好,集羣中主機可以靈活增加、減少;
  ● 服務優勢明顯,藉助聯鼎服務平臺,可以得到全方位、及時的技術服務
系統構架  
系統配置

  ● Linux、Other Unix
  ● SCO OpenServer 5.0.4 or later
  ● SCO Unware 7.0 or later
  ● WindowsNT/2000 or later
硬件要求:
  ● Intel構架服務器產品
  ● 服務器配置一個外部SCSI/FC接口
  ● SCSI/FC存儲子系統
  ● 服務器配置兩個以上全雙工網卡
  ● 256M以上內存:
磁盤空間要求:
  ● LanderCluster核心軟件包需要15M磁盤空間;
  ● 共享磁盤陣列子系統中需要劃分單獨的字符設備;
  ● 用於SCSI HeartBeat容量5M;
  ● LanderCluster需200K左右的內存;
數據庫:
  ● Informix 7.x or later
  ● Oracle DataServer 7.x or later
  ● Sybase all released version
  ● DB2 7.x or later
  其他:
  ● 用戶可以根據實際環境定製功能
  ● 用戶定製備援規則
配置示意圖解
  方案一:
  方案二:
  方案三:
注: 1、支持目前所有主流的 DataBase
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章