基於超融合構建關鍵業務數據庫新型系統加固方案

金融行業關鍵業務數據庫系統加固方案現狀

金融行業客戶(銀行、保險、證券、基金等)傳統關鍵業務系統數據庫仍然運行在商業化品牌數據庫平臺之上,主流數據庫以 Oracle、DB2、SQL Server 爲代表,由於數據庫在金融行業往往承載了關鍵業務數據,其數據訪問具備容量大、事務處理高、延時低等特點,因此數據庫的高性能、可靠性、可用性、容災能力等關鍵指標成爲金融客戶在系統架構規劃時關注的重點,直接或間接影響着業務系統的穩定運行。

以 Oracle 業務連續性爲例,其主流的運行操作系統集中在 Linux 和 AIX(金融行業保有量大) 之上,通常運行的物理環境多爲小型機、數據庫一體機、X86 物理服務,除數據庫一體機外,數據通常是存儲在 FC SAN 傳統存儲之上(典型的“煙囪式”垂直多層 IT 架構)。

除了以上投入,爲保護關鍵業務的可用性,客戶普遍會採用以下系統高可用加固方案(以下簡稱“加固方案”) :

1.使用Oracle RAC(Real Application Cluster)集羣部署模式,通過多節點的集羣部署爲數據

庫層面提供了高可用性、負載均衡、故障容錯、無縫切換的能力,將硬件和軟件錯誤造成的影響最小化。根據數據庫處理能力、數據容量、業務特點等需求,常有以下幾種部署方式:

  • RAC + 小型機 + FC SAN
  • RAC + 數據庫一體機
  • RAC + x86 + FC SAN
  • RAC + x86 + VM + FC SAN

在數據保護和業務連接性維度,由於 RAC 實際保障的是物理主機和軟件的高可用性,數據是集中存儲在 FC SAN 存儲(實際數據存儲仍是一份),爲防止存儲設備的物理或邏輯故障爲數據帶來的可靠性風險,金融行業用戶通常會採用帶庫備份、存儲異地數據同步複製以及通過 RAC + DG 組合的數據備份容災技術方案(行業監管對業務可用性和數據可靠性強要求)。

2.Oracle DG(Data Guard)創建和維護數據庫同步副本,保護 Oracle 數據免受站點故障、災難、人爲錯誤和數據損壞,同時爲關鍵業務應用提供站點間或站點內的數據容災。DG 可以實現底層硬件平臺的異構化,根據業務等級通常有以下幾種常見的DG部署方式:

  • RAC + 小型機 + FC SAN
  • RAC + x86 + FC SAN

下圖展示了金融行業的數據庫部署、備份、業務容災架構

hci-data-base1.png

傳統數據庫系統加固方案面臨的挑戰

金融行業核心業務數據在行業監管要求下對業務連續性不斷提升,在數據可靠性、可用性、容災能力也提出了更高的要求,同時也要求業務需要提供在多數據中心或異構環境下的數據備份和快速恢復能力,對系統軟件、承載的硬件以及網絡提出了全新的挑戰,架構複雜性、易維護性、投入成本等方面也影響着用戶對技術架構的選擇。

以 Oracle 爲例,數據庫層面已經提供數據備份複製等技術,如 ADG,GG 等技術保障數據庫層面的高可用、高可靠、數據容災,但承載關鍵業務連續性的 IT 基礎設施依然還是以傳統架構主導,服務器(x86 / 小型機) + FC SAN 的硬件解決方案,這種硬件方案面對的挑戰如下:

  • 架構複雜度高運維困難,對於關鍵業務備份容災、數據離線分析等場景,通常部署軟硬件與主系統(活躍的關鍵業務系統,也稱爲 Master 系統)架構相同,均採用垂直的 IT 多層架構(軟件-系統-服務器-FC 網絡-FC SAN 存儲),這種架構涉及多方面軟硬件技術和產品,在日常管理運維中,例如環境部署、配置變更、故障處理、切換演練等工作爲 IT 管理員提出了挑戰。
  • 同樣這個架構投入成本高昂,排除軟件層面的投入,在硬件方面該架構通常也是配置了擁有高處理性能的計算單元和基於 FC SAN 的中高端的共享存儲及網絡設備(如使用存儲級數據遠程複製技術,還需購買相關 License 授權)。
  • 架構擴展能力差,基於集中存儲架構的特點,存儲控制器通常是整個架構的性能處理瓶頸,當瓶頸發生時,通常手段是增加新的存儲設備進行替換或是新老存儲共存,這樣的擴展方法又會爲整體架構帶來更多的複雜度,可以看出架構擴展性完全受限於集中存儲設備的制約。

結合超融合技術的新型混合架構加固方案

作爲一個嶄新的 IT 基礎架構和產品形態,超融合基礎架構(Hyperconverged Infrastructure 簡稱 HCI)作爲近幾年IT基礎架構領域最重要變革技術之一,已經爲越來越多金融行業客戶所瞭解。部分金融客戶已經將超融合架構嘗試應用於各種業務場景,以下是超融合架構的特點和優勢:

  • 基於標準通用 x86 服務器與以太網,硬件品牌異構開放,軟硬件松耦合;
  • 分佈式架構,支持橫向按需擴展,性能線性提升;
  • 利用副本技術保障數據可靠性;
  • 資源集中統一管理,簡化運維;
  • 融合部署,相較於傳統架構,交付週期短;
  • TCO 整體成本低。

超融合架構特點結合數據庫複製技術可以爲關鍵業務數據庫數據提供一套完整的數據容災保護解決方案,該方案易維護、總投入成本低(相較與目前傳統方案)、架構彈性按需擴展,爲用戶在異構場景下設計數據容災架構提供了更多的靈活選擇空間。

下圖中以 Oracle 爲例結合超融合架構實現數據容災保護,該方案採用硬件基礎架構異構的設計思路,上層數據庫採用 ADG (Oracle Advance Data Guard 物理複製)和 OGG(Oracle GlodenGate 邏輯複製)組合的方式保障數據高可靠性,底層利用基於 x86 的超融合架構(融合計算、存儲、網絡)替代傳統架構下的服務器 + FC 網絡 + FC SAN 共享存儲的三層垂直架構,使整體架構扁平化,易於日常運維,並有效降低硬件投入成本,根據業務處理要求,按需靈活水平擴展,線性提高架構處理能力和存儲容量,爲金融行業用戶提供了一種新型的保障業務連續性的方案思路。

hci-data-base2.png

用戶案例

某保險公司用戶目前有6套業務數據庫系統(核心庫、非核心、OA、DMZ、財務、投資),分別運行在 Oracle 數據庫一體機和基於 x86 + 共享存儲架構平臺之上,數據備份使用 Commvault + 帶庫方案實現,目前需要對當前6套業務系統 Oracle 數據庫進行容災備份並同時集中6套庫的業務數據進行實時分析。在行業監控要求以及用戶自身對業務架構可靠性、數據容錯性、業務連續性、業務恢復速度的綜合多方面考慮背景下,結合現階段己部署的 IT 架構特點以及對新架構的大量評估、測試驗證,最終用戶選擇使用超融合 + 傳統架構混合異構的方式建設新一代容災保護平臺,爲業務數據提供底層技術保障。

考慮到容災的高成本,以及容災的實際使用概率,用戶一期計劃在同一機房內的不同區域採用異構平臺進行新的資源池部署,通過在不同資源池內對業務系統進行應用級高可用設計,實現同一機房內的系統加固,二期將結合私有云+公有云方案,實現數據在混合雲架構下的可用性和容災保障。

某保險公司一期超融合環境由7臺 SmartX Halo 7100S 組成,採用 vSphere + 分佈式存儲 ZBS 的超融合模式部署,每臺節點安裝 ESXi 虛擬化操作系統,並在每個節點上部署 SmartX SCVM 虛擬機,用於將7個節點的本地磁盤組成分佈式存儲池,節點之間通過 10G 網絡進行存儲數據交換同步,提供 64TB 數據存儲空間,業務系統的數據存儲策略爲2副本,數據庫存儲策略爲3副本。目前支撐 90+ 業務系統。

邏輯拓樸hci-data-base3.png

本次新建超融合集羣主要目的是備份用戶核心生產 Oracle 數據庫,提供數據庫容災備份,通過在 HCI 集羣新建備份數據庫並與主庫實時數據同步(ADG),在主庫故障發生時,切換業務到備庫的容災方案,數據庫 VM 的數據存儲爲3副本。通過 Oracle GoldenGate(OGG)邏輯同步功能,將6套生產數據實時業務數據同步到 HCI 集羣,爲業務關聯數據分析提供支撐。

項目實施後的 Oracle 容災邏輯拓樸

hci-data-base4.png

項目實施後爲用戶帶來的價值:

  • 降低 IT 基礎架構的日常運維複雜度,讓管理員將運維重心更多的放在上層業務應用層面,利用簡化的底層計算、存儲融合架構,爲用戶帶來簡單、高效的底層架構管理能力。
  • 降低總體投入成本,通過使用基於 x86 架構的虛擬化 + 分佈式存儲解決方案,替代傳統以物理服務器和小型機 + 共享存儲的底層架構,新型的超融合基礎架構按需擴展能力有效的幫助用戶按需成本投入,並根據未來資源需求靈活橫向擴展基礎架構。
  • 基礎架構快速交付,縮短基礎平臺的部署實施週期,向上層業務層快速交付計算、存儲資源池。

總結

超融合架構具備交付快、高可靠、擴展易、成本低等特點,爲金融行業關鍵業務系統加固提供了一種全新的 IT 支撐架構,方案己被金融行業客戶嚴格驗證,並在實際的生產環境中運行,與傳統架構協同相互集成,發揮各自的優勢和價值,爲用戶提供異構靈活的混合架構解決方案,併爲金融行業用戶未來的 IT 架構演進提供有力支撐。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章