雲上RAC部署、運維及實踐案例

雲數據庫產品越來越多,各家雲廠商也都推出基於開源MySQL、Postgre等的關係型數據庫產品,多副本、高可用、讀寫分離、分庫分表等功能更是集成在各類產品中,降低了機房建設和運維成本,助力更多的客戶上雲。

唯獨鮮見Oracle的雲產品輸出,除非是Oracle Cloud。

對於當前業務系統基於Oracle系統開發,且改造難度較大,如OA、ERP等系統;或對數據庫要求較高,必須使用Oracle數據庫的場景,如訂單流水、金融交付系統,袋鼠雲可以提供阿里、華爲、騰訊公有云,阿里、Zstack專有云上完善的雲上Oracle RAC實施部署、運維方案,協助客戶無縫上雲。

雲上單機還是集羣,Oracle的部署都遵循官方的指導文檔,沒有差別。

但是在基礎配置上面,雲環境將網絡、服務器、磁盤等以產品化輸出,有其特殊性:

  • 雲交換機:建議雲環境中所有的業務系統運行在專有網絡VPC中,創建不同網段交換機,供給RAC集羣、業務系統使用;同一個VPC網絡默認互通
  • 雲服務器:雲環境有地域/可用區一說,同一地域不同可用區類似於同城不同機房,集羣計算節點需要在同一個可用區中,購買在同地域不同可用區或不同地域的機器可用於部署業務/數據庫災備環境
  • 雲盤:同樣需要根據規劃購買與RAC計算節點同地域同可用區的雲盤,並掛載到計算節點上;

不同雲環境對一臺雲服務器上掛載磁盤個數的有不同限制,在集羣規劃階段需要考慮預估數據量大小以及雲盤大小。

雲服務器規格可以升配或減配,對於集羣計算節點,可以逐一進行,降低對業務的影響。

雲上RAC規劃一覽

穩定高效運行

  • 標準壓力測試

Swingbench可以構建真實OLTP事務場景,比如訂單類業務、新建客戶、訂購、下單等流程操作,通過大批量增刪改查操作,測試不同併發場景下數據庫性能趨勢和穩定性,同時結合其他監控工具,觀察服務器內存、負載、磁盤等的性能趨勢和穩定性;根據壓測結果及早發現和優化問題,評估數據庫的最佳使用方式。

依據袋鼠雲的集羣運維經驗,短時間、低併發的壓測無法驗證集羣的穩定性,所以在雲上集羣部署之後,會進行長時間(4小時以上)、高併發的持續壓測;

同時對壓測出來的集羣性能問題進行分析,優化集羣參數配置,並主動提供雲服務器、存儲資源優化建議,以期交付一個穩定、高性能的數據庫環境。

阿里雲2節點12.2.0.1RAC壓測舉例:

  • 業務回放測試

DBReplay的測試方法,抓取生產環境某一時間段業務負載,單次capture可以多次replay,更接近於正式的生產負載,更直觀有效。主要用於數據庫升級、遷移,應用程序部署等的預演,量化評估出變更實施後對現有的性能的影響程度。
對於平常壓力較大的業務系統,在遷移割接之前有必要進行此類測試。

案例分享

1. 某日企客戶

(1)需求分析

  • 業務整體上雲,需要部署雲上Oracle RAC 12C/11G各1套
  • 滿足高可用、容災等需求

(2)架構規劃

  • 規劃20G*3雲盤做OCR/Voting組、60G*2雲盤做REDODG1/2組、200G*1雲盤做ARCHDG組、規劃500G*1雲盤做DATADG組、100G*1雲盤做MGMTDG組
  • 規劃雲服務32C64G*2作爲計算節點
  • 建議客戶採用業務分離的模式訪問數據庫

2. 某國企招聘網站

(1) 需求分析

  • 需要同時滿足1w人在線訪問,併發事務2000以上
  • 自行搭建雲上Oracle單機數據庫,預計很快到達瓶頸
  • 需要高可用、容災的架構保障業務的持續運行

(2) 架構規劃

  • 新購高規格雲ECS作爲計算節點,保證充足的計算資源
  • 原單機數據庫割接後作爲DG備庫運行
  • 配置合理備份策略,上傳備份集到OSS對象存儲,異地保存

3. 某省級專有云交管平臺

彙總全省交管數據,並提供查詢、分析平臺。

(1)需求分析

  • 自建機房,部署在Windows服務器單機Oracle11.2.0.1
  • 18T數據,並在逐步上漲中
  • 業務調試需要和部裏對接、調整,實際沒有測試的可能
  • 可維護時間短

(2)架構規劃

  • 專有云環境部署,2節點RAC集羣,並搭建容災備庫
  • 通過ADG實時同步機房數據,進行DBRelay壓測
  • 繼續使用備份一體機備份生產數據

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章