杉巖海量對象存儲系統完美替代Documentum

自2006年至今十餘年來,金融行業內容管理系統通常採用Documentum+DB+NAS的整體解決方案,如下圖1所示,Documentum結合DB的索引能力和NAS的存儲能力,向上爲影像平臺等業務提供文檔數據的存儲和檢索讀取服務。

杉巖海量對象存儲系統完美替代Documentum

近年來隨着非結構化數據的爆發性增長,由於Documentum系統架構問題,此套解決方案出現了明顯性能瓶頸,杉巖海量對象存儲系統(SandStone MOS)採用全分佈式架構,針對海量文件場景提供可線性擴展的持續快速訪問性能,同時提供全方位的海量數據保護支持和數據生命週期管理功能,能夠完美替代Documentum。作爲金融行業內容管理系統的未來核心模塊,不僅要提供現在和未來的服務保障,更要能夠完美接納客戶現有數據,所以需要提供平滑友好的Documentum遷移方案。

Documentum應用架構

基於Documentum的應用平臺如圖2所示,存儲倉庫(Repository)作爲數據及元數據的最終存放位置,包含內容存儲系統(Content Store)及元數據存儲系統(Metadata Store); 內容服務器(Content Server)位於存儲倉庫之上,通過封裝好的接口給上層應用提供處理文檔數據的調用接口;上層應用(Web Application、Desktop Application等)通過調用內容服務器提供的API接口,給最終用戶提供友好的文檔內容管理功能,輕鬆應對文檔的存檔、搜索、分類、處理、安全保密和歸檔保存等一系列工作。

杉巖海量對象存儲系統完美替代Documentum

Documentum模塊介紹

存儲倉庫(Repository)

一個存儲倉庫是一個基本的內容和元數據存儲單元,包含內容存儲系統(Content Store)和元數據存儲系統(Metadata Store),如圖3是一個最小的存儲倉庫結構,默認情況下Documentum通過主機本地文件系統存儲內容,通過關係數據庫(RDBMS,Relational Database Management System)管理元數據及其相互關係,另外一個倉庫可以同時包含多個內容存儲系統,並且這些內容存儲系統可以是不同類型,比如關係數據庫、本地文件系統、NAS等。

杉巖海量對象存儲系統完美替代Documentum

內容服務器(Content Server)

內容服務器負責內容和元數據的生命週期管理,用戶無需關心文件和元數據具體存在哪裏,通過一個接口即可訪問內容(content)。一個Content Server只能對應一個Repository,但是一個Repository可以配置多個Content Server,這樣有如下好處:

  1. 通過多個Content Server分擔壓力,提高整體性能

  2. 通過遠程Content Server爲遠端用戶提供優質服務

  3. 通過多Content Server提供高可用和災備恢復支持

杉巖海量對象存儲系統完美替代Documentum

杉巖NAS異構特性介紹

傳統NAS設備在已經存放了數千萬級別文件數量的情況下,性能急劇下降,讀寫延遲可達到5-10秒,在杉巖對象存儲實施的過程中,由於NAS接口性能的瓶頸,導致現有數據的遷移週期長達數月之久,爲此我們開發了NAS異構特性。

如圖5所示,SandStone MOS納管NAS設備的元數據,無需立即觸發數據內容搬遷,應用統一使用S3接口即可訪問NAS和MOS的數據,通過生命週期轉移策略,可以後期平滑遷移NAS文件到SandStone MOS,數據內容搬遷過程中無需停機,業務切割時間窗極短。

杉巖海量對象存儲系統完美替代Documentum

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章