NoSQL數據庫敏捷數據模型

在近日舉行的2018年數據架構峯會上,Hackolade首席執行官Pascal Desmarets談了NoSQL數據庫的敏捷建模。他說,在NoSQL數據庫中,由於沒有規範化約束,數據建模變得更加重要。非結構化的多態大數據在數據治理和監管(GDPR和PII)以及利用積累的信息的能力方面都提出了挑戰。

Desmarets還談到了數據建模如何幫助企業從RDBMS遷移到NoSQL。在關係數據庫和NoSQL數據庫中,數據建模的好處包括提高應用程序質量,改善數據質量、GDPR&隱私身份信息以及商業智能。

團隊應該根據需求選擇合適的NoSQL數據庫。例如,如果你需要管理簡單的模式和快速地讀寫而不需要頻繁地更新,那麼就選擇鍵-值存儲。如果你需要支持複雜查詢的靈活模式,請選擇文檔數據存儲。面向列的數據庫很適合讀取速度相對較低而寫入速度極高的情況。圖數據庫更適合於需要在數據點之間進行遍歷的應用程序,因爲你需要能夠存儲每個數據點的屬性以及它們之間的關係。

他談到了傳統的數據建模過程以及我們如何從數據建模過渡到模式設計方法。概念數據模型已經被領域驅動設計(DDD)所取代,不再需要邏輯數據模型,物理數據模型則被物理模式設計所取代。

在敏捷開發過程中,數據建模在過程的每個步驟中都有作用,包括在生產環境中。數據建模工作成爲多個項目涉衆之間的共享責任和對話。

他還說,領域驅動設計(DDD)和NoSQL像是爲彼此量身設計的,DDD語言和NoSQL數據庫的概念直接吻合。他認爲,在整個的策略、過程、體系結構和技術中,一致性是必要的,因爲將所有這些原則一起應用比孤立地應用一兩項原則更可取:領域驅動設計、敏捷開發、“以數據爲中心(Data-Centricity)”、微服務、事件驅動的體系結構、NoSQL、DevOps和雲。

InfoQ採訪了Desmarets,內容涉及NoSQL數據庫數據建模及大數據管理的最佳實踐。

InfoQ:每種NoSQL數據庫類型的數據建模方法都不同嗎,比如像Cassandra這樣的時間序列數據庫和像Neo4j這樣的圖數據庫?

InfoQ:您能談談NoSQL數據庫敏捷建模中的一些最佳實踐嗎?

他還說,在相當長的一段時間裏,NoSQL數據庫供應商通過使用“無模式”或“非關係型”等術語創造了一種差異化和轟動效應。但是,NoSQL數據庫是如此的靈活和強大,沒有經驗的用戶如果不應用一些嚴格的技術,就很容易陷入麻煩。現在,供應商意識到,爲了將他們的解決方案賣給企業,更明智的做法是使用術語“動態模式”。在使用NoSQL時,數據建模(或模式設計)實際上比關係數據庫更重要。我們只是需要一種不同於以往的數據建模方法。數據建模者應該擁抱敏捷開發,並學習新技術棧,證明它們在這個過程中增加了價值。

查看英文原文:Agile Data Modeling for NoSQL Databases

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章