數據挖掘導論(學習筆記)——2.2 數據倉庫數據模型

2.2 數據倉庫數據模型



數據倉庫是企業一個專門的數據存儲結構,其存儲的數據是面向分析主題的、不同粒度的多維數據,應用在線分析(OLAP)等工具,可滿足快速、靈活的查詢需要,最終支持企業決策。



數據倉庫建模技術分爲實體關係建模和維度建模。其中維度建模是一種邏輯設計技術,它通過相對獨立的業務創建有針對性的分析模型來進行組織設計。



模型本身主要是由事實表和維度表組成的:事實表是維度模型的主表,一般含有兩個或者兩個以上的外鍵組合的集合,這些外鍵被用來連接它們各自對應的維度表。



當前流行的數據倉庫數據模型是多維數據模型,主要有星形模型、雪花模型、事實星座模型等。



主碼是表中一個屬性或幾個屬性的組合,它能唯一地標識表中的每條記錄。外碼是出現在一個表中,同時在另一個表中被定義成主碼的屬性。在數據倉庫中,事實表的主碼是組合碼,維表的主碼是簡單碼。事實就是通過與各維相對應的外碼值同維表聯繫在一起。



在數據倉庫中,對於比較簡單的主題,一般一個主題對應一個事實表;對於比較複雜的分析主題,很可能多個主題對應多個事實表。存儲在數據倉庫中的事實必須體現決策人員進行分析的需要,決策人員對什麼感興趣,那麼事實表中就該包含這個事實的度量值。



維表用於指導從不同的角度在事實表中選擇數據行。維表的主碼是事實表的外碼。



星形模型:(最常見的範例,維表通過關鍵詞實現與事實表的關聯,從而形成不同的查詢、分析和聚類。)

155628565.png

雪花模型:是星形模型的變種,雪花模型的維表是規範化形式的,以便減少冗餘。

155604172.png










事實星座:可以看作是一種特殊的星形模式集,允許多個事實表共享維表。

155641395.png


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章