數據倉庫相關概念

Data Warehouse
本世紀80年代中期,"數據倉庫之父"William H.Inmon先生在其《建立數據倉庫》一書中定義了數據倉庫的概念,隨後又給出了更爲精確的定義:數據倉庫是在企業管理和決策中面向主題的、集成的、與時間相關的、不可修改的數據集合。與其他數據庫應用不同的是,數據倉庫更像一種過程,對分佈在企業內部各處的業務數據的整合、加工和分析的過程。而不是一種可以購買的產品。

Data mart
數據集市,或者叫做"小數據倉庫"。如果說數據倉庫是建立在企業級的數據模型之上的話。那麼數據集市就是企業級數據倉庫的一個子集,他主要面向部門級業務,並且只是面向某個特定的主題。數據集市可以在一定程度上緩解訪問數據倉庫的瓶頸。

OLAP
聯機分析處理(OLAP)的概念最早是由關係數據庫之父E.F.Codd於1993年提出的。當時,Codd認爲聯機事務處理(OLTP)已不能滿足終端用戶對數據庫查詢分析的需要,SQL對大數據庫進行的簡單查詢也不能滿足用戶分析的需求。用戶的決策分析需要對關係數據庫進行大量計算才能得到結果,而查詢的結果並不能滿足決策者提出的需求。因此Codd提出了多維數據庫和多維分析的概念,即OLAP。Codd提出OLAP的12條準則來描述OLAP系統:
準則1 OLAP模型必須提供多維概念視圖
準則2 透明性準則
準則3 存取能力推測
準則4 穩定的報表能力
準則5 客戶/服務器體系結構
準則6 維的等同性準則
準則7 動態的稀疏矩陣處理準則
準則8 多用戶支持能力準則
準則9 非受限的跨維操作
準則10 直觀的數據操縱
準則11 靈活的報表生成
準則12 不受限的維與聚集層次

ROLAP
基於Codd的12條準則,各個軟件開發廠家見仁見智,其中一個流派,認爲可以沿用關係型數據庫來存儲多維數據,於是,基於稀疏矩陣表示方法的星型結構(star schema)就出現了。後來又演化出雪花結構。爲了與多維數據庫相區別,則把基於關係型數據庫的OLAP稱爲Relational OLAP,簡稱ROLAP。代表產品有Informix Metacube、Microsoft SQL Server OLAP Services。

MOLAP
Arbor Software嚴格遵照Codd的定義,自行建立了多維數據庫,來存放聯機分析系統數據,開創了多維數據存儲的先河,後來的很多家公司紛紛採用多維數據存儲。被人們稱爲Muiltdimension OLAP,簡稱MOLAP,代表產品有Hyperion(原Arbor Software) Essbase、Showcase Strategy等。

Client OLAP
相對於Server OLAP而言。部分分析工具廠家建議把部分數據下載到本地,爲用戶提供本地的多維分析。代表產品有Brio Designer,Business Object。

DSS
決策支持系統(Decision Support System),相當於基於數據倉庫的應用。決策支持就是在收集所有有關數據和信息,經過加工整理,來爲企業決策管理層提供信息,爲決策者的決策提供依據。

ETL
數據抽取(Extract)、轉換(Transform)、清洗(Cleansing)、裝載(Load)的過程。構建數據倉庫的重要一環,用戶從數據源抽取出所需的數據,經過數據清洗,最終按照預先定義好的數據倉庫模型,將數據加載到數據倉庫中去。

Ad hoc query
即席查詢,數據庫應用最普遍的一種查詢,利用數據倉庫技術,可以讓用戶隨時可以面對數據庫,獲取所希望的數據。

EIS
主管信息系統(Executive Information System),指爲了滿足無法專注於計算機技術的領導人員的信息查詢需求,而特意制定的以簡單的圖形界面訪問數據倉庫的一種應用。

BPR
業務流程重整(Business Process Reengineering),指利用數據倉庫技術,發現並糾正企業業務流程中的弊端的一項工作,數據倉庫的重要作用之一。

BI
商業智能(Business Intelligence),指數據倉庫相關技術與應用的通稱。指利用各種智能技術,來提升企業的商業競爭力。

Data Mining
數據挖掘,Data Mining是一種決策支持過程,它主要基於AI、機器學習、統計學等技術,高度自動化地分析企業原有的數據,做出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行爲,幫助企業的決策者調整市場策略,減少風險,做出正確的決策

CRM
客戶關係管理(Customer Relationship Management),數據倉庫是以數據庫技術爲基礎但又與傳統的數據庫應用有着本質區別的新技術,CRM就是基於數據倉庫技術的一種新應用。但是,從商業運作的角度來講,CRM其實應該算是一個古老的"應用"了。比如,酒店對客人信息的管理,如果某個客人是某酒店的老主顧,那麼該酒店很自然地會知道這位客人的某些習慣和喜好,如是否喜歡靠路邊,是否吸菸,是否喜歡大牀,喜歡什麼樣的早餐,等等。當客人再次光臨時,不用客人自己提出來,酒店就會提供客人所喜歡的房間和服務。這就是一種CRM。

Meta Data
元數據,關於數據倉庫的數據,指在數據倉庫建設過程中所產生的有關數據源定義,目標定義,轉換規則等相關的關鍵數據。同時元數據還包含關於數據含義的商業信息,所有這些信息都應當妥善保存,並很好地管理。爲數據倉庫的發展和使用提供方便 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章