數據治理的十五個最佳實踐

根據2019年的數據管理狀況顯示,數據治理是2019年全球組織機構的前5大戰略計劃之一。由於機器學習和人工智能(AI)等技術趨勢依賴於數據質量,並且隨着全球數字化轉型進程的推進,技術趨勢可能不會很快改變。

因此,我們希望提高對數據治理的認識,以幫助那些關心數據質量的人更多地瞭解數據治理如何影響當今的商業環境、利益相關者及公司目標。

我們開始着手在網上提供有關數據治理的最全面的免費資源;這也正是發表這篇文章的初衷。

 

數據治理是什麼?

 

谷歌搜索“數據治理”,五秒內,你會淹沒在解釋中。當然,你可以挑選你最喜歡的解釋。在Profisee,我們鍾情於保持簡單,所以用一句話解釋數據治理就是:

數據治理是一套原則和實踐,以保證數據在完整生命週期中的質量。

數據治理研究所(DGI)認爲,它是一套切實可行的框架,幫助任何組織的各種數據利益相關方識別並滿足其信息需求。

DGI認爲,企業不僅需要管理數據的系統 還需要一套完整的規則體系,並通過流程和程序來確保這些規則都得到遵守。對任何治理系統來說,這都是一項艱鉅的任務。Profisee平臺這樣的工具則可以使這項工作更加容易。這是一個好的開始。

 

爲何如此

數據正在成爲決定企業成功的核心企業資產。數字化轉型在世界各地都被提上了日程。如果能夠管理你的數據,就可以利用數據資產併成功進行數字化轉型。這意味着必須部署適合組織發展、未來業務目標及業務模型的數據治理框架。該框架必須控制此過程中所需的數據標準,並在組織內部以及公司運營所在的業務生態系統中委派所需的角色和職責。

一個管理良好的數據治理框架將爲組織內多個級別的數字平臺上進行的業務,提供轉型支撐:

  • 管理:對於高層管理來說,這將確保對公司數據資產、價值及其在不斷變化的業務運作和市場機會中的影響進行監督。

  • 財務:對於財務而言,這將保證報告的一致性和準確性。

  • 銷售:對於銷售和市場營銷而言,這將賦能他們以可靠的方式洞悉客戶的偏好和行爲。

  • 採購:對於採購和供應鏈管理而言,這將在利用數據和業務生態系統協作的基礎上進一步降低成本並提高運營效率。

  • 生產:對於生產而言,將是部署自動化的關鍵。

  • 法律:對於法律和合規性的遵守而言,將是滿足日益增長的法規要求的唯一途徑。

 

帶來的好處

如果能做到這一點,好處將是顯而易見的。數據治理意味着更好、更精益、更乾淨的數據,即數據能被更好的分析,如果數據能被更好的分析,也就意味着更好的業務決策,更好的業務決策也就意味着更好的業務結果,更好的市場定位。在業務範圍內的口碑,乃至聲望。最後帶來更好的利潤率(大家都希望看到這樣的結果)。

如果沒有經過數據治理的數據,很有可能就會演變成所謂的GIGO,垃圾進來,垃圾出去(Garbage In,Garbage Out)。或者正如斯科特·泰勒所言,垃圾進,垃圾便無處不在(GIGE,Garbage In,Garbage Everywhere)。

 

目標

當然,定義很重要,但行動更重要。現在我們知道數據治理是什麼了。我們可以用它做什麼?

以下是幾種可能性:

  • 根據可信數據做出一致的、自信的商業決策,以滿足企業內部使用數據資產的各種目的

  • 通過記錄數據資產的血緣關係以及與數據相關的訪問控制,滿足法規要求並避免罰款

  • 通過建立數據所有權和相關職責,提高數據安全性

  • 定義和驗證數據分發策略,包括相關內外部實體的作用和責任

  • 用數據來增加利潤(大家都喜歡這一點)。數據貨幣化始於以最佳方式存儲、維護、分類和訪問數據。

  • 分配數據質量職責,以衡量和跟進與企業內部總體績效相關的數據質量KPI

  • 更好地計劃,不必爲每個計劃目的清理和構造數據

  • 通過擁有可信的、標準化的並且能夠滿足多種目的的數據資產來消除重複工作

  • 通過提供符合所需數據質量閾值的數據資產,優化員工效率

  • 通過逐步提高數據治理成熟度來評估和改進

  • 確認取得的成果並利用前進勢頭,以確保利益相關方的持續承諾和廣泛的組織支持

 

以上只是列舉一些可以用數據治理來處理的少數事情。底線是,我們要麼想做這些事情以幫助自己成長,要麼不得不做它們以滿足監管的要求。無論出於何種原因,不做這些事情的最終結果都是相同的。如果使用錯誤的數據,便會做出錯誤的決定,且不法提前預知。到那時,爲時已晚。

斯科特·泰勒(Scott Taylor),也被稱爲數據佈道者。二十年來,他一直是MDM界的思想領袖,所以當他在二月份破壞我們的辦公室聚會時,我們才明白,他是有意而爲之。稍後你會聽到更多關於他的故事。

 

OpenStreetMap簡介

那麼,數據治理到底是什麼樣的呢?將這些實踐付諸實施的最具挑戰性的實現之一便是開源項目,如Open Street Map。由英國企業家史蒂夫·科斯特(Steve Coast)於2004年創建,它是對封閉孤立的、專有的國際地理數據源激增的一種迴應——當時有數十種繪圖軟件產品相互封閉發展,彼此之間的數據不能相互通信。

OSM使用志願者貢獻的數據,就像維基百科一樣,讓任何能連上互聯網的人都可以使用它。自2008年以來,OSM已從50,000個註冊用戶和貢獻者增長到200多萬,所有的地圖數據都是由這些志願者整理並提交的。目前,Facebook、Foursquare和MapQuest都在使用OSM,當然,只是從數以千計的專業用戶中列舉了其中最大的三個。

簡而言之:這件事行之有效是一個奇蹟。有些貢獻者是使用高科技GPS系統的專業製圖師,有些只是週末騎行者,他們用手機對旅行地標進行三角測量並上傳。但這確實有效,並且可以很好地成爲許多財富500強公司,一些快速成長的新興企業以及更多風行一時的創業公司值得信賴的數據源。也有許多人將OpenStreetMap直接用於個人業務。

當涉及到數據純度時,我們非常樂觀。理所當然的,我們認爲這是一個奇蹟。該模型只有在其背後的數據治理有效時才能發揮作用。這也正是Mr. Coast一直以來建立於單一啓示性概念上的一個想法。 

 

數據是產品,不是地圖                                                                              

就像你可能想象的那樣,如英國人所言,沒有一種方法用來標準化參與者數據的衆包製圖系統可能會變得很奇怪。然而,在此過程的早期建立數據標準並確保貢獻者遵守這些標準是該平臺持續成功的關鍵。

 

誰是參與者

數據治理將或多或少地涉及整個組織,先讓我們分解一下最常見的利益相關者:

  • 數據所有者:首先,需要在業務中指定數據所有者(或數據發起人)。必須是能夠做出決定並能保證決定在整個組織中得到執行的人。數據所有者可以在實體級別中任命(例如:客戶記錄、產品記錄、員工記錄等),並在屬性級別上補充(例如客戶地址、客戶狀態、產品名稱、產品分類等)。數據所有者最終要對作爲資產的數據狀態負責。

  • 數據管理員:接下來,需要數據管理員(或數據擁護者),他們確保數據策略和數據標準在日常業務中能得到遵守。這些人通常是數據實體且/或一組數據屬性的主題專家。數據管理者要麼是負責將數據作爲資產處理的負責人,要麼是負責諮詢指導如何處理數據的人。

  • 數據保管人:此外,可以使用數據保管人(或數據運營商)對數據資產進行業務和技術入門、維護和報廢的更新。

  • 數據治理委員會:通常情況下,將設立一個數據治理委員會作爲批准數據政策和數據標準並處理升級問題的主要論壇。根據組織的規模和結構,每個數據域都可能會有子論壇(例如客戶、供應商、產品、員工)。

以上強調的這些角色應由數據治理辦公室的數據治理團隊有選擇地支持。在典型企業中,以下是一些可能組成數據治理團隊的人:

  • 主數據治理經理:領導整個公司的主數據控制和治理的設計、實施和持續維護。

  • 解決方案和數據治理架構師:提供對解決方案設計和實施的監督。

  • 數據分析師:使用分析來確定趨勢並查看信息。

  • 數據策略師:開發並執行趨勢模式分析計劃 

  • 合規專家:確保遵守必需的標準(法律、國防、醫療、隱私)

分配和履行角色最重要的工作之一是對角色/期望以及角色間的相互作用進行詳細的描述。這通常將在RACI矩陣中進行概述,該矩陣描述數據由誰負責、由誰解釋,以及對某種執行、處理過程或一種策略/標準的特定artifact提供諮詢進行描述。

 

數據治理框架

 

數據治理框架是一組數據規則、組織角色的授權及過程,旨在讓組織中的每個人在同一個數據認識界面上。

目前有許多數據治理框架。作爲示例,我們將使用數據治理研究所的數據治理框架。這個框架有10個組成部分;下面將詳細介紹:

圖 1. DGI 數據治理框架 © 數據治理研究所

 

成長起來的孩子:成熟度模型

根據數據治理成熟度模型來衡量你的組織,對於讓路線圖的制定以及現狀和未來狀況的溝通,作爲數據治理計劃的一部分,並部署數據治理框架的上下文語境來說,非常有用。

分析公司Gartner的企業信息管理成熟度模型就是這種成熟度模型的一個示例:

圖 2. © Gartner

 

大多數組織在開始數據治理計劃之前,會發現自己處於這樣一個模型的較低階段。

  • 第0階段-無意識:這個時候可能是無意識階段,通常意味着在組織中或多或少都會有自己關於數據管理如何能夠實現更好的業務結果的想法。在此階段,你可能對需要的東西有一個願景,但需要專注於眼前的事情,比如說服業務和IT中合適的人圍繞其認知度和小成果實現較小的目標。

  • 第1階段-有意識:在此階段,意識到缺乏數據所有者和數據管理員,並認識到對政策和標準的需求,因此在這一階段,有推出個性化數據治理框架的空間,以解決組織內明顯的痛點。 

  • 第2階段和第3階段-響應性和前瞻性:進入此階段意味着可以建立一個更全面的數據治理框架,涵蓋數據治理的所有方面和完整的組織結構,包括數據所有權和數據管理權,以及一個數據治理辦公室/團隊,與已實現和即將實現的業務成果保持同一戰線。

  • 第4階段和第5階段-管理和效率:通過此階段,數據治理框架將成爲開展業務的重要組成部分。

如果當前的數據治理策略和流程是指導手冊,那麼成熟度模型就是歷史參考書。根據成熟度評估的歷史數據彙編而成,成熟度模型將公司的績效與既定時期內的既定目標和基準進行比較——例如一個季度、一年、甚至是五年。該模型展示了公司的歷史去向,這也將有助於指導確定公司的未來方向。

然而“一刀切”的方法在成熟度模型中並不奏效,只有“靈活調整“的方法才能適用於大多數公司。搜索現有的模型,找到最接近的一個,然後不斷調整以滿足公司的需求。正所謂常用道:“換鞋容易換腳難”。

 

連接主數據管理(MDM)

數據治理是一種戰略方法。MDM是戰術執行。

“所有企業系統(營銷,銷售,財務,運營)都需要主數據管理,”Scott在我們的Profisee 2019啓動會議中說道。對於任何規模的企業、任何行業、在數據旅程中的任何時刻,數據治理都無處不在地體現其好處。

Scott認爲,“主數據是最重要的數據,因爲它是負責的數據。它是關於“業務行爲名詞” –業務的基本要素。無論從事什麼業務,客戶、合作伙伴、產品、服務,都是主數據緊密關聯的地方。即使有最好的數據治理計劃,管理良好的不良數據也依然是不良數據。不會對業務有任何幫助。

“無論意識與否,每個人都在從事數據業務。我們接觸的一切都變成了數據。商業正在從模擬轉變爲數字。無論你產品是什麼,數據都是你的產品。業務因數據而改變,而數據就是力量。而使用正確的工具,可以立即利用這種力量。”

 

數據保護和數據隱私

隨着數據保護和數據隱私的認識不斷提高,如《歐洲聯盟通用數據保護條例(GDPR)》就是對數據治理產生的巨大影響的體現。

至少在處理諸如僱員數據、客戶數據、供應商數據和其他方主數據等數據域時,必須將作爲默認數據保護和默認數據隱私的條款納入到數據政策和數據標準中。

作爲數據控制器,必須對數據的存儲位置、誰在更新數據以及誰在訪問數據以達到什麼目的有個全面的監控。你必須知道何時處理個人身份信息,且是在生產環境以及測試和開發環境中爲給定地理區域中的合法目的而進行的身份信息的處理。

在法規時代,良好地執行刪除數據的規則也是必須的。

 

 最佳實踐

 

一方面,你可以從其他從事數據治理過程中進行學習。但是,每個組織都是不同的,你需要從無意識的成熟階段到有效的成熟階段中,一路調整數據治理實踐。

 

本文列舉了15個通用的最佳做法:

  1. 從小處開始。在商業的方方面面,不要眼高手低。力爭快速獲勝,並隨着時間的推移建立雄心。

  2. 設定清晰、可衡量且具體的目標。你無法控制無法測量的內容。達到目標時去慶祝,並以此來贏得下一個勝利。

  3. 定義所有權。沒有企業所有權,數據治理框架就無法成功。

  4. 確定相關角色和職責。數據治理是一個團隊合作,其中包含來自業務各個部門的交付成果。

  5. 教育利益相關者。儘可能使用業務術語,並將數據治理學科的學術部分轉換爲業務上下文中有意義的內容。 

  6. 專注於運營模式。數據治理框架必須集成到企業中開展業務的方式中。

  7. 地圖基礎架構、體系結構和工具。你的數據治理框架必須是企業體系結構、IT環境和所需工具的合理組成部分。

  8. 制定標準化的數據定義。必須分清什麼需要集中管理,哪些需要敏捷化及本地化管理,並在兩者之間取得平衡。

  9. 識別數據域。從數據域開始,在產生的影響和付出的行動之間獲得最佳比率,以提高數據治理的成熟度。

  10. 識別關鍵數據元素。聚焦最關鍵的數據元素。

  11. 定義控制度量。將這些部署在最有意義的業務流程、IT應用程序和/或報告中。

  12. 建立商業案例。確定與增長、節省成本、風險和合規性有關的數據治理成熟度不斷提高的優勢。

  13. 利用指標。聚焦於企業通用績效相關的有限的數據質量KPI。

  14. 經常交流。數據治理實踐者認爲,交流是該學科最關鍵的部分。

  15. 這是一種實踐,而不是項目。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章