談談技術驅動的數據治理會產生什么問題

數據治理的最大問題在于技術,因為技術決定了我們要優化的目標。這個過程可能是公開的,也可能是間接的,但確實會發生。所以,您開始踏上數據治理之旅,或許是因為了解它的價值,或許是因為您將其視為一項合規性任務,或許是因為人工智能的出現,您的組織意識到需要提高數據質量,而治理似乎已成為必需。您該從哪里開始呢?通常,一些共同的要素標志著一項計劃或項目的啟動,這些計劃或項目將塑造您的數據治理體系。這些要素可能是:
- 根據項目的觸發條件定義一些目標
- 組建團隊
- 評估你的愿景和成熟度
- 制定數據管理政策、標準和程序的框架
- 設定角色和職責
問題是:在考慮實施之前,組織應該以及能夠如何清晰地定義這些內容?而此時,情況往往會發生轉變:事情變得更加具體,需要實施,無論是安全策略、質量指標、元數據存儲庫等等。對于實施,工具供應商喜歡提供指導,甚至共同定義競爭環境。這似乎是理所當然的。畢竟,廠商最了解自己的工具,不是嗎?他們提供實施支持,并且通常將自己定位為數據治理專家。
但問題在于:供應商優化工具的功能,而不是您的組織實際需要的數據治理功能。這種不一致通常會導致數據治理工作由于工具功能的原因,更多地關注策略執行,而非戰略支持。
隨著人工智能的發展,這個問題變得更加嚴重。我們已經聽過很多次了:人工智能的好壞取決于它所輸入的數據。以工具而非目的為中心進行優化的數據治理模式,只會延續“垃圾進,垃圾出”的經典陷阱,尤其是在機器速度和規模下。

可以將其視為 GIGO 鏈:規劃不足+供應商優化實施+AI模型不透明=?
觀點一:數據治理不是一種工具
供應商銷售工具,而工具的構建是為了實施數據治理,而不是定義數據治理。因此,當供應商主導時,重點會迅速轉移到:
- 元數據標記
- 規則執行
- 訪問控制
- 監控儀表板
這些都是寶貴的能力,但前提是你必須明確治理數據的初衷。數據治理關乎的是數據在企業信息系統中使用方式的方向、監督和問責,而非工具配置。
我對數據治理的定義考慮到了這一點:
數據治理是一個以人為本的體系,通過該體系可以指導、監督企業信息系統中的數據資產,并要求組織對實現其既定目標負責。
這個定義并非始于工具,而是始于人和目標。工具是我們深思熟慮、經過深思熟慮的長期和短期選擇的結果。短期選擇基于業務需求、法規遵從性、市場條件和限制。長期選擇則基于我們對組織的愿景。最后,同樣重要的是:工具是確保問責和監督的一種方式,而不是定義問責和監督。

這是定義數據治理在現代組織中必須扮演的三個角色的基礎:數據總監、數據主管和數據審計。這正是在組織中定義數據治理獨立于執行所需的。
觀點二:治理不僅僅是執行制度
當數據治理實施變得由供應商主導或依賴于工具時,定義數據必須滿足的要求很容易優化工具性能。這可能是因為工具附帶了域結構、元數據收集的預定義設置,或者例如需要確認數據產品的定義。
如果從工具入手,數據治理的重點將集中在執行策略上,而不是在業務目標、監管要求、市場壓力和技術限制之間進行權衡。最終形成的治理框架將具備以下特點:
- 優先考慮合規性而非可用性
- 優化政策遵守情況而非創新
- 創建清單而不是培養數據文化
您最終可能會獲得出色的執行工作流程,但對于所執行的內容或原因卻沒有共同的理解。
一旦人工智能成為流程的一部分,決策就會變得更快、更自主。此時,數據治理缺乏清晰度會造成系統性風險。膚淺的、供應商優化的、工具優先的數據治理模式只會加速“垃圾進,垃圾出”的循環。想想我們的 GIGO 鏈吧。突然之間,即使我們的數據治理實施已經為數據安全、數據質量、數據沿襲等制定了明確的規則,偏見也會被放大,錯誤會被擴大,責任也會被模糊,所有這些都是因為基本的數據治理框架從一開始就沒有穩定地定義。
行動一:應該優化什么
所以這意味著你需要在轉向工具之前投入一些工作。有效的、以人為本的數據治理需要:
1. 從目標開始
您的組織希望利用數據實現什么目標?您的愿景是什么?您必須管理哪些風險?您必須實現哪些價值?數據治理應該源于這些問題,而不是產品功能。
2. 建立監督機制,而不僅僅是監控和控制
明確誰擁有決策權、如何解決分歧以及如何追蹤問責。數據治理是一套超越運營范疇的問責體系。這是一個治理主題,因此應該與公司治理方式保持一致。
3. 使用工具來實施和操作,而不是定義
一旦治理框架到位,工具可以加速執行。但它們必須服務于人為定義的數據治理系統,而不是相反。
4. 數據治理作為一個生命系統
數據治理并非一成不變。隨著商業模式的演變、法規的變遷以及技術的涌現(例如人工智能),治理必須隨之調整。這意味著需要不斷反思、衡量和迭代,探究數據治理的核心原因,而不僅僅是如何進行。
行動二:不要外包困難的部分
事實是:定義數據治理并非易事。它涉及持續的艱難溝通、權衡利弊、相互沖突的激勵機制以及文化變革。
這就是為什么人們傾向于讓供應商填補空白,從實施開始,然后再逆向工作。但數據治理不能通過工具進行逆向工程。它必須由了解組織使命、風險和價值觀的人員精心設計。
不要再把數據治理視為即插即用的功能,它是企業數據驅動的核心,這個體系定義了機器與人之間的互聯互通,需要指導、協商和問責。當你把它交給供應商時,你不僅僅是購買了一個工具,而是將你的價值觀、方向和監督外包出去了。



























