從概念到管理,一文讀懂元數據
如今,各行各業正在被“瘋狂”的大數據所包圍,企業需收集,歸檔,研究的數據量也日益增長。面對浩如煙海的數據,企業管理者應以什么為抓手來管理數據,充分挖掘數據的價值呢?答案就是“元數據”。
Gartner 曾在研究報告里指出,“元數據管理將是未來企業信息化的核心基礎設施”,尤其在大數據環境中,如果企業不通過元數據管理把多種復雜的信息管理起來,很難做到信息的有效利用。
“那么,究竟何為元數據,何為元數據管理?本文將為大家梳理元數據的概念,幫助企業理解元數據管理的作用。”
一、什么是元數據?
元數據被定義為:對數據及信息資源的描述性信息。簡單來說就是“關于數據的數據”。
比如:在上網選購衣服時,網店上展示的一件件衣服就是數據。而其中,衣服的品牌、款式、尺寸、顏色、面料材質、適用年齡等就是元數據,這些元數據詳細描述了這件衣服的具體信息,為你的購物選擇提供參考。
在生活中,元數據的應用場景非常多,甚至可以說,從我們呱呱落地開始認識這個世界的時候,我們就與元數據密不可分,比如圖書館的藏書信息卡、個人的信息登記等都屬于元數據的應用。
二、元數據有什么特點?
- 元數據是關于數據的結構化的數據。
- 元數據是與對象相關的數據,此數據使其潛在的用戶不必先具備對這些對象的存在和特征的完整認識。
- 元數據是對信息包裹 (information package) 的編碼的描述。
- 元數據包含用于描述信息對象的內容和位置的數據元素集,促進了網絡環境中信息對象的發現和檢索。
- 元數據不一定是數字形式。
- 元數據不僅對信息對象進行描述,還能夠描述資源的使用環境、管理、加工、保存和使用等方面的情況。
- 元數據可來自不同的資源。
- 在信息對象或系統的生命周期中自然增加元數據。
- 元數據常規定義中的“數據”,是表示事務性質的符號,是進行各種統計、計算、科學研究、技術設計所依據的數值,或是說數字化、公式化、代碼化、圖表化的信息。
三、元數據的作用
01、元數據是進行數據集成所必須的
我們知道,數據倉庫***的特點就是它的集成性。這一特點不僅體現在它所包含的數據上,還體現在實施數據倉庫項目的過程當中:
一方面,從各個數據源中抽取的數據要按照一定的模式存入數據倉庫,這些數據源與數據倉庫中數據的對應關系及轉換規則都要存儲在元數據知識庫里。而另一方面,在數據倉庫項目實施過程中,直接建立數據倉庫往往費時、費力。
因此在實踐當中,人們可能會按照統一的數據模型,首先建設數據集市,然后在各個數據集市的基礎上再建設數據倉庫。不過,當數據集市數量增多時很容易形成“蜘蛛網”現象,而元數據管理是解決“蜘蛛網”的關鍵。
02、元數據可以幫助用戶理解數據倉庫的數據
系統用戶不可能像數據倉庫系統管理員或開發人員那樣熟悉數據庫技術,因此迫切需要有一個“翻譯”,能夠使他們清晰地理解數據倉庫中數據的含意。
元數據可以實現業務模型與數據模型之間的映射,因而可以把數據以用戶需要的方式“翻譯”出來,從而幫助最終用戶理解和使用數據。
03、元數據是保證數據質量的關鍵
企業數據集成完成之后,在使用的過程中,用戶常常會對數據產生懷疑。這是由于底層的數據對于用戶來說是不“透明”的,使用者很自然地對結果產生懷疑。
借助元數據管理系統,最終的使用者對各個數據的來龍去脈以及數據抽取和轉換的規則都會很方便地得到,這樣他們自然會對數據具有信心;當然也可便捷地發現數據所存在的質量問題。
04、元數據可以支持需求變化
隨著信息技術的發展和企業職能的變化,企業的需求也在不斷地改變。傳統的信息系統往往是通過文檔來適應需求變化,但是僅僅依靠文檔遠遠不夠。
元數據獨立于平臺,可以把整個業務的工作流、數據流和信息流有效地管理起來,使得系統不依賴特定的開發人員,從而提高系統的可擴展性。
四、元數據管理功能
元數據管理為大數據平臺繪制數據地圖、統一數據口徑、標明數據方位、分析數據關系、管理模型變更及精確到字段級別的影響分析,打通上下游數據繼承關系斷層,為數據質量維護和業務邏輯可視化打下堅實基礎。
在這里我們主要對元數據管理中數據地圖、血緣分析、影響分析功能進行深入了解。
01、數據地圖
數據地圖以拓撲圖的形式對企業運營過程中的技術元數據與業務元數據進行分層次的圖形化展現,并通過不同層次的圖形展現粒度控制,滿足開發、運維或者業務上不同應用場景的圖形查詢和輔助分析需要。
02、血緣分析
血緣分析(也稱血統分析)是指從某一實體出發,往回追溯其處理過程,直到目標分析對象,按照轉化關系逐層擴展。
血緣分析直觀的展示目標對象的產生過程,包括從哪些表轉換而來,經歷了哪些轉換,從而幫助業務人員了解它在此過程中被賦予的含義,以及會受到的影響。
03、影響分析
影響分析描述了信息之間依賴性的細節,分析一個數據源發生變化時帶來的影響。
影響分析反映了當前對象在企業系統各平臺中,參與了哪些元數據的形成。用戶可以借助影響分析觀察該對象的影響能力,即對于當前元數據修改,會對哪些后代元數據造成影響。
五、結束語
大數據時代下,無法挖掘的數據將沒有任何價值,換句話說,如果沒有管理好元數據,收集和存儲的數據都會失去意義,也就沒有業務價值。
因此,企業信息化管理者只有重新拾起元數據,以元數據為抓手進行數據治理,逐步梳理企業數據、關系,加強管控,才能更好地管理企業數據資產。

































