<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          數(shù)據(jù)目錄是什么?您為何需要它?

          共 3962字,需瀏覽 8分鐘

           ·

          2022-07-08 17:36

          來源:談數(shù)據(jù)

          簡而言之,數(shù)據(jù)目錄就是關于企業(yè)數(shù)據(jù)資產(chǎn)的一個有序清單。它可以使用元數(shù)據(jù)來幫助企業(yè)管理數(shù)據(jù),幫助數(shù)據(jù)專業(yè)人員收集、組織、訪問和充實元數(shù)據(jù),從而為數(shù)據(jù)發(fā)現(xiàn)和治理提供支持。


            01  
          數(shù)據(jù)目錄的定義和類比


          在上文我們簡單介紹數(shù)據(jù)目錄的定義,也就是使用元數(shù)據(jù)來幫助企業(yè)管理數(shù)據(jù)。接下來,我們使用圖書館作類比,帶您詳細了解數(shù)據(jù)目錄。


          當您前往圖書館查找某一圖書時,您可以使用圖書目錄來查找該圖書是否存在,了解它的版本、位置以及相關描述。您可以使用所有這些信息來決定是否真的需要這本書,了解如何找到它。


          當今的許多對象存儲、數(shù)據(jù)庫和數(shù)據(jù)倉庫就相當于一座座圖書館。


          我們再回到圖書館和圖書目錄?,F(xiàn)在,我們對圖書目錄進行擴展,涵蓋整個國家的所有圖書館。想象一下,這樣您就可以在一個界面中查找整個國家中儲藏了您所需圖書的所有圖書館,查找關于您所需的每一本圖書的所有詳細信息。


          企業(yè)數(shù)據(jù)目錄之于數(shù)據(jù),正如圖書目錄之于圖書。它可以為您提供一個整體視圖,提供關于您所有數(shù)據(jù)的深度可見性,而不僅僅是一次只查看某一項數(shù)據(jù)。


          您為什么需要這樣一個視圖呢?


            02  
          數(shù)據(jù)目錄可以解決哪些問題?


          與過去相比,想從如今前所未有的數(shù)據(jù)海洋中找到正確的數(shù)據(jù)更加困難。同時,關于數(shù)據(jù)的監(jiān)管條例和法規(guī)(例如 GDPR)也比過去更多、更嚴格。在這一背景下,除了數(shù)據(jù)訪問之外,數(shù)據(jù)治理也成為了一個嚴峻的挑戰(zhàn)。您不僅要了解當前您所擁有數(shù)據(jù)的類型、哪些人在移動數(shù)據(jù)、數(shù)據(jù)的用途以及如何保護數(shù)據(jù),還必須避免過多的數(shù)據(jù)層和封裝,避免數(shù)據(jù)因太難使用而毫無用處。遺憾的是,很多企業(yè)和用戶在查找和訪問數(shù)據(jù)上面臨著很多問題,包括:

          • 需耗費大量時間和精力查找和訪問數(shù)據(jù)
          • 數(shù)據(jù)湖變成了數(shù)據(jù)沼澤
          • 無通用業(yè)務詞匯
          • 難以理解“黑暗數(shù)據(jù)”的結(jié)構和類別
          • 難以評估數(shù)據(jù)來源、質(zhì)量和可靠性
          • 無法捕獲部落知識或丟失的知識
          • 難以重用知識和數(shù)據(jù)資產(chǎn)
          • 需手動和臨時進行數(shù)據(jù)準備


            03  
          哪些用戶應使用數(shù)據(jù)目錄?


          數(shù)據(jù)工程師、數(shù)據(jù)科學家、數(shù)據(jù)管理員和首席數(shù)據(jù)官等用戶無不受到以上數(shù)據(jù)管理問題的困擾,無不希望能夠輕松訪問可靠的數(shù)據(jù)。他們面臨的一些常見的挑戰(zhàn)包括:
          數(shù)據(jù)工程師想知道任意更改將對整個系統(tǒng)產(chǎn)生哪些影響,他們可能會問:
          • 我們 CRM 應用中的模式變更將產(chǎn)生哪些影響?
          • Peoplesoft 和 HCM 數(shù)據(jù)結(jié)構有何不同?

          數(shù)據(jù)科學家希望能夠輕松訪問數(shù)據(jù)并進一步了解數(shù)據(jù)質(zhì)量,他們想了解以下信息:
          • 從何處可以找到和查看一些地理位置數(shù)據(jù)?
          • 如何輕松訪問數(shù)據(jù)湖中的數(shù)據(jù)?

          數(shù)據(jù)管理員負責管理數(shù)據(jù)流程,關注概念、利益相關者間協(xié)議以及數(shù)據(jù)生命周期管理。他們希望了解:
          • 我們是否真的在改善運營數(shù)據(jù)質(zhì)量?
          • 我們是否為重要的關鍵數(shù)據(jù)元素定義了標準?

          首席數(shù)據(jù)官關心哪些人在組織中做了哪些事,一般不使用數(shù)據(jù)目錄。但是,他們?nèi)匀幌M私猓?/span>
          • 哪些人可以訪問客戶的個人信息?
          • 我們是否為所有數(shù)據(jù)定義了保留策略?

          有了數(shù)據(jù)目錄,這些問題就能迎刃而解。


            04  
          數(shù)據(jù)目錄使用場景

          在過去幾年中,隨著需要管理和訪問的數(shù)據(jù)的數(shù)量日益增長,數(shù)據(jù)目錄這一概念開始流行起來。在這一切的背后,是云、大數(shù)據(jù)分析、人工智能和機器學習正逐漸改變?nèi)藗儾榭?、管理和使用?shù)據(jù)的方式 — 不僅要管理數(shù)據(jù),還要訪問和充分利用數(shù)據(jù)。


          使用數(shù)據(jù)目錄,您可以更好地使用數(shù)據(jù),獲得以下優(yōu)勢:

          • 節(jié)省成本
          • 提高運營效率
          • 增強競爭優(yōu)勢
          • 改善客戶體驗
          • 減少欺詐,降低風險
          • 等等

          這些只是數(shù)據(jù)目錄的一部分使用場景。實際上,數(shù)據(jù)目錄的使用方式多種多樣。從根本上說,它的宗旨就是提供更廣泛的數(shù)據(jù)可見性和更深入的數(shù)據(jù)訪問支持。

          1.自助分析

          許多用戶難以找到正確的數(shù)據(jù),同時,除了查找數(shù)據(jù)外,他們還難以判斷數(shù)據(jù)是否有用。例如,您可能會發(fā)現(xiàn)一個名為 customer_info.csv 的文件,而又恰好需要一個關于客戶的文件。但這并不意味著它就是您需要的,它可能只是 50 個類似文件中的一個。同時,該文件可能包含許多字段,您可能并不了解所有這些數(shù)據(jù)元素代表什么。對此,您需要通過一種更簡單的方法來查看數(shù)據(jù)的業(yè)務上下文,例如它是否是來自正確的數(shù)據(jù)存儲的托管資源以及它與其他數(shù)據(jù)工件之間的關系。

          數(shù)據(jù)發(fā)現(xiàn)還包括通過各種方式來理解數(shù)據(jù)的形態(tài)和特征,例如簡單的值分布和統(tǒng)計信息,或者重要且復雜的個人身份信息 (PII) 或個人健康信息 (PHI)。


          2.審計、合規(guī)和變更管理


          隨著關于數(shù)據(jù)的政府監(jiān)管法規(guī)數(shù)量不斷增長,企業(yè)經(jīng)常需要證明數(shù)據(jù)的來源,例如特定數(shù)據(jù)工件的來源,或在實現(xiàn)最終目標之前進行了哪些數(shù)據(jù)轉(zhuǎn)換;在查看表格、報告或文件時,數(shù)據(jù)用戶通常也希望理解數(shù)據(jù)的具體來源以及數(shù)據(jù)通過各種方式在整個組織中的移動過程。同時,對于變更管理來說,一項重要任務就是查看數(shù)據(jù)管道中某部分的變更將如何影響系統(tǒng)的其他部分。這就是為什么客戶希望詳細了解數(shù)據(jù)沿襲的原因。

          3.使用業(yè)務術語表增強數(shù)據(jù)治理

          如今大多數(shù)企業(yè)都建立了一個所有人都認可的術語表,就業(yè)務概念達成了一致。通常,業(yè)務術語表記錄在 Excel 工作簿中。其實,數(shù)據(jù)目錄比 Excel 工作簿更適合存儲和管理這一重要業(yè)務信息。

          此外,數(shù)據(jù)目錄還支持在業(yè)務術語之間建立鏈接,從而創(chuàng)建分類;可以記錄業(yè)務術語與實物資產(chǎn)(例如表和列)之間的關系;可以幫助用戶理解哪些業(yè)務概念與哪些技術工件相關;可以幫助用戶按業(yè)務概念線對數(shù)據(jù)資產(chǎn)分類,隨后直接使用業(yè)務概念(而不是技術名稱)來進行數(shù)據(jù)搜索和發(fā)現(xiàn)。數(shù)據(jù)目錄讓用戶可以看到與數(shù)據(jù)相關的所有內(nèi)容,增強對所查看內(nèi)容的信任度,為數(shù)據(jù)治理奠定一個絕佳的起點。

            05  
          如何充分利用數(shù)據(jù)目錄中的數(shù)據(jù)?

          許多人可能不熟悉元數(shù)據(jù),我們有必要先介紹一些簡單的概念。元數(shù)據(jù)是什么?元數(shù)據(jù)分為 3 類:

          • 技術元數(shù)據(jù):模式、表、列、文件名、報告名 — 源系統(tǒng)中記錄的所有信息

          • 業(yè)務元數(shù)據(jù):通常指用戶具備的關于組織資產(chǎn)的業(yè)務知識,包括業(yè)務描述、備注、注釋、分類、適用性、評級等等。

          • 操作元數(shù)據(jù):這一對象的刷新時間?它由哪一個 ETL 作業(yè)創(chuàng)建?表格被訪問次數(shù)有多少?具體有哪些?


          在過去幾年里,這些寶貴的元數(shù)據(jù)的使用方式發(fā)生了一次細微的變革。曾經(jīng),元數(shù)據(jù)僅用于審計、來歷追溯和報告。如今,無服務器處理、圖形數(shù)據(jù)庫等技術創(chuàng)新,尤其是全新、更加便捷的 AI 和機器學習技術正在突破元數(shù)據(jù)的界限,帶來新的可能。


          在今天,元數(shù)據(jù)可增強數(shù)據(jù)管理。從自助數(shù)據(jù)準備到角色和數(shù)據(jù)內(nèi)容庫訪問控制,自動化數(shù)據(jù)打通,異常監(jiān)視和警報,自動化資源供應和擴展等等,元數(shù)據(jù)可以全面增強所有這些功能。


          數(shù)據(jù)目錄可以使用元數(shù)據(jù)幫助您實現(xiàn)比數(shù)據(jù)管理更強大的功能。


            06  
          數(shù)據(jù)目錄應當具備哪些功能?

          一個優(yōu)秀的數(shù)據(jù)目錄應當具備以下功能:


          ①數(shù)據(jù)搜索和發(fā)現(xiàn):數(shù)據(jù)目錄應當具備靈活的搜索和過濾選項,從而賦能用戶快速找到相關數(shù)據(jù)集,以實施數(shù)據(jù)科學、分析或數(shù)據(jù)工程;按照數(shù)據(jù)資產(chǎn)的技術層級來瀏覽元數(shù)據(jù)。此外,如支持用戶輸入技術信息、自定義標簽或業(yè)務術語,數(shù)據(jù)目錄可以進一步改善搜索功能。


          ②從各種數(shù)據(jù)源收集元數(shù)據(jù):請確保您的數(shù)據(jù)目錄可以從各種互聯(lián)數(shù)據(jù)資產(chǎn)中收集技術元數(shù)據(jù),包括對象存儲、自治駕駛數(shù)據(jù)庫、本地部署系統(tǒng)等等。


          ③元數(shù)據(jù)管理:數(shù)據(jù)目錄應支持主題專家通過企業(yè)業(yè)務術語表、標簽、關聯(lián)、用戶自定義注釋、分類、評級等形式來貢獻業(yè)務知識。


          ④自動化和數(shù)據(jù)智能:對于大規(guī)模數(shù)據(jù),人工智能和機器學習通常必不可少。因此,數(shù)據(jù)目錄應利用 AI 和機器學習技術來處理所收集的元數(shù)據(jù),讓所有可以自動化的手動任務都實現(xiàn)自動化。此外,人工智能和機器學習還可以切實增強數(shù)據(jù)功能,例如為數(shù)據(jù)目錄用戶以及現(xiàn)代化數(shù)據(jù)平臺上其他服務的用戶提供數(shù)據(jù)建議。


          ⑤企業(yè)級功能:您需要利用強大的企業(yè)級功能來正確使用您至關重要的數(shù)據(jù)資產(chǎn),例如身份與訪問管理功能以及基于 REST API 的重要功能。同時,這還意味著客戶和合作伙伴可以貢獻元數(shù)據(jù)(例如自定義收集器),通過 REST 公開其應用中的數(shù)據(jù)目錄功能。


          除此之外,您的數(shù)據(jù)目錄還應當成為事實上的系統(tǒng)目錄,從而為所有持久層(例如對象存儲、Hadoop、數(shù)據(jù)庫和數(shù)據(jù)倉庫)以及跨所有數(shù)據(jù)存儲運行的查詢服務提供抽象。


          正是因為如此,數(shù)據(jù)目錄已不再僅僅是錦上添花,而是成為了一項必不可少的工具。

          免責聲明:

          本公眾號所有分享的軟件和資料來自網(wǎng)絡收集和整理,所有文字和圖片版權歸屬于原作者所有,且僅代表作者個人觀點,與數(shù)據(jù)工匠俱樂部無關,文章僅供讀者學習交流使用,并請自行核實相關內(nèi)容,文章內(nèi)容涉及侵權,請聯(lián)系后臺管理員刪除



          (歡迎大家加入數(shù)據(jù)工匠知識星球獲取更多資訊。)


          聯(lián)系我們

          掃描二維碼關注我們

          微信:SZH9543
          郵箱:[email protected]
          QQ:2286075659

          熱門文章


          國務院關于加強數(shù)字政府建設的指導意見


          麥肯錫:數(shù)字化轉(zhuǎn)型的1個目標,3大領域,6大因素和9個環(huán)節(jié)


          數(shù)據(jù)資產(chǎn)管理:數(shù)據(jù)發(fā)現(xiàn),發(fā)現(xiàn)什么,怎么發(fā)現(xiàn)?


          工業(yè)互聯(lián)網(wǎng)數(shù)字化中臺解決方案


          企業(yè)家觀點 | 對智能制造轉(zhuǎn)型的業(yè)務價值提升的認識與感悟

          我們的使命:發(fā)展數(shù)據(jù)治理行業(yè)、普及數(shù)據(jù)治理知識、改變企業(yè)數(shù)據(jù)管理現(xiàn)狀、提高企業(yè)數(shù)據(jù)質(zhì)量、推動企業(yè)走進大數(shù)據(jù)時代。

          我們的愿景:打造數(shù)據(jù)治理專家、數(shù)據(jù)治理平臺、數(shù)據(jù)治理生態(tài)圈。

          我們的價值觀:凝聚行業(yè)力量、打造數(shù)據(jù)治理全鏈條平臺、改變數(shù)據(jù)治理生態(tài)圈。


          了解更多精彩內(nèi)容




          長按,識別二維碼,關注我們吧!

          數(shù)據(jù)工匠俱樂部

          微信號:zgsjgjjlb

          專注數(shù)據(jù)治理,推動大數(shù)據(jù)發(fā)展。

          瀏覽 82
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  不要钱的黄视频免费看在线 | 中文字幕在线中文乱 | 国内久久婷婷 | 五月丁香婷婷色 | 性久久久久久久 |