<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          詳解數(shù)據(jù)倉庫的數(shù)據(jù)維——上下文

          共 2421字,需瀏覽 5分鐘

           ·

          2021-03-11 20:44

          「數(shù)倉寶貝庫」,帶你學(xué)數(shù)據(jù)!


          過去,典型的操作型信息系統(tǒng)將注意力集中在企業(yè)的當(dāng)前數(shù)據(jù)上。在操作型世界中,強(qiáng)調(diào)的重點(diǎn)是此刻賬目的余額是多少,此刻的存貨有多少,或此刻貨物的運(yùn)送情況如何。當(dāng)然,任何一個(gè)企業(yè)都有必要知道當(dāng)前的信息。但對(duì)過去一段時(shí)間的信息進(jìn)行考察也有真正的價(jià)值,并且,在有了數(shù)據(jù)倉庫技術(shù)以后,這個(gè)要求變得可能了。例如,對(duì)歷史信息進(jìn)行觀察就可以明顯地看到相應(yīng)的發(fā)展趨勢(shì),而僅僅查看當(dāng)前信息是看不到這一點(diǎn)的。數(shù)據(jù)倉庫定義中的一個(gè)最重要特征就是能夠?qū)σ欢螘r(shí)間內(nèi)的數(shù)據(jù)進(jìn)行存儲(chǔ)、管理和訪問。


          伴隨著作為數(shù)據(jù)倉庫一部分的足夠長的時(shí)間譜,出現(xiàn)了一個(gè)新的數(shù)據(jù)維—上下文。為了闡明上下文信息的重要性,下面給出了一個(gè)例子。



          例子


          假定一個(gè)管理者想從數(shù)據(jù)倉庫中要一份1995年的報(bào)表。報(bào)表生成后,管理者很滿意。事實(shí)上,由于管理者很滿意,所以想要一份1990年的報(bào)表。由于數(shù)據(jù)倉庫載有歷史信息,這樣的要求并不難實(shí)現(xiàn)。1990年的報(bào)表生成了。現(xiàn)在,管理者手上有兩份報(bào)表—1990年和1995年各一份,并宣布這些報(bào)表是一場(chǎng)災(zāi)難。



          數(shù)據(jù)倉庫體系結(jié)構(gòu)設(shè)計(jì)者檢查了報(bào)表,發(fā)現(xiàn)1995年的財(cái)政報(bào)告顯示收入為50 000 000美元,而1990年的報(bào)告對(duì)同一種類顯示為10 000美元。管理者宣稱任何賬戶或分類都不可能在5年時(shí)間內(nèi)就增長這么多。



          就在要放棄之前,數(shù)據(jù)倉庫體系結(jié)構(gòu)設(shè)計(jì)者向管理者指出,還有一些相關(guān)的因素沒有在報(bào)表中體現(xiàn)出來。1990年和1995年的數(shù)據(jù)是從不同來源得到的;1990年的產(chǎn)品定義不同于1995年的;1990年和1995年有不同的市場(chǎng)范圍;1990年和1995年有不同的計(jì)算方法,如針對(duì)貶值問題。另外,還有許多不同的外部因素需要考慮,如在通貨膨脹、稅款、經(jīng)濟(jì)預(yù)測(cè)等方面的差別。一旦把報(bào)表的上下文向管理者解釋之后,內(nèi)容就在相當(dāng)程度上顯得可接受。



          在這個(gè)簡單而又常見的例子中,如果隨著時(shí)間變化數(shù)據(jù)的內(nèi)容沒有任何附加信息,那么內(nèi)容本身就是非常難于解釋和難以令人相信的。然而,隨著時(shí)間的變化同時(shí),把上下文加入到數(shù)據(jù)的內(nèi)容上,內(nèi)容和上下文都變得非常明了


          為了解釋和理解一段時(shí)間內(nèi)的信息,需要一個(gè)全新的上下文維。雖然信息的內(nèi)容仍十分重要,但是,一段時(shí)間內(nèi)信息的比較和理解使得上下文和內(nèi)容具有同等的重要性。而在過去的幾年中,上下文一直是信息的一個(gè)未被發(fā)現(xiàn)、未被探索的維。



          上下文信息的三種類型


          需要管理三種級(jí)別的上下文信息:

          1.簡單上下文信息。

          2.復(fù)雜上下文信息。

          3.外部上下文信息。


          簡單上下文信息



          簡單上下文信息與數(shù)據(jù)本身的基本結(jié)構(gòu)有關(guān),包括如下一些內(nèi)容:

          ■ 數(shù)據(jù)的結(jié)構(gòu)。

          ■ 數(shù)據(jù)的編碼。

          ■ 數(shù)據(jù)的命名習(xí)慣。

          ■ 描述數(shù)據(jù)的度量,如:

          • 數(shù)據(jù)量有多少。

          • 數(shù)據(jù)增長速度。

          • 數(shù)據(jù)的哪一部分在增長。

          • 數(shù)據(jù)是如何被使用的。


          以往,簡單上下文信息用字典、目錄、系統(tǒng)監(jiān)視器等進(jìn)行管理。復(fù)雜上下文信息描述的數(shù)據(jù)和簡單上下文信息描述的相同,但是從不同的角度進(jìn)行描述。復(fù)雜上下文信息如下說明數(shù)據(jù):

          • 產(chǎn)品定義。

          • 市場(chǎng)范圍。

          • 定價(jià)。

          • 包裝。

          • 組織結(jié)構(gòu)。

          • 配送。



          復(fù)雜上下文信息


          復(fù)雜上下文信息是一些非常有用,同時(shí)又是非常難以捉摸的信息。難以捉摸是因?yàn)樗蝗藗兿氘?dāng)然,并存在于背景環(huán)境中。它非常基本,以致于沒有人會(huì)想到要定義它是什么,或怎樣隨時(shí)間變化。然而,長期下去,復(fù)雜上下文信息在理解和解釋一段時(shí)間內(nèi)的信息方面有著非常重要的作用。


          外部上下文信息是處于企業(yè)之外的、在理解隨時(shí)間變化的信息方面起重要作用的信息。外部上下文信息的實(shí)例包括:

          ■ 經(jīng)濟(jì)預(yù)測(cè):

          • 通貨膨脹。

          • 金融。

          • 稅務(wù)。

          • 經(jīng)濟(jì)增長。

          ■ 政治信息。

          ■ 競(jìng)爭信息。

          ■ 技術(shù)進(jìn)展。

          ■ 用戶人數(shù)的統(tǒng)計(jì)變動(dòng)。



          外部上下文信息


          外部上下文信息并沒有直接指出關(guān)于一個(gè)企業(yè)的任何事情,但指出了企業(yè)運(yùn)轉(zhuǎn)和競(jìng)爭中所處的大環(huán)境。考慮到外部上下文信息的立即顯現(xiàn)和隨時(shí)間變化的特性,外部上下文信息是很令人感興趣的。同復(fù)雜上下文信息一樣,很少會(huì)有企業(yè)嘗試去采集和量度這些信息。外部上下文信息非常之多,也很顯然,以致被人們想當(dāng)然,因此,它會(huì)很快被遺忘,而在需要時(shí)卻又很難重建。



          捕獲和管理上下文信息



          復(fù)雜上下文信息和外部上下文信息難以捕獲和確定,是因?yàn)檫@些信息都是非結(jié)構(gòu)化的。與簡單上下文信息相比較,外部上下文信息和復(fù)雜上下文信息顯得非常雜亂無章。另外的一個(gè)較輕的因素是上下文信息變化很快。這一刻相關(guān)的信息,在下一時(shí)刻就消失了。正是因?yàn)橥獠亢蛷?fù)雜上下文信息的這些不斷變化和沒有固定狀態(tài)的特點(diǎn),使得這種類型的信息難于系統(tǒng)化。



          回顧上下文信息管理歷史



          有人可能會(huì)爭辯說,信息系統(tǒng)行業(yè)在過去已經(jīng)有了上下文信息。字典、知識(shí)庫、目錄和庫都是用來管理簡單上下文信息的嘗試。盡管有這些好的想法,但存在的一些明顯的局限性大大地降低了它們的有效性。下面給出以往管理簡單上下文信息的方法存在的一些缺點(diǎn):

          • 信息的管理是針對(duì)信息系統(tǒng)的開發(fā)者,而不是最終用戶。這樣,對(duì)于最終用戶有很少的可視性。結(jié)果,最終用戶對(duì)并不明顯的事情沒有什么熱情,或者不支持這樣的事情。

          • 這些上下文信息管理的嘗試都是被動(dòng)的。開發(fā)者可以選擇用或不用這些上下文信息管理工具,很多人傾向于回避這些工具。

          • 這些上下文信息管理的計(jì)劃在很多情況下都會(huì)被從開發(fā)計(jì)劃中刪除。在許多的實(shí)例中,應(yīng)用是在1965年開發(fā)的,而數(shù)據(jù)字典是1985年做的,而到了1985年,就再也沒有更多的開發(fā)經(jīng)費(fèi)了。甚至,那些對(duì)組織和定義簡單上下文信息最有幫助的人早已改行或到了其他公司了。

          • 這些上下文信息管理的嘗試僅局限于簡單上下文信息,并沒有嘗試去捕獲或管理外部和復(fù)雜上下文信息。



          作者簡介:

          William H.Inmon,世界公認(rèn)的“數(shù)據(jù)倉庫之父”,企業(yè)信息工廠創(chuàng)造者之一。


          瀏覽 47
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  天天舔天天日天天干 | 黄a在线看 | 日韩免费高清无码 | 啪啪啪网站免费观看 | 青青草色成人网站视频 |