所謂數(shù)據(jù)模型


ODS:
Operational Data Store,操作數(shù)據(jù)層,在結(jié)構(gòu)上其與源系統(tǒng)的增量或者全量數(shù)據(jù)基本保持 一致。
它相當(dāng)于一個數(shù)據(jù)準(zhǔn)備區(qū),同時又承擔(dān)著基礎(chǔ)數(shù)據(jù)的記錄以及歷史變化。其主要作用是把基礎(chǔ)數(shù)據(jù)引入到MaxCompute。CDM:
Common Data Model,公共維度模型層,又細(xì)分為DWD和DWS。
它的主要作用是完成數(shù)據(jù)加工與整合、建立一致性的維度、構(gòu)建可復(fù)用的面向分析和統(tǒng)計(jì)的明細(xì)事實(shí)表以及匯總公共粒度的指標(biāo)。DWD:
Data Warehouse Detail,明細(xì)數(shù)據(jù)層。DWS:
Data Warehouse Summary,匯總數(shù)據(jù)層。ADS:
Application Data Service,應(yīng)用數(shù)據(jù)層。

公共維度層:
基于維度建模理念思想,建立整個企業(yè)的一致性維度。明細(xì)粒度事實(shí)層:
以業(yè)務(wù)過程為建模驅(qū)動,基于每個具體業(yè)務(wù)過程的特點(diǎn),構(gòu)建最細(xì)粒度的明細(xì)層事實(shí)表。
您可以結(jié)合企業(yè)的數(shù)據(jù)使用特點(diǎn),將明細(xì)事實(shí)表的某些重要維度屬性字段做適當(dāng)?shù)娜哂?,即寬表化處理?/p>公共匯總粒度事實(shí)層:
以分析的主題對象為建模驅(qū)動,基于上層的應(yīng)用和產(chǎn)品的指標(biāo)需求,構(gòu)建公共粒度的匯總指標(biāo)事實(shí)表,以寬表化手段來物理化模型。

按業(yè)務(wù)劃分:
命名時按主要的業(yè)務(wù)劃分,以指導(dǎo)物理模型的劃分原則、命名原則及使用的ODS project。
例如,按業(yè)務(wù)定義英文縮寫,阿里的“淘寶”英文縮寫可以定義為“tb”。按數(shù)據(jù)域劃分:
命名時按照CDM層的數(shù)據(jù)進(jìn)行數(shù)據(jù)域劃分,以便有效地對數(shù)據(jù)進(jìn)行管理,以及指導(dǎo)數(shù)據(jù)表的命名。
例如,“交易”數(shù)據(jù)的英文縮寫可定義為“trd”。按業(yè)務(wù)過程劃分:
當(dāng)一個數(shù)據(jù)域由多個業(yè)務(wù)過程組成時,命名時可以按業(yè)務(wù)流程劃分。
業(yè)務(wù)過程是從數(shù)據(jù)分析角度看客觀存在的或者抽象的業(yè)務(wù)行為動作。
例如,交易數(shù)據(jù)域中的“退款”這個業(yè)務(wù)過程的英文縮寫可約定命名為“rfd_ent”。
數(shù)據(jù)模型的作用
模型設(shè)計(jì)的基本原則
高內(nèi)聚和低耦合
核心模型與擴(kuò)展模型分離
公共處理邏輯下沉及單一
成本與性能平衡
數(shù)據(jù)可回滾
一致性
命名清晰可理解
一個模型無法滿足所有的需求。
需合理選擇數(shù)據(jù)模型的建模方式。
通常,設(shè)計(jì)順序依次為:概念模型->邏輯模型->物理模型。

