DAMA數(shù)據(jù)管理知識(shí)體系指南之?dāng)?shù)據(jù)架構(gòu)和建模
一、數(shù)據(jù)架構(gòu)語(yǔ)境關(guān)系圖

企業(yè)架構(gòu)包括多種不同類型,如包括業(yè)務(wù)架構(gòu)、數(shù)據(jù)架構(gòu)、應(yīng)用架構(gòu)和技術(shù)架構(gòu)等。其中數(shù)據(jù)架構(gòu)的主要目標(biāo)是有效地管理數(shù)據(jù),以及有效地管理存儲(chǔ)和使用數(shù)據(jù)的系統(tǒng)。
數(shù)據(jù)架構(gòu)是數(shù)據(jù)管理的基礎(chǔ)。由于大多數(shù)組織擁有的數(shù)據(jù)超出了個(gè)人可以理解的范圍,因此有必要在不同抽象層級(jí)上描述組織的數(shù)據(jù),以便更好地了解數(shù)據(jù),幫助管理層做出決策。
最為詳細(xì)的數(shù)據(jù)架構(gòu)設(shè)計(jì)文件是正式的企業(yè)數(shù)據(jù)模型,包含數(shù)據(jù)名稱、數(shù)據(jù)屬性和元數(shù)據(jù)定義、概念和邏輯實(shí)體、關(guān)系以及業(yè)務(wù)規(guī)則。
本章節(jié)中,將從以下幾個(gè)方面考慮數(shù)據(jù)架構(gòu):
1)數(shù)據(jù)架構(gòu)成果,包括不同層級(jí)的模型、定義、數(shù)據(jù)流,這些通常被稱為數(shù)據(jù)架構(gòu)的構(gòu)件。
2)數(shù)據(jù)架構(gòu)活動(dòng),用于形成、部署和實(shí)現(xiàn)數(shù)據(jù)架構(gòu)的目標(biāo)。
3)數(shù)據(jù)架構(gòu)行為,包括影響企業(yè)數(shù)據(jù)架構(gòu)的不同角色之間的協(xié)作、思維方式和技能。
二、業(yè)務(wù)驅(qū)動(dòng)因素
數(shù)據(jù)架構(gòu)常見(jiàn)的業(yè)務(wù)驅(qū)動(dòng)因素如下:
1)利用新興技術(shù)所帶來(lái)的業(yè)務(wù)優(yōu)勢(shì),從戰(zhàn)略上幫助組織快速改變產(chǎn)品、服務(wù)和數(shù)據(jù)。
2)將業(yè)務(wù)需求轉(zhuǎn)換為數(shù)據(jù)和應(yīng)用需求,以確保能夠?yàn)闃I(yè)務(wù)流程處理提供有效數(shù)據(jù)。
3)管理復(fù)雜數(shù)據(jù)和信息,并傳遞至整個(gè)企業(yè)。
4)確保業(yè)務(wù)和IT技術(shù)保持一致。
5)為企業(yè)改革、轉(zhuǎn)型和提高適應(yīng)性提供支撐。
數(shù)據(jù)架構(gòu)的主要成果包括:
1)數(shù)據(jù)存儲(chǔ)和處理需求。
2)設(shè)計(jì)滿足企業(yè)當(dāng)前和長(zhǎng)期數(shù)據(jù)需求的結(jié)構(gòu)和規(guī)劃。
三、企業(yè)數(shù)據(jù)架構(gòu)
企業(yè)數(shù)據(jù)架構(gòu)包括企業(yè)數(shù)據(jù)模型和數(shù)據(jù)流兩部分,詳情如下。
1、企業(yè)數(shù)據(jù)模型
企業(yè)數(shù)據(jù)模型:組織對(duì)企業(yè)內(nèi)數(shù)據(jù)實(shí)體、數(shù)據(jù)屬性和它們之間關(guān)系的理解。各層級(jí)模型(概念模型、邏輯模型、物理模型)是企業(yè)數(shù)據(jù)模型的組成部分。模型鏈接定義和管理了模型的橫向(關(guān)聯(lián))和縱向(層級(jí))關(guān)系。
常見(jiàn)的企業(yè)數(shù)據(jù)模型建設(shè)方法:自上而下、自下而上或者混合模式:
自上而下是從主題域開(kāi)始,先設(shè)計(jì)主題,再逐步設(shè)計(jì)下層模型。而采用自下而上的方法時(shí),主題域結(jié)構(gòu)則是基于現(xiàn)有邏輯數(shù)據(jù)模型向上提煉抽象而成。通常推薦兩種方法相結(jié)合,即自下而上地從分析現(xiàn)有模型開(kāi)始,自上而下地設(shè)計(jì)主題模型,通過(guò)兩種方法的結(jié)合來(lái)共同完成企業(yè)數(shù)據(jù)模型的設(shè)計(jì)工作。
企業(yè)數(shù)據(jù)模型概念圖:

主題域模型概念圖:

2、數(shù)據(jù)流
數(shù)據(jù)流:記錄數(shù)據(jù)血緣的數(shù)據(jù)加工過(guò)程,可以通過(guò)二維矩陣、數(shù)據(jù)流圖呈現(xiàn)。
2.1、二維矩陣數(shù)據(jù)流概念圖

2.2、數(shù)據(jù)流概念圖

四、度量指標(biāo)
常用的企業(yè)數(shù)據(jù)架構(gòu)衡量指標(biāo):架構(gòu)接受度、實(shí)施趨勢(shì)、業(yè)務(wù)價(jià)值。數(shù)據(jù)架構(gòu)衡量工作通常作為項(xiàng)目總體業(yè)務(wù)客戶滿意度的一部分,每年開(kāi)展一次。
(1)架構(gòu)標(biāo)準(zhǔn)接受率。測(cè)量項(xiàng)目與已建立的數(shù)據(jù)架構(gòu)的緊密程度,項(xiàng)目與企業(yè)架構(gòu)參與流程的遵循度。
(2)實(shí)施趨勢(shì)。對(duì)跟蹤企業(yè)架構(gòu)改善組織實(shí)施項(xiàng)目能力的程度,至少沿兩個(gè)方向進(jìn)行改善:
1)使用/重用/代替/廢棄測(cè)量。決定使用新架構(gòu)構(gòu)件與重用、代替或廢棄構(gòu)件的比例。
2)項(xiàng)目執(zhí)行效率測(cè)量。測(cè)量項(xiàng)目的交付時(shí)間和可重用構(gòu)件及指導(dǎo)構(gòu)件的交付改進(jìn)成本。
(3)業(yè)務(wù)價(jià)值度量指標(biāo) 。追蹤向期待的業(yè)務(wù)效果和利益方向的發(fā)展過(guò)程:
1)業(yè)務(wù)敏捷性改進(jìn)。解釋生命周期改進(jìn)或改變的好處,改進(jìn)延誤成本的測(cè)量方法。
2)業(yè)務(wù)質(zhì)量。測(cè)量業(yè)務(wù)案例是否按期完成;基于新創(chuàng)建或集成的數(shù)據(jù)導(dǎo)致業(yè)務(wù)發(fā)生的改變,測(cè)量項(xiàng)目是否實(shí)際交付了這些變更。
3)業(yè)務(wù)操作質(zhì)量。測(cè)量改進(jìn)效率的方法。實(shí)例包括準(zhǔn)確性改進(jìn)、時(shí)間減少,由于數(shù)據(jù)錯(cuò)誤而導(dǎo)致的糾錯(cuò)費(fèi)。
4)業(yè)務(wù)環(huán)境改進(jìn)。實(shí)例包括由于數(shù)據(jù)錯(cuò)誤減少而改變的客戶保留率和在遞交報(bào)告中當(dāng)局評(píng)論的減少率。
五、關(guān)鍵概念/工具/方法
1、企業(yè)架構(gòu)之間的關(guān)系
企業(yè)架構(gòu)包括多種不同類型,如包括業(yè)務(wù)架構(gòu)、數(shù)據(jù)架構(gòu)、應(yīng)用架構(gòu)和技術(shù)架構(gòu)等。每個(gè)架構(gòu)都不是孤立存在的,要么對(duì)其他架構(gòu)產(chǎn)生影響,要么受制于其他架構(gòu)。

2、企業(yè)架構(gòu)框架——Zachman框架
在建筑、飛機(jī)、企業(yè)、價(jià)值鏈、項(xiàng)目或系統(tǒng)中,有許多利益相關(guān)方,且各方對(duì)架構(gòu)都持有一個(gè)不同的觀點(diǎn)。這些概念可以應(yīng)用到一個(gè)企業(yè)的不同架構(gòu)類型和層次需求中。
Zachman模型可以完整地描述一個(gè)企業(yè)以及相互之間的關(guān)系。它并不定義如何創(chuàng)建模型,只是顯示哪些模型應(yīng)該存在。

矩陣框架的兩個(gè)維度為:?jiǎn)栐儨贤ǎㄈ缡鞘裁?、怎樣做、在哪里、是誰(shuí)、什么時(shí)間和為什么)在列中顯示,重新定義轉(zhuǎn)換(如識(shí)別、定義、描述、規(guī)范、配置和實(shí)例)在行中顯示??蚣芊诸惏凑諉卧癯尸F(xiàn)(問(wèn)詢和轉(zhuǎn)換之間的交叉)。框架的每個(gè)單元格代表一個(gè)獨(dú)特的設(shè)計(jì)組件。在問(wèn)詢溝通時(shí),可以詢問(wèn)關(guān)于任何一個(gè)實(shí)體的基本問(wèn)題,將其轉(zhuǎn)換成企業(yè)架構(gòu),每個(gè)列可以按照如下理解:
1)什么(What)。目錄列,表示構(gòu)建架構(gòu)的實(shí)體。
2)怎樣(How)。流程列,表示執(zhí)行的活動(dòng)。
3)在哪里(Where)。分布列,表示業(yè)務(wù)位置和技術(shù)位置。
4)誰(shuí)(Who)。職責(zé)列,表示角色和組織。
5)什么時(shí)間(When)。時(shí)間列,表示間隔、事件、周期和時(shí)間表。
6)為什么(Why)。動(dòng)機(jī)列,表示目標(biāo)、策略和手段。
重新定義轉(zhuǎn)換是將抽象的概念轉(zhuǎn)變?yōu)榫唧w的實(shí)例(實(shí)例化)的必經(jīng)步驟。矩陣中的每一行代表不同的角色,具體的角色包括規(guī)劃者、所有者、設(shè)計(jì)師、建造者、實(shí)施者和用戶。每個(gè)角色對(duì)整個(gè)過(guò)程和不同問(wèn)題的解決均持有不同的視角。這些不同的視角對(duì)應(yīng)的內(nèi)容在每行中進(jìn)行顯示。例如,每個(gè)視角與“什么”列(目錄或數(shù)據(jù))均有交叉,說(shuō)明相互之間具有不同關(guān)聯(lián)關(guān)系。具體說(shuō)明如下:
1)高管視角(業(yè)務(wù)背景)。定義不同模型范圍的業(yè)務(wù)元素目錄。
2)業(yè)務(wù)管理視角(業(yè)務(wù)概念)。明確管理層在定義的業(yè)務(wù)模型中所涉及的不同業(yè)務(wù)概念之間的關(guān)系。
3)架構(gòu)師視角(業(yè)務(wù)邏輯)。作為模型設(shè)計(jì)的架構(gòu)師細(xì)化系統(tǒng)需求,設(shè)計(jì)系統(tǒng)邏輯模型。
4)工程師視角(業(yè)務(wù)實(shí)體)。作為具體模型建造者的工程師,在特定技術(shù)、人員、成本和時(shí)間限制內(nèi),優(yōu)化和實(shí)施為具體應(yīng)用設(shè)計(jì)的物理模型。
5)技術(shù)人員視角(組件程序集)。采用特定技術(shù)、脫離上下文語(yǔ)境的視角,來(lái)解釋配置模型的技術(shù)人員如何使用、組裝和實(shí)施配置組件。
6)用戶視角(操作類)。參與人員所使用的實(shí)際功能實(shí)例。
六、數(shù)據(jù)建模和設(shè)計(jì)語(yǔ)境關(guān)系圖
數(shù)據(jù)建模是發(fā)現(xiàn)、分析和確定數(shù)據(jù)需求的過(guò)程,用一種稱為數(shù)據(jù)模型的精確形式表示和傳遞這些數(shù)據(jù)需求。
數(shù)據(jù)模型有助于組織能夠理解其數(shù)據(jù)資產(chǎn),數(shù)據(jù)建模的直接成果不是數(shù)據(jù)庫(kù),而是對(duì)組織數(shù)據(jù)的理解。
數(shù)據(jù)建模最常見(jiàn)的模式:關(guān)系模式、多維模式、面向?qū)ο竽J?、事?shí)模式、時(shí)間序列模式、NoSQL模式
每種模式又可以分為三層模型(不是所有的都可以分為三類):概念模型、邏輯模型、物理模型。
每種模型都包含一系列組件,如實(shí)體、關(guān)系、事實(shí)、鍵和屬性。
七、業(yè)務(wù)驅(qū)動(dòng)因素
驅(qū)動(dòng)組織進(jìn)行數(shù)據(jù)建模和設(shè)計(jì)的常見(jiàn)業(yè)務(wù)因素如下:
1)提供有關(guān)數(shù)據(jù)的通用詞匯表。
2)獲取、記錄組織內(nèi)數(shù)據(jù)和系統(tǒng)的詳細(xì)信息。
3)在項(xiàng)目中作為主要的交流溝通工具。
4)提供了應(yīng)用定制、整合,甚至替換的起點(diǎn)
良好的數(shù)據(jù)建模會(huì)降低支持成本,增加未來(lái)需求重復(fù)利用的可能性,從而降低構(gòu)建新應(yīng)用的成本。數(shù)據(jù)模型是元數(shù)據(jù)的一種重要形式。
八、活動(dòng)
1、規(guī)劃數(shù)據(jù)建模: 評(píng)估組織需求、確定建模標(biāo)準(zhǔn)、明確數(shù)據(jù)模型存儲(chǔ)等任務(wù)
2、建立數(shù)據(jù)模型: 一個(gè)不斷迭代的過(guò)程,不斷進(jìn)行優(yōu)化,直到滿足業(yè)務(wù)訴求。常見(jiàn)的建立數(shù)據(jù)模型的方法包括正向工程和逆向工程:
正向工程:從需求開(kāi)始構(gòu)建應(yīng)用程序的過(guò)程。首先通過(guò)概念模型來(lái)理解需求的范圍和核心的術(shù)語(yǔ)。然后建立邏輯模型詳細(xì)描述業(yè)務(wù)過(guò)程。最后通過(guò)具體的建表語(yǔ)句來(lái)實(shí)現(xiàn)物理模型。
逆向工程:記錄現(xiàn)有數(shù)據(jù)庫(kù)的過(guò)程。物理數(shù)據(jù)建模通常是第一步,以了解現(xiàn)有系統(tǒng)的技術(shù)設(shè)計(jì);邏輯數(shù)據(jù)建模是第二步,以記錄現(xiàn)有系統(tǒng)滿足業(yè)務(wù)的解決方案;概念數(shù)據(jù)建模是第三步,用于記錄現(xiàn)有系統(tǒng)中的范圍和關(guān)鍵術(shù)語(yǔ)。
該部分在執(zhí)行時(shí),細(xì)節(jié)比較多,詳細(xì)的操作指南,可在執(zhí)行時(shí)再次翻閱DMBOK
3、審核數(shù)據(jù)模型: 持續(xù)改進(jìn)、模型評(píng)估和正式發(fā)布。
4、維護(hù)數(shù)據(jù)模型: 數(shù)據(jù)模型需要保持最新?tīng)顟B(tài)。在維護(hù)數(shù)據(jù)模型時(shí)一個(gè)好的習(xí)慣是對(duì)最新的物理數(shù)據(jù)模型進(jìn)行逆向工程,并確保它與相應(yīng)的邏輯數(shù)據(jù)模型保持一致。許多數(shù)據(jù)建模工具可以自動(dòng)比較物理模型與邏輯模型差異
九、度量指標(biāo)
可以參考下表來(lái)制定適合自己企業(yè)的數(shù)據(jù)模型計(jì)分卡和評(píng)估指標(biāo)。

十、數(shù)據(jù)建模核心概念
1、實(shí)體、關(guān)系、屬性、域
1.1、實(shí)體
實(shí)體定義是有別于其他事物的一個(gè)事物,是一個(gè)組織收集信息的載體。一個(gè)實(shí)體可以被認(rèn)為是一些基本問(wèn)題的答案——誰(shuí)、什么、何時(shí)、何地、為什么、怎么辦或這些問(wèn)題的綜合。
實(shí)體在不同層級(jí)模型中的叫法不同:
概念模型:概念concept/術(shù)語(yǔ)term
邏輯模型:實(shí)體entity
物理模型:表table

實(shí)體類型——實(shí)體——實(shí)體實(shí)例之間的關(guān)系

1.2、關(guān)系
關(guān)系是實(shí)體之間的關(guān)聯(lián)。關(guān)系捕獲概念實(shí)體之間的高級(jí)別交互、邏輯實(shí)體之間的詳細(xì)交互和物理實(shí)體之間的約束。
關(guān)系有一些內(nèi)在的屬性,如基數(shù),元數(shù)等:
關(guān)系的基數(shù):一對(duì)一、一對(duì)多、多對(duì)多關(guān)系
關(guān)系的元數(shù):涉及到的實(shí)體的個(gè)數(shù),一元關(guān)系、二元關(guān)系、三元關(guān)系等

1.3、屬性
屬性是定義、描述和度量實(shí)體某方面的性質(zhì)。
屬性中的標(biāo)識(shí)符,也稱為鍵。
按照結(jié)構(gòu)分:?jiǎn)我绘I、組合鍵(多個(gè)屬性集合)、復(fù)合鍵(組合鍵 + 其他)、代理鍵(也是單一鍵,表的唯一標(biāo)識(shí)符,技術(shù)上的自增ID)
按照功能分:候選鍵(標(biāo)識(shí)實(shí)體實(shí)例的最小屬性集合,可能包含一個(gè)或多個(gè)屬性)、主鍵(被選為實(shí)體唯一標(biāo)識(shí)符的候選鍵)、超鍵(唯一標(biāo)識(shí)實(shí)體實(shí)例的任何屬性集)、備用鍵(沒(méi)有被選為主鍵的候選鍵)——一般主鍵是代理鍵,備用鍵是業(yè)務(wù)鍵

1.4、域
域代表某一屬性可被賦予的全部可能取值,也被稱為值域。
2、常用數(shù)據(jù)建模方法


2.1、關(guān)系建模
關(guān)系建模是一種能夠清晰表達(dá)含義的組織數(shù)據(jù)的系統(tǒng)方法,在減少數(shù)據(jù)存儲(chǔ)冗余方面卓有成效,特別適合設(shè)計(jì)操作型的系統(tǒng)。最常見(jiàn)的就是信息工程法,用三叉線表示基數(shù)

2.2、維度建模。
維度建模的理念是,數(shù)據(jù)組織的方式是為了優(yōu)化海量數(shù)據(jù)的查詢和分析。
維度建模主要包括下面概念:
事實(shí)表:特定的數(shù)值型度量值。如金額、交易量。往往占據(jù)數(shù)據(jù)庫(kù)的大部分空間。 維度表:表示業(yè)務(wù)的重要對(duì)象,主要包含文字描述。如用戶信息,地區(qū)信息。 粒度:事實(shí)表中單行數(shù)據(jù)的含義或描述,如日期、地區(qū)、用戶等

2.3、非關(guān)系型數(shù)據(jù)庫(kù)
NoSQL:Not only SQL。不是關(guān)于如何查詢數(shù)據(jù)庫(kù),而是關(guān)于如何存儲(chǔ)數(shù)據(jù)的。通常有四類:文檔數(shù)據(jù)庫(kù)、鍵值數(shù)據(jù)庫(kù)、列數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)。
3、關(guān)系模型和維度模型不同層級(jí)的展現(xiàn)
3.1、概念模型CDM
一系列相關(guān)主題域的集合來(lái)描述概要數(shù)據(jù)需求。概念數(shù)據(jù)模型僅包括給定的領(lǐng)域和職能中基礎(chǔ)和關(guān)鍵的業(yè)務(wù)實(shí)體,同時(shí)也給出實(shí)體和實(shí)體之間關(guān)系的描述。
3.2、邏輯模型LDM
對(duì)數(shù)據(jù)需求的詳細(xì)描述,通常用于支持特定用法的語(yǔ)境中(如應(yīng)用需求)。邏輯模型不受任何技術(shù)或特定實(shí)施條件的約束,邏輯數(shù)據(jù)模型通常是從概念數(shù)據(jù)模型擴(kuò)展而來(lái)。
3.3、物理模型PDM
描述了一種詳細(xì)的技術(shù)解決方案,通常以邏輯模型為基礎(chǔ),與某一類系統(tǒng)硬件、軟件和網(wǎng)絡(luò)工具相匹配。物理模型與特定技術(shù)相關(guān)



4、規(guī)范化
規(guī)范化(Normalization)是運(yùn)用規(guī)則將復(fù)雜的業(yè)務(wù)轉(zhuǎn)化為規(guī)范的數(shù)據(jù)結(jié)構(gòu)的過(guò)程。范式化的基本目標(biāo)是保證每個(gè)屬性只在一個(gè)位置出現(xiàn),以消除冗余或冗余導(dǎo)致的不一致性。范式的層次包括:
1)第一范式(1NF)。確保每個(gè)實(shí)體都有一個(gè)有效的主鍵,每個(gè)屬性都依賴于主鍵,而且消除冗余的分組,以確保每個(gè)屬性的原子性(不能有多個(gè)值存在)。第一范式包括了與通常稱為關(guān)聯(lián)實(shí)體的附加實(shí)體的多對(duì)多關(guān)系解析。
2)第二范式(2NF)。確保每個(gè)實(shí)體都有最小的主鍵,每個(gè)屬性都依賴于完整的主鍵。
3)第三范式(3NF)。確保每一個(gè)實(shí)體都沒(méi)有隱藏的主鍵,每個(gè)屬性都不依賴于鍵值之外的任何屬性(僅依賴于完整的主鍵)。
實(shí)踐中一般達(dá)到第三范式即可,4NF,5NF很少出現(xiàn)
DAMA對(duì)范式的解釋有點(diǎn)官方,為了幫助理解,可以參考:

十一、關(guān)鍵概念/工具/方法
1、數(shù)據(jù)建模和設(shè)計(jì)質(zhì)量管理
1.1、開(kāi)發(fā)數(shù)據(jù)建模和設(shè)計(jì)標(biāo)準(zhǔn)
如前所述,數(shù)據(jù)建模和數(shù)據(jù)庫(kù)設(shè)計(jì)標(biāo)準(zhǔn)提供了滿足業(yè)務(wù)數(shù)據(jù)需求、符合企業(yè)和數(shù)據(jù)架構(gòu)標(biāo)準(zhǔn)以及確保數(shù)據(jù)質(zhì)量的指導(dǎo)原則。數(shù)據(jù)建模和數(shù)據(jù)庫(kù)設(shè)計(jì)標(biāo)準(zhǔn)應(yīng)包括以下內(nèi)容:
1)標(biāo)準(zhǔn)數(shù)據(jù)建模和數(shù)據(jù)庫(kù)設(shè)計(jì)可交付成果的列表和描述。
2)適用于所有數(shù)據(jù)模型對(duì)象的標(biāo)準(zhǔn)名稱、可接受的縮寫(xiě)和非常用單詞的縮寫(xiě)規(guī)則列表。
3)所有數(shù)據(jù)模型對(duì)象的標(biāo)準(zhǔn)命名格式列表,包括屬性和分類詞。
4)用于創(chuàng)建和維護(hù)這些可交付成果的標(biāo)準(zhǔn)方法的列表和說(shuō)明。
5)數(shù)據(jù)建模和數(shù)據(jù)庫(kù)設(shè)計(jì)角色和職責(zé)的列表和描述。
6)數(shù)據(jù)建模和數(shù)據(jù)庫(kù)設(shè)計(jì)中捕獲的所有元數(shù)據(jù)屬性的列表和描述,包括業(yè)務(wù)元數(shù)據(jù)和技術(shù)元數(shù)據(jù)。例如,指導(dǎo)原則中可以設(shè)置數(shù)據(jù)模型為每個(gè)屬性捕獲數(shù)據(jù)血緣的期望。
7)元數(shù)據(jù)質(zhì)量期望和要求(參見(jiàn)第13章)。
8)如何使用數(shù)據(jù)建模工具的指南。
9)準(zhǔn)備和領(lǐng)導(dǎo)設(shè)計(jì)評(píng)審的指南。
10)數(shù)據(jù)模型版本控制指南。
11)禁止或需要避免的事項(xiàng)列表。
1.2、評(píng)審數(shù)據(jù)模型以及數(shù)據(jù)庫(kù)設(shè)計(jì)質(zhì)量
組建具有不同背景、技能、期望和意見(jiàn)的不同領(lǐng)域的專家小組對(duì)數(shù)據(jù)模型和數(shù)據(jù)庫(kù)設(shè)計(jì)進(jìn)行評(píng)審。在組建專家評(píng)審小組時(shí),可能需要通過(guò)特定途徑,邀請(qǐng)有關(guān)領(lǐng)域的專家參與。參與者必須能夠討論不同的觀點(diǎn),并最終達(dá)成小組共識(shí),不存在任何個(gè)人沖突,因?yàn)樗袇⑴c者都有共同的目標(biāo),即推廣最實(shí)用、表現(xiàn)最好、最可用的設(shè)計(jì)。
1.3、管理數(shù)據(jù)模型版本與集成
對(duì)數(shù)據(jù)模型和其他設(shè)計(jì)規(guī)范需要謹(jǐn)慎的變更控制,就像需求規(guī)范和其他SDLC可交付成果一樣。注意對(duì)數(shù)據(jù)模型的每次更改,需要以時(shí)間線記錄變更內(nèi)容。如果更改影響到了邏輯數(shù)據(jù)模型,如新的或更改了的業(yè)務(wù)數(shù)據(jù)要求,則需要數(shù)據(jù)分析師或架構(gòu)師審核并批準(zhǔn)對(duì)模型的更改。每個(gè)變更都應(yīng)該予以記錄,包括:
1)為什么(Why)項(xiàng)目或情況需要變更。
2)變更對(duì)象(What)以及如何(How)更改,包括添加了哪些表,修改或刪除了哪些列等。
3)變更批準(zhǔn)的時(shí)間(When)以及將此變更應(yīng)用于模型的時(shí)間(不一定在系統(tǒng)中實(shí)施更改)。
4)誰(shuí)(Who)做出了變更。
5)進(jìn)行變更的位置(Where)在哪些模型中。
2、行業(yè)數(shù)據(jù)模型
行業(yè)數(shù)據(jù)模型是為整個(gè)行業(yè)預(yù)建的數(shù)據(jù)模型,包括醫(yī)療保健、電信、保險(xiǎn)、銀行、制造業(yè)等行業(yè)。這些模型通常范圍廣泛且內(nèi)容詳細(xì)。一些行業(yè)的數(shù)據(jù)模型包含數(shù)千個(gè)實(shí)體和屬性??梢酝ㄟ^(guò)供應(yīng)商購(gòu)買(mǎi)行業(yè)數(shù)據(jù)模型,也可以通過(guò)ARTS(零售)、SID(通信)或ACORD(保險(xiǎn))等行業(yè)組織獲得。
任何購(gòu)買(mǎi)的數(shù)據(jù)模型都需要進(jìn)行定制以適應(yīng)組織的特點(diǎn),因?yàn)樗歉鶕?jù)其他組織的需求進(jìn)行設(shè)計(jì)的。所需的定制級(jí)別取決于該數(shù)據(jù)模型與組織需求的接近程度,以及最重要部分的詳細(xì)程度。在某些情況下,它們可以作為工作參考,幫助建模人員制作更完整的模型。有時(shí),它只能幫助數(shù)據(jù)建模人員節(jié)約一些公共元素的錄入工作。
3、數(shù)據(jù)庫(kù)設(shè)計(jì)中的最佳實(shí)踐
在設(shè)計(jì)和構(gòu)建數(shù)據(jù)庫(kù)時(shí),DBA應(yīng)牢記以下PRISM設(shè)計(jì)原則:
1)性能和易用性(Performance and Ease of Use)。確保用戶可快速、輕松地訪問(wèn)數(shù)據(jù),從而最大限度地提高應(yīng)用程序和數(shù)據(jù)的業(yè)務(wù)價(jià)值。
2)可重用性(Reusability)。應(yīng)確保數(shù)據(jù)庫(kù)結(jié)構(gòu)在適當(dāng)?shù)那闆r下,能夠被多個(gè)應(yīng)用重復(fù)使用,并且可用于多種目的(如業(yè)務(wù)分析、質(zhì)量改進(jìn)、戰(zhàn)略規(guī)劃、客戶關(guān)系管理和流程改進(jìn))。避免將數(shù)據(jù)庫(kù)、數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)對(duì)象耦合到單個(gè)應(yīng)用程序中。
3)完整性(Integrity)。無(wú)論語(yǔ)境如何,數(shù)據(jù)應(yīng)始終具有有效的業(yè)務(wù)含義和價(jià)值,并且應(yīng)始終反映業(yè)務(wù)的有效狀態(tài)。實(shí)施盡可能接近數(shù)據(jù)的數(shù)據(jù)完整性約束,并立即檢測(cè)并報(bào)告數(shù)據(jù)完整性約束的違規(guī)行為。
4)安全性(Security)。應(yīng)始終及時(shí)向授權(quán)用戶提供真實(shí)準(zhǔn)確的數(shù)據(jù),且僅限授權(quán)用戶使用。必須滿足所有利益相關(guān)方(包括客戶、業(yè)務(wù)合作伙伴和政府監(jiān)管機(jī)構(gòu))的隱私要求。強(qiáng)化數(shù)據(jù)安全性,就像數(shù)據(jù)完整性檢查一樣,執(zhí)行數(shù)據(jù)的安全性約束檢查,盡可能確保數(shù)據(jù)的安全性。如果檢查發(fā)現(xiàn)存在違反數(shù)據(jù)安全性約束的情況,則立刻報(bào)告違規(guī)行為。
5)可維護(hù)性(Maintainability)。確保創(chuàng)建、存儲(chǔ)、維護(hù)、使用和處置數(shù)據(jù)的成本不超過(guò)其對(duì)組織的價(jià)值,以能夠產(chǎn)生價(jià)值的成本方式執(zhí)行所有數(shù)據(jù)工作;確保盡可能快速地響應(yīng)業(yè)務(wù)流程和新業(yè)務(wù)需求的變化。


