數(shù)據(jù)庫(kù)的范式詳解
作者:topologian
來(lái)源:SegmentFault 思否社區(qū)
在關(guān)系模式R中的每一個(gè)具體關(guān)系r中,如果每個(gè)屬性值 都是不可再分的最小數(shù)據(jù)單位,則稱R是第一范式的關(guān)系。
如果關(guān)系模式R(U,F(xiàn))中的所有非主屬性都完全依賴于任意一個(gè)候選關(guān)鍵字,則稱關(guān)系R 是屬于第二范式的。例:選課關(guān)系 SCI(SNO,CNO,GRADE,CREDIT)其中SNO為學(xué)號(hào), CNO為課程號(hào),GRADEGE 為成績(jī),CREDIT 為學(xué)分。由以上條件,關(guān)鍵字為組合關(guān)鍵字(SNO,CNO) 在應(yīng)用中使用以上關(guān)系模式有以下問(wèn)題:
a.數(shù)據(jù)冗余,假設(shè)同一門(mén)課由40個(gè)學(xué)生選修,學(xué)分就 重復(fù)40次。
b.更新異常,若調(diào)整了某課程的學(xué)分,相應(yīng)的元組CREDIT值都要更新,有可能會(huì)出現(xiàn)同一門(mén)課學(xué)分不同。
c.插入異常,如計(jì)劃開(kāi)新課,由于沒(méi)人選修,沒(méi)有學(xué)號(hào)關(guān)鍵字,只能等有人選修才能把課程和學(xué)分存入。
d.刪除異常,若學(xué)生已經(jīng)結(jié)業(yè),從當(dāng)前數(shù)據(jù)庫(kù)刪除選修記錄。某些門(mén)課程新生尚未選修,則此門(mén)課程及學(xué)分記錄無(wú)法保存。
如果關(guān)系模式R(U,F(xiàn))中的所有非主屬性對(duì)任何候選關(guān)鍵字都不存在傳遞信賴,則稱關(guān)系R是屬于第三范式的。
(1)由以上得 PNO 不能確定QNT,由組合屬性(WNO,PNO)來(lái)決定,存在函數(shù)依賴(WNO,PNO) -> ENO。
(2)由于每個(gè)倉(cāng)庫(kù)里的一種配件由專人負(fù)責(zé),而一個(gè)人可以管理幾種配件,所以有組合屬性(WNO,PNO)才能確定負(fù)責(zé)人,有(WNO,PNO)-> ENO。
解決辦法:分成管理EP(ENO,PNO,QNT),關(guān)鍵字是(ENO,PNO)工作EW(ENO,WNO)其關(guān)鍵字是ENO 缺點(diǎn):分解后函數(shù)依賴的保持性較差。
目的:規(guī)范化目的是使結(jié)構(gòu)更合理,消除存儲(chǔ)異常,使數(shù)據(jù)冗余盡量小,便于插入、刪除和更新
原則:遵從概念單一化 "一事一地"原則,即一個(gè)關(guān)系模式描述一個(gè)實(shí)體或?qū)嶓w間的一種聯(lián)系。規(guī)范的實(shí)質(zhì)就是概念的單一化。
方法:將關(guān)系模式投影分解成兩個(gè)或兩個(gè)以上的關(guān)系模式。要求:分解后的關(guān)系模式集合應(yīng)當(dāng)與原關(guān)系模式"等價(jià)",即經(jīng)過(guò)自然聯(lián)接可以恢復(fù)原關(guān)系而不丟失信息,并保持屬性間合理的聯(lián)系。
注意:一個(gè)關(guān)系模式結(jié)這分解可以得到不同關(guān)系模式集合,也就是說(shuō)分解方法不是唯一的。最小冗余的要求必須以分解后的數(shù)據(jù)庫(kù)能夠表達(dá)原來(lái)數(shù)據(jù)庫(kù)所有信息為前提來(lái)實(shí)現(xiàn)。其根本目標(biāo)是節(jié)省存儲(chǔ)空間,避免數(shù)據(jù)不一致性,提高對(duì)關(guān)系的操作效率,同時(shí)滿足應(yīng)用需求。實(shí)際上,并不一定要求全部模式都達(dá)到BCNF不可。有時(shí)故意保留部分冗余可能更方便數(shù)據(jù)查詢。尤其對(duì)于那些更新頻度不高,查詢頻度極高的數(shù)據(jù)庫(kù)系統(tǒng)更是如此。在關(guān)系數(shù)據(jù)庫(kù)中,除了函數(shù)依賴之外還有多值依賴,聯(lián)接依賴的問(wèn)題,從而提出了第四范式,第五范式等更高一級(jí)的規(guī)范化要求。在此,以后再談。

