分布式存儲(chǔ)技術(shù):三副本 vs 雙重RAID

1
消耗網(wǎng)絡(luò)帶寬,可能會(huì)影響到業(yè)務(wù)數(shù)據(jù)的正常工作;
2
TCP/IP網(wǎng)絡(luò)具有數(shù)據(jù)包丟失與重發(fā)的特性,可能導(dǎo)致網(wǎng)絡(luò)故障或網(wǎng)絡(luò)抖動(dòng),影響OSD的狀態(tài),引起OSD重建的連鎖反應(yīng);
3
嚴(yán)重時(shí)可導(dǎo)致業(yè)務(wù)中斷、甚至丟失數(shù)據(jù)的風(fēng)險(xiǎn)。

三副本分布式存儲(chǔ)的另一個(gè)弊端就是“慢盤”效應(yīng),以及相關(guān)的性能及穩(wěn)定性問(wèn)題。在三副本系統(tǒng)中,每個(gè)機(jī)械磁盤(HDD)單獨(dú)作為一個(gè)OSD存儲(chǔ)單元承接用戶工作負(fù)載,而單個(gè)HDD隨機(jī)IO讀寫非常低,僅為120 次讀寫/秒,極容易成為瓶頸。
由于分布式存儲(chǔ)采用隨機(jī)數(shù)據(jù)分布,而隨機(jī)性必然導(dǎo)致個(gè)別磁盤上的負(fù)載遠(yuǎn)超平均值(著名的正太分布效應(yīng));此外,磁盤本身的制造缺陷或故障還會(huì)加劇?“慢盤”現(xiàn)象發(fā)生的頻率。當(dāng)系統(tǒng)出現(xiàn)一個(gè)或多個(gè)慢盤時(shí),不僅會(huì)拖累總體性能與用戶體驗(yàn),甚至可能導(dǎo)致業(yè)務(wù)卡頓、中斷、甚至系統(tǒng)崩潰的嚴(yán)重事故。
與網(wǎng)絡(luò)數(shù)據(jù)修復(fù)相比,本地RAID數(shù)據(jù)修復(fù)具有以下特征:
1
硬件故障隔離,避免了網(wǎng)絡(luò)修復(fù)可能導(dǎo)致的穩(wěn)定性問(wèn)題;
2
可自動(dòng)避讓業(yè)務(wù),保證業(yè)務(wù)無(wú)感知;
3
本地修復(fù)時(shí)數(shù)據(jù)延遲小,不消耗網(wǎng)絡(luò)帶寬;
4
抵御故障能力強(qiáng),每個(gè)節(jié)點(diǎn)都能抵御一個(gè)或多個(gè)硬盤故障;而三副本最多抵御兩個(gè)連續(xù)的硬盤故障。

雙重RAID的另一個(gè)技術(shù)優(yōu)勢(shì)在于,支持在線增加NVMe固態(tài)硬盤個(gè)數(shù),或在線替換更大容量的NVMe固態(tài)硬盤,從而使得用戶活動(dòng)工作負(fù)載數(shù)據(jù)集 (Working Data Set),俗稱熱數(shù)據(jù),可幾乎全部落在兩級(jí)緩存加速層中,從而使得系統(tǒng)總體性能可逼近全閃存存儲(chǔ)系統(tǒng)。
10T 技術(shù)資源大放送!包括但不限于:Linux、虛擬化、容器、云計(jì)算、網(wǎng)絡(luò)、Python、Go 等。在?開源Linux?公眾號(hào)內(nèi)回復(fù)?10T,即可免費(fèi)獲取!
有收獲,點(diǎn)個(gè)在看?



