并行文件系統(tǒng):元數(shù)據(jù)如何縱向可擴(kuò)展?


在HPC計(jì)算和存儲業(yè)務(wù)中,針對文件系統(tǒng)的IO請求中,一半以上是元數(shù)據(jù)訪問。元數(shù)據(jù)訪問特點(diǎn):
I/O大小較?。ㄔ獢?shù)據(jù)大小通常只有幾百Byte),使得元數(shù)據(jù)服務(wù)器CPU的負(fù)載重 許多元數(shù)據(jù)操作包含多次子操作,例如打開文件需要進(jìn)行多次的路徑解析,使得元數(shù)據(jù)操作會觸發(fā)多次網(wǎng)絡(luò)I/O
當(dāng)前,主流并行文件系統(tǒng)大多采用分布式解決方案中,Lustre、CephFS采用子樹劃分+目錄條帶化;BeeGFS根據(jù)名稱的Hash值分布到多節(jié)點(diǎn);GlusterFS采用無中心架構(gòu);IndexFS的元數(shù)據(jù)以KV存儲,通過GIGA+算法分布到多節(jié)點(diǎn)。
現(xiàn)有文件系統(tǒng)元數(shù)據(jù)管理的潛在缺陷:1)POSIX的語義限制了元數(shù)據(jù)性能提升,2)數(shù)據(jù)結(jié)構(gòu)不利于并發(fā)處理,3)元數(shù)據(jù)性能提升面臨的機(jī)遇,如IO設(shè)備跨越式發(fā)展(NVMe SSD充裕的IOPS和帶寬,多通道并發(fā)能力)。
針對文件系統(tǒng)元數(shù)據(jù)一直是文件系統(tǒng)的瓶頸問題,單點(diǎn)元數(shù)據(jù)性能仍然存在很大的提升空間,如沒有充分發(fā)揮IO效能,沒有充分發(fā)揮計(jì)算效能等,本文提出改進(jìn)數(shù)據(jù)結(jié)構(gòu),降低IO之間的依賴,發(fā)揮并行IO能力(降低目錄路徑解析延遲,降低大目錄訪問延遲,降低數(shù)據(jù)塊訪問延遲)改進(jìn)算法,發(fā)揮計(jì)算部件的并行計(jì)算能力等措施。





















針對文件系統(tǒng)元數(shù)據(jù)一直是文件系統(tǒng)的瓶頸問題,單點(diǎn)元數(shù)據(jù)性能仍然存在很大的提升空間,如沒有充分發(fā)揮IO效能,沒有充分發(fā)揮計(jì)算效能等,本文提出改進(jìn)數(shù)據(jù)結(jié)構(gòu),降低IO之間的依賴,發(fā)揮并行IO能力(降低目錄路徑解析延遲,降低大目錄訪問延遲,降低數(shù)據(jù)塊訪問延遲)改進(jìn)算法,發(fā)揮計(jì)算部件的并行計(jì)算能力等措施。

免責(zé)申明:本號聚焦相關(guān)技術(shù)分享,內(nèi)容觀點(diǎn)不代表本號立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。
電子書<服務(wù)器基礎(chǔ)知識全解(終極版)>更新完畢。
獲取方式:點(diǎn)擊“閱讀原文”即可查看182頁?PPT可編輯版本和PDF閱讀版本詳情。
溫馨提示:
請搜索“AI_Architect”或“掃碼”關(guān)注公眾號實(shí)時(shí)掌握深度技術(shù)分享,點(diǎn)擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。

