SCM新介質(zhì)未來方向思考和探討


Storage Class Memory (SCM)是非易失性內(nèi)存,該類介質(zhì)的存取速度略比內(nèi)存慢,但是遠快于NAND類介質(zhì)。本文對該類介質(zhì)的特性及使用方法做了簡單總結(jié)和介紹。

PRAM(Phase-Change RAM)利用特殊合金材料在晶態(tài)和非晶態(tài)下的導電性差異來表示0或者1數(shù)據(jù)。其優(yōu)點是結(jié)構(gòu)簡單,容易實現(xiàn)大容量、同時具備低成本等特點。
主要用于Cache加速和Cache內(nèi)存應用,考慮到PRAM的成熟度、對熱度敏感和寫穿透等因素,在應用中一般搭配DRAM或SRAM一起使用,在填補RAM和Storage之間的性能、容量差距的同時,形成具有分級能力的高速Cache應用資源池;其典型代表為Intel的3D Xpoint。
ReRAM(Resistive RAM)通過在上下電極間施加不同的電壓,控制Cell內(nèi)部導電絲的形成和熔斷的狀態(tài)對外呈現(xiàn)不同的阻抗(憶阻器)值來表示數(shù)據(jù);目前典型代表廠商為HPE和Crossbar。

HPE提出了憶阻器內(nèi)存技術(shù),并計劃在新型計算機架構(gòu)The Machine中使用,未來成為取代SRAM、DRAM形成通用內(nèi)存(Universal Memory),主流的SCM技術(shù)如下:

隨著大數(shù)據(jù)時代的到來,以及多核、分布式、內(nèi)存計算、云等技術(shù)的不斷發(fā)展,應用場景對存儲系統(tǒng)的要求越來越高,SCM技術(shù)的出現(xiàn)為存儲系統(tǒng)的發(fā)展提供了新的路徑。在未來,新型非易失存儲介質(zhì)將進一步在計算機存儲系統(tǒng)中嶄露頭角,特別是當前Intel已經(jīng)推出了它的SCM技術(shù)——3D XPoint,而針對以此為代表的SCM介質(zhì)在系統(tǒng)級的應用,仍有很多挑戰(zhàn)性的問題需要深入研究,這些研究,將可能從以下幾個方面展開,特此交流探討,以啟發(fā)我們對未來存儲系統(tǒng)以及未來上層應用的思考(本文中討論的研究方向不涉及介質(zhì)自身的研究和芯片級別的研究):
1、基于SCM的存儲系統(tǒng)的組織結(jié)構(gòu)方法研究
當前存儲系統(tǒng)的組織結(jié)構(gòu)是專為易失、讀寫差異小、幾乎無壽命問題的DRAM以及傳統(tǒng)的硬盤、NAND等存儲介質(zhì)而設計的,這種系統(tǒng)組織結(jié)構(gòu)對于SCM而言是不適用的,無論是當前的內(nèi)存管理方法、訪問接口設計,還是I/O請求調(diào)度等都沒有充分考慮SCM的缺點,比如典型的SCM介質(zhì)PCRAM(相變存儲器),其壽命、性能、讀寫不均衡等問題,都會導致當前技術(shù)不能夠充分發(fā)揮介質(zhì)的特性,同時還可能會將介質(zhì)的弱點放大,不利于構(gòu)建面向未來大數(shù)據(jù)和內(nèi)存計算環(huán)境的高性能低功耗、大容量的存儲系統(tǒng)。
如上所述,從SCM、DRAM、NAND Falsh等多種介質(zhì)的優(yōu)缺點出發(fā),研究SCM在異構(gòu)混合存儲系統(tǒng)中的組織方法,合理組合多種存儲介質(zhì),構(gòu)建多介質(zhì)的異構(gòu)混合存儲環(huán)境,建立可以充分發(fā)揮各存儲介質(zhì)特性的體系結(jié)構(gòu),解決多介質(zhì)異構(gòu)混合存儲時的系統(tǒng)優(yōu)化設計問題,實現(xiàn)新型非易失存儲器與現(xiàn)有存儲技術(shù)和系統(tǒng)的完美融合。
2、基于SCM的存儲系統(tǒng)的訪問方法研究
研究基于SCM存儲系統(tǒng)的多接口適配的訪問方法,以匹配新型非易失存儲器的特性,從而隱藏多介質(zhì)在訪問粒度、延遲、帶寬及壽命等方面的差距,提升存儲系統(tǒng)的性能。未來研究將可能包括:
①研究SCM在內(nèi)存環(huán)境中字節(jié)粒度尋址的讀寫訪問方法,充分挖掘SCM通道間、芯之間以及芯片內(nèi)部的多層次訪問并行性;
②研究在外存環(huán)境中塊粒度尋址的高效讀寫訪問方法,并遵循業(yè)界針對非易失存儲器的接口標準(如NVMe協(xié)議);
③優(yōu)化訪問路徑,減少系統(tǒng)I/O調(diào)用給性能帶來的影響;
④利用SCM的讀寫特點來優(yōu)化讀寫操作和流程,以此減少訪問延遲;
⑤立足SCM特性優(yōu)化系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu),減少對SCM無用的寫操作和寫入數(shù)據(jù)量,以提升系統(tǒng)性能和壽命。
3、基于SCM的存儲系統(tǒng)數(shù)據(jù)可靠性研究
隨著工藝制程的降低,非易失存儲器的存儲單元不斷變小,當SCM采用更小制程、提供更高存儲密度和更大容量時,其存儲單元的錯誤率隨之升高.同時,SCM存儲單元的可擦寫次數(shù)有限(108~1012),頻繁的擦寫會導致芯片單元很快到達壽命極限.這些將使存儲系統(tǒng)面臨數(shù)據(jù)發(fā)生錯誤、損壞以及丟失的風險,對數(shù)據(jù)可靠性造成了極大的威脅。
未來的研究將立足于SCM的特性,通過多種途徑來保障數(shù)據(jù)的可靠性,研究將可能在以下幾個方面展開:
①研究降低當前已有的糾錯機制(軟硬件)所需的開銷;
②研究可配置、適應數(shù)據(jù)集屬性的組合校驗算法,即區(qū)別不同屬性的數(shù)據(jù)集,根據(jù)其所需的可靠性需求采用不同糾錯能力和開銷的校驗算法,以平衡其糾錯強度和校驗開銷;
③研究新的通過減少寫操作次數(shù)、寫入數(shù)據(jù)量來提升SCM的壽命的策略;
④研究新穎、可用范圍廣的磨損均衡策略,在現(xiàn)有磨損均衡基礎上進行創(chuàng)新、優(yōu)化,設計出可應用于不同需求環(huán)境下的磨損均衡策略,提升SCM壽命;
⑤研究基于SCM的壞塊復用和數(shù)據(jù)容錯機制,進一步增加SCM的使用壽命,提高數(shù)據(jù)可靠性;
⑥研究數(shù)據(jù)一致性的保障和維護,根據(jù)存儲系統(tǒng)數(shù)據(jù)一致性需求、訪問接口粒度等因素,設計低開銷、多路徑的數(shù)據(jù)更新策略和數(shù)據(jù)一致性維護方法。
4、基于SCM的存儲系統(tǒng)數(shù)據(jù)安全性保障研究
由于SCM具有非易失性,即當系統(tǒng)斷電時,SCM存儲的數(shù)據(jù)并不會消失,從而通過惡意修改數(shù)據(jù)所導致的執(zhí)行狀態(tài)可能是持久的,即使設備斷電,系統(tǒng)也會存在冷啟動攻擊的風險.因此非易失特性會使系統(tǒng)被入侵和數(shù)據(jù)被盜竊的風險增大.所以當采用SCM構(gòu)建內(nèi)存子系統(tǒng)時,需要考慮數(shù)據(jù)的安全性保障機制。
對此,未來該領域還需要研究針對操作系統(tǒng)的加密機制,通過加密模塊對寫入SCM的數(shù)據(jù)進行加密,防止存儲數(shù)據(jù)被竊取或泄密的情況發(fā)生;研究利用訪問權(quán)限控制等策略來保證數(shù)據(jù)的訪問安全性;特別針對PCM中的系統(tǒng)關(guān)鍵數(shù)據(jù),需采用強度更高的加密、上鎖等算法,防止惡意的入侵修改所引起的系統(tǒng)安全問題,保障基于SCM的存儲系統(tǒng)的數(shù)據(jù)安全性。
5、基于SCM的存儲系統(tǒng)軟件優(yōu)化研究
由于SCM異于傳統(tǒng)存儲介質(zhì)的特性,使得SCM存儲技術(shù)不能良好地兼容當前存儲系統(tǒng)的內(nèi)存管理、文件系統(tǒng)等軟件架構(gòu)。基于SCM的存儲系統(tǒng),在軟件層仍然需要改進,以進一步優(yōu)化和提升存儲系統(tǒng)的性能。
未來基于SCM的存儲系統(tǒng)軟件優(yōu)化研究將可能包括:
①結(jié)合各存儲介質(zhì)的特性,基于SCM存儲管理架構(gòu),研究冷熱數(shù)據(jù)識別算法和數(shù)據(jù)熱度分級管理等軟件策略,降低存儲系統(tǒng)中的讀寫操作開銷,實現(xiàn)負載均衡;
②立足于SCM在存儲系統(tǒng)中的應用場景(如統(tǒng)一內(nèi)外存),針對SCM支持本地修改、位修改和可字節(jié)編址等特性,研究適應于SCM的文件系統(tǒng),從而提升文件系統(tǒng)乃至存儲系統(tǒng)的性能;
③研究基于SCM的內(nèi)存分配機制及其優(yōu)化策略,從操作系統(tǒng)層入手面向文件系統(tǒng)、虛擬內(nèi)存等進行優(yōu)化,降低頁面分配等多種內(nèi)存管理開銷,充分地利用SCM的非易失性提高系統(tǒng)性能;
④研究設計新的軟件調(diào)度算法,通過調(diào)度策略的設計和優(yōu)化,達到系統(tǒng)性能的提升。
6、基于SCM的存儲硬件原型系統(tǒng)的研究
由于真正的SCM芯片還沒實現(xiàn)市場的量產(chǎn),目前也就只有Intel的ColdStream問世,因此現(xiàn)有的研究還面臨著幾乎沒有可用的基于SCM的真實硬件原型平臺的尷尬局面,絕大多數(shù)研究均是在軟件模擬器上進行的,當前比較成熟的模擬器有PCRAMsim、Simics、M5和DRAMsim以及近些年備受學者青睞的全系統(tǒng)模擬器GEM5。
由于SCM技術(shù)研究還處于起步階段,其應用場景和價值尚未完全開發(fā)實現(xiàn);而且目前市面上的主流存儲器仍然不是SCM,適合于當前存儲環(huán)境的大容量、高性能的SCM物理芯片稀貴,這些都導致當前系統(tǒng)級的研究幾乎全都是基于軟件模擬器進行的,從而無法獲取最真實的實驗數(shù)據(jù)以進行更加專業(yè)、深入的研究。
利用SCM物理芯片,實現(xiàn)真實的存儲硬件原型系統(tǒng),包括基于SCM的內(nèi)存原型系統(tǒng)和外存原型系統(tǒng),甚至于搭建基于SCM的專用硬件系統(tǒng),比如基于SCM的DIMM條,基于SCM的全新硬件框架,基于SCM的高速通信通道等等,以解決目前相關(guān)研究沒有原型平臺的尷尬局面,通過在平臺上獲得最真實的數(shù)據(jù),展開更有說服力、有數(shù)據(jù)依據(jù)的相關(guān)研究,將對當前內(nèi)/外存儲系統(tǒng)架構(gòu)的研究工作起到積極作用。
7、基于SCM的事務性存儲系統(tǒng)研究
事物存儲技術(shù)作為存儲領域最為關(guān)鍵的技術(shù)之一,幾乎被應用于所有數(shù)據(jù)庫系統(tǒng)與文件系統(tǒng)。隨著閃存等介質(zhì)的廣泛應用,存儲體系結(jié)構(gòu)正面臨著較大的變革,在這種背景下;因此在SCM技術(shù)的到來的背景下,研究基于SCM的事務性存儲系統(tǒng)比較迫切。
針對目前SCM介質(zhì)應用于事務處理技術(shù),如下幾個問題還需要進一步探索和研究:
①事務存儲接口:如何提高實用性且支持不同特性事務的設備接口;
②數(shù)據(jù)可用性:如何高效迅速的進行故障恢復;
③系統(tǒng)可擴展性:分布式環(huán)境下,如何利用SCM提供高效的事務處理,多核環(huán)境下的分布式系統(tǒng)中如何提供更加優(yōu)秀的日志等技術(shù)能力;
④數(shù)據(jù)可靠性:如何保證新介質(zhì)中數(shù)據(jù)的可靠性持久化能力等等。
8、基于SCM的上層應用研究
在上述研究內(nèi)容的背景下,顯而易見可以看出SCM的多種優(yōu)勢都將會給未來的存儲系統(tǒng)以及計算機其他技術(shù)領域帶來變革,那么,面向SCM技術(shù)的內(nèi)存數(shù)據(jù)庫、面向SCM技術(shù)的實時分析應用、面向SCM技術(shù)的內(nèi)存計算技術(shù)、面向SCM的大數(shù)據(jù)服務等等,都將可能會因為SCM的到來,有了新的機會和變革窗口。
這些領域的研究,最直接的,比如考慮將當前的存儲介質(zhì)全部換成SCM后,在性能得到收益的同時,應該如何應對新的問題,將是未來的研究重點。
9、結(jié)語
綜上所述,面對新應用環(huán)境的需求,思考如何在存儲系統(tǒng)領域的設計中充分利用SCM的優(yōu)勢,并通過新的機制和策略來克服它們的劣勢,與現(xiàn)有存儲系統(tǒng)融合并獲得更加優(yōu)秀的性能,從而最大限度地匹配以數(shù)據(jù)為中心的發(fā)展趨勢和面向大數(shù)據(jù)背景的上層應用服務,將是未來的主要工作之一。

轉(zhuǎn)載申明:轉(zhuǎn)載本號文章請注明作者和來源,本號發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系處理,謝謝。
推薦閱讀
更多架構(gòu)相關(guān)技術(shù)知識總結(jié)請參考“架構(gòu)師全店鋪技術(shù)資料打包”相關(guān)電子書(37本技術(shù)資料打包匯總詳情可通過“閱讀原文”獲取)。
全店內(nèi)容持續(xù)更新,現(xiàn)下單“全店鋪技術(shù)資料打包(全)”,后續(xù)可享全店內(nèi)容更新“免費”贈閱,價格僅收198元(原總價350元)。
溫馨提示:
掃描二維碼關(guān)注公眾號,點擊閱讀原文鏈接獲取“架構(gòu)師技術(shù)全店資料打包匯總(全)”電子書資料詳情。

