東數(shù)西算拉動千億產(chǎn)業(yè),敢啃“硬骨頭”的存儲廠商才更有機會

隨著東數(shù)西算工程的推出,帶來了業(yè)界廣泛長期的討論,特別是在數(shù)據(jù)已經(jīng)成為企業(yè)資產(chǎn)的情況下,針對數(shù)據(jù)存儲領(lǐng)域在東數(shù)西算工程中涌現(xiàn)出來的發(fā)展機會,也備受業(yè)內(nèi)廠商關(guān)注。
01
夯實東數(shù)西算的基石,數(shù)據(jù)存儲首當(dāng)其沖
來自全球分析機構(gòu)IDC的預(yù)測顯示,到2024年中國分布式存儲市場規(guī)模將達到24.6億美元,成為企業(yè)級存儲市場增長的主要驅(qū)動力之一,并為云計算、大數(shù)據(jù)、人工智能等新興應(yīng)用提供主流存儲形態(tài)。
一方面,東數(shù)西算對海量數(shù)據(jù)的需求和運用更廣泛。來自中商產(chǎn)業(yè)研究院發(fā)布的數(shù)據(jù)顯示,中國83.7%的數(shù)據(jù)集中在“胡煥庸線”以東,為此需要通過“東數(shù)西算”工程來改善數(shù)字基建不平衡的布局,對海量數(shù)據(jù)進行合理、優(yōu)化的調(diào)度、存儲與處理,發(fā)揮數(shù)據(jù)資產(chǎn)對行業(yè)數(shù)字化的更大價值。既然“東數(shù)西算”工程的重點就是針對海量數(shù)據(jù),那么針對海量數(shù)據(jù)存儲的創(chuàng)新與應(yīng)用也必然會更多。
另一方面,在東數(shù)西算建設(shè)中,對基礎(chǔ)軟件的投入會更大。據(jù)北京計算機學(xué)會數(shù)字經(jīng)濟專委會秘書長王娟分析指出,“東數(shù)西算”工程共布局了8個國家算力樞紐節(jié)點和10個國家數(shù)據(jù)中心集群。其中,國家樞紐節(jié)點重點建設(shè)任務(wù)就包括服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫、中間件、分布式計算與存儲等基礎(chǔ)設(shè)施的規(guī)模化創(chuàng)新應(yīng)用。

因此,相關(guān)核心基礎(chǔ)軟件在性能、穩(wěn)定性、可靠性、可用性、安全性方面也需要實現(xiàn)更多的創(chuàng)新,才能更好地支持東數(shù)西算工程的未來發(fā)展。特別是海量存儲,作為“東數(shù)西算”數(shù)據(jù)承載與處理的基石,需要數(shù)據(jù)存儲廠商具備深厚的技術(shù)自研能力,才能應(yīng)對諸多高要求。對此,中科曙光存儲事業(yè)部副總經(jīng)理張新鳳分析指出,雖然針對海量數(shù)據(jù)的存儲處理大家都熟悉,但是海量存儲并不是簡簡單單的存儲設(shè)備堆積,特別面向東數(shù)西算這樣的工程,相關(guān)存儲技術(shù)難度呈現(xiàn)出指數(shù)級的增長。
02
四大高要求考驗存儲廠商,敢啃硬骨頭才更有機會
那么,東數(shù)西算給數(shù)據(jù)存儲到底帶來了哪些具體的高要求呢?
一是,安全性要求更高。如前文提到的,東數(shù)西算要實現(xiàn)東西之間的海量數(shù)據(jù)大規(guī)模、跨地域流動,對于數(shù)據(jù)安全性的要求自然更高,畢竟這些數(shù)據(jù)關(guān)系到行業(yè)、企業(yè)發(fā)展的命運。要保障海量數(shù)據(jù)的安全流動,作為數(shù)據(jù)基石的海量存儲系統(tǒng),安全性自然要放在首位。對于國家級數(shù)據(jù)中心,相關(guān)基礎(chǔ)設(shè)施軟硬件的自主研發(fā)程度,核心技術(shù)及底層代碼的掌握程度,對數(shù)據(jù)安全的影響至關(guān)重要。
曙光存儲從一開始就選擇了海量存儲的發(fā)展方向,基于分布式存儲的技術(shù)路線,成為國內(nèi)首批堅持自研分布式存儲的廠商之一,是國內(nèi)為數(shù)不多掌握底層技術(shù)、實現(xiàn)代碼級開發(fā)與優(yōu)化的分布式存儲系統(tǒng)的廠商。其可根據(jù)用戶實際需求,進行定制化的設(shè)計開發(fā),從部件、網(wǎng)絡(luò)、節(jié)點、數(shù)據(jù)冗余等各層面保證數(shù)據(jù)的安全性及系統(tǒng)的穩(wěn)健性,滿足東數(shù)西算工程對海量存儲的更高安全級別的要求。
二是,海量存儲的落地規(guī)模更大。全球分析機構(gòu)IDC預(yù)測,到2025年,中國數(shù)據(jù)總量將達到48.6ZB。隨著東數(shù)西算工程的推進,海量存儲系統(tǒng)規(guī)模化部署的需求更大,PB級將會常態(tài)化,技術(shù)難度將會越來越高。
針對海量存儲系統(tǒng)伴隨的大量客戶端的并發(fā)訪問需求,曙光ParaStor的分布式鎖,能保障所有客戶端數(shù)據(jù)訪問的強一致性,避免對同一文件的并發(fā)讀寫對彼此數(shù)據(jù)的破壞,有效保障高并發(fā)共享訪問場景的順序、秩序與效率;此外,曙光ParaStor通過智能化的技術(shù)來識別硬件的健康狀態(tài),通過高效無感知的自愈技術(shù)和智能化故障預(yù)處理來保證硬件的可靠性;采用多副本、糾刪碼等技術(shù)顯著縮短故障數(shù)據(jù)的重建時間,保障系統(tǒng)真正可靠、高效、穩(wěn)定的運行。
正是跨過了一個又一個的技術(shù)門檻,曙光存儲實現(xiàn)了從最初16PB,到今天的300PB,單一存儲系統(tǒng)規(guī)模已經(jīng)可以滿足“東數(shù)西算”海量存儲的更高要求了。
三是,多種應(yīng)用支持要求更強。東數(shù)西算涉及的海量數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),需要文件存儲、塊存儲、對象存儲、HDFS等多種存儲接口類型。曙光存儲從底層實現(xiàn)協(xié)議互通和融合,滿足對多種應(yīng)用的支持。
2009年,曙光存儲基于POSIX協(xié)議,推出了第一代全自主研發(fā)的分布式存儲系統(tǒng)ParaStor,實現(xiàn)數(shù)據(jù)處理的高性能體驗。2013年,完成了對NAS共享的協(xié)議支持,助力數(shù)據(jù)中心的規(guī)模化部署。2019年,開啟了分布式塊協(xié)議支持,助力企業(yè)用戶的業(yè)務(wù)上云。
而今,曙光ParaStor單一存儲節(jié)點同時支持文件、塊、對象、HDFS四種存儲服務(wù),3節(jié)點存儲集群即可承載非結(jié)構(gòu)化與結(jié)構(gòu)化數(shù)據(jù)業(yè)務(wù),消除存儲設(shè)備多樣性及管理復(fù)雜性,實現(xiàn)海量異構(gòu)數(shù)據(jù)統(tǒng)一納管。為了滿足對象應(yīng)用,曙光存儲對IO協(xié)議棧進行極簡優(yōu)化,實現(xiàn)了單桶千億KB級小對象的存儲能力,存儲集群百萬級TPS吞吐性能可達到業(yè)內(nèi)領(lǐng)先水平,滿足云生態(tài)的應(yīng)用需求。同時,提供原生HDFS接口,無任何協(xié)議損耗,無縫接入大數(shù)據(jù)平臺,實現(xiàn)高性價比的大數(shù)據(jù)存算分離解決方案。
四是,節(jié)能低碳要求更綠色。在綠色節(jié)能策略方面,已經(jīng)成為行業(yè)發(fā)展的共識,促進東數(shù)西算發(fā)展的同時,數(shù)據(jù)存儲系統(tǒng)需要在技術(shù)創(chuàng)新上聚焦綠色節(jié)能的雙碳發(fā)展趨勢。張新鳳透露,在2022年,曙光存儲會推出一套液冷的分布式存儲,采用冷板的設(shè)計,再加上前端曙光液冷的計算節(jié)點,從而形成一體化的液冷方案,PUE可達1.04。
由此可見,唯有長期的自研技術(shù)積累,真正啃過存儲技術(shù)硬骨頭,才能真正應(yīng)對東數(shù)西算帶來海量存儲四大高要求的挑戰(zhàn)。
03
加速存儲產(chǎn)業(yè)升級,迎接自研存儲發(fā)展新機遇
當(dāng)然,東數(shù)西算對產(chǎn)業(yè)發(fā)展的影響與意義都是巨大的。
一方面,通過優(yōu)化東西部之間的整體資源配比,加速信息建設(shè)結(jié)構(gòu)的優(yōu)化與調(diào)整,改善數(shù)據(jù)中心的存儲、計算和網(wǎng)絡(luò)的資源配比,更重視數(shù)據(jù)和存儲系統(tǒng)在數(shù)字化轉(zhuǎn)型中的創(chuàng)新作用。
另一方面,加速存儲產(chǎn)業(yè)不斷升級。之前,國內(nèi)IT行業(yè)以發(fā)展業(yè)務(wù)為核心,“重應(yīng)用、輕基礎(chǔ)設(shè)施”。在東數(shù)西算的高質(zhì)量要求和發(fā)展下,IT行業(yè)需要構(gòu)建新的數(shù)字基建體系,必然要求應(yīng)用與基礎(chǔ)設(shè)施“兩手抓兩手都要硬”。為此,基礎(chǔ)軟件產(chǎn)業(yè)、存儲產(chǎn)業(yè)、計算產(chǎn)業(yè)、網(wǎng)絡(luò)產(chǎn)業(yè)都將迎來快速發(fā)展。尤其是有核心技術(shù)的存儲廠商,在新一輪的存儲產(chǎn)業(yè)升級過程中,將發(fā)揮出前所未有的產(chǎn)業(yè)生態(tài)作用,助力東數(shù)西算工程,推進數(shù)字經(jīng)濟高質(zhì)量發(fā)展。
一個不爭的事實已經(jīng)表明,自研存儲“馬太效應(yīng)”日益凸顯,越是有技術(shù)積累,堅持長期自研的存儲廠商,將獲得越來越多的行業(yè)資源。大家也可以看到,在國內(nèi)存儲廠商中,堅持自研“敢啃硬骨頭”的越來越多了。隨著他們掌握的存儲核心技術(shù)越來越成熟,帶動服務(wù)支持能力也將越來越強,實現(xiàn)行業(yè)應(yīng)用也將越來越廣泛。這些勇立潮頭且堅持長期自研的存儲企業(yè),必將脫穎而出,對存儲產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化與升級帶來積極的影響與推動作用。借助東數(shù)西算的發(fā)展東風(fēng),基于自研存儲創(chuàng)新動力,牢牢把握海量新數(shù)據(jù)時代的發(fā)展大趨勢,以曙光存儲為代表的自研存儲廠商必將有一番新的大作為。
(by Aming)


