全球存儲(chǔ)觀察|DNA存儲(chǔ)發(fā)展簡(jiǎn)史(技術(shù)風(fēng)云錄)
?
每一次技術(shù)創(chuàng)新
都需要第一個(gè)吃螃蟹的人
堅(jiān)持再堅(jiān)持堅(jiān)持十年二十年冷板凳
甚至三十年,或更久……
我們看看DNA存儲(chǔ)發(fā)展的歷史
或許很驚訝
但或許會(huì)看到新的希望
【全球存儲(chǔ)觀察 | 科技熱點(diǎn)關(guān)注】
我非常好奇|為何法國(guó)人對(duì)DNA存儲(chǔ)有著濃厚興趣?
據(jù)外媒消息稱,法國(guó)初創(chuàng)公司Biomemory推出了商業(yè)化的DNA存儲(chǔ)產(chǎn)品,1KB存儲(chǔ)空間需要1000美元。這種DNA卡比標(biāo)準(zhǔn)硬盤貴了了不知道多少倍。1TB硬盤市場(chǎng)零售價(jià)也就幾百元人民幣,幾十美元而已。
預(yù)計(jì)到2030年Biomemory將實(shí)現(xiàn)EB級(jí)的DNA存儲(chǔ)“陣列”。
暢想未來,碳基和硅基將在數(shù)據(jù)存儲(chǔ)領(lǐng)域并駕齊驅(qū)了么?
來仔細(xì)看看這個(gè)DNA存儲(chǔ)的消息,如下:
當(dāng)然,DNA存儲(chǔ)由于其高存儲(chǔ)密度與低能耗處理等特點(diǎn),被視為一種極具潛力的存儲(chǔ)技術(shù),成為應(yīng)對(duì)數(shù)據(jù)存儲(chǔ)增長(zhǎng)挑戰(zhàn)的新機(jī)遇。只是價(jià)格目前不容易普惠,DNA存儲(chǔ)的讀寫成本都不低。
所以,我們可以看到目前全球第一款DNA存儲(chǔ)商業(yè)化產(chǎn)品售價(jià)1Kb就要1000美元,約合人民幣8000多元。所以DNA存儲(chǔ)絕對(duì)昂貴,所以也絕對(duì)冷門。你看全球存儲(chǔ)界扛把子Dell EMC都從來木有碰過,全球愿意坐冷板凳善于基礎(chǔ)研究的IBM也么有碰過,其中的難,是真的難。
盡管如此貴,但法國(guó)這家初創(chuàng)公司創(chuàng)始人依然非常憧憬未來?,F(xiàn)在1KB要1000美元,2026年100PB,需要花150000美元,2030年1000PB+……業(yè)內(nèi)人士對(duì)此評(píng)論到,會(huì)不會(huì)希望越大失望越大。
但是技術(shù)進(jìn)步,確實(shí)需要令人難以置信的堅(jiān)持,真正的創(chuàng)新才會(huì)最終出現(xiàn)。
為此,Biomemory在DNA數(shù)據(jù)存儲(chǔ)方面不斷取得重大進(jìn)展。對(duì)外透露消息說已經(jīng)開始建造專為數(shù)據(jù)中心中的合成DNA數(shù)據(jù)存儲(chǔ)而設(shè)計(jì)的機(jī)器,第一個(gè)模型能夠自主操作,將于2026年首次亮相。更先進(jìn)的版本預(yù)計(jì)在2030年將超過EB級(jí)存儲(chǔ)。
最近,Biomemory推出了一款B2C產(chǎn)品,以展示其技術(shù)的能力和商業(yè)準(zhǔn)備。這一初始產(chǎn)品不僅證明了Biomemory的技術(shù)成熟度,而且還作為探索各種用例的橋梁。
當(dāng)前,Biomemory實(shí)驗(yàn)室規(guī)模擴(kuò)大了兩倍,吸引了新的人才,并在行業(yè)內(nèi)建立了戰(zhàn)略合作伙伴關(guān)系。
隨著Biomemory的首款產(chǎn)品DNA卡投放市場(chǎng),證實(shí)了一個(gè)事實(shí)就是DNA數(shù)據(jù)存儲(chǔ)本身正在迅速發(fā)展。
那對(duì)于DNA存儲(chǔ)的發(fā)展,你以為如何呢?
再看看國(guó)內(nèi)DNA存儲(chǔ)的發(fā)展消息,在2022年左右,天津大學(xué)元英進(jìn)院士帶領(lǐng)的合成生物學(xué)科研團(tuán)隊(duì)創(chuàng)新DNA存儲(chǔ)算法,將十幅敦煌壁畫存入DNA中,通過實(shí)驗(yàn)驗(yàn)證壁畫信息在實(shí)驗(yàn)室常溫下可保存千年。這一算法支持DNA分子成為世界上最可靠的數(shù)據(jù)存儲(chǔ)介質(zhì)之一,可以讓面臨老化破損危機(jī)的人類文化遺產(chǎn)信息保存千年萬年。只是在實(shí)驗(yàn)室中實(shí)現(xiàn),并未做產(chǎn)品商業(yè)化準(zhǔn)備。
從實(shí)驗(yàn)室到商業(yè)化產(chǎn)品,這之間的距離,做產(chǎn)品的人應(yīng)該都深有體會(huì)。還有很長(zhǎng)一段路要走吧。
進(jìn)一步分析來看,有朋友非常斷定地說:存儲(chǔ)作為需求會(huì)永遠(yuǎn)存在,但是,這種需求的載體會(huì)不斷變化。
不過呀,更有興趣的朋友,不妨可以繼續(xù)讀讀下面有關(guān)DNA存儲(chǔ)發(fā)展歷史的三篇“老掉牙”文章。
▼ ▼ ▼
技術(shù)風(fēng)云錄|基于DNA的存儲(chǔ)系統(tǒng)距離我們還有多遠(yuǎn)?
阿明 全球存儲(chǔ)觀察 2016-04-30

存儲(chǔ)技術(shù)的發(fā)展,以存儲(chǔ)介質(zhì)的發(fā)展所驅(qū)動(dòng)著,年復(fù)一年,再年復(fù)一年。EMBL-EBI成員、哈佛醫(yī)學(xué)院教授、著名遺傳學(xué)家George Church的團(tuán)隊(duì)一篇有關(guān)DNA存儲(chǔ)信息的論文,帶給了人類新的希望。
從磁帶、光盤、磁盤和閃存,每一種存儲(chǔ)介質(zhì)的出現(xiàn)都對(duì)存儲(chǔ)技術(shù)有著劃時(shí)代的意義,那么近年大家十分關(guān)注基于DNA的存儲(chǔ)到底距離我們還有多遠(yuǎn)呢?
首先我們先來摸清楚
DNA存儲(chǔ)的定義和概念
DNA存儲(chǔ)的原理是為核酸中的堿基賦予二進(jìn)制值,隨后通過微流體芯片對(duì)基因序列合成,從而使該序列與相關(guān)數(shù)據(jù)集相匹配。1立方毫米即可存儲(chǔ)704TB的數(shù)據(jù),相當(dāng)于數(shù)百個(gè)硬盤的容量。
DNA存儲(chǔ)方式是采用DNA雙螺旋結(jié)構(gòu)上有4個(gè)核堿基,開發(fā)定制代碼,DNA數(shù)字存儲(chǔ)系統(tǒng)首先把硬盤信息中的二進(jìn)制數(shù)翻譯成定制代碼,然后借助標(biāo)準(zhǔn)DNA合成機(jī)器制造出相應(yīng)的堿基序列。
這一序列并非一個(gè)長(zhǎng)分子,而是多個(gè)重復(fù)片段,每一個(gè)片段攜帶一些索引細(xì)節(jié),明確各自在整體序列中所處位置。分子生物學(xué)實(shí)驗(yàn)室用來讀取生物體DNA的標(biāo)準(zhǔn)設(shè)備可以讀取信息,當(dāng)即呈現(xiàn)在電腦屏幕上。
可見,DNA存儲(chǔ)技術(shù)的與傳統(tǒng)的存儲(chǔ)技術(shù)不同,傳統(tǒng)的電子存儲(chǔ)是基于0、1這兩個(gè)符號(hào)的組合,而DNA有A、T、C、G4個(gè)堿基,在編碼上就比傳統(tǒng)的二進(jìn)制存儲(chǔ)多了許多可能。
再看看DNA存儲(chǔ)發(fā)展歷史
實(shí)際上,DNA存儲(chǔ)與計(jì)算的研究已經(jīng)持續(xù)了近30年,來自《數(shù)據(jù)存儲(chǔ)的未來:把宇宙寫進(jìn)DNA里》文章介紹說,早在1986年,麻省理工學(xué)院一位被稱為科學(xué)狂人的科學(xué)家Joe Davis就成功將5×7像素的圖片編碼到DNA中。
1994年 ,美國(guó)南加州大學(xué)教授雷納德·阿德勒曼(L.Adleman)博士在《科學(xué)》雜志上發(fā)表一篇題為《組合問題的生物電腦解決方案》的論文,首次提出分子計(jì)算機(jī),即用DNA分子構(gòu)建電腦的設(shè)想。阿德勒曼指出,DNA電腦將采用其本身的“語言”,以四進(jìn)制系統(tǒng)來編碼,與“人工生命”的研究范疇將融合在一起。今后的工程技術(shù)人員應(yīng)該接受更加廣泛的科學(xué)教育,使自己成為“通才”,全面掌握數(shù)學(xué)、物理、化學(xué)、生物學(xué)和計(jì)算機(jī)科學(xué)知識(shí),才能做出更多的發(fā)明和創(chuàng)新。
2001年 ,以色列科學(xué)家成功研制成世界第一臺(tái)DNA計(jì)算機(jī),它的輸出、輸入和軟硬件全由在活性有機(jī)體中儲(chǔ)存和處理編碼信息的DNA分子組成。雖然該計(jì)算機(jī)不過一滴水大小,但這已顯示出未來DNA計(jì)算機(jī)的雛形。吉尼斯世界紀(jì)錄稱之為“最小的生物計(jì)算設(shè)備”。隨后幾年,以色列科學(xué)家對(duì)DNA計(jì)算機(jī)進(jìn)行了改進(jìn),當(dāng)時(shí)的運(yùn)行速度已高達(dá)每秒330萬億次。
2004年 ,來自《南方周末》徐彬的文章報(bào)道說,中國(guó)上海交大Bio-X生命科學(xué)研究中心馮國(guó)鄞稱已在試管中完成了DNA計(jì)算機(jī)的雛形研制工作,論文發(fā)表在中國(guó)《科學(xué)通報(bào)》49卷第1期英文版上。
2007年 ,日本科學(xué)家成功使用細(xì)菌DNA儲(chǔ)存數(shù)據(jù)。
2011年 6月,深圳特區(qū)報(bào)報(bào)道稱,新加坡南洋理工大學(xué)舒建軍教授在《物理評(píng)論快報(bào)》(Physical Review Letters )發(fā)表了他的最新研究成果,稱他的團(tuán)隊(duì)提出了一種通過操縱DNA鏈能解決基于DNA計(jì)算的戰(zhàn)略分配問題。在實(shí)驗(yàn)?zāi)P椭?,DNA分子用來存儲(chǔ)與計(jì)算目的相關(guān)的信息。當(dāng)前使用的計(jì)算機(jī)芯片都是硅計(jì)算依靠二進(jìn)制,即1和0。而通過DNA計(jì)算,除了1和0以外,你還可以做的更多。DNA由AGTC四種堿基組成,這可以形成更多的排列。DNA計(jì)算將有潛力處理模糊數(shù)據(jù),超越數(shù)位數(shù)據(jù)。
2012年 ,臺(tái)灣國(guó)立清華大學(xué)和德國(guó)一研究所合作,用三文魚的DNA制造出單次寫入、多次讀取的存儲(chǔ)器。
但是,取得階段性實(shí)質(zhì)進(jìn)展的,卻是來自英國(guó)的一個(gè)EMBL-EBI的科學(xué)家團(tuán)隊(duì)。歐洲生物信息研究所(EMBL-EBI)全稱EMBL - European Bioinformatics Institute,是一個(gè)非盈利性的學(xué)術(shù)機(jī)構(gòu),致力于以信息學(xué)手段解答生命科學(xué)問題。EMBL-EBI建立于1994年,位于英國(guó)劍橋南部的維康信托基因園,是歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL,全稱EuropeanMolecular Biology Laboratory)的一部分。

2012年9月 ,歐洲生物信息研究所Ewan Birney和哈佛醫(yī)學(xué)院教授、著名遺傳學(xué)家George Church的團(tuán)隊(duì)在Science雜志上發(fā)表《Towards practical, high-capacity, low-maintenance information storage in synthesized DNA》即《邁向?qū)嵱酶咝艿捅pB(yǎng)的合成DNA存儲(chǔ)信息》文章表示,他們將一本5.34萬字的書籍、11張圖片和一段Java程序存進(jìn)了不到一沙克(億萬分之一克)DNA中!有人根據(jù)這個(gè)比例換算得出,1克DNA將能存儲(chǔ)700TB數(shù)據(jù),相當(dāng)于1.4萬張藍(lán)光光盤,或233個(gè)3TB的硬盤。而George Church教授則表示:“今后,拇指大小的設(shè)備或許就能存下整個(gè)互聯(lián)網(wǎng)的信息。”

從EBI官方網(wǎng)站上可以查詢到,George Church也是EMBL-EBI的一員,并且還有聯(lián)系電話。
同樣在2013年,阿根廷科學(xué)家近日成功將該國(guó)國(guó)歌旋律以人工基因編碼形式植入某種細(xì)菌染色體中。
那么,按照George Church的做法,將二進(jìn)制信息翻譯成某個(gè)中間代碼,再通過微流體芯片對(duì)基因序列進(jìn)行合成,從而使該序列的位置與相關(guān)數(shù)據(jù)集相匹配,方便讀取。
George Church基于DNA存儲(chǔ)
到底如何實(shí)現(xiàn)呢?
來自東方早報(bào)的《存儲(chǔ)數(shù)碼信息的DNA》的文章給予了詳細(xì)介紹,這里摘錄如下:
首先, 把電子文件的二進(jìn)制碼(0,1)翻譯成三進(jìn)制碼(0,1,2);然后,用由DNA四個(gè)堿基(分別以它們的學(xué)名首字母A、T、C、G代表)構(gòu)成的一套特定編碼和規(guī)則,將二進(jìn)制碼編譯成一個(gè)DNA碼序列。接著,以每25個(gè)堿基向后錯(cuò)位的方式,把這個(gè)DNA序列切割成若干個(gè)含100個(gè)堿基的等長(zhǎng)片段,直至整個(gè)序列的所有內(nèi)容都獲得四個(gè)副本(例如:1,2,3,4;2,3,4,1;3,4,1,2;4,1,2,3)。這樣一來,當(dāng)任何一個(gè)副本出錯(cuò)時(shí),有另外三個(gè)副本可供參考認(rèn)證,可謂萬無一失。為了確定這些等長(zhǎng)片段在這個(gè)DNA序列中的準(zhǔn)確位置,George Church團(tuán)隊(duì)給它們各自的首尾加上了索引標(biāo)識(shí)。
用DNA編碼編好電子文件后,再用專門設(shè)備做DNA合成,信息寫錄就完成了。取用合成DNA中的信息時(shí),先把合成DNA放入標(biāo)準(zhǔn)化學(xué)試劑,然后用DNA測(cè)序儀,根據(jù)索引標(biāo)識(shí),將各個(gè)片段依序粘接成原DNA碼序列,再譯回二進(jìn)制碼,形成電子文件,就大功告成了。George Church團(tuán)隊(duì)十分謹(jǐn)慎,在編碼設(shè)計(jì)中不惜繁瑣,引入多重防錯(cuò)檢錯(cuò)機(jī)制,為的是保證編輯和解讀復(fù)原達(dá)到零誤差。
編碼設(shè)計(jì)好之后 ,George Church團(tuán)隊(duì)用了五個(gè)不同類型的電子文件做測(cè)試:
一段26秒鐘長(zhǎng)的馬丁·路德·金《我有一個(gè)夢(mèng)想》演講錄音;
一篇關(guān)于DNA結(jié)構(gòu)的經(jīng)典學(xué)術(shù)論文的PDF文件;
莎士比亞十四行詩全篇,一張EBI大樓的彩色照片;
以及一段這次試驗(yàn)使用的軟件算法(Huffman編碼)。信息總量不大,約739千字節(jié),著重檢驗(yàn)編碼對(duì)不同信息形式、內(nèi)容以及格式的適用能力。
DNA的存儲(chǔ)能力的確驚人,當(dāng)裝著這五個(gè)文件的合成DNA的試管送到George Church手中,他看了半天,竟然什么也沒找到。還是經(jīng)同事指點(diǎn),才發(fā)現(xiàn)試管底部那顆灰塵般大小的DNA。
然后, George Church團(tuán)隊(duì)用DNA測(cè)序儀,把合成DNA中的信息復(fù)原為電子文件。結(jié)果令人振奮:它與原始電子文件的重合率為100%。不過這100%跟著一段有驚無險(xiǎn)的小插曲。在DNA測(cè)序時(shí),PDF文件中的兩個(gè)25堿基小節(jié)不見了。
缺了它們,就會(huì)出現(xiàn)誤差,這是絕對(duì)不能容忍的。好在編碼為每個(gè)小節(jié)提供了四個(gè)副本,根據(jù)副本,編碼準(zhǔn)確地完成了復(fù)原任務(wù)。這次歪打正著,證明了該編碼防錯(cuò)的優(yōu)越性能。
還好,George Church團(tuán)隊(duì)很快找到了丟失的原因,George Church博士保證,只需稍微修改一下程序,類似問題以后不會(huì)再發(fā)生了。
George Church團(tuán)隊(duì)的論文精華解讀
《Towards practical, high-capacity, low-maintenance information storage in synthesized DNA》 的論文中有兩個(gè)圖可以值得研究一下。
一是DNA的數(shù)字信息編碼圖。

數(shù)字信息(a,藍(lán)色)部分,這里的三進(jìn)制數(shù)字的ASCII碼是莎士比亞十四行詩第18,采用Huffman編碼,轉(zhuǎn)化為(b,紅色)用五或六base-3編碼代替每個(gè)字節(jié)。這也是DNA編碼的轉(zhuǎn)換在硅片(c,綠色),由不同于之前使用過的三個(gè)核苷酸來替換,并確保沒有homopolymers同聚物生成。在此基礎(chǔ)上形成的大量的副本,產(chǎn)生四倍冗余(d,綠色,采用紫色的備用段反向補(bǔ)充增強(qiáng)數(shù)據(jù)安全性)。增加了索引DNA編碼(黃)的索引基因,也被編碼為不重復(fù)的DNA核苷酸。
二是,基于DNA的存儲(chǔ)的穩(wěn)定性和Scaling特性描述圖

從這個(gè)圖可以看出,圖a表示編碼效率情況,即針對(duì)存儲(chǔ)信息量增加時(shí)編碼效率和成本變化?!凛S表示被編碼的信息總數(shù)。標(biāo)注了常見的數(shù)據(jù)字節(jié)容量:
1MB\1GB\1TB\1PB\1EB\3ZB(2014年估計(jì)全球數(shù)據(jù)信息量)……。
黑色Y軸表示的編碼效率,測(cè)定合成堿可用于數(shù)據(jù)編碼的比例。藍(lán)色的曲線(Y軸從左向右)在當(dāng)前的綜合成本水平上,指出了相應(yīng)的編碼成本的影響。
圖b 表示誤差率情況,(Y軸)為每個(gè)恢復(fù)基的誤差率,作為測(cè)序覆蓋的函數(shù)。藍(lán)色曲線代表四個(gè)文件恢復(fù),無需人工干預(yù):當(dāng)原始讀取率≥2%時(shí)使用誤差為零。從我們的理論誤差率模型的Monte Carlo模擬得到的灰色曲線。橙色曲線代表watsoncrick.pdf文件,需要人工校正:最小可能的誤差率為0.0036%。那個(gè)盒子所在的區(qū)域顯示嵌入放大。
圖c 表示基于DNA的存儲(chǔ)成本的時(shí)間表。當(dāng)每10年數(shù)據(jù)發(fā)生改變,DNA存儲(chǔ)的成本效益不錯(cuò);當(dāng)每5-10年數(shù)據(jù)發(fā)生改變,DNA存儲(chǔ)的成本效益表現(xiàn)才稍差一點(diǎn);如果每5年甚至更頻繁的數(shù)據(jù)改變,磁帶的成本效益還是更佳一下。當(dāng)然了,有人也提到,倘若存儲(chǔ)500年的數(shù)據(jù)來計(jì)算的話,DNA成本效益就更明顯表現(xiàn)出來了。
George Church的論文指出,DNA作為存儲(chǔ)介質(zhì),也有顯著的弱點(diǎn)。 一是成本過高。
George Church團(tuán)隊(duì)的實(shí)驗(yàn)費(fèi)用高得驚人:每一兆(MB,10的6次方)字節(jié)的存儲(chǔ)費(fèi)用是12,400美元,外加測(cè)序解讀220美元。這是常規(guī)磁帶存寫費(fèi)用的一百萬倍還多。所以,DNA存儲(chǔ)必須大大降低成本,才談得上實(shí)際應(yīng)用。二是信息寫讀耗時(shí)。數(shù)碼信息編入DNA目前只能由專門的DNA合成設(shè)備來做;而從DNA中取讀信息,重組復(fù)原為數(shù)碼文件,也很費(fèi)時(shí)。George Church團(tuán)隊(duì)用了整整兩個(gè)星期,才完成五個(gè)文件739千字節(jié)的復(fù)原。三是DNA介質(zhì)不能重復(fù)使用,寫錄完畢,一般來說不能修改,不能再用。
DNA存儲(chǔ)并非可以替代目前所有的磁帶存儲(chǔ)、光盤存儲(chǔ)、磁盤存儲(chǔ)或閃存存儲(chǔ),而是為大家提供了一個(gè)針對(duì)用戶大規(guī)模的、長(zhǎng)期和不經(jīng)常訪問的數(shù)字歸檔的現(xiàn)實(shí)技術(shù)方向。比如存儲(chǔ)期五十年以上,且無需多次存取的信息,DNA介質(zhì)就很有競(jìng)爭(zhēng)力了。同時(shí),“未來的DNA計(jì)算機(jī)在研究邏輯、破譯密碼、生物醫(yī)藥以及航空航天等領(lǐng)域應(yīng)用將發(fā)揮其獨(dú)特優(yōu)勢(shì)。”那么在DNA存儲(chǔ)和DNA計(jì)算兩個(gè)領(lǐng)域交叉發(fā)展推進(jìn)進(jìn)步的情況下,DNA在存儲(chǔ)與計(jì)算領(lǐng)域的應(yīng)用相信在不久的將來會(huì)來到我們身邊。(阿明整理編輯)
▼ ▼ ▼
太扯了??!用DNA分子存儲(chǔ)數(shù)據(jù)可保存長(zhǎng)達(dá)百萬年!
全球存儲(chǔ)觀察 2015-08-19
Dostorage8月19日轉(zhuǎn)發(fā)消息:據(jù)《獨(dú)立報(bào)》報(bào)道,ETH Z rich瑞士聯(lián)邦技術(shù)研究所的科學(xué)團(tuán)隊(duì)提出了使用DNA分子來存儲(chǔ)信息的方法,并提出了一個(gè)數(shù)學(xué)算法可以解碼DNA分子上的編碼信息。
當(dāng)該技術(shù)成熟應(yīng) 用后,大概一枚便士硬幣的28克(1盎司)左右的DNA分子,能夠存儲(chǔ)30萬TB的信息數(shù)據(jù),并且保存長(zhǎng)達(dá)至少100萬年。而目前的存儲(chǔ)介質(zhì)最高保存期限大概為50年左右。
科研團(tuán)隊(duì)的Robert Grass博士“隨著DNA分子的雙螺旋結(jié)構(gòu)的發(fā)現(xiàn),人們發(fā)現(xiàn)DNA中的信息編碼類似于計(jì)算機(jī)中采用的二進(jìn)制編碼,二進(jìn)制編碼由0和1組成,而DNA中的信息則由A、C、T、G4種核苷酸排列組成?!?/span>

科學(xué)家使用了一種機(jī)器合成包含數(shù)據(jù)信息的DNA分子,并將它們加熱至71 ,結(jié)果這些信息可以保存一周。這等同于在50 的環(huán)境下保存信息2000年。
目前商業(yè)化該方法還具有較大的難度,因?yàn)樯袥]有經(jīng)濟(jì)實(shí)惠的方式來生產(chǎn)這種DNA,另外能夠讀取DNA信息的驅(qū)動(dòng)器顯然也不經(jīng)濟(jì)。
而且目前科學(xué)家能夠讀取DNA分子中的整塊信息,但不能指向特定的DNA信息片段的數(shù)據(jù)塊,相當(dāng)于能夠讀取一個(gè)全文件,但無法定位讀取指定片段,這些都是目前面臨的問題。
▼ ▼ ▼
牛逼的DNA硬盤能夠讓存儲(chǔ)技術(shù)飛躍100年嗎?
全球存儲(chǔ)觀察 2015-07-24
Dostorage7月24日轉(zhuǎn)載消息:50年前,在仙童半導(dǎo)體公司任職的摩爾提出了著名的“摩爾定律”,指引了21世紀(jì)的一場(chǎng)偉大科技革命。
在這50年間,人類獲取、處理信息的能力,遵循著摩爾定律沖破天際,但隨之而來的一個(gè)問題也擺在了人類面前:這么多信息,我們?cè)撊绾芜M(jìn)行存儲(chǔ)?

事實(shí)上,這個(gè)問題自現(xiàn)代計(jì)算機(jī)誕生以來便如鯁在喉。如今的教科書,更愿意把相關(guān)的解決方法統(tǒng)稱為“存儲(chǔ)技術(shù)”。
在計(jì)算技術(shù)騰飛的這幾十年,存儲(chǔ)技術(shù)一直是一個(gè)疲憊的追趕者——其首要原因便是物理限制。與中央處理器(CPU)的硅片介質(zhì)不同,現(xiàn)代的數(shù)據(jù)存儲(chǔ)一般以磁介質(zhì)為核心。
顧名思義,就是要通過磁介質(zhì)磁場(chǎng)行為的“記憶效應(yīng)”來實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)的功能。這種存儲(chǔ)模式無論在尺寸上(數(shù)據(jù)密度)還是在使用壽命上(保存時(shí)間)都大打折扣。
我們現(xiàn)如今使用的機(jī)械硬盤、固態(tài)硬盤、USB閃存等,其預(yù)期壽命都在十年左右,而且個(gè)頭還不小,一旦數(shù)據(jù)丟失,造成的損失便無法彌補(bǔ),維護(hù)的成本自然也相當(dāng)高昂。
近年來,一些存儲(chǔ)技術(shù)專家把目光投向了仿生學(xué)。他們論證道:生命是如此精細(xì)和復(fù)雜,為了能夠無誤地繁衍遺傳,哪怕是一條蚯蚓,它所攜帶的信息也足以寫滿一屋子硬盤。蚯蚓的小身軀到底如何存儲(chǔ)這些數(shù)據(jù)呢?答案便是DNA(脫氧核糖核酸)。
DNA是遺傳和基因編碼的基本結(jié)構(gòu),其功能主要是半保留復(fù)制(延續(xù)生命)以及轉(zhuǎn)錄核糖核酸從而合成蛋白質(zhì)(實(shí)現(xiàn)生命功能)。
相比較磁介質(zhì)存儲(chǔ)的“傻大憨粗壽命不長(zhǎng)”,DNA存儲(chǔ)信息的能力極強(qiáng)——一湯匙DNA所攜帶的信息,可以存儲(chǔ)自人類文明出現(xiàn)以來所有的書籍影音;且由于它特殊的雙螺旋緊密結(jié)構(gòu),物理化學(xué)特性穩(wěn)定,不易被破壞,低溫下可保存千百年不變質(zhì)。
可見,困擾存儲(chǔ)技術(shù)多年的問題答案,早就被“造物主”寫在了我們每個(gè)人的身體里。
DNA由四種含氮堿基——A、T、C和G互補(bǔ)配對(duì)構(gòu)成,科學(xué)家將數(shù)據(jù)編碼成二進(jìn)制的數(shù)字串,每遇到一個(gè)0,就在目標(biāo)DNA的尾巴上合成一個(gè)A—T堿基對(duì);如果是1,就合成一個(gè)C—G堿基對(duì)。這樣一來,整部莎士比亞全集就可以被存儲(chǔ)在頭發(fā)絲大小的“DNA硬盤”中。
每次寫完數(shù)據(jù),就把“DNA硬盤”放到低溫環(huán)境中保存。需要讀取數(shù)據(jù)的時(shí)候,只需對(duì)目標(biāo)DNA進(jìn)行測(cè)序,將堿基對(duì)還原成二進(jìn)制編碼,再完成解碼工作,就可以被人類“閱讀”了。
當(dāng)然,以目前的技術(shù)來看,“DNA硬盤”還有很多挑戰(zhàn)要突破,比如存儲(chǔ)(合成)成本太高、讀?。y(cè)序)速度較慢。
但是,利用DNA來存儲(chǔ)數(shù)據(jù)的確是存儲(chǔ)技術(shù)的一個(gè)光明的發(fā)展方向。
隨著仿生學(xué)的不斷進(jìn)步,用微如發(fā)絲的“DNA硬盤”存儲(chǔ)記錄人類文明的珍貴信息,將不再是一個(gè)久遠(yuǎn)的夢(mèng)想。(來源:人民日?qǐng)?bào))
?
