前言:
DNA存儲(chǔ)了恐龍的生物信息,科技讓它重新表達(dá)。DNA存儲(chǔ)或許也可以像我們?nèi)缃裼玫囊苿?dòng)硬盤一樣進(jìn)行現(xiàn)場即時(shí)存儲(chǔ)。
DNA存儲(chǔ)技術(shù)將有望成為下一代信息存儲(chǔ)技術(shù)。
DNA數(shù)據(jù)保存面臨“大”問題
在大自然里,DNA負(fù)責(zé)存儲(chǔ)遺傳信息。
單個(gè)人體細(xì)胞的平均直徑是5到200微米,這其中的DNA可以包含一個(gè)人全部的遺傳信息:30億對堿基。
大規(guī)模的基因組測序正在進(jìn)行,隨之產(chǎn)生的數(shù)據(jù)規(guī)模快速增長。
存儲(chǔ)、壓縮這些數(shù)據(jù)是個(gè)麻煩事,現(xiàn)有的技術(shù)方案看起來不太行。
據(jù)估計(jì):人類基因組需要高達(dá)2-40EB的存儲(chǔ)容量。
這可能超過一個(gè)世界級科技公司的云存儲(chǔ)量,全世界蘋果用戶存儲(chǔ)在谷歌云上的數(shù)據(jù)總量大約是8EB。
這8EB數(shù)據(jù),每月存儲(chǔ)費(fèi)需要2.18億美元。
DNA存儲(chǔ)原理其實(shí)很難理解
DNA由腺嘌呤(A)、鳥嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)4個(gè)堿基構(gòu)成雙螺旋結(jié)構(gòu),可以保存生物體的遺傳信息。
DNA存儲(chǔ)遺傳信息的原理并不復(fù)雜,它由四種核苷酸A、T、G、C組成,彼此兩兩對應(yīng),組成雙螺旋結(jié)構(gòu)。
在數(shù)字世界,所有的信息本質(zhì)上是0和1組成的數(shù)據(jù)串。
想要DNA存儲(chǔ)數(shù)字信息,簡單理解,原就是將0和1的編碼序列轉(zhuǎn)換成核苷酸的序列。
DNA存儲(chǔ)的優(yōu)勢在于密度大,大約在你眼前逗號這么大小,1立方毫米的DNA,就可以容納9TB(1TB=1024GB)的信息。
在自然界存在的DNA中,A和T,C與G兩兩配對,在一條DNA中,CG與AT的存在比例基本均勻,為50%左右。
也就是說,雖然DNA的存儲(chǔ)能力很強(qiáng),但它們不得不以很多條短鏈的方式存在。
難以突破的結(jié)構(gòu)性障礙
雖然DNA存儲(chǔ)具有較為明顯突出的優(yōu)勢,政策、資本等也在全方位的支持,應(yīng)用的前景廣闊,但商業(yè)化的進(jìn)展仍然十分緩慢。
其最大屏障來自于其存儲(chǔ)技術(shù)本身。
DNA存儲(chǔ)數(shù)據(jù)的過程主要分為五個(gè)步驟:
、倬幋a——將數(shù)字信息編碼為DNA序列;
②合成——將序列融入實(shí)際的DNA分子;
、鄞鎯(chǔ)——將合成的DNA片段保存在載體或細(xì)胞中;
④訪問——檢索和選擇性讀取序列信息;
、萁獯a——將測定的序列信息轉(zhuǎn)換回?cái)?shù)字信息。
在整個(gè)存儲(chǔ)的過程中,編碼與合成是DNA存儲(chǔ)中較為關(guān)鍵和困難的環(huán)節(jié)。
總的來說,DNA存儲(chǔ)的各個(gè)環(huán)節(jié)都有較多的難關(guān)需要克服,DNA存儲(chǔ)真正意義上的走入商業(yè)市場。
DNA存儲(chǔ)試圖走向商業(yè)化道路
2020年微軟、西部數(shù)據(jù)和基因測序巨頭Illumina、DNA合成初創(chuàng)公司TwistBioscience等聯(lián)合成立了DNA數(shù)據(jù)存儲(chǔ)聯(lián)盟。
這是世界上第一個(gè)該領(lǐng)域的學(xué)術(shù)和產(chǎn)業(yè)鏈聯(lián)盟,這個(gè)聯(lián)盟希望制定技術(shù)和格式標(biāo)準(zhǔn),最終建立一個(gè)可以通用的商業(yè)系統(tǒng)。
微軟研究院在2015年就成立了DNA存儲(chǔ)的項(xiàng)目,2021年微軟開發(fā)出首個(gè)納米級DNA存儲(chǔ)器,能夠在每個(gè)平方厘米的區(qū)域上,同時(shí)合成25X106(2650)條堿基序列。
這個(gè)新的技術(shù)把原來同時(shí)合成堿基序列的數(shù)字從個(gè)位提升到了千位。這個(gè)吞吐量,讓DNA合成速度變成了每秒兆字節(jié)(MB)。
進(jìn)一步發(fā)展成為主流的存儲(chǔ)設(shè)備,還需要長時(shí)間的沉淀,才能讓DNA存儲(chǔ)技術(shù)有實(shí)質(zhì)的進(jìn)階。
DNA存儲(chǔ)在AI技術(shù)的加持下,其編碼的環(huán)節(jié)效率也獲得了極大地提升。
未來隨著納米技術(shù)與AI技術(shù)的加持,DNA存儲(chǔ)的技術(shù)也會(huì)一步步解除智識的限制禁錮,逐步升級,為存儲(chǔ)領(lǐng)域帶來質(zhì)的飛躍。
DNA存儲(chǔ)的四大優(yōu)勢
相比于目前我們常用的存儲(chǔ)介質(zhì),如U盤、光盤、硬盤等,DNA存儲(chǔ)具有一系列優(yōu)勢。
、俅鎯(chǔ)密度高。每立方厘米的DNA分子可以存儲(chǔ)大約1EB的信息,這一密度是當(dāng)前存儲(chǔ)密度最高的介質(zhì)(閃存)的1000倍,是硬盤數(shù)據(jù)存儲(chǔ)密度的百萬倍。
、诒4鎵勖L。從理論上來說,DNA數(shù)據(jù)在沒有特別人工干預(yù)的情況下至少能保存千年之久。
、劬S護(hù)成本低。存儲(chǔ)在DNA的數(shù)據(jù),理論上來說通過低溫冷凍或者固態(tài)封存的手段,可以長時(shí)間存儲(chǔ)且?guī)缀醪恍枰S護(hù)。
④DNA存儲(chǔ)所需要的占地也遠(yuǎn)小于傳統(tǒng)存儲(chǔ)介質(zhì),并且還具備數(shù)據(jù)易復(fù)制、易攜帶、能在生物體內(nèi)存儲(chǔ)等特點(diǎn)。
現(xiàn)階段至少需要解決的三大問題
、僮x寫速度太慢:以目前的技術(shù)在合成DNA時(shí),每添加一個(gè)堿基大約需要0.1秒鐘時(shí)間。保存一首高音質(zhì)的MP3歌曲都需要差不多1個(gè)月時(shí)間。
、诔杀咎撸耗壳昂铣2MB的DNA數(shù)據(jù)需要7000美元,讀取數(shù)據(jù)需要2000美元,如果以DNA形式存儲(chǔ)1GB大小的電影,編碼大約需要花費(fèi)358萬美元。
、酆铣蒁NA的穩(wěn)定性:合成DNA過程中產(chǎn)生的錯(cuò)誤率對于要求確保100%真實(shí)性和完整性的數(shù)據(jù)存儲(chǔ)指標(biāo)而言是致命的問題。
結(jié)尾:
但這項(xiàng)技術(shù)目前遠(yuǎn)未成熟,或許離真正商用還需要20年,甚至更長。
或許有可能過程中碰到一個(gè)難以突破的技術(shù)瓶頸導(dǎo)致中途夭折;或許過程中出現(xiàn)另外一項(xiàng)更具革命性的存儲(chǔ)技術(shù),比如量子存儲(chǔ),形成降維打擊。
部分資料參考:極客公園:《你身體里的DNA,能存下整個(gè)宇宙的數(shù)據(jù)》,腦極體:《存儲(chǔ)新圖譜:DNA存儲(chǔ)的邊界與天地》
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。