中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書(shū)本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫(huà)像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車(chē)產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶(hù)可在朋友圈發(fā)實(shí)況照片了蘋(píng)果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚(yú)相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷(xiāo)量及銷(xiāo)售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專(zhuān)利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁(yè) > 數(shù)據(jù)存儲(chǔ)頻道 > 數(shù)據(jù).存儲(chǔ)頻道 > 存儲(chǔ)資訊

    基因組數(shù)據(jù)太多了,存儲(chǔ)怎么辦?

    2022年08月15日 16:39:50   來(lái)源:Ai芯天下

      前言:

      DNA存儲(chǔ)了恐龍的生物信息,科技讓它重新表達(dá)。DNA存儲(chǔ)或許也可以像我們?nèi)缃裼玫囊苿?dòng)硬盤(pán)一樣進(jìn)行現(xiàn)場(chǎng)即時(shí)存儲(chǔ)。

      DNA存儲(chǔ)技術(shù)將有望成為下一代信息存儲(chǔ)技術(shù)。

      DNA數(shù)據(jù)保存面臨“大”問(wèn)題

      在大自然里,DNA負(fù)責(zé)存儲(chǔ)遺傳信息。

      單個(gè)人體細(xì)胞的平均直徑是5到200微米,這其中的DNA可以包含一個(gè)人全部的遺傳信息:30億對(duì)堿基。

      大規(guī)模的基因組測(cè)序正在進(jìn)行,隨之產(chǎn)生的數(shù)據(jù)規(guī)?焖僭鲩L(zhǎng)。

      存儲(chǔ)、壓縮這些數(shù)據(jù)是個(gè)麻煩事,現(xiàn)有的技術(shù)方案看起來(lái)不太行。

      據(jù)估計(jì):人類(lèi)基因組需要高達(dá)2-40EB的存儲(chǔ)容量。

      這可能超過(guò)一個(gè)世界級(jí)科技公司的云存儲(chǔ)量,全世界蘋(píng)果用戶(hù)存儲(chǔ)在谷歌云上的數(shù)據(jù)總量大約是8EB。

      這8EB數(shù)據(jù),每月存儲(chǔ)費(fèi)需要2.18億美元。

      DNA存儲(chǔ)原理其實(shí)很難理解

      DNA由腺嘌呤(A)、鳥(niǎo)嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)4個(gè)堿基構(gòu)成雙螺旋結(jié)構(gòu),可以保存生物體的遺傳信息。

      DNA存儲(chǔ)遺傳信息的原理并不復(fù)雜,它由四種核苷酸A、T、G、C組成,彼此兩兩對(duì)應(yīng),組成雙螺旋結(jié)構(gòu)。

      在數(shù)字世界,所有的信息本質(zhì)上是0和1組成的數(shù)據(jù)串。

      想要DNA存儲(chǔ)數(shù)字信息,簡(jiǎn)單理解,原就是將0和1的編碼序列轉(zhuǎn)換成核苷酸的序列。

      DNA存儲(chǔ)的優(yōu)勢(shì)在于密度大,大約在你眼前逗號(hào)這么大小,1立方毫米的DNA,就可以容納9TB(1TB=1024GB)的信息。

      在自然界存在的DNA中,A和T,C與G兩兩配對(duì),在一條DNA中,CG與AT的存在比例基本均勻,為50%左右。

      也就是說(shuō),雖然DNA的存儲(chǔ)能力很強(qiáng),但它們不得不以很多條短鏈的方式存在。

      難以突破的結(jié)構(gòu)性障礙

      雖然DNA存儲(chǔ)具有較為明顯突出的優(yōu)勢(shì),政策、資本等也在全方位的支持,應(yīng)用的前景廣闊,但商業(yè)化的進(jìn)展仍然十分緩慢。

      其最大屏障來(lái)自于其存儲(chǔ)技術(shù)本身。

      DNA存儲(chǔ)數(shù)據(jù)的過(guò)程主要分為五個(gè)步驟:

     、倬幋a——將數(shù)字信息編碼為DNA序列;

      ②合成——將序列融入實(shí)際的DNA分子;

      ③存儲(chǔ)——將合成的DNA片段保存在載體或細(xì)胞中;

     、茉L問(wèn)——檢索和選擇性讀取序列信息;

      ⑤解碼——將測(cè)定的序列信息轉(zhuǎn)換回?cái)?shù)字信息。

      在整個(gè)存儲(chǔ)的過(guò)程中,編碼與合成是DNA存儲(chǔ)中較為關(guān)鍵和困難的環(huán)節(jié)。

      總的來(lái)說(shuō),DNA存儲(chǔ)的各個(gè)環(huán)節(jié)都有較多的難關(guān)需要克服,DNA存儲(chǔ)真正意義上的走入商業(yè)市場(chǎng)。

      DNA存儲(chǔ)試圖走向商業(yè)化道路

      2020年微軟、西部數(shù)據(jù)和基因測(cè)序巨頭Illumina、DNA合成初創(chuàng)公司TwistBioscience等聯(lián)合成立了DNA數(shù)據(jù)存儲(chǔ)聯(lián)盟。

      這是世界上第一個(gè)該領(lǐng)域的學(xué)術(shù)和產(chǎn)業(yè)鏈聯(lián)盟,這個(gè)聯(lián)盟希望制定技術(shù)和格式標(biāo)準(zhǔn),最終建立一個(gè)可以通用的商業(yè)系統(tǒng)。

      微軟研究院在2015年就成立了DNA存儲(chǔ)的項(xiàng)目,2021年微軟開(kāi)發(fā)出首個(gè)納米級(jí)DNA存儲(chǔ)器,能夠在每個(gè)平方厘米的區(qū)域上,同時(shí)合成25X106(2650)條堿基序列。

      這個(gè)新的技術(shù)把原來(lái)同時(shí)合成堿基序列的數(shù)字從個(gè)位提升到了千位。這個(gè)吞吐量,讓DNA合成速度變成了每秒兆字節(jié)(MB)。

      進(jìn)一步發(fā)展成為主流的存儲(chǔ)設(shè)備,還需要長(zhǎng)時(shí)間的沉淀,才能讓DNA存儲(chǔ)技術(shù)有實(shí)質(zhì)的進(jìn)階。

      DNA存儲(chǔ)在AI技術(shù)的加持下,其編碼的環(huán)節(jié)效率也獲得了極大地提升。

      未來(lái)隨著納米技術(shù)與AI技術(shù)的加持,DNA存儲(chǔ)的技術(shù)也會(huì)一步步解除智識(shí)的限制禁錮,逐步升級(jí),為存儲(chǔ)領(lǐng)域帶來(lái)質(zhì)的飛躍。

      DNA存儲(chǔ)的四大優(yōu)勢(shì)

      相比于目前我們常用的存儲(chǔ)介質(zhì),如U盤(pán)、光盤(pán)、硬盤(pán)等,DNA存儲(chǔ)具有一系列優(yōu)勢(shì)。

     、俅鎯(chǔ)密度高。每立方厘米的DNA分子可以存儲(chǔ)大約1EB的信息,這一密度是當(dāng)前存儲(chǔ)密度最高的介質(zhì)(閃存)的1000倍,是硬盤(pán)數(shù)據(jù)存儲(chǔ)密度的百萬(wàn)倍。

     、诒4鎵勖L(zhǎng)。從理論上來(lái)說(shuō),DNA數(shù)據(jù)在沒(méi)有特別人工干預(yù)的情況下至少能保存千年之久。

     、劬S護(hù)成本低。存儲(chǔ)在DNA的數(shù)據(jù),理論上來(lái)說(shuō)通過(guò)低溫冷凍或者固態(tài)封存的手段,可以長(zhǎng)時(shí)間存儲(chǔ)且?guī)缀醪恍枰S護(hù)。

     、蹹NA存儲(chǔ)所需要的占地也遠(yuǎn)小于傳統(tǒng)存儲(chǔ)介質(zhì),并且還具備數(shù)據(jù)易復(fù)制、易攜帶、能在生物體內(nèi)存儲(chǔ)等特點(diǎn)。

      現(xiàn)階段至少需要解決的三大問(wèn)題

     、僮x寫(xiě)速度太慢:以目前的技術(shù)在合成DNA時(shí),每添加一個(gè)堿基大約需要0.1秒鐘時(shí)間。保存一首高音質(zhì)的MP3歌曲都需要差不多1個(gè)月時(shí)間。

     、诔杀咎撸耗壳昂铣2MB的DNA數(shù)據(jù)需要7000美元,讀取數(shù)據(jù)需要2000美元,如果以DNA形式存儲(chǔ)1GB大小的電影,編碼大約需要花費(fèi)358萬(wàn)美元。

     、酆铣蒁NA的穩(wěn)定性:合成DNA過(guò)程中產(chǎn)生的錯(cuò)誤率對(duì)于要求確保100%真實(shí)性和完整性的數(shù)據(jù)存儲(chǔ)指標(biāo)而言是致命的問(wèn)題。

      結(jié)尾:

      但這項(xiàng)技術(shù)目前遠(yuǎn)未成熟,或許離真正商用還需要20年,甚至更長(zhǎng)。

      或許有可能過(guò)程中碰到一個(gè)難以突破的技術(shù)瓶頸導(dǎo)致中途夭折;或許過(guò)程中出現(xiàn)另外一項(xiàng)更具革命性的存儲(chǔ)技術(shù),比如量子存儲(chǔ),形成降維打擊。

      部分資料參考:極客公園:《你身體里的DNA,能存下整個(gè)宇宙的數(shù)據(jù)》,腦極體:《存儲(chǔ)新圖譜:DNA存儲(chǔ)的邊界與天地》

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。