DNA存儲技術,可持續存儲的未來?| 億歐問答

DNA存儲技術,可持續存儲的未來?| 億歐問答

移動互聯網經過多年的發展,全球覆蓋人群已經突破40億大關,聊天軟件、短視頻、網購、搜索引擎等互聯網應用服務每天產生著大量數據。隨著5G時代來臨,傳感器以及各種數字化終端設備的普及將會造就一個萬物互聯的世界,同時意味著新一輪數字洪流也將洶湧而來。

數據爆炸式增長時代,新興存儲技術迎來發展機遇

根據國際機構IDC預測,全球數據產生量將從2018年的33ZB(澤字節)快速增長至2025年的175ZB,1ZB約相當於10億TB(太字節)的數據量存儲,屆時不僅將會對全球數據中心的建設產生影響,同時也會對數據的存儲發起挑戰。

DNA存儲技術,可持續存儲的未來?| 億歐問答

按目前最大的單個硬盤數據存儲量換算,全部存儲175ZB數據至少需要約120億個硬盤。根據IDEMA(國際磁盤驅動器設備制造商協會)研究報告顯示,2018年全球固態硬盤出貨量約為1.7億片。

以目前數據的生成速度來看,到2040年全球將至少需要百萬噸的矽基芯片才能存儲當年產生的數據,不到100年的時間內,現在所用的磁存儲系統或光學存儲系統就會達到容量上限。

因此,未來短期內存儲硬盤將迎來快速增長需求,但從長遠來說,全球數據存儲將面臨著嚴峻的考驗,這就不得不造就可持續使用的存儲介質和全新的存儲替代方案。

日前,億歐智庫最新發佈瞭《2020技術趨勢報告》,通過技術篩選以及關鍵性指標測評,將具有技術承接性、資源持續性和顛覆革新性的DNA存儲技術列為2020年之後的重點發展趨勢,體積小、獲取方便,擁有極高密度的DNA存儲或將成為數據儲發展的未來。

DNA存儲優勢初現,引領企業爭相角逐

DNA是磷酸基團、多糖和四種堿基構成的雙螺旋結構大分子,四種基本堿基單元為A、T、C、G,通過堿基兩兩配對,構成DNA雙鏈。DNA是生物信息保存最久的存在,也是已知最古老的信息存儲系統,DNA的半衰期約為521年,即每過521年,構成DNA骨架的核苷酸間的化學鍵才會有一半斷裂。

DNA存儲是利用4個堿基,以二進制代碼形式對數據文件進行信息編碼,按堿基序列順序通過人工合成技術形成長鏈DNA來保存數據。

同時,根據最新的研究進展發現,每克DNA的數據存儲密度已經達到215PB(約22萬TB),理論上最大可以達到455EB(約4.7億TB),而且DNA作為存儲介質,常溫條件下的儲存半衰期可以達到數千年之久。因此,存儲密度大、能耗低、存儲周期長的DNA存儲便逐漸成為全球存儲技術的研究熱點。

科技巨頭微軟公司是最早研究DNA存儲技術的公司之一,微軟一直以來都堅信DNA是長期存儲數據的最佳介質。2016年時,微軟便宣佈從一傢舊金山生物科技公司購買1000萬個 DNA長寡核苷酸分子,用以探索 DNA 分子存儲數據的方法。2019年3月,微軟公司和華盛頓大學的研究人員已經開發出一個完全自動化的系統,用於編寫、存儲和讀取DNA編碼的數據。

2019年6月,初創公司Catalog Technologies宣佈已經將16GB的英文維基百科數據存儲在DNA鏈上,使DNA存儲技術對於簡單數據存檔需求用戶來說成為現實。除此之外,包括Evonetix、Molecular Assemblies、DNA Script等初創企業也在加速DNA存儲研發的探索。

DNA存儲技術,可持續存儲的未來?| 億歐問答

核心技術原理探索,方法與性能並進

從技術原理來看,完整的DNA存儲包括編碼寫入部分、存放部分和解碼讀取部分。編碼寫入由DNA編碼和人工合成DNA組成,解碼讀取部分即DNA測序解碼讀取,而想要實現成熟的DNA存儲應用,DNA編碼技術和讀取技術的發展至關重要。

DNA編碼過程包含壓縮、糾錯和轉換三個部分。其中壓縮方法經過長期不斷的發展,形成瞭以哈夫曼編碼、噴泉碼為代表的多種壓縮方法;糾錯方面,漢明碼糾錯、RS碼糾錯等糾錯方式的出現提高瞭數據編碼和讀取的準確性;DNA編碼轉換由最初的二進制模型發展演變成三進制和四進制共存的三種常見轉換模型。

2012年,美國哈佛大學教授Church采用二進制進行轉換,將659kB信息存入DNA中,使DNA存儲數據容量的紀錄提高瞭1000倍,此後,DNA存儲技術便進入瞭新的快速發展期。2013年,Goldman等人利用哈夫曼編碼、四倍重疊法、三進制編碼等,將739kB的內容存入DNA中;2017年,Erlich等人基於噴泉碼壓縮技術,將6個文件存入瞭DNA中,該技術隻引入瞭20.71%的冗餘,大大降低瞭DNA存儲的成本。

2018年,愛爾蘭沃特福德理工學院(WIT)研究人員開發出一種新型DNA存儲方法,可在1克大腸桿菌DNA中存儲1ZB的數據。經過多年的研發積累,DNA存儲的方法形式與性能不斷得到進步提升。

DNA存儲技術,可持續存儲的未來?| 億歐問答

DNA存儲價值曙光初現,應用挑戰仍有待突破

目前,DNA存儲數據讀取主要通過傳統測序法實現,微軟研究院與華盛頓大學研究人員測試瞭一種隨機讀取數據的方案,但是這種方案定位依然不夠精確,而且效率很低。除此之外,通過納米孔進行測序的數據讀取技術還處於研發階段,但作為新興的第四代測序技術,納米孔測序讀取或許將成為讀取技術新的突破。

2019年12月,哥倫比亞大學聯合蘇黎世聯邦理工學院研究團隊通過3D打印制作瞭一隻兔子,並將這隻兔子的三維結構數據以雙鏈 DNA 結構形式內置在打印材料中,實現瞭其自身數據的DNA存儲和傳遞。這項研究的最大突破在於證實瞭萬物皆可實現 DNA 存儲的理論,且不受任何形狀限制,這也使得DNA存儲的商業價值曙光進一步顯現。

從技術發展成熟度來看,DNA數據存儲還面臨著較大的技術挑戰,主要集中體現在人工合成成本高、合成速度慢、數據讀取時間長、準確性低等方面。如目前DNA合成成本約為0.05-0.1美元一個堿基,合成存儲200MB的數據需要耗資上百萬美元,時間花費至少兩周左右。所以,如果可以使得DNA合成讀取成本通過技術發展大幅得到改善的話,DNA存儲的應用將會非常可觀。

DNA存儲對於一些不常用卻需要長期保存信息的應用場景極為適用,如政府文件、病人臨床信息、研究數據、歷史檔案、視頻資料等。其次,DNA存儲作為一種全新的存儲方式,或將成為軍事領域、經濟領域等特殊加密用途的數據存儲手段,並且在人工智能應用前端及雲存儲方面,也將發揮獨特的存儲優勢。

雖然DNA擁有可持續獲取的天然優勢,但如何使得DNA存儲達到現有硬盤存儲系統的效率和便捷,實現數據存儲的可持續發展和顛覆變革,還需大量的理論研究與技術探索。作為人類未來的無限存儲方式,DNA存儲技術將會伴隨人類的前進腳步共同發展。

Published in News by Awesome.

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *