5357cc拉斯维加斯·官方网站-App Store

Industry Watch

北国咨观点

北国咨观点 | DNA数据存储:引领数据存储从“硅基”向“碳基”转变

发布日期:2025-09-05

来源:北京国际工程咨询有限公司

在科技飞速发展的今天,数据量正呈现出井喷式的增长态势。据国际数据公司(IDC)预测,2025年全球将产生213ZB数据(1ZB=10亿TB),2029年数据量将再次翻倍。传统硅基存储技术(如硬盘、闪存等)正陷入存储密度逼近物理极限、能耗成本高、介质寿命有限等多重瓶颈,基于现有技术预计5年内将只有不到1%的数据可被保存。在ZB级数据洪流的冲击下,研究开发新型数据存储技术势在必行。而此时,一种全新的存储技术——DNA数据存储,正逐渐崭露头角,有望引领数据存储从“硅基”向“碳基”的重大转变。

一、DNA数据存储介绍

DNA数据存储是利用人工合成的脱氧核糖核酸(DNA)作为信息载体的前沿存储技术。作为生物体遗传信息的天然存储器,DNA由四种核苷酸构成,分别是腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C)四种碱基,可以翻译成二进制中的00(A)、01(T)、10(G)、11(C)。在数据写入时,先将文本、图片等信息翻译成二进制代码,再将二进制代码转换为碱基的四进制序列,然后通过人工合成技术生成对应的DNA分子,并放到适宜环境中保存,从而实现数据的高密度存储。当数据读取时,再通过DNA测序技术反向操作即可。


图片来源:擎科生物公众号
图1 DNA数据存储及读取流程图

二、发展历程

DNA数据存储的发展并非一蹴而就,而是经历了多个关键的技术突破阶段。

早期探索阶段——从概念构想到实验突破。20世纪60年代,美国麻省理工学院教授维纳与苏联物理学家涅曼率先提出“遗传记忆”概念,大胆设想将DNA作为信息存储载体,为DNA数据存储技术播下理论种子。但受限于当时落后的DNA测序与合成技术,这一构想长期停留在纸面。直到1988年,哈佛大学教授戴维斯成功设计并合成含18个核苷酸的DNA片段,完成DNA存储的首次实验验证,标志着该技术从理论走向实践,开启了科研界对DNA存储的探索之路。

突破性发展阶段——从实验可行到实践可行。2012年,哈佛大学教授丘奇采用短链DNA进行编码,成功将一本659kb的书籍内容转化为DNA序列,最终测序结果仅出现22个错误。2016年,微软和华盛顿大学的研究人员对外公布,其利用DNA存储技术成功实现了约200MB数据的保存,包括《战争与和平》在内的100部文学作品。这些成果首次证明DNA能够存储大容量数据,充分展现了其作为存储介质的巨大潜力。

快速迭代阶段——技术革新与成本优化。2025年,麻省理工学院的研究团队研发出一种新型聚合物材料,能够在室温环境下实现DNA的长期稳定保存。同年,中国科学院北京基因组研究所(国家生物信息中心)等单位科研人员提出了一种经济高效的存储方法——DNA活字喷墨打印机“毕昇一号”。该技术以预制短DNA片段为存储单元,每个片段存1字节信息,通过酶连接组装成DNA活字块,类似于毕昇印刷术的“活字重组逻辑”,通过标准化预制片段的灵活拼接实现信息的高效存储与组合。“毕昇一号”成功实现各类数字文件的高效存储与精准还原,解码准确率达100%,并且无需从头合成DNA序列进行编码,将DNA活字存储成本降至122美元/MB(主流DNA存储3500美元/MB),推动DNA存储技术迈向实用化。


图片来源:中国科学院北京基因组研究所(国家生物信息中心)官网
图2 “毕昇一号”DNA活字存储流程图

三、优势分析

与传统数据储存方式相比,DNA数据存储主要具有以下三大优势:

超高存储密度:DNA数据存储的超高存储密度堪称“数据存储界的奇迹”,1克DNA就能容纳约215PB的数据(约1000万小时高清视频),理论上一吨DNA即可存储全球现有数据总量,远超传统硬盘或磁带的容量极限。

超长存储寿命:DNA具有高度稳定性,在适宜条件下,可保存数千年乃至更久。近年科学家曾从格陵兰岛冻土中成功提取200万年前的DNA序列,其中信息仍历历可辨。相比硬盘等传统存储介质几年到十几年的使用寿命,DNA存储优势显著。

超低能耗:传统数据中心每存储1PB数据,每年的耗电量大致在8万-30万度电;与之相比,DNA数据存储仅在DNA合成、编码过程中产生少量能耗,一旦数据写入完成,仅需基础的冷藏保存条件,后续能耗几乎可忽略不计。

四、面临的挑战

存储成本高。当下,主流DNA存储多以化学合成碱基来写入数据,过程复杂、耗时久且成本高。虽然以“毕昇一号”为代表的创新技术已将DNA活字存储成本降至122美元/MB,但与传统硬盘、闪存每MB不到0.01美元的成本相比,仍存在巨大差距。

读写速度慢。相较于硬盘、闪存等读写速度最快可达到数百/数千MB/S,DNA存储写入速度目前每天仅能达到MB量级,读取速度同样迟缓。传统DNA存储依赖逐条合成与测序,在DNA合成过程中,每添加一个碱基所需时间大约为0.1秒钟,这使得整体写入过程极为缓慢。

DNA合成出现错误。在DNA合成过程中易出现碱基缺失错误,每碱基发生率约0.2%~1%。这类缺失会导致序列阅读框移位,进而使解码时数据出现连贯性偏差,为准确还原存储信息带来巨大挑战。此外,合成中还可能伴随少量碱基插入或替换错误,进一步增加了数据解码的复杂性。

技术标准不统一。目前DNA数据存储技术尚未形成统一的行业执行标准,不同的实验室科研人员和企业使用者在操作DNA存储介质时,无法按照同样的方式来进行DNA存储和读取,这阻碍了DNA信息存储技术走向商业化应用的进程。

五、发展趋势及对策建议

DNA存储的独特优势正促使其应用领域不断拓展。在长期冷数据(国家历史档案、珍贵文物资料等)存储方面,其超长存储时间和高存储密度特性使其成为理想选择。在航天领域,低能耗、高稳定性和高存储密度让它有望用于存储航天器飞行数据、科学实验数据等。在医疗健康领域,能用于长期保存患者个体基因数据。未来DNA存储将走进千家万户,在数据存储市场占据重要地位,与传统存储方式共同构建多元化存储格局。

建议加快推动DNA数据存储技术与人工智能、生物信息学等前沿技术的交叉融合,通过跨学科协同创新突破技术瓶颈;积极开展与大型数据中心、医疗机构等合作,以应用场景驱动技术迭代;同时,加强国际间技术交流与合作,共同推动DNA数据存储技术标准制定与应用推广,加速新技术的成熟与普及。期待DNA数据存储技术在未来能够彻底改变数据存储格局,开启一个全新的“碳基”存储时代。

参考文献

[1]董一名,孙法家,武瑞君,钱珑.DNA数字信息存储的研究进展[J].合成生物学,2021,2(3):323-334.

[2]DNA存储技术及其在档案信息存储中应用的可能[EB/OL].https://mp.weixin.qq.com/s/-nDb4qK3wWQda0pk-oO2pg

[3]基因合成驱动DNA存储:开启万亿数据存储的新时代[EB/OL].

https://mp.weixin.qq.com/s/0nP3E4_GVFCnUJY_5zEV8w

作者介绍

赵瑞鑫

中级经济师

长期关注研究生物经济、医药健康等领域,深度参与《北京合成生物发展现状及未来发展路径研究》《北京市“十五五”时期生物医药产业发展分析服务》《完善北京市支持创新药械发展的监管和支付机制研究》等多项北京市相关产业研究、政策制定等咨询服务,获2025年北京市优秀咨询成果奖一等奖1项。

严一凡

咨询师

长期关注研究生物经济领域,深度参与《国家生物制造产业创新中心创新能力建设项目》《北京合成生物发展现状及未来发展路径研究》等多项生物领域咨询项目,在北京市生物产业战略规划、政策制定等方面拥有丰富实践,获2025年北京市优秀咨询成果奖一等奖1项。

编辑:张 华

审核:兰国威

更多资讯

010-63363998

Baidu
sogou