如果我们像今天使用磁带来存储数据一样使用 DNA,那么理论上就可以粗略地撕毁了人类在空间中记录的所有信息双车库大小。
与他人分享他们的目标麻省理工科技评论本周,微软研究院计算机架构师表示,他们希望在未来几年内开始将数据存储在 DNA 链上,并预计到本世纪末,数据中心内将拥有一个使用 DNA 的可操作存储系统。
尽管看起来已经过时,但目前在小空间中存储大量信息的最佳方法之一是老式的好方法磁带- 它不仅便宜,而且足够坚固,可以保存信息长达 30 年,并且每卷可以保存多达 1 TB 的数据。
但是当我们考虑已经生成了更多数据时就在过去的两年里与整个人类历史相比,似乎在接下来的几十年里,即使是磁带也可能无法切割它。
DNA 等生物材料对于备份大量数字信息来说似乎是一个奇怪的选择,但 70 多年来,人们已经清楚它能够在狭小的空间内存储大量数据。
早在20世纪40年代,物理学家欧文“盒子里的猫”薛定谔提出可以将遗传的“代码脚本”打包成他描述为的非重复结构非周期性晶体。
他的建议极大地启发了詹姆斯·沃森和弗朗西斯·克里克,他们根据以下研究确定了 DNA 的螺旋结构:,引发了一场理解生命机制的革命。
虽然数十亿年来一直使用核酸串将信息塞入活细胞中,但就在五年前,它在 IT 数据存储中的作用才首次得到证明,当时哈佛大学遗传学家他将他的书(包括用于插图的 jpg 数据)编码到了近 55,000,000 条 DNA 中。
从那时起,该技术已经发展到科学家能够记录(2.15 亿千兆字节)单克 DNA 上的信息。
它可能很紧凑,但以核酸序列的形式记录数据并不快。 或者便宜。
去年,微软展示了其DNA数据存储技术通过在单个过程中将大约200兆字节的数据以100部文学经典的形式编码到DNA的四个碱基中。
根据麻省理工学院评论,使用公开市场上的材料,这一过程的成本约为 800,000 美元,这意味着它需要便宜数千倍才能使其成为具有竞争力的选择。
它的速度也非常慢,数据存储速度约为每秒 400 字节。微软说它需要达到每秒 100 兆字节左右才可行。
目前尚不清楚微软可能发现了哪些效率来降低流程成本并加快流程,但新技术已经看到了基因测序成本下降近年来,因此其十年结束的目标可能是现实的。
即便如此,它也可能只会在特定情况下用于愿意付费购买专门存储解决方案的客户(例如医疗或法律数据的关键档案),而不是作为当前大规模存储方法的替代品。
但就在我们猜测的同时,基于 DNA 的数据存储的一种更科幻的用途有一天可能会涉及到活体计算机。
虽然微软的 DNA 存储解决方案将基于芯片,但未来版本的存储很可能涉及酶或细菌工程进行计算。
即使在细胞之外,DNA 也可能提供计算数据的新方法,开辟了快速处理某些问题的数字的方法,就像为数学的其他领域做事。
目前看来,DNA 在解决一个非常现实的问题方面似乎可以发挥坚实的作用,而这个问题只会变得更糟。