基因与二进制代码。图片由artida/shutterstock提供
DNA是生命的基石。但在未来,它也可能成为标准的百科全书、音乐和其他数据的知识库。科学家昨天宣布,他们成功将739千字节的硬盘数据转化成了基因序列,然后以100%的正确率将其恢复了出来。
这些研究人员从一些广为人知的文化锦集的计算机文件着手:一段1963年马丁·路德·金《我有一个梦想》的演讲录音,莎士比亚全部的154首十四行诗,并且还恰如其分的加上了一份沃森和克里克描述DNA双螺旋结构的原创性研究报告。在硬盘里,这些数据是以一系列0和1的方式储存着。研究人员们计算出一种算法,可以将二进制代码转化成构成基因的四个要素——A, C, G和T。他们用这种基因编码合成新的DNA主链,把文件的内容镶嵌到其基础结构之中。
实际上,新合成的DNA主链非常不起眼:也就是在试管底部几乎看不见的一点点东西罢了。 当研究人员们把步骤颠倒过来的时候,令人惊奇的现象出现了。他们把载有数据的DNA基因组按顺序排好,然后把它重新转换成0和1。结果他们将原文件内容丝毫不差的再现了出来。周二发行的《自然》杂志刊登了这些研究成果。
那么,比起其他数据存储方法,用DNA存储数据有什么优点呢?第一,用DNA进行数据存储可以把数据非常紧密的压缩。研究人员表示,仅仅一克DNA就可以储存一百多万张CD的数据信息。第二,DNA可以在一定条件下保持很长时间,而不像现存的数据库那样容易被破坏。第三,DNA因信息的安全存储而著称:它承载了地球上所有生命的历史,这项功能是其他技术无法匹敌的。
这已经不是DNA第一次被用于存储数据了,但是最新的实验比之前的更有效,更准确,也更具规模。这种储存数据的方法尤其适用于那些不需要经常使用,需要长期保存的档案。相对于作为实用性闪存盘的替代物,这种方法更适合扮演救急的数据备份的角色。
目前制约这项技术发展的主要因素是成本问题。测序,尤其是合成DNA,是十分昂贵的。但是就像其他新兴科技一样,这项技术的成本将迅速减少。研究人员表示,最快到2023年,DNA数据储存技术将会得到广泛的应用。