来源:生物通
印刷机和活字印刷术(可以排列和上墨的金属字母)的发明引发了文艺复兴和信息爆炸,这种爆炸一直持续到今天。
现在,研究人员报告说,在分子水平上应用可移动字体的概念,大大加快了在DNA链中编码数据的能力,DNA链是一种难以置信的高密度存储信息的介质。独立研究人员说,尽管目前只在实验室中进行了演示,但今天在《Nature》杂志上报道的这种新方法可以为新兴的DNA数据存储行业注入活力,因为它可以使重要信息存档几十年甚至更长时间都具有成本效益。Altos实验室的基因组学专家Kun Zhang说:“这是一个非常好的概念验证,也是对以前DNA数据存储方法的重大改进。”华盛顿大学的生物物理学家Jeff Nivala补充说:“它绕过了需要从头合成DNA的DNA数据存储障碍。”DNA数据存储的吸引力是巨大的:一克DNA可以存储多达215pb的数据,足以存储1000万小时的高清视频。按照这个速度,几辆皮卡卡车的DNA就可以存储人类记录的所有数据。传统的电子硬盘在几年或几十年内就会退化,而DNA可以持续数千年。此外,如今用DNA测序仪读出DNA四字母字母表编码的数据既直接又相对较快。问题是写入数据,这通常需要一次一个字母地合成定制的DNA链。今天最快的DNA编写者每天可以合成大约3.2亿字节的DNA数据。按照这个速度,写出一克DNA需要近200万年的时间。北京大学计算生物学家Long Qian表示:“与硬盘驱动器相比,它负担不起,因为写入速度相当慢。”为了加快速度,Qian和她的同事们从活字印刷术中寻找灵感,活字印刷术最初是在公元1040年左右在中国发明的,比约翰内斯·古腾堡的印刷机早400年,他们使用瓷器而非金属。作为“纸”,他们合成了长标准化的单链DNA模板片段。对于“类型”,他们合成了数百个短单链DNA“砖块”,每个“砖块”长24个碱基,其序列被设计成沿着DNA模板与特定区域结合。然后,研究人员转向细胞中一种叫做甲基化的自然过程,用数字0或1对积木进行编码。在体内,细胞将甲基(一个碳原子和三个氢原子)附着在特定的DNA序列上,以指示哪些基因应该在不同的组织中表达和沉默。为了存储DNA, Qian和她的同事们添加了一种酶,将甲基连接到一些DNA砖块(1s)上,而留下其他的(0)。就像文艺复兴时期的排字工人一样,他们选择砖块,用合适的15和0与模板对齐,以编码他们想要的任何数字文件。放置在溶液中,砖块很快找到并连接到模板上相应的序列。最后,研究人员必须“墨汁”打字并打印到纸上。他们添加了一种被称为甲基转移酶的酶,这种酶可以将砖块上的所有甲基复制到模板链上的邻近位置,然后可以通过商业DNA测序机读取。他们演示了写入和读取包含近27万比特的文件,足以对老虎和大熊猫等高分辨率图像进行编码。Qian说,目前用这种方法写入数据的成本约为每比特0.003美元。虽然这比DNA合成公司对每个新DNA字母的收费要高,但钱相信商业化操作将比她的实验室使用更少的试剂来降低成本。但是Qian说,这项研究已经证明了将数据写入DNA的速度加快了。钱估计,这种新方法的商业版本可以达到每天2tb的速度,比目前最好的商业DNA合成器提高了6000倍。Qian和她的同事们现在正在寻找除了甲基之外的其他化学标记来修饰DNA模板,以便每条链编码更多的数据,并进一步加快速度。如果成功,活字印刷术可能不仅是古代的突破之一,也是未来的突破之一。
参考文献
Parallel molecular data storage by printing epigenetic bits on DNA
阅读研究报告,欢迎访问欧米伽研究所的“未来知识库”
未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。