细菌大肠杆菌有时会使我们生病,但它们已经成为科学的主力。哈佛大学研究人员在“自然”杂志发表的一份报告中表明,可以将图像和电影转存、嵌入到活体大肠杆菌细胞的DNA中。
左边是“Anna G”马赛克动图的框架,它们被编码成核苷酸,并由Crispr基因编辑技术依次实验捕获,将其植入活性细菌的DNA当中;右边是多代细菌生长后的框架。
这个gif图的内容是一个人骑着马狂奔时的情景,它只有5帧图像,36x26个像素大小。Shipman和他的同事使用CRISPR–Cas系统把这个gif图存进一群细菌的基因组中,并发现,他们目前存取信息的准确度能达到90%左右。
实际上,使用DNA存储数据并不新鲜,我们早就已经听说过“基因能够储存大量信息”的概念。据Xtecher了解,此前也有科学家尝试过将近60万字的《战争与和平》小说嵌入其中,以及像斯瓦尔巴全球种子库的植物材料归档那样。不过它们都是合成DNA,而不是本次这样的活细菌DNA。
除存了一张人骑着马狂奔的Gif图,研究人员还尝试在这群细菌中存了一张人手的照片。上图是其编码、存储和读取信息的过程。
DNA的特点是能够在生物体内高保真地复制,从而保证其正确地被传递下去。但细胞总是在变化,因此将信息存在活细菌DNA当中更加困难。
要解决两个问题:首先是如何编码,然后是如何将这些电报一样的编码转入,并稳定地储存在大肠杆菌中。
DNA是包括人在内很多生命体的遗传物质,储存着生命最重要的遗传信息。作为生物细胞中最稳定的成分之一,长长的DNA序列由一个个核苷酸组成。在人类基因组中,三个核苷酸代表一个语义。
研究人员在一群大肠杆菌中存储了一张gif图:一个人骑着马狂奔。上图是其编码、存储和读取信息的过程。
在希普曼的研究中,他们也用核苷酸生成代码,一个代码关联一张图片中单个像素。也就是说,每个像素都对应着多个核苷酸组成的DNA序列。
视频由一张张按时间顺序出现的图像组成,单张图像被解构成像素代码,对应着核苷酸序列。
研究人员合成了代表上述图像的DNA序列,通过电穿孔技术,把这些DNA转入大肠杆菌中。在CRISPR-Cas系统的帮助下,这些DNA被整合到大肠杆菌基因组中。一旦整合,就实现了信息的存储。
Shipman表示:“我们发现,如果我们让自己提供的序列看起来像是系统通常从细胞中获取的那样,这些序列通常会采取我们提供的编码。”
一旦信息嵌入细菌,下一步就是测序。因此,该研究小组对大肠杆菌的DNA进行了测序,并通过计算机程序运行序列,从而成功复制了原始图像。因此,您在文章一开头看到的“奔驰的骏马”就是计算机对DNA序列的测试,毕竟,我们不能用肉眼看到DNA。
图像和视频的选择并不是随机的,Shipma表示该团队希望参考一些人类曾经放在自然界中的原始形象,比如现在团队手中的洞穴画。Muybridge电影的五帧动图也是此次动态影像之一,图中一匹驰骋的骏马,这使用了20世纪70年代的新技术。Shipman表示,“我们还将以新的方式将信息编码到自然界,并尝试和测试新的东西”。
只是,到目前为止,这种方式无法处理大量的信息。文章一开始的动图只有36*26像素,如果我们想在合成DNA存储更长的电影和书籍,未来还有很长的路要走。
但使用活细菌编码存储的新方法打开了令人兴奋的大门,也证明了活细菌DNA存储的可能性。例如,我们可以使细胞记录附近环境中发生的情况。作为神经科学家,Shipman希望有一天可以将Crispr系统用于记录随时间发生的事件,例如神经元在大脑中的形成。是的,也许未来有一天,你可以将《权力游戏》嵌入你的皮肤当中。
据Xtecher了解,Crispr 被认为是下一个重大科学应用,它能够安全地切开一段 DNA,并将新基因材料拼接上去。其应用领域非常广泛,甚至在未来还能切除致病基因片段、添加健康材料,攻克癌症等等。