行业新闻
Group news
青岛广盛源肥业有限公司    您的位置: 首页  >  行业新闻  >  正文

使用DNA在现实世界中存储数据

2019年10月12日 文章来源:网络整理 热度:165℃ 作者:刘英

相比传统的数据储存方式,DNA存储具有占用空间小、获取容易、储存时间长3大优势,但也面临存储速度慢、花费高的弊端。随着技术的不断成熟,它真的能成为主流吗?

全球每年产生的数据需要4180亿个1TB硬盘才能放下,若是把如此庞大的数据放到DNA上,只需 1kg DNA就够了!DNA存储才是未来!

几年前,甚至研究人员也不愿使用DNA来存储数据,因为这看起来过于科幻,并没有任何实用价值。今天,我们可以使用正确的软件和生物化学模块扩展PostgreSQL,并在DNA上运行SQL。

在这个数据爆炸的时代,全球的数据不仅远远超过我们理解数字的能力(比如你知道Zettabytes是多少吗?)更超过了我们的储存能力。

一切都是数字化的,一切都越来越多地运行在基于数据训练算法的应用程序上,而这些算法反过来会产生更多的数据来为更多的下游应用程序和算法提供信息。你懂了吧?

简单地说,按照这种速度,很快就没有足够的数据存储和计算材料可供使用。这就是为什么人们现在已经开始寻找替代的数据存储介质的原因。使用DNA来存储数据,这听起来很奇怪,实际上很有意义。现在,研究人员取得了突破,使他们能够将DNA存储整合到流行的开源数据库PostgreSQL中。

使用DNA在现实世界中存储数据

DNA是如何储存数据的?

DNA的核心是数据存储层。DNA由四种碱基组成:腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶(又名AGCT)。从这四个碱基中,DNA形成由三个核苷酸组成的基团(称为密码子)。密码子是给我们的细胞指示蛋白质形成的单位。

我们的信息技术基础设施基于以位(bits)为单位的信息存储(由两位数字组成:0和1),而DNA信息存储在四个潜在基本单元的串中。为了将非遗传信息存储在DNA中,我们必须首先将二进制数据从位转换为DNA数据(AGCT)结构。

使用DNA在现实世界中存储数据

将Bits转换为DNA序列

理论部分实际上相当简单。与使用硅或磁性介质(它们的工作原理是将状态存储为1和0的序列)相同,存储A、G、C和T的序列。但是,这在实践中是如何工作的呢?如何在DNA中写入和读取数据呢?

这听起来可能有点遥不可及,但分子技术的进步已经使它成为可行——尽管并不完美。

例如,微软展示了世界上第一个自动DNA数据存储和检索系统。如果你想知道这个DNA来自哪里:这是合成DNA,产生它的是系统的一部分。

天然存在的DNA由两条核苷酸链的双螺旋的形式构成。相反,用于数据存储的DNA是单链核苷酸序列,也称为寡核苷酸(oligo),它通过化学过程合成,该化学过程一次构建一个核苷酸。

使用DNA在现实世界中存储数据

伦敦帝国理工学院 SCALE实验室负责人Heinis和Eurecom数据科学系助理教授Appuswamy 在创新数据系统研究会议上发表了题为“ OligoArchive: Using DNA in the DBMS storage hierarchy ”的研究论文。虽然他们不是第一个使用DNA存储和检索数据的人,但他们是第一个使用结构化数据、与现成的数据库集成、并超越存储、实现计算的人。

关于DNA作为数据存储层的第一件事是,每次执行写操作时,都必须合成寡核苷酸。这将如何在实践中发挥作用?实验室技术人员是否必须待命执行此操作,并“重新填充”用于化学过程的原材料?

并非如此,根据Appuswamy和Heinis的说法,这是微软通过其自动DNA存储和检索系统所证明的价值所在。这表明,在没有人参与的情况下操作这样一个过程是可能的。就像除了维护,没有人监督数据中心的日常运作一样,这同样适用于基于DNA的数据中心。

尽管如此,我们还远没有用合成DNA阵列取代硬盘。首先,以这种方式存储数据的现代技术非常缓慢。刚开始,科学家们花了一周时间来存储一兆字节的数据。

Appuswamy和Heinis一致认为,在这方面还需要更多的工作。但这超出了他们自己的研究范围,所以只能等待生化合成过程进一步提高。

首先,他们注意到存储速度已经越来越快,目前速度是每秒几KB。虽然与SSD相比,这仍然非常缓慢,但这是一个很大的进步。对于Appuswamy和Heinis的研究(即归档存储),这实际上是可以接受的。

数据库引擎使用三层存储层次结构,由具有不同价格/性能特性的设备组成。性能层存储高性能OLTP和实时分析应用程序访问的数据。

容量层存储由延迟不敏感(latency-insensitive)的批分析应用程序访问的数据。归档层用于存储很少访问的数据,例如,在安全合规性检查或法律审计期间。今天磁带通常用于这一层。

上一篇:手机镜头未来发展潜力仍受厚度限制


下一篇:人工智能被纳入国家战略,催生AI落地中国

友情链接
Links