DeepMind人工智能破解了蛋白质结构的密码

alphafold预测蛋白质折叠,具有突破性的精度。

由伦敦DeepMind开发的人工智能AlphaFold在过去几十年里取得了突破性进展,它预测了蛋白质的结构,除了用x射线实际解剖蛋白质外,其准确性无与伦比。

这项研究的成功来自第14轮蛋白质结构预测技术的关键评估(CASP),这是一项只基于氨基酸序列预测蛋白质结构的竞赛。

“蛋白质是非常复杂的分子,他们精确的三维结构是许多角色,他们执行的关键,例如胰岛素调节血糖水平在我们的血液和抗体帮助我们抵抗感染,”马里兰大学的约翰•蜕皮CASP的联合创始人和主席,说新闻稿。

“即使是这些重要分子的微小重排也会对我们的健康产生灾难性影响,因此了解疾病的最有效方法之一,并找到新的治疗方法是研究所涉及的蛋白质。”

Alphafold的准确性足够高,Casp已将其称为蛋白质折叠问题的解决方案。

英国剑桥欧洲生物信息学研究所的珍妮特·桑顿夫人在一次新闻发布会上说:“我开始认为,这个问题在我有生之年不会得到解决。”

“知道这些结构真的有助于我们了解人类如何运作和功能,我们如何工作。”

(蛋白质)结构确定功能

蛋白质是生命的基础 - 或者在病毒的情况下,类似的东西。它们由20种不同氨基酸的长串组成,其又为DNA编码。

但只是因为你知道蛋白质的遗传代码并不意味着你可以预测它看起来像什么。虽然DNA告诉您蛋白质的氨基酸成分,但它并没有告诉您所有这些成分如何适合并将其折叠成三维物体。

蛋白质的结构是复杂的,由丝带、藤蔓和卷薯条组成的三维缠绕;氨基酸以非常特定的方式折叠形成非常特定的形式。蛋白质折叠是它们唯一的工作方式;如果它们不能正确折叠——或者根本没有折叠——后果可能是可怕的。

(以可怕的朊病毒为例,它是一种错误折叠的蛋白质,可以导致其他蛋白质错误折叠,从而导致许多脑融化疾病,最著名的是“疯牛病”和CJD。)

虽然我们知道许多遗传码和它们编码的氨基酸,但能够从那些酸中飞跃到它们看起来像3D蛋白质结构的东西是漫长而艰苦,昂贵的过程。蛋白质更大,更复杂,越难。

当克里斯蒂安·安芬森(Christian Anfinsen)在1972年的诺贝尔奖获奖演讲中提出,蛋白质的结构应该决定其功能时,这开启了数十年的研究工作,朝着科学的伟大风车之一倾斜。

可能是可能的蛋白质结构的难以理解的数量;这监护人'伊aniam样本挂钩在googol立方体的数字,如果我键入它,那将是一个1300zeroes。

麻省理工学院技术评论,实验室目前使用X射线晶体学,核磁共振或冷冻电子显微镜测定蛋白质的结构。我不会进入他们在这里工作,但足以说,这些方法可以消耗充足的时间和资本。

“成千上万的人类蛋白质和其他数十亿种,包括细菌和病毒,但锻炼的形状只需要昂贵的设备,可能需要多年的时间,”莫尔特说。

如果能够根据蛋白质的遗传密码来预测它们复杂的折纸形状,将为科学研究开辟一个广阔的天地。

“这真的是一个很大的事。”

Casp比赛于1994年落成。每两年,球队挑战,妥善预测基于其氨基酸序列的数十种蛋白质的结构。蛋白质结构首先在实验室中工作,然后与不同AI或计算机程序的预测相比。

Deepmind已经在Casp挥手了。Alphafold在2018年版中展出了强烈的表演;在2020年,它粉碎了它。

“这真的是一项大不了的大奖,”华盛顿大学蛋白质设计研究所负责人David Baker告诉麻省理工学院技术审查。(蛋白质设计研究所在折叠后面,使蛋白质折叠到游戏中并竞争性地挤Coronavirus抗病毒目标。)

英国遗传学家亚当·卢瑟福在推特上写道:“DeepMind的蛋白质折叠结果真的很不可思议,也非常重要。”但正如他所指出的,这也是一种头发情结。

以下是崩溃:Casp Rates如何准确蛋白质结构预测使用称为全局距离测试(GDT)的测量。从0-100划分,这基本上是表示您预测的结构是多么接近氨基酸的实际位置,通过与MRIS或X射线晶体学的观察确定。

GDT的90分被认为与目前的黄金标准实验室观察值相当。对于非常小、非常简单的蛋白质来说,这是一个容易的目标,但对于较大的蛋白质和更复杂的形状来说,就变得非常困难了。

alphafold在所有目标中都有92.4的中位数得分。当介绍深度的博客他们被描述为“非常难”预测的蛋白质结构,GDT的中位数为87.0。

alphafold不仅击败了其他计算机程序和进入CASP的AIS,而且在实验室中获得的蛋白质结构几乎是准确的。

“这是一个很大的事,”莫尔特告诉自然.“从某种意义上说,问题已经解决了。”

DeepMind在训练AlphaFold时,使用了一个来自蛋白质数据库的约17万个已知蛋白质结构的数据库,以及大量结构未知的蛋白质序列。将所有这些信息输入AlphaFold的深度学习神经网络后,DeepMind让它以“相对适中的”计算机马力运行了几周。

据《麻省理工学院技术评论》报道,基于这项工作,AlphaFold可以高度精确地猜测氨基酸在未知蛋白质结构中的位置。

谁知道未来折叠的东西

对蛋白质折叠和蛋白质结构的理解可能会从根本上改变我们对任何与蛋白质有关的功能的理解,基本上是对所有生物学的理解。

Alphafold已经帮助在该领域。德国Max Planck发育生物学研究所的进化生物学家安德烈·卢布斯使用了alphafold来挑剔蛋白质结构,这些蛋白质结构已经闪烁了他的实验室。

“427组(DeepMind的Casp Psedony)的模型在半小时后给了我们我们的结构,之后我们花了十年的一切,”Lupas - 谁评估了Casp的高精度模型 - 告诉大自然。

Deepmind创始人和首席执行官Demis Hassabis推断了Deepmind希望alphafold“将对疾病的理解和药物发现产生很大影响。”

能够准确预测一种蛋白质的结构可以帮助研究人员开发新的药物,比如抗体或抗病毒药物,阻止SARS-CoV-2的各种蛋白质,包括尖峰蛋白,并帮助提高我们对疾病在体内的作用的理解。

长期影响可能涉及帮助科学家设计可以吃掉废物,增强生物燃料的蛋白质,创造更健康,更加强硬的作物。

然而,不要让号角淹没了一些仍有待完成的工作。

据《自然》杂志报道,AlphaFold在⅔的目标中取得了令人印象深刻的成绩,但与磁共振成像相比,它出现了一些问题;根据Moult的说法,这可能是技术如何将数据转化为模型之间的差异。到目前为止,它还很难预测蛋白质复合物中的蛋白质结构,在蛋白质复合物中,几种不同的蛋白质可以改变彼此的折叠。

Deepmind在alphafold纸上工作,并弄清楚了使研究人员能够获得工具的方法。

深度背后的终极愿景一直是建立AI,然后通过加快科学发现的速度来帮助进一步了解我们周围世界的知识,“Hassabis推文。

“对我们来说,AlphaFold代表了这一论点令人兴奋的第一个证明点。”

下一个
在家乳腺癌筛查
订阅到Freethink了解更多信息伟大的故事