
概念假色蛋白的3D说明。 Christoph Burgstedt / Shutterstock.com
当涉及生命时,蛋白质就是一切。基因的蛋白质产生的基础是每个细胞过程,一个人的外表,每个运动的每一个差异。产生这些蛋白质依赖于复杂的折叠氨基酸(我们的遗传密码产生的构件)的复杂系统,以创建复杂的结构,以决定蛋白质将如何作用以及其作用。尽管在蛋白质研究中进行了巨大的飞跃和技术进步,但了解蛋白质如何折叠以及简单的氨基酸代码将产生什么形状。这称为“蛋白质折叠问题”,是生物学的最大挑战之一。
但是,在一个突破科学家们认为,由英国的人工智能公司DeepMind的Alphafold团队,他们在AI中找到了解决方案。深入学习系统被誉为“改变生物学和医学”的成就,可能能够从氨基酸代码中模拟蛋白质结构,这一壮举通常需要整个博士学位才能完成。
“我们一直困扰着这个问题 - 蛋白质如何折叠近50年。要看到DeepMind为此产生解决方案,在这个问题上亲自工作了这么长时间,经过这么长时间的工作,想知道我们是否会到达那里,这是一个非常特殊的时刻。陈述。
众所周知,蛋白质结构很难弄清楚。我们当前的方法包括X射线晶体学,X射线晶体学涉及在X射线成像之前结晶蛋白样品并编译电子密度数据以创建3D结构或冷冻电子显微镜,该结构将样品冷冻到3D成像之前的低温温度。这些使我们对蛋白质结构有了令人印象深刻的见解,但是某些蛋白质不能以这种方式成像,并且都需要大量时间,而且非常昂贵。
除此之外,这两种技术都将永远无法解决蛋白质折叠问题,因为它们仅对面前呈现的样品进行图像 - 如果您想从其氨基酸序列预测蛋白质结构怎么办?
相反,研究人员尝试了另一种方法 - 他们为全球各地的人们创建了一个在线游戏。该游戏称为折叠,是通过允许用户预测给定序列的自己的蛋白质形状来预测蛋白质折叠的众包,并获得了最高的评分模型。作为一种创新的方法,它是耗时,费力且常常不准确的。
为了解决这个问题,DeepMind招募了人工智能来做凡人无法做的事情。他们使用深度学习创建了一个AI驱动的系统,该系统可以在短短几天的时间内预测从碱性氨基酸序列到令人难以置信的准确性的蛋白质结构。
Alphafold开发人员指出:“我们对蛋白质数据库中约170,000个蛋白质结构的公开数据进行了培训,以及包含未知结构蛋白质序列的大数据库。” “它使用了大约128个TPUV3核(大约等同于〜100-200个图形处理单元),在几周内运行,这在当今机器学习中使用的大多数大型最新模型的情况下是相对适量的计算。”

尽管官方数据尚未发布,但该公告使科学界的兴奋和猜测对结构生物学意味着什么。对蛋白质折叠的充分理解将飞跃诸如医学前进的领域,这可能会使更有效,更量身定制的药物的生产速度远远超过以往。
“这项计算工作代表了蛋白质折叠问题的惊人进步,这是一项50年历史的生物学挑战。它发生在几十年之前,在该领域的许多人预测的是,这将是令人兴奋的,很高兴看到它从根本上改变生物学研究的许多方式,”诺贝尔·拉马克兰(Venki Ramakrishnan)教授说,诺贝尔·拉马克兰(Nobel Ramakrishnan)说。