一个关于蛋白质结构和行为的长期存在且极其复杂的科学问题已被一种新的方法有效地解决了。(人工智能)系统,科学家报告。
DeepMind 是一家总部位于英国的人工智能公司多年来让我们惊叹不已其不断进步的神经网络不断击败人类复杂的游戏,例如国际象棋和围棋。
然而,所有这些渐进的进步不仅仅是掌握娱乐消遣。
在后台,DeepMind 的研究人员正在寻求引导他们的人工智能解决更多问题根本性重要的科学难题– 例如通过预测人类生物学中微小但极其重要的方面来寻找对抗疾病的新方法。
现在,凭借最新版本的 AlphaFold AI 引擎,他们似乎实际上已经实现了这个非常雄心勃勃的目标 - 或者至少让我们比科学家以前更接近这个目标。
大约 50 年来,研究人员一直致力于预测蛋白质如何实现三维结构,而且这不是一个容易解决的问题。
事实上,潜在配置的数量之大令人难以置信,以至于研究人员假设需要比宇宙的年龄还长对所有可能的分子排列进行采样。
尽管如此,如果我们能够解决这个难题——被称为蛋白质折叠问题– 它将构成科学能力的巨大突破,极大地加速药物发现和疾病建模等方面的研究工作,并带来远远超出健康范围的新应用。
因此,尽管挑战规模巨大,但几十年来,研究人员一直在合作开发蛋白质折叠问题的解决方案,并取得了进展。
一项严格的实验称为CASP(蛋白质结构预测的关键评估)始于 20 世纪 90 年代,向科学家提出挑战,要求他们设计出能够预测蛋白质折叠深奥之谜的系统。
现在,在第三个十年中,CASP 实验看起来已经产生了迄今为止最有前途的解决方案——DeepMind 的 AlphaFold 以前所未有的准确性提供 3D 蛋白质结构的预测。
“近 50 年来,我们一直致力于解决这一问题——蛋白质如何折叠。”说CASP 联合创始人来自马里兰大学的约翰·莫尔特 (John Moult)。
“看到 DeepMind 为这个问题制定了一个解决方案,我个人在这个问题上工作了这么长时间,经过了这么多次停下来,并开始怀疑我们是否能实现这一目标,这是一个非常特殊的时刻。”
在实验中,DeepMind 使用了 AlphaFold 的新深度学习架构,能够解释和计算 3D 蛋白质的“空间图”,预测支撑其折叠配置的分子结构。
该系统通过分析大约 170,000 个蛋白质结构的数据库进行训练,在今年的 CASP 挑战赛(称为 CASP14)中运用了其独特的技能,其预测中位数达到 92.4 GDT(全球距离测试)。
这高于约 90 GDT 阈值,该阈值通常被认为与通过实验方法获得的相同结果具有竞争力,而 DeepMind 表示其预测仅偏离约 1.6埃平均(大约一个原子的宽度)。
“当我看到这些结果时,我差点从椅子上摔下来。”基因组学研究员 Ewan Birney 说来自欧洲分子生物学实验室。
“我知道 CASP 有多严格——它基本上确保计算建模必须执行具有挑战性的任务从一开始就蛋白质折叠。 看到这些模型能够如此准确地做到这一点,我感到很荣幸。 有很多方面需要理解,但这对科学来说是一个巨大的进步。”
值得注意的是,该研究尚未经过同行评审,也没有在科学期刊上发表(尽管 DeepMind 的研究人员表示正在开发中)。
即便如此,熟悉该领域的专家已经认可并赞扬这一突破,尽管完整的报告和详细的结果还有待观察。
“这项计算工作代表了蛋白质折叠问题的惊人进展,这是生物学领域 50 年来的一项重大挑战,”说结构生物学家 Venki Ramakrishnan,英国皇家学会主席。
“这件事的发生比该领域许多人的预测早了几十年。”
完整的研究结果尚未发表,但您可以查看该研究的摘要,“使用深度学习进行高精度蛋白质结构预测”,这里,并找到有关 CASP14 的更多信息这里。