生物研究的新时代已经开启,人工智能(AI) 预测科学上几乎所有已知蛋白质的 3D 形状——仅一年后首次数据发布。
感谢 Google 旗下人工智能公司 DeepMind 开发的人工智能工具 AlphaFold,现在已经有超过 2 亿个蛋白质结构在一个免费访问、可搜索的数据库(称为 AlphaFold DB)中在线共享。
这一成就为对蛋白质(生命的基石)进行无数的科学探索铺平了道路。研究人员兴奋得头晕目眩。
“确定蛋白质的 3D 结构过去需要花费数月或数年的时间,现在只需要几秒钟,”斯克里普斯研究转化研究所的心脏病专家埃里克·托波尔 (Eric Topol)解释了在有关数据发布的声明中。
“随着这种新结构的出现几乎照亮了整个蛋白质宇宙,我们可以期待每天有更多的生物谜团被解开。”
DeepMind 与欧洲分子生物学实验室欧洲生物信息学研究所 (EMBL-EBI) 的科学家合作,推出了其第一批 AlphaFold 预测去年7月。
被誉为一种革命性的工具转变生物学研究为了加速药物发现,AlphaFold 根据氨基酸序列预测蛋白质的 3D 形状。
这些氨基酸序列以链的形式连接在一起,将长蛋白质卷绕起来,这些蛋白质被折叠成褶皱片和扭曲丝带。
通过了解任何给定蛋白质折叠成的形状,科学家可以掌握该蛋白质的运作方式,破译其在细胞内的主要作用。
AlphaFold 旨在加速这一过程,在最新发布的数据中提供了超过 2 亿个在植物、细菌、动物和其他生物体中发现的蛋白质的预测结构。
DeepMind 首席执行官德米斯·哈萨比斯 (Demis Hassabis) 表示:“这种希望成为现实的速度远远快于我们的梦想。”说在有关最新数据发布的声明中。
对于#人工智能在生命科学领域。通过开源发布超过 2 亿个预测的 3D 蛋白质结构#阿尔法折叠,几乎整个蛋白质宇宙
— 埃里克·托波尔 (@EricTopol)2022 年 7 月 28 日
看:https://t.co/gjASHqACqa@DeepMind
我的评论如下pic.twitter.com/yPgtPHMZac
研究人员已经使用 AlphaFold 的第一批预测来完善他们对致命疾病的理解,例如疟疾,打开改进疫苗的大门,并且到破解生物谜题关于困扰科学家数十年的庞然大物蛋白质。
更不用说识别出以前从未见过的可以帮助的酶了升级循环塑料污染。
“AlphaFold 在分子生物学界引起了轩然大波,”说Sameer Velankar,结构生物学家,负责 EMBL-EBI 蛋白质数据库。
“仅在过去一年,就有超过一千篇关于广泛研究主题的科学文章使用了 AlphaFold 结构;我从未见过类似的东西。
“这只是 100 万次预测的影响,”Velankar额外。 “想象一下在 AlphaFold 数据库中公开访问超过 2 亿个蛋白质结构预测的影响。”
尽管开源 AlphaFold 软件自去年发布以来就已经可供研究人员使用,但在可搜索数据库中拥有数百万个预测的蛋白质结构无疑将加快研究速度。
根据 EMBL-EBI 的数据,在超过 2.14 亿个预测中,大约三分之一被归类为高度准确,与 X 射线晶体学和冷冻电子显微镜等常用实验方法得出的蛋白质结构相当。
几十年来,科学家们从这些方法产生的模糊图片中煞费苦心地推断出分子结构——也许最著名的是罗莎琳德·富兰克林的螺旋 DNA 图像。
然而,AlphaFold 的预测质量各不相同,并且可能不太准确对于科学家知之甚少的稀有蛋白质。因此,在某些情况下,其预测的结构可用于理解实验数据。
尽管有庞大的数据转储,但 AlphaFold 仍然无法捕获大量生命,包括有关蛋白质组装后如何相互作用的预测。
从土壤和海水中的遗传物质痕迹中鉴定出的微生物蛋白质也不在数据库中——但这些微生物代表了一种尚未开发的有效化合物资源,因为科学家们已经将其编目只有一小部分全部的地球上的微生物生命。
一些科学家还提出了对可访问性的担忧AlphaFold 数据库及其惊人的 23 TB 内容,考虑到复杂的数据分析所需的昂贵的计算机能力和基于云的存储,对于某些研究团队来说访问这些内容可能不太可行。
尽管如此,DeepMind 表示,它已经给人类健康带来了迫在眉睫的好处仔细权衡潜在的生物伦理风险——如此宏伟,几乎难以想象。
结构生物学家兼 EMBL-EBI 高级科学家 Janet Thornton 女爵士表示:“我预计这一最新更新将在未来数月乃至数年内引发大量令人兴奋的新发现”告诉 卫报。 “这都要归功于数据可供所有人公开使用。”
DeepMind 和 EMBL-EBI 将继续定期刷新 AlphaFold 数据库。但现在,您可以阅读有关最新数据发布和过去发现的更多信息这里。