人工智能(AI)公司DeepMind表示,它将很快发布一个数据库,其中包括科学已知的每种蛋白质的形状,超过1亿。
这就是人体中的每个结构化蛋白质,以及20种研究物种,包括酵母和大肠杆菌细菌,果蝇和小鼠。在公司的Alphafold项目(使用人工智能预测蛋白质形状)之前,人体中只有17%的蛋白质已确定其结构。技术评论。
伦敦帝国学院的合成生物学家汤姆·埃利斯(Tom Ellis)告诉《技术评论》:“看起来令人印象深刻。”
蛋白质折叠非常复杂。蛋白质由长长的构件制成氨基酸,将自己包裹成奇怪而复杂的形状,形成功能结构。在实验室中拆开这些结构需要很长时间,但很深在12月宣布其字母算法可以确定蛋白质的形状原子在几分钟内。该公司称,到目前为止,Alphafold已经预测了36%的人类蛋白质具有原子水平的准确性,并且已经预测了一半以上的精度,足以激发蛋白质功能的研究。 (大约三分之一的蛋白质在体内没有结构,除非它们与其他物质结合,因此深膜无法准确预测它们的形状。)Alphafold使用神经网络进行这些预测,这是一种算法,一种算法,旨在模仿该算法。脑在大量数据中,处理信息,尤其擅长识别模式(例如特定的氨基酸序列相互作用)。
埃利斯告诉《技术评论》,仍需要在实验室中确认预测的形状。如果结果成立,它们将迅速推动对蛋白质组或给定生物体中蛋白质的研究。 DeepMind研究人员发表了他们的开源法规,并列出了该方法两篇由同行评审的论文 在自然界发表上星期。
他们现在已经在Alphafold蛋白质结构数据库中自由使用了约35万蛋白质结构,根据公司公告。其中包括人类基因组表达的20,000蛋白。 (当“表达”蛋白质时,这意味着将存储在基因组中的信息转化为指令以制造蛋白质,然后在体内发挥某些功能。)在接下来的几个月中,该公司计划添加几乎所有已知科学已知的测序蛋白质。
了解蛋白质结构可以帮助研究人员深入研究疾病的原因,并使他们能够发现可以在体内执行特定功能的新药。根据DeepMind的说法,研究人员已经在使用Alphafold的发现来研究抗生素耐药性,研究导致Covid-19的SARS-COV-2病毒的生物学,并寻求新的酶可以用来回收塑料。
最初发表在现场科学上