
概念假色蛋白的3D說明。 Christoph Burgstedt / Shutterstock.com
當涉及生命時,蛋白質就是一切。基因的蛋白質產生的基礎是每個細胞過程,一個人的外表,每個運動的每一個差異。產生這些蛋白質依賴於復雜的折疊氨基酸(我們的遺傳密碼產生的構件)的複雜系統,以創建複雜的結構,以決定蛋白質將如何作用以及其作用。儘管在蛋白質研究中進行了巨大的飛躍和技術進步,但了解蛋白質如何折疊以及簡單的氨基酸代碼將產生什麼形狀。這稱為“蛋白質折疊問題”,是生物學的最大挑戰之一。
但是,在一個突破科學家們認為,由英國的人工智能公司DeepMind的Alphafold團隊,他們在AI中找到了解決方案。深入學習系統被譽為“改變生物學和醫學”的成就,可能能夠從氨基酸代碼中模擬蛋白質結構,這一壯舉通常需要整個博士學位才能完成。
“將近50年來,我們一直在這個問題上陷入困境 - 蛋白質如何折疊。為了看到DeepMind為此提供解決方案,已經在這個問題上親自工作了這麼長時間,並且經過這麼多停止並開始,想知道我們是否會到達那裡,這是一個非常特殊的時刻。”陳述。
眾所周知,蛋白質結構很難弄清楚。我們當前的方法包括X射線晶體學,X射線晶體學涉及在X射線成像之前結晶蛋白樣品並編譯電子密度數據以創建3D結構或冷凍電子顯微鏡,該結構將樣品冷凍到3D成像之前的低溫溫度。這些使我們對蛋白質結構有了令人印象深刻的見解,但是某些蛋白質不能以這種方式成像,並且都需要大量時間,而且非常昂貴。
除此之外,這兩種技術都將永遠無法解決蛋白質折疊問題,因為它們僅對面前呈現的樣品進行圖像 - 如果您想從其氨基酸序列預測蛋白質結構怎麼辦?
相反,研究人員嘗試了另一種方法 - 他們為全球各地的人們創建了一個在線遊戲。該遊戲稱為折疊,是通過允許用戶預測給定序列的自己的蛋白質形狀來預測蛋白質折疊的眾包,並獲得了最高的評分模型。作為一種創新的方法,它是耗時,費力且常常不准確的。
為了解決這個問題,DeepMind招募了人工智能來做凡人無法做的事情。他們使用深度學習創建了一個AI驅動的系統,該系統可以在短短幾天的時間內預測從鹼性氨基酸序列到令人難以置信的準確性的蛋白質結構。
Alphafold開發人員指出:“我們對蛋白質數據庫中約170,000個蛋白質結構的公開數據進行了培訓,以及包含未知結構蛋白質序列的大數據庫。” “它使用了大約128個TPUV3核(大約等同於〜100-200個圖形處理單元),在幾週內運行,這在當今機器學習中使用的大多數大型最新模型的情況下是相對適量的計算。”

儘管官方數據尚未發布,但該公告使科學界的興奮和猜測對結構生物學意味著什麼。對蛋白質折疊的充分理解將飛躍諸如醫學前進的領域,這可能會使更有效,更量身定制的藥物的生產速度遠遠超過以往。
“這項計算工作代表了關於蛋白質折疊問題的驚人進步,這是一個50年曆史的生物學挑戰。它發生在該領域的許多人預測的數十年中。諾貝爾獎獲得者兼皇家學會主席Venki Ramakrishnan教授說:“看到它從根本上改變生物學研究的多種方式將是令人興奮的。”