2024年10月9日,谷歌旗下公司DeepMind的 Demis Hassabis、John Jumpe 因對蛋白質結構的預測,與蛋白質設計先驅 David Baker 分享了2024年諾貝爾化學獎。
2024年11月11日,DeepMind宣布,其最新版AI蛋白質結構預測工具AlphaFold3正式開源,現(xiàn)在,科學家們可以下載其底層代碼,并將其應用于非商業(yè)領域。
半年前,DeepMind團隊在 Nature 期刊發(fā)表論文,描述了AlphaFold3,但并未隨論文公布其底層代碼和模型訓練權重,這一做法引起了科學家們的批評。
AI能夠準確預測蛋白質結構真正廣為人知,始于2021年DeepMind推出的AlphaFold2,其能夠根據氨基酸序列來準確預測蛋白質的三維結構。AlphaFold2的出現(xiàn),引發(fā)了蛋白質結構及其相互作用建模領域的一場革命,為蛋白質建模和設計應用提供了廣泛的可能。
2024年5月9日,Demis Hassabis、John Jumper 等人在 Nature 期刊發(fā)表了題為:Accurate structure prediction of biomolecular interactions with AlphaFold 3 的研究論文,推出了AlphaFold2的全面升級版——AlphaFold3。
AlphaFold3是一個強大的結構預測統(tǒng)一框架,涵蓋了前所未有的廣度和精確度,能夠高準確性預測蛋白質與各種生物分子相互作用的結構。這一最新模型能夠預測含有蛋白質數據庫內幾乎所有分子類型的復合物的結構,包括配體(小分子)、蛋白質、核酸(DNA和RNA)如何聚集在一起并相互作用,以及預測翻譯后修飾和離子對這些分子系統(tǒng)的結構影響,從而幫助我們在原子水平上精確地觀察生物分子系統(tǒng)的結構。
這種用計算機解析蛋白質與其他分子復雜相互作用的能力,有助于為疾病通路、基因組學、治療靶點、蛋白質工程及合成生物學等領域帶來新見解。更重要的是,AlphaFold3為藥物研發(fā)開辟了令人興奮的可能性,有望顛覆當前的藥物研發(fā)模式。
與AlphaFold2相比,AlphaFold3最大的進步在于——不僅能預測單個蛋白質的結構,還能預測蛋白質與幾乎任何生命分子的相互作用。
AlphaFold3預測蛋白質與DNA相互作用的結構
然而,DeepMind并沒有再像AlphaFold2那樣直接發(fā)布其底層代碼,而是通過一個網絡服務器提供對AlphaFold3的訪問權限,這限制了科學家們使用AlphaFold3做出預測的數量和類型,更重要的是,AlphaFold3的服務器阻止了科學家們使用AlphaFold3預測蛋白質與潛在藥物的相互作用。
DeepMind希望AlphaFold3能夠幫助科學家們重新認識生物世界、重新思考藥物發(fā)現(xiàn)。而同時,DeepMind又成立了一家名為Isomorphic Labs的子公司,利用AlphaFold3在藥物開發(fā)和設計方面的潛力來開發(fā)治療人類最致命疾病的新療法。
因此,DeepMind一開始只提供AlphaFold3的訪問權限,而不公布底層代碼和模型權重,是為了在促進科學研究與保護自身的商業(yè)野心之間取得平衡。
這一做法招致了科學家們的批評,DeepMind迅速做出回應,表示將在半年內推出AlphaFold3的開源版本。
現(xiàn)在,DeepMind決定公布AlphaFold3的底層代碼,任何人都可以下載AlphaFold3的代碼,意味著科學家可以暢通無阻地使用AlphaFold3進行各種預測。但目前只有學術機構(而非商業(yè)機構)的科學家才能根據要求獲得模型訓練權重(指在訓練過程中,模型通過學習數據集的特征而不斷調整的權重參數)。
DeepMind之所以決定開源AlphaFold3,除了來自科學界的批評之聲,還可能源于競爭壓力。
在AlphaFold3發(fā)布以來的幾個月里,已經有幾家公司根據原始論文中的偽代碼(Pseudocode)推出了受AlphaFold3啟發(fā)的開源蛋白質結構預測模型,其中包括來自中國的科技巨頭百度和字節(jié)跳動,以及來自美國的初創(chuàng)公司Chai Discovery。這些預測模型都沒有被授權用于藥物發(fā)現(xiàn)等商業(yè)應用。
而一家名為Ligo Biosciences的公司則推出了一款無需限制的AlphaFold3版本,但其目前還不具備AlphaFold3的全部功能,例如無法建模除蛋白質以外的藥物和分子。
此外,哥倫比亞大學的 Mohammed AlQuraishi 教授團隊則在開發(fā)沒有各種限制的AlphaFold3版本,他表示,希望在今年年底推出一個完全開源模型——OpenFold3。這將使制藥公司能夠使用專有數據(例如與不同藥物結合的蛋白質結構)重新訓練他們自己的模型版本,從而有可能提高預測性能。
AlphaFold2的開源,引發(fā)了科學家們大量創(chuàng)新。
例如,今年8月份,蛋白質工程師 Alex Naka 利用他的筆記本電腦和大約80個基于云計算的AI處理器,設計了幾十種蛋白質,這些蛋白質旨在靶向抑制腫瘤中發(fā)生突變的受體——EGFR(表皮生長因子受體),他選出了其中最有前景的10種設計,參加了一項新發(fā)起的蛋白質設計競賽,并登上了排行榜榜首。
今年10月份,維也納大學的研究人員在 Cell 期刊發(fā)表論文,利用DeepMind團隊推出了蛋白質-蛋白質復合物的結構和相互作用預測模型AlphaFold-Multimer,做出了一項重磅發(fā)現(xiàn)——確定了在精子和卵子結合中發(fā)揮關鍵的“媒人”作用的三種蛋白質——TMEM81、IZUMO1和SPACA6,沒有這三種蛋白質,從魚類到哺乳動物的有性繁殖可能會陷入死胡同。
具體來說,該研究發(fā)現(xiàn),TMEM81是在魚類和小鼠中必需的雄性生育因子,并發(fā)現(xiàn)它與IZUMO1和SPACA6相互作用。這三種蛋白組成的蛋白質復合物在受精過程中,分別與哺乳動物卵子上的JUNO蛋白或魚類卵子上的Bouncer蛋白結合,從而連接精子和卵子膜。
2024年諾貝爾化學獎得主、AlphaFold團隊負責人 John Jumper 表示,期待AlphaFold3在開源后,會同樣帶來驚喜。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com