侵權投訴
訂閱
糾錯
加入自媒體

丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

2022-08-09 09:09
Ai芯天下
關注

前言:

蛋白質(zhì)是有機體內(nèi)細胞的關鍵構成部分,也被稱為支撐生命正常運轉(zhuǎn)的基石。它具有一定的形狀和空間結構,且形狀與功能之間有密切的聯(lián)系。

因此,只有深入了解蛋白質(zhì)結構,才能更好地掌握原理和功能,進一步推動生物科學的發(fā)展。

作者 | 方文

圖片來源 |   網(wǎng) 絡

蛋白質(zhì)結構研究加速度

蛋白質(zhì)是生命的基石,由氨基酸鏈組成,并折疊成復雜的形狀。蛋白質(zhì)根據(jù)儲存在DNA中的指令產(chǎn)生復雜的生物分子,它們執(zhí)行著至關重要的細胞任務,并完成各種機體功能。

一些蛋白質(zhì)是有益的,例如那些參與消化食物的蛋白質(zhì);而另一些則是有害的,例如那些參與腫瘤生長的蛋白質(zhì)。它們各自都有著非常復雜的形狀和結構。

由于蛋白質(zhì)的形狀與其功能密切相關。了解蛋白質(zhì)的結構可以更好地了解其作用和工作原理,這也是解決許多生命科學問題的關鍵。

以前,研究人員需要付出幾個月或幾年的時間和精力,才能弄清蛋白質(zhì)的結構。

如今,憑借人工智能的力量,幾秒鐘內(nèi)就能完成。

它不僅可被用于疾病研究、食物安全、疫苗開發(fā)、可持續(xù)發(fā)展等領域;

還幫助科學家深入了解體內(nèi)復雜過程是如何工作的、以及哪些有機分子能被用于克服污染、生命起源于何處等那些為全人類所關注的重要問題。

AlphaFold蛋白質(zhì)數(shù)據(jù)庫

AlphaFold蛋白質(zhì)數(shù)據(jù)庫不僅實現(xiàn)了1000倍的擴容,成為[蛋白質(zhì)宇宙],更能在幾分鐘破解漸凍人等不治之癥相關的世界級生物難題。

這些轉(zhuǎn)儲數(shù)據(jù)將在Deep Mind和歐洲分子生物學實驗室歐洲生物信息研究所共同建立的一個數(shù)據(jù)庫中免費公開。

AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

在這些逾 2.14 億個結構預測中,約35%的預測結果被認為準確度很高,即和實驗解析的結構一樣可靠。

另有45%的預測被認為置信度足夠高,在很多情況下都能使用。

AlphaFold預測的許多結構都很可靠,能在很多情況下替代實驗解析的結構。

其他情況下,研究人員會用AlphaFold的預測結果驗證和解讀實驗數(shù)據(jù)。

不可靠的預測結果一望即知,其中一些源于蛋白質(zhì)固有的無序性質(zhì),這種無序意味著蛋白質(zhì)本身沒有固定的形狀,至少在沒有其他分子的情況下是無序的。

AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

AlphaFold的發(fā)展歷程

2016年,DeepMind公司開發(fā)的AlphaGo擊敗韓國傳奇圍棋選手李世石后,其先進性與潛力受到認可,DeepMind決定成立團隊開始研究[蛋白質(zhì)折疊問題]。

2018年12月,AlphaFold在第13屆國際蛋白質(zhì)結構預測競賽上預測出了43種蛋白質(zhì)中25種蛋白質(zhì)的最精確結構。

2020年,DeepMind 推出一個名為 AlphaFold的AI算法,它可以正確地完成蛋白質(zhì)的結構測定。

2021年,與歐洲分子生物學實驗室EMBL合作,建立了一個公開發(fā)布 AlphaFold 預測結果的可搜索數(shù)據(jù)庫,即 AlphaFold DB,其公布的最初一組數(shù)據(jù)包含了 98% 的人類蛋白質(zhì)。

2021年7月15日,DeepMind通過一篇Nature論文開源了其基于深度學習神經(jīng)網(wǎng)絡的AlphaFold2模型;

7月22日,DeepMind再次發(fā)表Nature論文,推出AlphaFold蛋白質(zhì)結構數(shù)據(jù)庫,向公眾免費開放人類蛋白質(zhì)組以及另外20種模式生物的總共超過350000種結構,并且對98.5%的人類蛋白質(zhì)結構進行了準確預測。

AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

今年1月,DeepMind 宣布已經(jīng)有超過30萬研究者使用了 AlphaFold數(shù)據(jù)庫,并且添加了超過27個蛋白質(zhì)組,總計超過19萬條蛋白質(zhì)結構預測數(shù)據(jù)。

這次添加的重要性在于其中17個蛋白質(zhì)組都和被忽視熱帶疾病有關,影響全球十多億人。

今年7月,DeepMind 將 AlphaFold 數(shù)據(jù)庫從近100萬條擴展到2.14億條,覆蓋了人類已知的絕大多數(shù)蛋白質(zhì)。

AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

目前預測準確度尚待提升

人工智能有一個學習的過程,要通過大量的訓練來提升其準確性。

如果AlphaFold預測的蛋白質(zhì)結構是不常見的結構,AI無法通過已有的知識學習到這個結構,預測時就容易產(chǎn)生偏差。

AI是一個能夠利用現(xiàn)有的知識預測將來的工具,如果連現(xiàn)有的知識都是缺失狀態(tài),自然無法預測新結構。

除非把世界上所有的蛋白質(zhì)結構都預測并驗證過了,否則是不可能達到100%的準確率。

雖然對部分蛋白質(zhì)結構的預測不完全準確,但AlphaFold蛋白質(zhì)結構數(shù)據(jù)庫在開放數(shù)據(jù)的同時也提供了相應結構預測的準確度報告,為使用者提供參考。

AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

將開啟數(shù)字生物學新時代

過去幾十年來,確定蛋白質(zhì)結構的主要方法是實驗室中的各種成像技術,包括X 射線晶體學、冷凍電鏡、微晶電子衍射等。

這些方式通常依賴昂貴的設備,耗時比較長,解析出一個蛋白質(zhì)結構可能需要數(shù)月甚至數(shù)年時間。

與實驗室中的各種成像技術相比,基于氨基酸序列預測蛋白質(zhì)結構是一種極具吸引力的方式,也是 AI 在生命科學領域的重要落腳點。

以 AlphaFold 為代表的蛋白結構預測模型可能是人工智能對科學界的最大貢獻。

DeepMind 在官方通稿中表示:以 AlphaFold 為代表的蛋白結構預測將生物學帶入了一個結構更為豐富的時代,并以數(shù)字化速度開啟科學探索。

AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

結尾:

數(shù)量龐大的蛋白質(zhì)結構為生命科學研究帶來的影響仍是毋庸置疑,尤其是在結構生物學的領域。

AlphaFold蛋白質(zhì)結構數(shù)據(jù)庫中的結構雖然有不足之處,不能全部將其應用于研究中,但數(shù)量龐大的蛋白質(zhì)結構對生命科學各個領域的研究,仍有著不可忽略的意義。

部分資料參考:雷鋒網(wǎng):《AlphaFold 新成果再次引爆生命科學界》,ZAKER:《AlphaFold把幾乎所有已知蛋白質(zhì)的結構預測完了》,硅星人:《DeepMind“順手”放的大招,要一舉攻克漸凍人癥》

       原文標題 : AI芯天下丨分析丨AlphaFold幾乎破解所有蛋白質(zhì),Deep Mind的下一步戰(zhàn)略?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號