侵權(quán)投訴
訂閱
糾錯
加入自媒體

蛋白質(zhì)的新“折疊”!DeepMind重磅推出家族新成員AlphaFold

人工智能領(lǐng)域第一大家族,來自DeepMind的Alpha家族最喜歡做的事情就是出其不意。

它們所有的小確幸都是,意料之中、精彩尤甚。

比如之前一戰(zhàn)成名的AlphaGo、后續(xù)傲嬌的AlphaZero,以及這兩天剛剛加入家族戰(zhàn)隊的AlphaFold,中文封號為,阿爾法折疊。

生物醫(yī)學(xué)領(lǐng)域,一向都是冷靜與熱情并存,而這位AI新寵兒AlphaFold的性格雖然還不明朗,但至少目前看來,勢必會引發(fā)生物醫(yī)學(xué)領(lǐng)域新一輪的研究加速。

“小奇妙”阿爾法折疊

據(jù)DeepMind介紹,阿爾法折疊這項成果的重大意義就在于,你給它一段基因序列(生物學(xué)上稱其為蛋白質(zhì)一級結(jié)構(gòu)),在電腦上跑一下,就可以成功對這種蛋白質(zhì)建模。

看似簡單,但意義非凡。

在過去五十年,和阿爾法折疊起到相同功能的技術(shù)有冷凍電子顯微鏡、核磁共振或X射線晶體學(xué)等實驗技術(shù)。單看儀器,它們就需要高昂的價格,但最重要的是,其實驗成本也很高,需要專人做大量的實驗,器材損耗不說,實驗用料就要花費數(shù)萬美元。

花錢不說,最主要的是,整個過程太慢,需要耗費研究者幾年甚至數(shù)十年的光陰。

有了阿爾法折疊就不一樣了,生物學(xué)家再也不用在實驗器材面前耗費數(shù)十年的光陰,只需要簡單錄入數(shù)據(jù)就好。

當(dāng)然,阿爾法折疊的好處不僅這么點,最終它還是惠及到我們普羅大眾的身上。

以老年癡呆癥(學(xué)名為阿爾茨海默氏癥)為例,它在人體的潛伏期長達(dá)十幾年之久,且病因復(fù)雜,以目前的醫(yī)學(xué)技術(shù),臨床上甚至很難在發(fā)病前幾年檢測出這一疾病。

在生物學(xué)研究上,科學(xué)家普遍認(rèn)為蛋白質(zhì)的變化是引發(fā)老年癡呆的病因。換句話說,老年癡呆患者的某一部分蛋白質(zhì)長得一定和正常人不一樣。但是由于我們的研究速度太慢,所以生物學(xué)家不知道身體中所有的蛋白質(zhì)形態(tài),因此檢測哪一部分不一樣就難如登天。

想象一下,通過阿爾法折疊,提前十年檢測老年癡呆就容易多了,只要通過電腦看下蛋白質(zhì)長得是否有差異就可以了。

人工智能對蛋白質(zhì)結(jié)構(gòu)的“深度寵愛”

這一次,讓阿爾法折疊一戰(zhàn)成名的還是一項比賽。

在1994年,為了促進(jìn)研究和衡量最新方法在提高預(yù)測準(zhǔn)確性方面的進(jìn)展,蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)關(guān)鍵評估社區(qū)范圍實驗(CASP)的雙年度全球競賽被設(shè)立。演變至今,其比賽結(jié)果已經(jīng)成為行業(yè)標(biāo)準(zhǔn)。

雖然沒有AlphaGo當(dāng)年成名那么壯觀,但作為阿爾法家族的一員,阿爾法折疊一出手就是不凡。在今年的CASP比賽上,它不出所料的成功拿到了第一。

據(jù)DeepMind官網(wǎng)上的介紹,基于深度神經(jīng)網(wǎng)絡(luò),他們設(shè)計了兩種方法以用來構(gòu)建完整而精確的蛋白質(zhì)結(jié)構(gòu)。

首先,他們先采集氨基酸對之間的距離和連接這些氨基酸的化學(xué)鍵之間的角度數(shù)據(jù),接著將這些數(shù)據(jù)設(shè)計成用以評估蛋白質(zhì)結(jié)構(gòu)準(zhǔn)確度的分析工具。

使用這一分析工具,研究團(tuán)隊想出第一種方法,就是在現(xiàn)有蛋白質(zhì)數(shù)據(jù)庫里找到最匹配的蛋白質(zhì),如果找不到,他們就基于最接近的搜索結(jié)構(gòu)上,用新的基因片段不斷替換,以創(chuàng)造出匹配要求的新結(jié)構(gòu)。

而這第二種方法要更簡單一些。據(jù)他們介紹,研究人員主要用的就是梯度下降 -a數(shù)學(xué)技術(shù),它的精度相較于第一種會更高一些。相較于第一種方式,這種技術(shù)一步就可以預(yù)測整個蛋白質(zhì)鏈,而不用經(jīng)歷組裝的過程,整個過程更簡單。

DeepMind沒有公布更多細(xì)節(jié),但經(jīng)過這樣“簡單”的設(shè)計,奇跡就這樣發(fā)生了。

最后,科普來了

在人體內(nèi),蛋白質(zhì)是一種神奇的存在。

眾所周知,蛋白質(zhì)是構(gòu)成人體結(jié)構(gòu)的主要成分,其含量僅次于水,約占一個人體重的五分之一。我們身體所要執(zhí)行的幾乎所有功能,包括肌肉的收縮與拉伸、身體對光線的感知和食物的轉(zhuǎn)化,都需要蛋白質(zhì)在其中起關(guān)鍵作用。

而科學(xué)家指出,蛋白質(zhì)的結(jié)構(gòu)很大程度上決定了一種蛋白質(zhì)的特性,因此研究蛋白質(zhì)3D結(jié)構(gòu)的重要性就顯而易見了。在我們的身體里,這樣的案例比比皆是,如構(gòu)成我們免疫系統(tǒng)的抗體蛋白質(zhì)是“Y形”的;膠原蛋白的形狀像繩索;用于基因編輯的CRISPR和Cas9,它們則像剪刀一樣。

但是純粹從基因序列只能夠找出蛋白質(zhì)的三維形狀是一項復(fù)雜的任務(wù),按照傳統(tǒng)的研究方法,科學(xué)家需要從一級結(jié)構(gòu)、二級結(jié)構(gòu)來一層層研究,花費幾十年甚至千百年才能夠完全建立蛋白質(zhì)的形態(tài)模型。

而阿爾法折疊的出現(xiàn),讓生物學(xué)家省去了不少功夫。

在DeepMind官網(wǎng)上,他們是這么介紹這一重大成果的面世的:“我們很高興與大家分享DeepMind在展示人工智能研究如何推動和加速新科學(xué)發(fā)現(xiàn)方面的第一個重要里程碑。DeepMind匯集了來自結(jié)構(gòu)生物學(xué)、物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的專家們,通過跨學(xué)科方式將尖端技術(shù)運用其中,設(shè)計出了僅根據(jù)其基因序列就可以預(yù)測蛋白質(zhì)3D結(jié)構(gòu)的AlphaFold!

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號