蛋白質(zhì)的新“折疊”!DeepMind重磅推出家族新成員AlphaFold
人工智能領(lǐng)域第一大家族,來自DeepMind的Alpha家族最喜歡做的事情就是出其不意。
它們所有的小確幸都是,意料之中、精彩尤甚。
比如之前一戰(zhàn)成名的AlphaGo、后續(xù)傲嬌的AlphaZero,以及這兩天剛剛加入家族戰(zhàn)隊的AlphaFold,中文封號為,阿爾法折疊。
生物醫(yī)學(xué)領(lǐng)域,一向都是冷靜與熱情并存,而這位AI新寵兒AlphaFold的性格雖然還不明朗,但至少目前看來,勢必會引發(fā)生物醫(yī)學(xué)領(lǐng)域新一輪的研究加速。
“小奇妙”阿爾法折疊
據(jù)DeepMind介紹,阿爾法折疊這項成果的重大意義就在于,你給它一段基因序列(生物學(xué)上稱其為蛋白質(zhì)一級結(jié)構(gòu)),在電腦上跑一下,就可以成功對這種蛋白質(zhì)建模。
看似簡單,但意義非凡。
在過去五十年,和阿爾法折疊起到相同功能的技術(shù)有冷凍電子顯微鏡、核磁共振或X射線晶體學(xué)等實驗技術(shù)。單看儀器,它們就需要高昂的價格,但最重要的是,其實驗成本也很高,需要專人做大量的實驗,器材損耗不說,實驗用料就要花費數(shù)萬美元。
花錢不說,最主要的是,整個過程太慢,需要耗費研究者幾年甚至數(shù)十年的光陰。
有了阿爾法折疊就不一樣了,生物學(xué)家再也不用在實驗器材面前耗費數(shù)十年的光陰,只需要簡單錄入數(shù)據(jù)就好。
當(dāng)然,阿爾法折疊的好處不僅這么點,最終它還是惠及到我們普羅大眾的身上。
以老年癡呆癥(學(xué)名為阿爾茨海默氏癥)為例,它在人體的潛伏期長達(dá)十幾年之久,且病因復(fù)雜,以目前的醫(yī)學(xué)技術(shù),臨床上甚至很難在發(fā)病前幾年檢測出這一疾病。
在生物學(xué)研究上,科學(xué)家普遍認(rèn)為蛋白質(zhì)的變化是引發(fā)老年癡呆的病因。換句話說,老年癡呆患者的某一部分蛋白質(zhì)長得一定和正常人不一樣。但是由于我們的研究速度太慢,所以生物學(xué)家不知道身體中所有的蛋白質(zhì)形態(tài),因此檢測哪一部分不一樣就難如登天。
想象一下,通過阿爾法折疊,提前十年檢測老年癡呆就容易多了,只要通過電腦看下蛋白質(zhì)長得是否有差異就可以了。
人工智能對蛋白質(zhì)結(jié)構(gòu)的“深度寵愛”
這一次,讓阿爾法折疊一戰(zhàn)成名的還是一項比賽。
在1994年,為了促進(jìn)研究和衡量最新方法在提高預(yù)測準(zhǔn)確性方面的進(jìn)展,蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)關(guān)鍵評估社區(qū)范圍實驗(CASP)的雙年度全球競賽被設(shè)立。演變至今,其比賽結(jié)果已經(jīng)成為行業(yè)標(biāo)準(zhǔn)。
雖然沒有AlphaGo當(dāng)年成名那么壯觀,但作為阿爾法家族的一員,阿爾法折疊一出手就是不凡。在今年的CASP比賽上,它不出所料的成功拿到了第一。
據(jù)DeepMind官網(wǎng)上的介紹,基于深度神經(jīng)網(wǎng)絡(luò),他們設(shè)計了兩種方法以用來構(gòu)建完整而精確的蛋白質(zhì)結(jié)構(gòu)。
首先,他們先采集氨基酸對之間的距離和連接這些氨基酸的化學(xué)鍵之間的角度數(shù)據(jù),接著將這些數(shù)據(jù)設(shè)計成用以評估蛋白質(zhì)結(jié)構(gòu)準(zhǔn)確度的分析工具。
使用這一分析工具,研究團(tuán)隊想出第一種方法,就是在現(xiàn)有蛋白質(zhì)數(shù)據(jù)庫里找到最匹配的蛋白質(zhì),如果找不到,他們就基于最接近的搜索結(jié)構(gòu)上,用新的基因片段不斷替換,以創(chuàng)造出匹配要求的新結(jié)構(gòu)。
而這第二種方法要更簡單一些。據(jù)他們介紹,研究人員主要用的就是梯度下降 -a數(shù)學(xué)技術(shù),它的精度相較于第一種會更高一些。相較于第一種方式,這種技術(shù)一步就可以預(yù)測整個蛋白質(zhì)鏈,而不用經(jīng)歷組裝的過程,整個過程更簡單。
DeepMind沒有公布更多細(xì)節(jié),但經(jīng)過這樣“簡單”的設(shè)計,奇跡就這樣發(fā)生了。
最后,科普來了
在人體內(nèi),蛋白質(zhì)是一種神奇的存在。
眾所周知,蛋白質(zhì)是構(gòu)成人體結(jié)構(gòu)的主要成分,其含量僅次于水,約占一個人體重的五分之一。我們身體所要執(zhí)行的幾乎所有功能,包括肌肉的收縮與拉伸、身體對光線的感知和食物的轉(zhuǎn)化,都需要蛋白質(zhì)在其中起關(guān)鍵作用。
而科學(xué)家指出,蛋白質(zhì)的結(jié)構(gòu)很大程度上決定了一種蛋白質(zhì)的特性,因此研究蛋白質(zhì)3D結(jié)構(gòu)的重要性就顯而易見了。在我們的身體里,這樣的案例比比皆是,如構(gòu)成我們免疫系統(tǒng)的抗體蛋白質(zhì)是“Y形”的;膠原蛋白的形狀像繩索;用于基因編輯的CRISPR和Cas9,它們則像剪刀一樣。
但是純粹從基因序列只能夠找出蛋白質(zhì)的三維形狀是一項復(fù)雜的任務(wù),按照傳統(tǒng)的研究方法,科學(xué)家需要從一級結(jié)構(gòu)、二級結(jié)構(gòu)來一層層研究,花費幾十年甚至千百年才能夠完全建立蛋白質(zhì)的形態(tài)模型。
而阿爾法折疊的出現(xiàn),讓生物學(xué)家省去了不少功夫。
在DeepMind官網(wǎng)上,他們是這么介紹這一重大成果的面世的:“我們很高興與大家分享DeepMind在展示人工智能研究如何推動和加速新科學(xué)發(fā)現(xiàn)方面的第一個重要里程碑。DeepMind匯集了來自結(jié)構(gòu)生物學(xué)、物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的專家們,通過跨學(xué)科方式將尖端技術(shù)運用其中,設(shè)計出了僅根據(jù)其基因序列就可以預(yù)測蛋白質(zhì)3D結(jié)構(gòu)的AlphaFold!
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
11月19日立即報名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
11月25日立即預(yù)約>> 【上海線下】設(shè)計,易如反掌—Creo 11發(fā)布巡展
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會暨展覽會
-
精彩回顧立即查看>> 全數(shù)會2024中國人形機(jī)器人技術(shù)創(chuàng)新發(fā)展大會
-
精彩回顧立即查看>> OFweek 2024中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會
-
10 科源制藥并購“大戲”深解
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市