侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

用RoseTTAFold設(shè)計(jì)全新結(jié)構(gòu)與功能的蛋白質(zhì)

01

文章背景簡(jiǎn)介   

BACKGROUND INTRODUCTION

科學(xué)家們長(zhǎng)期認(rèn)為蛋白質(zhì)的形狀決定了其功能。只要了解蛋白質(zhì)的形狀,就能猜測(cè)其在細(xì)胞中的作用,并且開(kāi)發(fā)出與其形狀相關(guān)的藥物。因此,研究人員通過(guò)冷凍電鏡、核磁共振、X射線等多種手段來(lái)確定蛋白質(zhì)的形狀。這一過(guò)程不僅繁瑣而且成本高昂。為此,CASP(Critical Assessment of protein Structure Prediction)大賽應(yīng)運(yùn)而生。2020年,隨著AI技術(shù)的發(fā)展,Deepmind公司的AlphaFold2在CASP中橫空出世,有望解決這一困擾研究人員多年的難題。

為了探究合成全新蛋白質(zhì)算法的準(zhǔn)確度,2021年7月,華盛頓大學(xué)生物學(xué)家大衛(wèi)·貝克(David Baker)團(tuán)隊(duì)研發(fā)的RoseTTAFold構(gòu)建了一種“三軌(three-track)”神經(jīng)網(wǎng)絡(luò),能在十幾分鐘之內(nèi)解析給定序列的三維結(jié)構(gòu)。2023年7月,該團(tuán)隊(duì)成功獲得了一個(gè)蛋白質(zhì)骨架生成模型(generative model),并且通過(guò)實(shí)驗(yàn)表征和電鏡驗(yàn)證后,證明了該模型的可靠性,完成了真正意義上的蛋白質(zhì)從頭設(shè)計(jì)(de novo protein design),并且在《Nature》雜志(IF=64.8,Q1)上發(fā)表了題為“De novo design of protein structure and function with RFdiffusion”的文章。

02

所用到的主要方法

METHODS   

1、RFdiffusion

2、DDPM

3、冷凍電鏡

4、圓二色光譜

5、尺寸排阻色譜

03

文章主要內(nèi)容摘要

ABSTRACT 

對(duì)于蛋白質(zhì)設(shè)計(jì)的軟件來(lái)說(shuō),最終需要建立可視化的蛋白質(zhì)三維結(jié)構(gòu),為達(dá)成這一目標(biāo),該團(tuán)隊(duì)使用了去噪擴(kuò)散概率模型(Denoising Diffusion Probabilistic Model,DDPM)對(duì)已知的蛋白結(jié)構(gòu)模型進(jìn)行學(xué)習(xí)并且根據(jù)所需條件引導(dǎo)該模型生成目標(biāo)蛋白。遺憾的是,無(wú)論是生成全新的蛋白質(zhì)還是二級(jí)結(jié)構(gòu),最終結(jié)果與實(shí)驗(yàn)數(shù)據(jù)大相徑庭。

該團(tuán)隊(duì)在DDPM中加入了RoseTTAFold(RF),不僅能夠生成高精度的蛋白質(zhì)結(jié)構(gòu),以具有旋轉(zhuǎn)等變性的殘基的剛性框架表示,并且具有能夠在單個(gè)殘基、殘基間距離和方向以及3D坐標(biāo)水平上對(duì)設(shè)計(jì)規(guī)格進(jìn)行調(diào)節(jié)的體系結(jié)構(gòu)。首先,對(duì)RF進(jìn)行了微調(diào),一步完成圍繞輸入的功能基序的蛋白質(zhì)骨架。實(shí)驗(yàn)結(jié)果表明,該方法可以以原子精度支持廣泛的蛋白質(zhì)功能基序,但該方法只能接收精確的指令,對(duì)于給定的問(wèn)題只能產(chǎn)生有限的設(shè)計(jì)多樣性。最終,該團(tuán)隊(duì)通過(guò)算法優(yōu)化,建立了RFdiffusion模型,并且利用PDB數(shù)據(jù)庫(kù)進(jìn)行深度學(xué)習(xí)。

圖1強(qiáng)調(diào)了RF結(jié)構(gòu)預(yù)測(cè)和RF擴(kuò)散去噪步驟之間的相似之處:在這兩種情況下,根據(jù)模型的輸入條件將坐標(biāo)轉(zhuǎn)換為預(yù)測(cè)結(jié)構(gòu)。在RF中,輸入蛋白序列,并提供額外的結(jié)構(gòu)信息作為模板和模型的初始坐標(biāo)。在RF擴(kuò)散中,主要的輸入是上一步得到的加噪坐標(biāo)。對(duì)于特定的設(shè)計(jì)任務(wù),可以提供一系列輔助條件信息,包括部分序列、折疊信息或固定的功能模體坐標(biāo)。

該實(shí)驗(yàn)獲得了一個(gè)蛋白質(zhì)骨架的生成模型,該模型在無(wú)條件和拓?fù)涫芟薜牡鞍踪|(zhì)單體設(shè)計(jì)、蛋白質(zhì)粘合劑設(shè)計(jì)、對(duì)稱(chēng)寡聚物設(shè)計(jì)、酶活性位點(diǎn)支架和對(duì)稱(chēng)基序支架用于治療性和金屬結(jié)合蛋白設(shè)計(jì)方面取得了出色的性能。通過(guò)實(shí)驗(yàn)表征數(shù)百種設(shè)計(jì)的對(duì)稱(chēng)組裝體、金屬結(jié)合蛋白和蛋白粘合劑的結(jié)構(gòu)和功能,證明了該方法的威力和通用性,稱(chēng)為Rose TTAFold diffusion ( RF diffusion )。

用RFdiffusion方法解決的問(wèn)題的廣度和復(fù)雜性以及和精確性遠(yuǎn)遠(yuǎn)超過(guò)了以前的結(jié)果。與從文本提示生成圖像的方式類(lèi)似,RFdiffusion使得用最少的專(zhuān)業(yè)知識(shí)從最小的分子規(guī)格(例如,對(duì)用戶指定的目標(biāo)蛋白質(zhì)具有高親和力的粘合劑,以及來(lái)自用戶指定對(duì)稱(chēng)性的各種蛋白質(zhì)組裝體)生成功能蛋白成為可能。將RF擴(kuò)展到包含配體,同樣可以使RFdiffusion擴(kuò)展到顯式地模擬配體原子,并允許設(shè)計(jì)蛋白質(zhì)-配體相互作用。通過(guò)添加外部勢(shì)能和微調(diào)來(lái)定制RF擴(kuò)散以應(yīng)對(duì)特定設(shè)計(jì)挑戰(zhàn)的能力,以及對(duì)基礎(chǔ)方法的持續(xù)改進(jìn),應(yīng)該能夠使從頭設(shè)計(jì)的蛋白質(zhì)設(shè)計(jì)達(dá)到更高的復(fù)雜性水平,以接近并在某些情況下超過(guò)自然進(jìn)化所取得的成就。

簡(jiǎn)而言之,本研究的主要內(nèi)容有:

1、獲得了一個(gè)蛋白質(zhì)骨架的生成模型

2、該模型在無(wú)條件和拓?fù)涫芟薜牡鞍踪|(zhì)單體設(shè)計(jì)、蛋白質(zhì)粘合劑設(shè)計(jì)、對(duì)稱(chēng)寡聚物設(shè)計(jì)、酶活性位點(diǎn)支架和對(duì)稱(chēng)基序支架用于治療性和金屬結(jié)合蛋白設(shè)計(jì)方面取得了出色的性能。

3、將RF擴(kuò)展到包含配體,同樣可以使RF擴(kuò)散擴(kuò)展到顯式地模擬配體原子,并允許設(shè)計(jì)蛋白質(zhì)-配體相互作用。

       原文標(biāo)題 : 用RoseTTAFold設(shè)計(jì)全新結(jié)構(gòu)與功能的蛋白質(zhì)

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)