侵權(quán)投訴
訂閱
糾錯
加入自媒體

“計算醫(yī)學”發(fā)現(xiàn)藥物標志物,交叉團隊組網(wǎng)藥物 “北斗系統(tǒng)”

藥物研發(fā)正面臨巨大挑戰(zhàn),新藥研發(fā)周期長(約14年)、新藥研發(fā)成本居高不下(超10億美元),上市藥物九死一生(成功率不足10%)…...為了扭轉(zhuǎn)頹勢,預期能夠降低研發(fā)成本的AI技術(shù)受到了制藥行業(yè)的關(guān)注。

AI+藥物研發(fā)賽道全球已有超100家企業(yè),大多數(shù)集中在優(yōu)化候選藥物這一環(huán)節(jié)。不幸的是,進入臨床一期候選藥物數(shù)量的增加并不能直接帶來上市成功率的顯著提升。藥企如果借力大數(shù)據(jù)和AI技術(shù)在以下幾個問題上找到突破性的解決方案,將帶來巨大的回報:如何提高臨床試驗成功率?如何提高藥物的有效率?如何不斷拓展適應癥?能否喚回失敗的藥物?

這幾個問題都可歸結(jié)于如何找到能讓人藥更匹配的標志物。生物標志物用于疾病診斷、分型、分期,判斷藥物在目標人群的有效性和安全性,在藥物開發(fā)與臨床應用中的作用日益提升,被喻為藥物研發(fā)漫漫征途中的“指南針”。

那么,標志物開發(fā)的現(xiàn)狀如何?AI+大數(shù)據(jù)如何助力標志物開發(fā)?除了單分子,標志物還能以什么形式產(chǎn)生?

在本文中,有以下六個要點值得關(guān)注

1.單一分子生物標志物紅利逐漸枯竭,基于大數(shù)據(jù)的新標志物將帶來新紅利;

2.從數(shù)據(jù)到標志物,存在維度詛咒、變異洪流、算力泥沼三大挑戰(zhàn);

3.來自中國頂尖機構(gòu)的生命與計算交叉團隊,潛心二十年,研發(fā)出基于計算醫(yī)學的藥物Pattern發(fā)現(xiàn)引擎;

4.渡過技術(shù)和數(shù)據(jù)積累期,藥物Pattern發(fā)現(xiàn)引擎TD-P平臺進入商業(yè)化階段;

5.平臺的最新成果,CDK4/6抑制劑在乳腺癌以外癌種中的新應用場景已經(jīng)被發(fā)現(xiàn);

6.實現(xiàn)藥物研發(fā)從”三個10”到“三個5”的全面升級。

簡單標志物紅利枯竭,大數(shù)據(jù)中蘊藏新紅利

單一分子生物標志物曾經(jīng)成就過諸多的明星靶向藥物。但是簡單標志物紅利正在逐漸枯竭。如果將藥物伴隨診斷的基因組學標志物的發(fā)現(xiàn)比喻為從樹上摘桃子的話,這種通過“篩選”單個位點突變就能獲得明確標志物的方式就好比摘低處的桃子,易得且成本優(yōu)勢明顯,但畢竟這樣的桃子數(shù)量有限,目前基本被摘完。

全球每年產(chǎn)生的生物數(shù)據(jù)總量已達EB(109G)級。隨著不斷下降的測序成本,多種組學數(shù)據(jù)、醫(yī)學影像和臨床資料在內(nèi)統(tǒng)計的數(shù)據(jù)產(chǎn)出達到了10TB/人的水平。生物醫(yī)學大數(shù)據(jù)已經(jīng)可以完整刻畫生命系統(tǒng)。 PubMed 數(shù)據(jù)庫收錄生物醫(yī)學3000萬篇文獻,每天還有超1萬篇的新提交。 利用知識、解讀數(shù)據(jù)來尋找新標志物的新紅利,無疑為業(yè)內(nèi)帶來了新期望。美國FDA腫瘤學卓越研究中心前主任曾表示,人工智能最有希望的應用之一是生物標志物的發(fā)現(xiàn)與開發(fā)。

從全球?qū)嵺`來看,國際上已經(jīng)出現(xiàn)了幾家能利用知識圖譜、機器學習掌控生物醫(yī)學大數(shù)據(jù)的AI公司。英國獨角獸公司Benevolent AI和諾華制藥公司在2019年簽訂了一項合作,旨在利用AI技術(shù)探索臨床階段腫瘤藥物適應癥和響應人群。Insilico Medicine公司通過收集大量不同年齡的健康和患病人群的多類組學數(shù)據(jù),尋找與衰老和疾病有關(guān)的生物標記物。

從數(shù)據(jù)到標志物,逃避不開的三個門檻

有了數(shù)據(jù)就一定能發(fā)現(xiàn)標志物嗎?

數(shù)據(jù)具有高維性和復雜性特點,要利用AI技術(shù)挖掘出新標志物仍然挑戰(zhàn)重重:

第一,維度詛咒。數(shù)據(jù)爆炸帶來了數(shù)千或數(shù)萬個可檢測的潛在生物標志物。傳統(tǒng)的生物信息學工具、分析方法無法將日益增長、多樣性的數(shù)據(jù)用以發(fā)現(xiàn)生物標志物。用上述方法篩選出的生物標志物只能代表小范圍內(nèi)的患者特征,在前瞻性臨床試驗中無法得到驗證。在這種情況下,AI算法如何將生物標記信號從噪聲中分離出來變得非常重要。

第二,變異洪流。通過測序技術(shù),我們現(xiàn)在已經(jīng)能較為清晰的看到腫瘤基因組的全貌,但是“畫面”卻極度混亂。每個腫瘤都包含50~100種變異,不同腫瘤又都各不相同,多數(shù)基因變異人類還不認識。但基因不是孤立作戰(zhàn),而是作為群體通過各種通路所形成的復雜網(wǎng)絡系統(tǒng)來傳遞各種增殖和凋亡信號。不僅要發(fā)現(xiàn)單個變異,AI算法更需要從復雜的基因網(wǎng)絡中識別標志物。

第三,算力泥沼。能否掌控算力又是下一個深具挑戰(zhàn)的關(guān)卡。理解生物醫(yī)學大數(shù)據(jù)必須利用超算。擁有算力已相對容易,社會上的超算中心、云計算中心可付費獲得。但是現(xiàn)成的算力并不是為生物醫(yī)學大數(shù)據(jù)而設(shè)計,如果處理計算密集型的算法能打100分,處理基因組數(shù)據(jù)只能打1分。如果將算力比喻為飛機,開動裝載生物醫(yī)學數(shù)據(jù)的飛機還得有并行優(yōu)化技術(shù)來當駕駛員。具備生物醫(yī)學領(lǐng)域知識專用并行優(yōu)化技術(shù)的團隊,在全球來說都是稀缺資源。

基于計算醫(yī)學的藥物Pattern發(fā)現(xiàn)引擎

在過去的二十年中,中國科學院計算技術(shù)研究所高性能計算機研究中心一直在從事“生物醫(yī)學信息處理系統(tǒng)”的研究,在國家項目的支持下,已經(jīng)在面向生物醫(yī)學大數(shù)據(jù)的高性能計算處理技術(shù)、生命融合大數(shù)據(jù)分析技術(shù)方面取得了多項重大技術(shù)突破。

該中心的生命與計算交叉團隊首倡“計算醫(yī)學”,利用人工智能、高性能計算技術(shù)從單個基因或蛋白功能的解釋轉(zhuǎn)向從系統(tǒng)生物學,尤其是細胞信號通路的解釋中挖掘Pattern級(實現(xiàn)某一生物性能的一組基因組成的功能模塊)的新型標志物。

計算醫(yī)學從全局變異角度解讀數(shù)據(jù)。雖然腫瘤有很多罕見變異,但是它們驅(qū)動的下游事件并不罕見。因此,如果能構(gòu)建一種新的模型,建立罕見變異與下游事件的關(guān)系,就能夠破解腫瘤異質(zhì)性難題,找出未被發(fā)現(xiàn)的腫瘤進化生物學機制,挖掘Pattern級標志物。

就像是AlphaGo,它比人類厲害的地方在于,它的算法更關(guān)注大局觀,而不是局部計算。在每個局部計算中找到最優(yōu)的下法并不一定能獲得最終勝利,只有清晰理解全局戰(zhàn)況,才能做出必勝策略。

這也就是團隊這些年來的主要發(fā)力方向。

破解維度詛咒,將變異洪流降維到細胞功能事件模型。團隊大數(shù)據(jù)建模過程與AlphaGo的算法策略異曲同工。團隊根據(jù)曾發(fā)生變異的18000基因,1000種不同來源細胞系基因組內(nèi)罕見變異的基因集合特征,對200+種表型特征(細胞內(nèi)確定性事件集)進行關(guān)聯(lián)訓練,獲得基于神經(jīng)網(wǎng)絡的細胞行為、功能、信號通路之間的關(guān)系模型,將零散、孤立的變異轉(zhuǎn)化成有功能、有解釋意義的事件。團隊沒有直接將基因變異與疾病建模關(guān)聯(lián),而是先降維到細胞功能事件模型,再去與疾病、藥物關(guān)聯(lián),這極大提高了從數(shù)據(jù)中發(fā)現(xiàn)新洞見的效能。

經(jīng)過數(shù)年的基礎(chǔ)工作,團隊已經(jīng)產(chǎn)出了400+細胞內(nèi)確定性事件基礎(chǔ)模型。擊敗人類的圍棋機器人AlphaGo面對的是19路圍棋棋盤的361個落點,可以變幻出無數(shù)的棋路。同樣,這400種基礎(chǔ)模型可以組合無數(shù)種不同的腫瘤進化情況,足以為每個患者構(gòu)造一個數(shù)字生命方程式。現(xiàn)已驗證的肺癌病例中無陰性報告,整體有效率為70.6%,抗血管生成通路有效率更高達91%。

image.png

將變異數(shù)據(jù)編碼為細胞功能事件

從知識中推理生物醫(yī)學機制新洞見。團隊根據(jù)海量的生物醫(yī)學文獻構(gòu)建了自己的生命科學專用知識圖譜TWIRLS,去發(fā)現(xiàn)疾。硇停颍鞍祝幬镏g的關(guān)聯(lián)。應用這一知識圖譜,不僅能夠最大化地挖掘已有的知識,還可以根據(jù)已有的知識做出推斷,產(chǎn)生新知識。

在新冠疫情期間,團隊在4小時內(nèi)通過對1.4萬多篇有關(guān)冠狀病毒文獻智能推理分析,最終得出病毒與ACE2之間的結(jié)合可能引發(fā)ACE2/AT2R的功能變化,使腎素——血管緊張素系統(tǒng)(RAS)參與的細胞因子調(diào)控軸發(fā)生穩(wěn)態(tài)失衡,并最終導致“細胞因子風暴”的結(jié)論。團隊認為這可能是參與冠狀病毒感染后導致宿主病理性變化的重要調(diào)控因素,也得到了國內(nèi)三家權(quán)威機構(gòu)回顧性研究的確認。該研究最近發(fā)表于《DRUG DEVELOPMENT RESEARCH》期刊。

大幅提速數(shù)據(jù)處理效能的高性能計算。團隊擁有世界領(lǐng)先的并行優(yōu)化算法,在訓練模型階段,團隊用到了106G的數(shù)據(jù),調(diào)動 2000個CPU運行半年。如果沒有并行優(yōu)化技術(shù),即使歷時數(shù)年也可能跑不出結(jié)果。對同一模型、同一數(shù)據(jù)量處理,如果直接在小型機上計算需要1萬小時,加載并行優(yōu)化技術(shù)后,計算時間可壓縮到100小時。高水平的并行優(yōu)化團隊還能再獲得更大的效率收益。

渡過技術(shù)和數(shù)據(jù)積累期,TD-P平臺開放商業(yè)化服務

基于計算醫(yī)學的藥物Pattern發(fā)現(xiàn)引擎是否還是一個科研階段,能提供商業(yè)化解決方案嗎?

為了將“生物醫(yī)學信息處理系統(tǒng)”賦能產(chǎn)業(yè),中科院計算所孵化了哲源科技,對其研究成果進行轉(zhuǎn)化,并聯(lián)合成立了“中國科學院計算技術(shù)研究所·哲源-圖靈-達爾文實驗室”,致力于計算醫(yī)學的發(fā)展,通過藥物Pattern發(fā)現(xiàn)引擎TD-P平臺(Turing-Darwin Pattern Discovery Platform)賦能藥物研發(fā)、精準醫(yī)學。該平臺已經(jīng)渡過了技術(shù)積累和數(shù)據(jù)積累期,具備了工業(yè)化服務能力。

第一,標志物兼容性好。基于TD-P平臺不僅可以發(fā)現(xiàn)定量性質(zhì)的,具有生物學意義的新型標志物,同時也能向下兼容單分子生物標志物。例如,該平臺與國內(nèi)著名PI在某一實體腫瘤化療藥物適應人群判斷的合作中,最終收斂出能夠被PCR技術(shù)檢測的變異位點,質(zhì)優(yōu)價廉,為IVD行業(yè)帶來全新解決方案。

第二,迅捷解決臨床問題。針對某一特定藥物研發(fā)與臨床應用場景需求,只需要投入較少量的指定樣本數(shù)據(jù)在該技術(shù)平臺適配,即可以周為單位交付初步發(fā)現(xiàn)的標志物。然后利用后續(xù)患者數(shù)據(jù)在該模型中做進一步前瞻性預測,優(yōu)化模型精準度。同樣在上述案例中,20個樣本規(guī)模即有初步發(fā)現(xiàn),用預測模型對上百個前瞻性樣本預測的陽性檢出率達70%。

image.png

場景專屬模型適配

第三,適用場景廣泛。平臺一體兩面,為藥找人,為人找藥。在藥物研發(fā)階段,可以協(xié)助新藥臨床場景的選擇、臨床試驗入組優(yōu)化、適應癥擴展、跨線晉級。在臨床應用階段,為患者匹配響應度最佳、副作用最小的用藥方案,將醫(yī)生臨床實踐中已經(jīng)積累的寶貴的臨床治療方案和經(jīng)驗發(fā)揮到極致,實施更加精準的個體化治療。

image.png

廣泛的服務場景

發(fā)現(xiàn)CDK4/6抑制劑新場景

TD-P平臺是否能為業(yè)界帶來重磅驚喜?

CDK4/6抑制劑是針對CDK4和CDK6兩個蛋白的靶向藥物,主要應用于激素受體陽性Her2陰性的乳腺癌患者群體。首款CDK4/6抑制劑“愛博新”2019年銷售額近50億美元。多家知名企業(yè)都在布局CDK4/6抑制劑,預計國內(nèi)競爭將很快達到白熱化。

不過即便使用了雌激素受體作為生物標志物,仍有大約20%的患者最初不會對CDK4 / 6抑制劑產(chǎn)生反應,并且所有患者最終都有產(chǎn)生耐藥性的可能。其他一些相關(guān)臨床試驗也曾嘗試過多種不同分子標志物,都不盡人意?梢哉f,采用單分子作為標志物的努力基本宣告失敗。誰能回答以下問題,誰就更有機會在白熱化競爭的市場中勝出。

1. 是否存在標志物預測患者的藥物反應?

2. 是否可與內(nèi)分泌療法以外的其他療法結(jié)合使用?

3. 是否可將適應癥擴大到其他癌種?

TD-P平臺在對CDK4/6抑制劑以往的研究數(shù)據(jù)和臨床情況分析后,已經(jīng)發(fā)現(xiàn)幾個其他癌種的患者同樣能從CDK4/6抑制劑中獲益,療效甚至可能優(yōu)于乳腺癌患者。哲源科技也希望能與CDK4/6抑制劑研發(fā)企業(yè)合作這一自有成果。TD-P平臺還在抗血管藥物、PD-1/PD-L1單抗等抗腫瘤藥物的伴隨診斷開發(fā)、全新臨床場景挖掘、臨床試驗入組優(yōu)化方面有突破性發(fā)現(xiàn)。

從”三個10”到“三個5”

中國科學院計算技術(shù)研究所西部高等技術(shù)研究院常務副院長張春明向動脈網(wǎng)表示:“我們希望利用緊貼臨床的人工智能加速藥物研發(fā),大幅降低研發(fā)費用。將十年研發(fā)周期、十億美金投入、10%臨床試驗成功率的‘三個10’研發(fā)挑戰(zhàn),提高到‘三個5’,即5年研發(fā)、5億美金、50%的臨床試驗成功率!

利用大數(shù)據(jù)、人工智能、高性能計算組網(wǎng)的藥物研發(fā)與應用的“北斗系統(tǒng)”為面臨困局的醫(yī)藥行業(yè)開啟了藥物精準定位的新時代。制造出藥物已經(jīng)不是競爭的終點,提速臨床試驗、不斷拓展新適應癥、為患者提供更精準響應的藥物、更好地利用真實世界數(shù)據(jù)才是未來的競爭制勝之道!坝嬎汜t(yī)學”從數(shù)字生命的視角認識疾病與藥物,協(xié)助開發(fā)特異性、有效性、安全性更好的藥物,帶來更精準的“人藥匹配”,將會帶動醫(yī)藥行業(yè)新一輪的智能化升級。

作者:郝翰

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號