侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

知圖生物:旨在構(gòu)建300億條合理小分子化合物數(shù)據(jù)庫

“未來的藥物研發(fā)肯定需要AI的參與”,2016年還在廈門大學(xué)讀博士的陳星強(qiáng)聽從導(dǎo)師的建議,朝著“AI+醫(yī)療”的方向做了一些早期創(chuàng)業(yè)的嘗試。

陳星強(qiáng)從理論物理學(xué)到生物物理的前沿交叉,專注于計(jì)算機(jī)輔助藥物設(shè)計(jì)和AI技術(shù)研發(fā),求學(xué)期間的研究也一直圍繞著蛋白質(zhì)與小分子之間相互以及蛋白質(zhì)和小分子的化學(xué)反應(yīng)過程的計(jì)算模擬展開,工作期間主要投入在AI技術(shù)的應(yīng)用和產(chǎn)品落地上。

早在2013年,陳星強(qiáng)便已埋下從事藥物研發(fā)事業(yè)的種子,并默默努力著。他告訴動(dòng)脈網(wǎng),他一直在等待一個(gè)合適的契機(jī)切入到醫(yī)藥行業(yè),而這個(gè)機(jī)會(huì)在2016年來了。

“我看到AI的風(fēng)口,就想要進(jìn)入醫(yī)療行業(yè)做事情。”2016年10月,陳星強(qiáng)開始了第一次“AI+醫(yī)療”領(lǐng)域的創(chuàng)業(yè)嘗試,成立了廈門市廈之醫(yī)生物科技有限公司(簡稱:廈之醫(yī)),從熱門的AI賦能醫(yī)學(xué)影像篩查切入醫(yī)療領(lǐng)域,用AI助力醫(yī)生更加精準(zhǔn)地診斷患者肺部影像。

2020年3月,憑借著在AI應(yīng)用落地上積累的豐富經(jīng)驗(yàn),陳星強(qiáng)決定回歸自己一直專長且想要從事的領(lǐng)域——計(jì)算機(jī)輔助藥物設(shè)計(jì),并成立了浙江知圖生物醫(yī)藥科技有限公司(簡稱:知圖生物),致力于應(yīng)用先進(jìn)的機(jī)器學(xué)習(xí)算法,為新藥發(fā)現(xiàn)提供精準(zhǔn)高效的解決方案。

對(duì)于接連兩次創(chuàng)業(yè),動(dòng)脈網(wǎng)專訪了創(chuàng)始人陳星強(qiáng),從他的口中試著重現(xiàn)知圖生物的核心競爭力以及窺見AI賦能新藥研發(fā)的未來。

構(gòu)建30億虛擬化合物數(shù)據(jù)庫,預(yù)計(jì)年底完成數(shù)據(jù)清洗重組并擴(kuò)增十倍

>>>>

問:“您怎樣看待AI在這個(gè)行業(yè)的應(yīng)用情況?”

“首先,我們必須明確AI相對(duì)于傳統(tǒng)的計(jì)算機(jī)軟件區(qū)別和聯(lián)系在哪里。傳統(tǒng)的軟件,更多的是構(gòu)建在圖靈機(jī)上的功能聚合體,希望借助CPU的密集計(jì)算,幫助我們提高日常工作效率。而AI輸出的是一種能力,并非具體功能。如果你仔細(xì)甄別,會(huì)發(fā)現(xiàn)軟件的功能實(shí)現(xiàn)是確定的,而AI的‘能力’是變化且發(fā)展的;軟件功能的應(yīng)用是對(duì)應(yīng)到具體的工作流程當(dāng)中,而能力是解決一類問題的核心特質(zhì),要求更高。AI的能力需要達(dá)到人類專家的水準(zhǔn),才能進(jìn)入生產(chǎn)環(huán)節(jié)進(jìn)行商業(yè)化設(shè)計(jì),這對(duì)計(jì)算機(jī)來說是一種新的要求,不僅僅是實(shí)現(xiàn)一些功能的聚合體。

同時(shí),當(dāng)我們看到AI和傳統(tǒng)軟件的區(qū)別之處,我們也需要看到它們的關(guān)聯(lián)之處,任何軟件也好,AI系統(tǒng)也好,脫離不了解決問題的場景,在一個(gè)場景中,單獨(dú)有功能是不夠的,單獨(dú)有能力也是不夠的,我們既要功能也要能力,這就是當(dāng)前AI從業(yè)者和軟件開發(fā)者面臨的共同問題,如何定義好各自的職能屬性,并且發(fā)揮出整合的優(yōu)勢。

醫(yī)藥行業(yè)的AI輸出的這種能力,必須要達(dá)到專家的水平,必須經(jīng)受來自CFDA、FDA等醫(yī)療機(jī)構(gòu)從業(yè)者和專家檢驗(yàn)和認(rèn)可,這樣才能做到臨床應(yīng)用級(jí)別的AI。在這一切的背后,AI需要構(gòu)建自己對(duì)行業(yè)問題的模型,這需要足夠的數(shù)據(jù)支持和對(duì)行業(yè)的深度認(rèn)知。

數(shù)據(jù)始終是AI驅(qū)動(dòng)的第一步,這個(gè)問題無法回避。面對(duì)真實(shí)世界的零零總總的問題,大量可以參考和標(biāo)定的數(shù)據(jù)在產(chǎn)生著,也在消逝著。

如果重新提大數(shù)據(jù)的概念,我認(rèn)為需要做到兩方面:一方面,是我們所能獲取的有相當(dāng)價(jià)值的數(shù)據(jù)都是有成本的,隨著計(jì)算機(jī)技術(shù)和行業(yè)的深入發(fā)展,云計(jì)算和大數(shù)據(jù)開發(fā)工具成本這逐漸降低,大數(shù)據(jù)成為企業(yè)重新考慮出路和發(fā)展的一個(gè)選項(xiàng);另一方面,人們對(duì)數(shù)據(jù)產(chǎn)生價(jià)值這件事的認(rèn)可和數(shù)據(jù)分析能力邊界的認(rèn)知也在不斷更新。

在這個(gè)角度下看,大數(shù)據(jù)或許才剛開始,因?yàn)闆]有AI這個(gè)工具的升級(jí)換代,挖掘大數(shù)據(jù)和應(yīng)用大數(shù)據(jù)不過是紙上談兵。所以,合理的應(yīng)用和生產(chǎn)以及存儲(chǔ)大數(shù)據(jù)是每一家致力于數(shù)據(jù)驅(qū)動(dòng)的公司所必須考慮和實(shí)踐的任務(wù),AI行業(yè)的公司尤甚。我們不可能離開行業(yè)去探尋數(shù)據(jù),更不可能離開行業(yè)數(shù)據(jù)去找行業(yè)解決方案,也不可能憑空創(chuàng)造出有價(jià)值的工具!

>>>>

問:“您能具體談?wù)勚獔D生物在醫(yī)藥研發(fā)行業(yè)數(shù)據(jù)方面是如何應(yīng)用和生產(chǎn)以及存儲(chǔ)的嗎?”

“知圖生物在數(shù)據(jù)這一點(diǎn)上,具有兩個(gè)核心戰(zhàn)略支撐點(diǎn),一個(gè)要靠走出去,一個(gè)要靠自力更生。

走出去,是說 我們公司的數(shù)據(jù)構(gòu)建過程不能脫離行業(yè)痛點(diǎn),脫離行業(yè)問題,我們必須找準(zhǔn)行業(yè)現(xiàn)存的主要矛盾,通過認(rèn)識(shí)這些矛盾的存在,確立我們需要收集和存儲(chǔ)的數(shù)據(jù);自力更生,一方面是說我們要靠自己,但也不全是這個(gè)主觀感情層面上的努力,而是我們需要通過AI技術(shù),來生產(chǎn)和優(yōu)化數(shù)據(jù)。

基于以上兩點(diǎn)的思路,我們清楚地看到,在制藥行業(yè),靶點(diǎn)和先導(dǎo)化合物的關(guān)系確認(rèn)是一件非常值得嘗試和需要深入解決的難題。我們作為AI行業(yè)的從業(yè)者,首先是要優(yōu)化掉舊有的流程,提高解決問題的效率,突出創(chuàng)新和變革!

>>>>

問:“長遠(yuǎn)看來,您公司希望自己能夠怎樣去應(yīng)用醫(yī)藥行業(yè)的大數(shù)據(jù)?”

“知圖生物希望結(jié)合當(dāng)下研究產(chǎn)生的各類組學(xué)數(shù)據(jù),包含基因組學(xué)、表觀遺傳組、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、細(xì)胞組學(xué)等,分別針對(duì)相應(yīng)疾病提供病理機(jī)制的研究和潛在靶點(diǎn)的發(fā)現(xiàn),并以靶點(diǎn)為核心的構(gòu)建數(shù)據(jù)采集流程,構(gòu)建相應(yīng)的先導(dǎo)化合物庫,并應(yīng)用深度學(xué)習(xí)算法搜索推薦出合適的候選化合物。

公司長遠(yuǎn)目標(biāo)是將組學(xué)數(shù)據(jù)能夠結(jié)合體外實(shí)驗(yàn)數(shù)據(jù)、臨床階段實(shí)驗(yàn)數(shù)據(jù)進(jìn)行綜合分析和算法應(yīng)用,并對(duì)數(shù)據(jù)進(jìn)行分類,建立相關(guān)靶點(diǎn)的一系列從頭算(ab initio database)數(shù)據(jù)庫,最后將采集到的數(shù)據(jù)集應(yīng)用于機(jī)器學(xué)習(xí)模型,不斷進(jìn)行模型訓(xùn)練和模型優(yōu)化迭代!

>>>>

問:“公司目前的在研核心產(chǎn)品有哪些?”

“目前公司圍繞藥物靶點(diǎn)和先導(dǎo)化合物,構(gòu)建了一款名為MolecularFlow的虛擬篩選平臺(tái)。我們利用的小分子化合物開源數(shù)據(jù)約30億條數(shù)據(jù),根據(jù)已有的15萬潛在成藥小分子進(jìn)行新化合物的生成學(xué)習(xí)和探索,結(jié)合圖神經(jīng)網(wǎng)絡(luò)(GCN)、強(qiáng)化學(xué)習(xí)(RL)和對(duì)抗學(xué)習(xí)(GAN)去創(chuàng)建新的成藥小分子化合物,預(yù)計(jì)將在今年年底前完成十倍基礎(chǔ)數(shù)據(jù)的擴(kuò)容,進(jìn)一步清洗和整理數(shù)據(jù),將數(shù)據(jù)庫的有效數(shù)據(jù)擴(kuò)展到300億條,小分子庫擴(kuò)充到更大的化合物空間。”

我們的這款產(chǎn)品在設(shè)計(jì)之初就考慮到藥物研發(fā)中的流程與效率問題,相對(duì)于現(xiàn)有的一些AI輔助藥物設(shè)計(jì)的CRO企業(yè),我們更多的是基于算法結(jié)合軟件的系統(tǒng)驅(qū)動(dòng)。一些進(jìn)行藥物大規(guī)模篩選的軟件,大多數(shù)藥企只是將其作為一個(gè)獨(dú)立的工具使用,但是知圖生物改進(jìn)了這種傳統(tǒng)的工具使用和研發(fā)流程銜接,用一套算法系統(tǒng)將其全部集成、優(yōu)化、承接下來,最終企業(yè)關(guān)于任何一個(gè)‘藥’的需求,都可以通過我們的這個(gè)系統(tǒng)輸出完成。

這就是AI輸出能力和軟件輸出功能非常明顯的一個(gè)區(qū)別。面對(duì)已有的一些有效靶點(diǎn),知圖生物會(huì)根據(jù)客戶需求去針對(duì)性地多次篩查數(shù)據(jù)庫,在‘篩選’和‘召回’的多次循環(huán),逐次降低目標(biāo)化合物的數(shù)量級(jí),最終獲取更加精準(zhǔn)的目標(biāo)小分子化合物范圍,整個(gè)虛擬篩選的流程我們預(yù)期在3~5天左右即可完成。

>>>>

問:“在AI賦能新藥研發(fā)的市場里,知圖生物為何選擇此時(shí)進(jìn)場?”

“國家這幾年一直鼓勵(lì)和支持創(chuàng)新藥的研發(fā),行業(yè)的需求是明確的,加上最近諸多新的利好政策,我們的市場和機(jī)會(huì)始終在那里。藥企往往看中的是CRO公司的技術(shù)實(shí)力,需要CRO公司提供一個(gè)明確的解決方案和可信的結(jié)果。所以,知圖生物只有真正將技術(shù)的價(jià)值做出來給藥企看到,我們才能讓市場認(rèn)識(shí)到AI的價(jià)值和能力!

>>>>

問:“知圖生物目前與哪些科研機(jī)構(gòu)有建立合作關(guān)系,未來會(huì)自己做藥嗎?”

“目前知圖生物正在和廈門大學(xué)實(shí)驗(yàn)室、藥學(xué)院以及深圳先進(jìn)研究院展開合作,公司也正在積極尋求一些新的合作可能。知圖生物的定位是做一家AI賦能新藥發(fā)現(xiàn)的CRO企業(yè),未來無論從戰(zhàn)略上還是公司發(fā)展上,這一點(diǎn)始終都不會(huì)改變。我們首先要做好CRO公司這一角色,去和好的藥企做好的合作,讓市場充分認(rèn)識(shí)我們的前提下,再沉淀下來考慮去獨(dú)立做原研藥,這樣的發(fā)展路徑會(huì)更加合理穩(wěn)妥!

>>>>

問:“最后能談?wù)勀鷮?duì)公司下一步發(fā)展的一些期待和愿景嗎?”

“知圖生物已經(jīng)有三個(gè)方向的雛形產(chǎn)品,涉及先導(dǎo)化合物庫的擴(kuò)建,虛擬篩選加速,疫苗設(shè)計(jì)等方向。目前正在進(jìn)行首個(gè)產(chǎn)品MolecularFlow的初步驗(yàn)證,具體產(chǎn)品細(xì)節(jié)我們還未公開。從知圖生物成立到現(xiàn)在,剛好三個(gè)月有余,我們完成了首個(gè)項(xiàng)目的30%,預(yù)期在今年10月完成整個(gè)數(shù)據(jù)庫后臺(tái)的搭建工作。公司也開始啟動(dòng)pre-A輪融資,計(jì)劃募集資金1000萬人民幣左右,主要用于數(shù)據(jù)庫擴(kuò)容、驗(yàn)證以及流程優(yōu)化,人才招募等工作!

作者:王嬋

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)