訂閱
糾錯(cuò)
加入自媒體

除了算力,AI超算還將解決數(shù)據(jù)團(tuán)隊(duì)的“要素配置”難題?

文|智能相對(duì)論

作者|葉遠(yuǎn)風(fēng)

對(duì)CT圖像分析,分割出結(jié)節(jié);

對(duì)結(jié)節(jié)進(jìn)行定量定性分析;

對(duì)隨訪病人記錄其結(jié)節(jié)在時(shí)間上的變化,形成動(dòng)態(tài)跟蹤;

對(duì)各類信息綜合考量,判斷結(jié)節(jié)類型;

甚至,自動(dòng)生成報(bào)告……

找尋、分析、跟蹤、判斷、總結(jié),這是山東聊城某三級(jí)醫(yī)院CT檢測(cè)室里,一套AI系統(tǒng)幫助影像科醫(yī)生對(duì)肺結(jié)節(jié)進(jìn)行診斷的過程。

隨著AI醫(yī)療影像開始廣泛落地,越來越多的醫(yī)院,尤其是基層醫(yī)院開始享受到切切實(shí)實(shí)的“醫(yī)療技能”普惠。聊城這家醫(yī)院的系統(tǒng)來自北京一家AI創(chuàng)新科技企業(yè),在2018年,其專門針對(duì)肺結(jié)節(jié)的系統(tǒng)就已經(jīng)安裝超過一百家醫(yī)院,處理了超90萬病例。

這幾年AI醫(yī)療影像熱潮迭起,其中肺結(jié)節(jié)診斷又被認(rèn)為是“入門”級(jí)能力,導(dǎo)致業(yè)界對(duì)落地成果的出現(xiàn)并不算敏感,而事實(shí)上,CT斷層成像作為分辨率非常高的三維成像,每個(gè)病人基本上都有幾百?gòu)垟嗥上,AI系統(tǒng)需要處理的數(shù)據(jù)量十分龐大,應(yīng)用落地一直是一件充滿挑戰(zhàn)的事。

這意味著,能夠符合醫(yī)療需要并實(shí)現(xiàn)快速迭代的AI系統(tǒng),其背后一定需要越來越強(qiáng)大的算力來加速模型的訓(xùn)練。

一個(gè)現(xiàn)實(shí)是,算力價(jià)值凸顯,甚至成為阻礙企業(yè)發(fā)展的桎梏(不僅限于醫(yī)療影像領(lǐng)域)——這也一定程度上解釋了,為什么當(dāng)初醫(yī)療影像領(lǐng)域的初創(chuàng)企業(yè)一窩蜂上馬,但能活下來出成果的很少,除了開發(fā)能力不濟(jì),很有可能是沒有找到合適的算力資源。

解決算力難題,成為內(nèi)部數(shù)據(jù)科學(xué)團(tuán)隊(duì)的當(dāng)務(wù)之急。

AI超算——人工智能數(shù)據(jù)中心的小型化,問題的答案?

一位從事AI醫(yī)療影像的專家曾這樣闡述過算力的重要性:

由于模型訓(xùn)練經(jīng)常需要調(diào)整某些參數(shù)或者嘗試不同的模型,算力不夠,每個(gè)調(diào)整都可能需要等上幾天才能出結(jié)果,這導(dǎo)致模型優(yōu)化缺乏效率,甚至因?yàn)闀r(shí)間太長(zhǎng)都忘記了當(dāng)初的測(cè)試目的。

幾乎所有AI場(chǎng)景對(duì)算力的需求都在加速膨脹,過去一些年,市面上能夠提供給數(shù)據(jù)科學(xué)團(tuán)隊(duì)的算力形態(tài),在一定的條件下都未必能很好地滿足需要,尤其是主流的基于CPU的龐大數(shù)據(jù)中心,在計(jì)算能力上離支撐快速迭代要求的算力水準(zhǔn)還有較大差距。

甚至,由于數(shù)據(jù)科學(xué)團(tuán)隊(duì)無法找到合適的算力供給而導(dǎo)致項(xiàng)目擱置或企業(yè)消亡的案例屢見不鮮,業(yè)界呼喚新的解決方案。

需求變化推動(dòng)著供給變革,算力供給形態(tài)這些年也在持續(xù)進(jìn)化,其中,一類可以承擔(dān)人工智能數(shù)據(jù)中心職責(zé)、提供符合需求算力的產(chǎn)品——“AI超級(jí)計(jì)算機(jī)”開始走向臺(tái)前。

開篇的北京AI創(chuàng)新企業(yè)能走下來,除了團(tuán)隊(duì)在美國(guó)積累了一系列經(jīng)驗(yàn)等原因,恰當(dāng)?shù)乃懔┙o也不可忽視,其命名為σ-Discover Lung的智能肺結(jié)節(jié)分析系統(tǒng)的開發(fā),采用了來自NVIDIA的DGX Station加速神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。

以小型化服務(wù)器系統(tǒng)的形式,NVIDIA DGX Station主要通過互聯(lián)的GPU以及大容量?jī)?nèi)存,來實(shí)現(xiàn)一體式AI數(shù)據(jù)中心的功能。

而這種產(chǎn)品的出現(xiàn),其本質(zhì)上是算力供給形態(tài)適應(yīng)市場(chǎng)需求的一種進(jìn)化,即人工智能數(shù)據(jù)中心的小型化——通過新的GPU芯片以及適配的主板與整機(jī)系統(tǒng),大幅度提升算力性能,形成在外形上如同個(gè)人計(jì)算機(jī)產(chǎn)品一樣的“AI超級(jí)計(jì)算機(jī)”(以下簡(jiǎn)稱AI超算),告別CPU產(chǎn)品的冗重與低效。

從具體參數(shù)看,AI超算表現(xiàn)出十分超前的性能。

不久前國(guó)內(nèi)某龍頭科技企業(yè)幫助武漢建設(shè)的AI數(shù)據(jù)中心投入使用,其峰值性能為100 petaflops,相當(dāng)于50萬臺(tái)個(gè)人PC的算力之和,而作為AI超算的DGX Station,其最新產(chǎn)品單臺(tái)可提供2.5 petaflops的算力,即只需要40臺(tái)就能在量級(jí)上與一個(gè)地區(qū)數(shù)據(jù)中心的峰值能力持平。

而在具體場(chǎng)景中,很多組織也在通過AI超算獲得算力。

中科院深圳先進(jìn)技術(shù)研究院醫(yī)工所在醫(yī)療影像圖譜分析領(lǐng)域借助AI超算進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,相比傳統(tǒng)CPU計(jì)算方案,單臺(tái)搭載4個(gè)V100 GPU的DGX產(chǎn)品,提升訓(xùn)練速度40倍以上,大大減少了模型訓(xùn)練的時(shí)間。

由于心血管的復(fù)雜性,定向攻克心血管CT圖像識(shí)別的科亞醫(yī)療,需要高精度的AI模型來支持血管的精細(xì)重建及功能的準(zhǔn)確分析,必須通過大量多維度多模態(tài)的醫(yī)學(xué)影像進(jìn)行訓(xùn)練,參數(shù)龐大而傳統(tǒng)的算法和工具平臺(tái)無法滿足這種需要。

采用AI超算后,科亞醫(yī)療的數(shù)據(jù)處理和訓(xùn)練速度得到了極大提升,其解決方案“深脈分?jǐn)?shù)DVFFR”實(shí)現(xiàn)了92%的檢測(cè)精準(zhǔn)度,避免了非必要的冠脈造影,減輕了醫(yī)生的工作負(fù)擔(dān)和患者的手術(shù)痛苦及經(jīng)濟(jì)負(fù)擔(dān)。

可以看到,AI超算正在滿足不同類型組織中的數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要。

除了算力,AI超算還將解決數(shù)據(jù)團(tuán)隊(duì)的“要素配置”難題?

除了性能表現(xiàn),在過去,一個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì)要完成算力體系的搭設(shè),往往還需要一套包括各種要素的體系:

要配置計(jì)算硬件;

要搭設(shè)用于各種開發(fā)目的的軟件;

要有AI工程師;

要運(yùn)營(yíng)維護(hù);

甚至有時(shí)還要考慮設(shè)備的散熱降噪……

“麻雀雖小也必須五臟俱全”,很多數(shù)據(jù)科學(xué)團(tuán)隊(duì)顯然缺乏條件進(jìn)行配置,而因?yàn)橥度臊嫶笄椅幢啬芊纤懔σ螅幢闶谴笮徒M織也面臨尷尬的選擇。

而AI超算這種算力形態(tài)或能通過一體化的方式規(guī)避這個(gè)“要素配置”難題,這類產(chǎn)品并不要求復(fù)雜的安裝過程,甚至不需要IT部門的幫助,當(dāng)缺乏這些要素(典型如AI工程師)時(shí),數(shù)據(jù)科學(xué)團(tuán)隊(duì)仍然可以實(shí)現(xiàn)即插即用、一站式的計(jì)算能力配置。

這意味著,那些非AI專業(yè)領(lǐng)域的團(tuán)隊(duì),不需要學(xué)習(xí)深度學(xué)習(xí)知識(shí),不需要對(duì)AI框架、模型有十分深入的理解,甚至不需要自己配備數(shù)據(jù)模型,只需要有數(shù)據(jù)集,就能輕而易舉地完成AI數(shù)據(jù)訓(xùn)練與模型開發(fā)工作。

毫無疑問,AI超算的這種特性,對(duì)那些相對(duì)于AI專業(yè)來說的“傳統(tǒng)”行業(yè),例如汽車制造、生物制藥、光伏產(chǎn)業(yè)等,十分友好。

在國(guó)外,寶馬工廠就利用人工智能工作組設(shè)備NVIDIA DGX Station訓(xùn)練和模擬出從零部件到裝配產(chǎn)線的“數(shù)字孿生世界”,幫助產(chǎn)線實(shí)現(xiàn)更好的效率與穩(wěn)定性,為寶馬每天超1萬輛汽車的訂單生產(chǎn)貢獻(xiàn)力量。

構(gòu)成AI超算即插即用特性的能力有很多,軟件系統(tǒng)方面操作系統(tǒng)、開發(fā)框架甚至各個(gè)場(chǎng)景的預(yù)訓(xùn)練模型整合最為典型,軟硬件一體化協(xié)同讓數(shù)據(jù)科學(xué)團(tuán)隊(duì)基本上無需再花太多心思到開發(fā)環(huán)境搭設(shè)上。

例如,在暨南大學(xué)信息科學(xué)技術(shù)學(xué)院計(jì)算機(jī)系,其教學(xué)與科研往往有多個(gè)數(shù)據(jù)團(tuán)隊(duì)在同時(shí)使用算力設(shè)備,DGX Station AI.超算產(chǎn)品的OS自帶的多用戶、多任務(wù)管理功能,能夠讓不同數(shù)據(jù)團(tuán)隊(duì)甚至不同成員在工作組設(shè)置下,按照不同的計(jì)劃同時(shí)進(jìn)行各自的實(shí)驗(yàn),大大提升了資源的利用效率——這種多任務(wù)并舉的情形,在眾多組織中都廣泛存在。

此外,由于臺(tái)式PC式的產(chǎn)品形態(tài),在企業(yè)辦公室、實(shí)驗(yàn)室、科研機(jī)構(gòu),甚至在家中工作的數(shù)據(jù)科學(xué)團(tuán)隊(duì)都能很容易通過AI超算配置自己的人工智能數(shù)據(jù)中心,進(jìn)行深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練、推理與高級(jí)分析等計(jì)算密集型AI探索。

用通俗的話說,DGX Station的出現(xiàn),更像是為組織內(nèi)的數(shù)據(jù)科學(xué)團(tuán)隊(duì)打開了“懶人模式”——他們只需要聚焦于算法模型的創(chuàng)新即可,其他相關(guān)的工作都被一個(gè)一體化產(chǎn)品“包圓了”。

小結(jié)

如同PC的發(fā)展,從一間房到半張桌,從KB到GB到TB,從專業(yè)團(tuán)隊(duì)操作到人人可用,AI算力設(shè)備也在經(jīng)歷類似的過程,高能力、低門檻,優(yōu)質(zhì)算力資源正在實(shí)現(xiàn)更好的觸達(dá),讓組織的數(shù)據(jù)科學(xué)團(tuán)隊(duì)更好地獲取匹配的算力。

而從AI醫(yī)療影像場(chǎng)景可以看出,正是因?yàn)楝F(xiàn)實(shí)場(chǎng)景應(yīng)用對(duì)AI有著越來越深刻的需求,才不斷倒逼著數(shù)據(jù)科學(xué)團(tuán)隊(duì)以更快的方式來實(shí)現(xiàn)模型創(chuàng)新與迭代。這意味著,AI落地越廣泛和深入,最終傳導(dǎo)到數(shù)據(jù)科學(xué)團(tuán)隊(duì),就是對(duì)算力條件越來越高甚至必須一次次突破常規(guī)的要求。

AI超算成為了AI應(yīng)用創(chuàng)新的起點(diǎn),但它也是AI應(yīng)用落地的結(jié)果,市場(chǎng)需求始終“水漲船高”,算力形態(tài)的進(jìn)化,還將繼續(xù)。

*本文圖片均來源于網(wǎng)絡(luò)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)