訂閱
糾錯
加入自媒體

黃氏定律再次生效,AI算力版圖正越來越大

2020-12-19 09:09
億歐網(wǎng)
關注

相比售賣顯卡,英偉達(NVIDIA)著力點毫無疑問是AI算力。

1965年,得力于對行業(yè)的洞察,戈登·摩爾提出經(jīng)典的摩爾定律,集成電路飛速發(fā)展,人類在信息時代中飛速發(fā)展,隨后誕生了互聯(lián)網(wǎng)浪潮,間接催生了微軟、蘋果、亞馬遜、阿里巴巴、百度等科技公司,也加速了IBM、甲骨文等老牌科技公司的轉(zhuǎn)型。

千禧年后,學界進入“算力解放”世代,集成電路的智慧結(jié)晶“CPU”算力無法完全滿足學者需要,人工智能算法對算力的支持更強勁、更多元,隨后英偉達在2006年推出Tesla架構,借助CUDA系列編程環(huán)境,開啟了AI算力次世代,黃氏定律持續(xù)發(fā)揮作用。

在12月15日開始的2020 GTC中國大會上,英偉達帶著2020新品NVIDIA A100,繼續(xù)詮釋著“加速計算”的定位。

AI算力與商業(yè)世界的未來

主導未來科技發(fā)展的關鍵已經(jīng)落在人工智能,場景、數(shù)據(jù)、模型、算力缺一不可。

根據(jù)OpenAI數(shù)據(jù),自2012年以來,AI訓練任務使用的算力呈指數(shù)級增長,每3.5個月翻一倍?萍脊菊粩噙\用AI算法與新商業(yè)模式,推動AI能力滲透個人消費市場,底層代表則是算力服務者英偉達。

在2020 GTC中國上,英偉達展示了阿里巴巴淘寶在使用NVIDIA GPU計算平臺下為直播和AI推薦提供加速服務;快手也利用GPU超分辨率處理技術,將視頻分辨率提升至720p或1080p;英偉達與京東物流基于Jetson平臺打造的智能機器。

在廣袤的新能源汽車領域,芯片市場更是大有可為。僅在中國市場,中國汽車工程學會副秘書長葉盛基就預測2020年中國將銷售130萬輛新能源汽車,其背后涉足的是182.5億美元的AI芯片市場。

相比消費級市場,投資者也將目光轉(zhuǎn)向更具成長力、前景更好、更注重運用AI技術的公司身上,其中汽車、大健康與基礎元件是最受關注的領域。2012-2017年間,中國AI私募投資頻數(shù)以68%的復合增長率快速增長,其中視覺類、數(shù)據(jù)挖掘、機器學習、語音等技術應用為企業(yè)首選。

盡管在2020年行業(yè)周期變化下,一級市場投資頻數(shù)有所下降,但明顯單筆投資金額在加大,一級市場的投資窗口期即將結(jié)束,同時AI商業(yè)應用落地更多,企業(yè)對AI算力的需求也更加渴望。

這一現(xiàn)象同樣體現(xiàn)在二級市場,根據(jù)億歐智庫數(shù)據(jù),截至2020年4月,共有91家從事人工智能技術開發(fā)與應用的中國企業(yè)完成上市。

持續(xù)成長的中國AI市場,讓英偉達看到比顯卡更大的商業(yè)機會。

黃氏定律再次生效

在12月15日的GTC大會上,億歐受邀參與了主論壇報道與中國區(qū)媒體溝通會。主論壇上,英偉達首席科學家Bill Dally圍繞新架構產(chǎn)品A100,分享了AI推理、光追技術、集群加速以及各個落地產(chǎn)業(yè)的最新支持與應用。

作為世界上最大7nm芯片,GPU A100基于Ampere架構,利用第三代Tensor Core,A100增加了對TF32的支持,可以獲得156 TeraFLOPS(萬億次浮點運算每秒)性能,同時MIG技術可以將A100分解為7個獨立GPU,而A100本身也支持第三代NVLink與NVSwitch,以集群形式產(chǎn)生更大算力。

英偉達中國工程和解決方案高級總監(jiān)賴俊杰表示,TF 32是介于FP 16與FP 32之間的中間態(tài),滿足研發(fā)人員與工程師在計算精度與速度的折中,一方面它有足夠的動態(tài)范圍與精度,保證網(wǎng)絡在訓練時沒有任何精度損失,另一方面,利用Tensor Core架構提升神經(jīng)網(wǎng)絡計算性能。

圍繞這款新品,Bill Dally也提到,根據(jù)研究,大多數(shù)神經(jīng)網(wǎng)絡是可以修剪的,在切斷神經(jīng)元之間70%到90%連接后,精度并不發(fā)生太大變化。

借助結(jié)構稀疏,Ampere在神經(jīng)網(wǎng)絡結(jié)構中允許4個權重中的兩個為0,而在矩陣乘法中,一旦權重達成2/4模式,就能額外獲得雙倍性能提升,賴俊杰也表示,在實測中,神經(jīng)網(wǎng)絡計算效果也能獲得1.5倍性能提升。

億歐:英偉達GPU算力持續(xù)大幅提升/英偉達

英偉達GPU算力持續(xù)大幅提升/英偉達

借助架構優(yōu)勢,英偉達集群高性能算力也表現(xiàn)突出。在11月超算TOP 500中,前十名中有8位采用了英偉達技術,英偉達Selene在TOP 500和Green 500中都名列第五,而中美歐的頂級超算中都采用了英偉達的技術。

Bill Dally認為,黃氏定律揭示了推理性能持續(xù)提升的秘密。

從28nm的Kepler、16nm到7nm的Ampere架構,英偉達持續(xù)對Tensor Core改進,不斷優(yōu)化電路設計與架構,拋棄傳統(tǒng)集成電路對制程的依賴。在Bill Dally展示中,Ampere架構下數(shù)據(jù)中心的推理能力遠高于競爭對手Intel以及Xilinx,邊緣推理更是遠超競爭對手。

v2-39982bcd3de937cde223d706c32e2880_1440w.jpg.jpg

v2-06f9713315e4d5cbeed0bb3dcf8b29af_1440w.jpg.jpg

RTXDI效果對比圖/英偉達

在光追技術展示中,英偉達展示了直接照明技術RTXDI。利用這項技術,圖形界面上每個光源都會將光線投射到相鄰表面上,其支持數(shù)百萬個光線,光線在物體表面會發(fā)生多次反射再回到眼睛,借助這項技術,光線效果將更加逼真。

此外,Bill Dally還帶來了DLSS(深度學習超級采樣)2.0版本,相比1.0版本,2.0支持圖像更加精確升級,圖像升級后將與更高分辨率實際渲染的數(shù)據(jù)比較,其中誤差部分會進入DGX SuperPODs訓練神經(jīng)網(wǎng)絡loss函數(shù),經(jīng)過數(shù)據(jù)集的特定迭代,準確展示升級后的圖像。

這一技術也被用到視頻的升級,利用神經(jīng)網(wǎng)絡,游戲畫面可以顯著提升動態(tài)幀率,同時電影在特效制作中也能基于物理性質(zhì)實現(xiàn)路徑追蹤,鏡面反射、折射與再折射都可以得到多光線采樣。

相比GPU產(chǎn)品性能展示,英偉達此次也更加強調(diào)集群計算的支持。

Bill Dally在會上展示了英偉達MAGNet工具AI推理加速器模擬結(jié)果,其推理能力可以達到每瓦100 teraops,眾所周知,運算中數(shù)據(jù)傳輸帶來的能量損耗最大,MAGNet通過協(xié)調(diào)并控制信息流,最大限度減少數(shù)據(jù)傳輸來達到節(jié)能效果。

億歐:傳統(tǒng)電氣鏈路與設計的光鏈路DGX/英偉達

傳統(tǒng)電氣鏈路與設計的光鏈路DGX/英偉達

此外Bill Dally也與技術團隊研究光鏈路取代電氣鏈路的新技術,采用“密集波分復用”技術,就有可能在1毫米大小的芯片實現(xiàn)Tb/s級傳輸,將是現(xiàn)在互連密度的10倍以上。

借助這一吞吐量和NVSwitch技術,Bill Dally和英偉達計劃未來開發(fā)出依托光鏈路、搭載9排共160個GPU的DGX,這將大幅提升數(shù)據(jù)中心算力。

在軟件方面,全新編程系統(tǒng)原型Legate可以運行針對單一GPU編寫的程序,其適用于Jetson Nano、A100以及超算,但目前Legate還無法對大量GPU進行理想的并行處理,Bill Dally與技術團隊仍在優(yōu)化。

英偉達與中國公司的“!迸c“機”

在媒體溝通會上,英偉達GPU計算專家團隊亞太區(qū)總監(jiān)李曦鵬,強調(diào)英偉達25年來持續(xù)在進行“加速計算”。消費級市場對英偉達一直是“顯卡廠商”定位,但從AI算力進入主流產(chǎn)學界后,加速計算這一定位開始充分體現(xiàn)。

億歐:NVIDIA數(shù)據(jù)中心平臺/英偉達

NVIDIA數(shù)據(jù)中心平臺/英偉達

除了顯卡產(chǎn)品與新技術外,英偉達在大會上用了更多筆墨展示其在數(shù)據(jù)中心以及產(chǎn)業(yè)端的支持,包括第三代的NVLink和NVSwitch等技術的展望,其中還包括對中小企業(yè)、創(chuàng)業(yè)公司乃至傳統(tǒng)公司的支持。

例如圍繞軟件支持,李曦鵬提到,借助CUDA統(tǒng)一架構,英偉達保證了新的應用能持續(xù)滿足市場需求,做到了算法、軟件、硬件的相互配合,在本代Ampere架構下,TensorFlow有了專門的配套,TensorRT也提供更好的矩陣乘法支撐,甚至還有加速SDK,同時英偉達也積極投身到應用的開發(fā)上,滿足更多企業(yè)或機構“開箱即用”,進一步服務更多B端。

企業(yè)端的表現(xiàn)吸引了眾多中國公司參與,包括阿里巴巴、字節(jié)跳動、中國電信、浪潮、快手等,中國的OEM廠商、云廠商、互聯(lián)網(wǎng)企業(yè)都在利用英偉達相關產(chǎn)品與技術進行開發(fā)。

英偉達醫(yī)療業(yè)務全球副總裁Kimberly Powell,在15日主論壇圓桌環(huán)節(jié)提到,中國平安、聯(lián)影智能、推想科技和數(shù)坤科技在新冠疫情期間,利用英偉達GPU產(chǎn)品與技術,加快了影像診斷,為影像診斷提供巨大幫助。

英偉達亞太區(qū)戰(zhàn)略運營與合作伙伴副總裁Ashok Pandey,在圓桌中直接用中文表示,英偉達與中國云服務廠商合作已7年,目前頂級的中國云服務商已經(jīng)推出或即將推出基于A100的新產(chǎn)品,更多AI應用也將面向更多云服務開發(fā)者和使用者。

同時在超算中大放異彩的ARM也將在中國的云、數(shù)據(jù)中心、邊緣計算場景市場中出現(xiàn),英偉達宣稱,未來ARM的開放度不會受到貿(mào)易管制影響。

英偉達工程與解決方案高級總監(jiān)李浩南表示,GPU加速的ARM服務器正在各個場景中夯實,目前在HPC、AI以及游戲中已有表現(xiàn),更多中國公司將加入到ARM陣營。

億歐:2013-2020英偉達投資布局版圖/億歐商業(yè)分析師趙寧

2013-2020英偉達投資布局版圖/億歐商業(yè)分析師趙寧

除了產(chǎn)品與技術市場的合作外,英偉達過去在全球范圍內(nèi)布局了眾多AI初創(chuàng)公司,本次大會上,12家中國初創(chuàng)公司得到了英偉達幫助。

在本次GTC大會上,100家初創(chuàng)公司通過“英偉達初創(chuàng)加速計劃”,在40家投資機構及產(chǎn)業(yè)代表投票中,12家企業(yè)參與了線上展示,涉及領域包括醫(yī)療、零售、消費互聯(lián)網(wǎng)、深度學習、IoT、工業(yè)制造等領域。

相比過去,英偉達對于中國市場的重視程度不斷加強。中國是全球AI算力最富集的地區(qū)之一,大量AI與數(shù)字化公司需要更多算力支持,同時中國也是自動駕駛成長最快的市場,以百度Apollo、地平線、馭勢科技、四維圖新等為代表,AI芯片必將是核心需要。

另一方面,目前中國市場占到英偉達收入一半左右,通過在ARM、Mellanox的布局,英偉達有了更強的數(shù)據(jù)中心建設能力,但同時也讓中國客戶不得不購買英偉達的產(chǎn)品。

超算采購已經(jīng)成為英偉達核心收入之一,通過外延并購,其完成了對超算產(chǎn)品的嚴密布局,中國公司進入的門檻被大大提高。

換句話說,在服務器與底層技術上,中國公司與海外巨頭的競爭差距被資本拉大,知名的OEM廠商看似在生產(chǎn)高附加值的服務器,但仍處于利潤的微笑曲線底部。

面對英偉達的橄欖枝,中國公司與市場充滿了機遇與挑戰(zhàn),下游企業(yè)可以充分享受產(chǎn)品技術、乃至生態(tài)紅利;英偉達、AMD、英特爾等半導體巨頭仍占有巨大優(yōu)勢。

這對國產(chǎn)自研的刺激并不低,寒武紀為代表的中國上市公司會越來越多,從另一個角度而言,這也不失為另一種機會。

參考資料:

《WIA2020 | 2020全球半導體芯片科技創(chuàng)新TOP50》,億歐智庫,何少佳,2020年12月9日

《2020年中國人工智能商業(yè)落地研究報告》,億歐智庫,張一豪,2020年7月10日

作者:黃志磊    

聲明: 本文系OFweek根據(jù)授權轉(zhuǎn)載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號