訂閱
糾錯
加入自媒體

國產(chǎn)GPU“挑戰(zhàn)”美國禁令,創(chuàng)全球通用GPU最高算力

上個月,美國以維護國家安全為由,禁止英偉達、AMD向中國銷售AI芯片,引發(fā)市場熱議。但同時有專家指出,此舉給予中國廠商與相關(guān)產(chǎn)業(yè)崛起的機會,如同2015年美國政府發(fā)出禁令要求英特爾停止向中國超級計算機制造商出售高端芯片,因擔(dān)心中國用于核武研究,但僅僅一年后,中國便成功研發(fā)出用于超算的自主知識產(chǎn)權(quán)的國產(chǎn)芯片。

業(yè)內(nèi)人士認為,美國禁止AI芯片銷往中國,是打擊超級計算機、高效能運算以及AI等領(lǐng)域的措施之一,去年美國將7家超算企業(yè)及研發(fā)機構(gòu)列入“貿(mào)易黑名單”,如今又禁止英偉達、AMD向中國銷售AI芯片,未來不排除會擴大制裁范圍。

然而,近日,非盈利性機器學(xué)習(xí)開放組織MLCommons聯(lián)盟發(fā)布報告指出,國產(chǎn)高端GPU芯片企業(yè)——壁仞科技的AI芯片擁有出色的效率,甚至超越其中一款被美國政府限制出售的AI芯片。

有專家認為,這是里程碑的代表,國內(nèi)廠商獲得了額外的機會,因為許多客戶無法取得國外的芯片,而國內(nèi)廠商正在生產(chǎn)類似的產(chǎn)品。

【國產(chǎn)GPU賽道的“種子選手”】

據(jù)了解,壁仞科技創(chuàng)立于2019年,是國內(nèi)一家通用智能芯片的初創(chuàng)企業(yè),也是國產(chǎn)圖形GPU賽道的“種子選手”。截至目前,壁仞科技已完成B輪融資,總?cè)谫Y額超50億元人民幣。

今年4月,公司公布首款通用GPU芯片BR100系列,是首款面向云端AI訓(xùn)練集推理的通用GPU算力產(chǎn)品。

該系列芯片架構(gòu)完全由壁仞科技自主原創(chuàng)研發(fā),核心性能能夠直接對標國際廠商近期發(fā)布的旗艦產(chǎn)品。消息稱,其峰值算力超過了英偉達目前在售的旗艦A100。

國產(chǎn)GPU“挑戰(zhàn)”美國禁令,創(chuàng)全球通用GPU最高算力

據(jù)了解,BR100芯片采用7nm制程、壁仞原創(chuàng)“壁立仞”芯片架構(gòu),容納近800億顆晶體管,配備超300MB片上高速SRAM,并應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),突破了大尺寸芯片制造與封裝中的光罩尺寸限制問題,做到高良率與高性能的兼顧。

總體而言,壁仞科技BR100最大的爆點在于單芯片1000TFLOPs,以及這是在550W功耗約束下的算力。在發(fā)布會上,壁仞科技創(chuàng)始人、董事長、CEO張文稱,中國通用GPU芯片進入每秒1,000,000,000,0000,000次計算新時代。

BR100系列芯片將主要用于AI訓(xùn)練推理、通運用算等場景,在智慧城市、云游戲、自動駕駛等領(lǐng)域都有很大的發(fā)揮空間。

據(jù)消息稱,壁仞的CTO是華為海思出身的洪洲,當(dāng)年海思推GPU,進展很好,但是被美國制裁了,壁仞的技術(shù)團隊還有不少技術(shù)才俊,包括曾創(chuàng)建高通公司驍龍GPU團隊、領(lǐng)導(dǎo)了5代Adreno GPU架構(gòu)開發(fā)的首席架構(gòu)師焦國方,前阿里云AI基礎(chǔ)架構(gòu)負責(zé)人徐凌杰,海光前海外GPU部門副總裁張凌嵐,EDA軟件巨頭Synopsys(新思科技)前AI Lab負責(zé)人唐杉,AMD前全球副總裁、中國研發(fā)中心總經(jīng)理李新榮,英偉達前上?偨(jīng)理楊超源等。

【BR104創(chuàng)造全球通用GPU最高算力】

近日,全球權(quán)威AI基準評測MLPerf公布了最新AI基準測試結(jié)果(MLPerf Inference v2.1)。壁仞科技以最新發(fā)布的通用GPU芯片BR104,拿下數(shù)據(jù)中心推理評測中自然語言理解(BERT模型)和圖像分類(ResNet50模型)兩類基準評測“available”(可售產(chǎn)品類別)單卡性能全球第一的成績,其中BR104在BERT模型下達到了英偉達A100單卡性能的1.58倍。

國產(chǎn)GPU“挑戰(zhàn)”美國禁令,創(chuàng)全球通用GPU最高算力

據(jù)了解,MLPerf由圖靈獎得主大衛(wèi)·帕特森(David?Patterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等共同成立,是國際上最權(quán)威、最有影響力的基準測試之一。為及時跟蹤和評測迅速發(fā)展的AI計算需求與性能,MLPerf每年組織2次AI測試。其數(shù)據(jù)中心場景的評測,綜合考察參與廠商的硬件系統(tǒng)和軟件優(yōu)化能力,而此次BR104參加的“Closed Division”(固定任務(wù))類別,則要求參評者在完全一致的模型和環(huán)境下進行性能結(jié)果的提交,因此這一類別下的結(jié)果被認為是全球數(shù)據(jù)中心產(chǎn)業(yè)最具參考價值的AI性能基準測試結(jié)果。

與此同時,在BERT模型下,BR104還拿下了4卡整機、8卡整機性能全球第一的成績,算力能效比也遠遠領(lǐng)先于其他廠商,達到英偉達A100算力能效比的2.11倍。BERT模型是目前自然語言理解領(lǐng)域應(yīng)用最廣泛的模型之一,也是相關(guān)產(chǎn)業(yè)應(yīng)用中最重要的模型。

壁仞科技董事長、創(chuàng)始人、CEO張文表示,ResNet50模型和BERT模型是目前產(chǎn)業(yè)客戶最重視的AI模型,此次MLPerf最新發(fā)布的評測結(jié)果,直接證明了BR100系列通用GPU芯片的落地應(yīng)用能力。目前,BR104已經(jīng)開始了大規(guī)模的客戶送測和適配,性能更強大的BR100也已啟動落地應(yīng)用,我們對BR100系列未來的應(yīng)用前景充滿信心。

【硝煙開始彌漫】

長期以來,全球GPU產(chǎn)業(yè)都被英偉達和AMD等美國企業(yè)所壟斷,在美國禁令的背景下,中國在技術(shù)領(lǐng)域“自給自足”的重要性愈發(fā)凸顯。

當(dāng)下,看到機會的不止是壁仞科技,除了早先入局的寒武紀、比特大陸、燧原科技等云端芯片創(chuàng)企外,過去一年間,陸續(xù)有新玩家現(xiàn)身,大量資本也正積極地涌入這一賽道。

分析機構(gòu)CCS Insight的分析師表示,壁仞科技已經(jīng)展現(xiàn)出實力,商機已經(jīng)落在他們身上,可能會因此獲得成功。此外,有分析師認為,要在人工智能領(lǐng)域獲得成功,不僅是生產(chǎn)芯片,還需要一套與英偉達CUDA平臺競爭的完整的人工智能軟件生態(tài)系統(tǒng),而這挑戰(zhàn)難度極大。

眾所周知,英偉達的一個關(guān)鍵優(yōu)勢在于2006年發(fā)表的CUDA通用并行計算平臺和編程模型,讓GPU成為并行運算的首選,如今已被開發(fā)者們大量使用。

壁仞科技CTO洪洲曾表示,新的GPU板卡要無縫地支持CUDA生態(tài),這比更高的算力,更好的能效比更重要。目前階段必須保證用CUDA寫的程序能無縫運行在壁仞科技的異構(gòu)計算開發(fā)平臺上,不應(yīng)當(dāng)為了追求所謂的極致能效,而打破對通用編程模型的兼容性。

當(dāng)前壁仞科技的第一要務(wù)是在打造自有編程模型的同時,兼容CUDA當(dāng)前版本,而壁仞科技的終極目標,是提供比CUDA更好的自研編程模型。

國內(nèi)云端AI芯片及GPU賽道的硝煙正開始彌漫,入局者將越來越多。

畢竟,GPU, CPU, NPU, XPU國產(chǎn)化是這一代國人工程師的歷史使命,也是中國拿下電車,自動駕駛,物聯(lián)網(wǎng)這些蛋糕的前置條件。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號