訂閱
糾錯(cuò)
加入自媒體

英偉達(dá)背后的“諸神之爭(zhēng)”。

缺芯演變?yōu)槿蚋餍懈鳂I(yè)的痛點(diǎn),催促更多的國(guó)產(chǎn)AI芯片企業(yè)努力追趕甚至超越。

 內(nèi)容/嵐羽

 編輯TV  

校對(duì)莽夫

2024年剛開(kāi)局,AI“王炸”頻現(xiàn)。蘋(píng)果放棄長(zhǎng)達(dá)十年的造車(chē)計(jì)劃轉(zhuǎn)投生成式AI,OpenAI首個(gè)文生視頻模型Sora驚艷亮相,號(hào)稱(chēng)比GPT-4快18倍的大模型Groq橫空出世,華為發(fā)布首個(gè)通信行業(yè)大模型……

AI浪潮已經(jīng)勢(shì)不可擋,AI芯片作為其發(fā)展的底層基石也迎來(lái)了前所未有的機(jī)遇。據(jù)Gartner最新預(yù)測(cè),到2024年AI芯片市場(chǎng)規(guī)模將較上一年增長(zhǎng)25.6%,達(dá)671億美元。預(yù)計(jì)到2027年,AI芯片市場(chǎng)規(guī)模將是2023年規(guī)模的兩倍以上,達(dá)到1194億美元。

在這樣的背景下,“算力霸主”英偉達(dá)被捧上神壇,以高達(dá)80%的占有率幾乎壟斷了市場(chǎng),賺得盆滿缽滿。英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)的營(yíng)收再創(chuàng)新高,帶動(dòng)2024年財(cái)年Q4季度總營(yíng)收狂漲265%。由于這份遠(yuǎn)超預(yù)期的財(cái)報(bào)數(shù)據(jù),英偉達(dá)一夜?jié)q出2770億美金市值,相當(dāng)于:一夜?jié)q出阿里巴巴+百度+京東。

英偉達(dá)的“狂飆”也引來(lái)了眾多挑戰(zhàn)者。亞馬遜、谷歌、微軟、華為、百度等巨頭積極推動(dòng)自研芯片,寒武紀(jì)、摩爾線程、燧原科技等新銳力量崛起。據(jù)外媒報(bào)道,英偉達(dá)在提交給美國(guó)證券交易委員會(huì)的文件中,其中包含AI芯片等多個(gè)類(lèi)別里,首度將華為認(rèn)定為“最大競(jìng)爭(zhēng)對(duì)手”。

理想與狂熱交織下,人們不免好奇:英偉達(dá)的“鐵王座”還能坐多久?為什么華為被其列為最大競(jìng)爭(zhēng)對(duì)手?其他國(guó)產(chǎn)AI芯片發(fā)展如何?

Part.1

英偉達(dá)“外患”大于“內(nèi)憂”

與英偉達(dá)不斷刷新預(yù)期的業(yè)績(jī)相伴相隨的是,越來(lái)越多的挑戰(zhàn)。

正如英偉達(dá)CEO黃仁勛在一次演講中所說(shuō):“我們并不需要假裝公司處于危險(xiǎn)之中,因?yàn)槲覀兡芨杏X(jué)到公司確實(shí)一直處于危險(xiǎn)之中!

英偉達(dá)目前最顯著的問(wèn)題是產(chǎn)能。從去年開(kāi)始,臺(tái)積電在先進(jìn)封裝方面的產(chǎn)能變得緊張,而英偉達(dá)芯片依賴于臺(tái)積電的CoWoS封裝技術(shù)以及基于65nm硅中介層的工藝。雖然臺(tái)積電已計(jì)劃將CoWoS封裝產(chǎn)能提高一倍,但需到2024年下旬產(chǎn)能才能紓解。

為緩解產(chǎn)能緊張的局面,英偉達(dá)與英特爾達(dá)成了代工合作意向,初步估算英特爾每月生產(chǎn)5000片晶圓,如果全部用于生產(chǎn)H100芯片,在理想情況下最多可以得到30萬(wàn)顆芯片,這也意味著英偉達(dá)高性能GPU的交貨周期將有望縮短更多。

內(nèi)憂好解,外患卻不容忽視。去年12月,AMD發(fā)布了MI300系列芯片產(chǎn)品。AMD首席執(zhí)行官蘇姿豐稱(chēng),MI300X在訓(xùn)練大語(yǔ)言模型方面與英偉達(dá)的H100芯片相當(dāng),但推理能力更為出色。目前,MI300系列產(chǎn)品已開(kāi)始量產(chǎn)出貨,上個(gè)季度推動(dòng)AMD數(shù)據(jù)中心GPU總收入超過(guò)4億美元。

英特爾也在發(fā)力謀求在市場(chǎng)中更大的話語(yǔ)權(quán)。新一代的Gaudi 3將采用先進(jìn)的5nm制程工藝,配備最高達(dá)128GB的HBM3e內(nèi)存,大幅提升AI的學(xué)習(xí)和訓(xùn)練性能,可對(duì)標(biāo)英偉達(dá)的H200芯片。

除了上述兩個(gè)直接競(jìng)爭(zhēng)對(duì)手的“步步緊逼”,英偉達(dá)還面臨多家科技大廠的挑戰(zhàn)。微軟發(fā)布了其首款定制化Maia 100 GPU和Azure Cobalt CPU100,以降低AI服務(wù)成本。亞馬遜和谷歌已經(jīng)使用了自研芯片,并部分產(chǎn)品向客戶提供。OpenAI的7萬(wàn)億芯片計(jì)劃和孫正義的1000億“豪賭”也在試圖分一杯羹。此外,MLIR、谷歌等都在轉(zhuǎn)向“以Python語(yǔ)言為基礎(chǔ)的編程層”,以使AI訓(xùn)練更加開(kāi)放,逐漸擺脫對(duì)英偉達(dá)CUDA生態(tài)的依賴,建立起自己的護(hù)城河。

與此同時(shí),受出口管制影響,英偉達(dá)在中國(guó)市場(chǎng)的收入暴跌。根據(jù)英偉達(dá)最新的財(cái)報(bào)數(shù)據(jù),中國(guó)區(qū)2023年第四季度的營(yíng)收下滑到個(gè)位數(shù)比例。如何在美國(guó)政府管制、中國(guó)客戶需求間保持平衡成為英偉達(dá)的一道關(guān)鍵課題。

在專(zhuān)門(mén)為中國(guó)市場(chǎng)特供的A800和H800也被禁售后,英偉達(dá)推出了新款H20,但該產(chǎn)品性價(jià)比并不高,性能縮水為H100的四分之一,阿里巴巴、騰訊、百度等中國(guó)企業(yè)明確表示今年會(huì)大砍訂單量,英偉達(dá)在中國(guó)的營(yíng)收恐不樂(lè)觀。

Part.2

華為AI芯片的自研苦旅

英偉達(dá)在曾提交給美國(guó)證券交易委員會(huì)的文件中,把華為列為最大競(jìng)爭(zhēng)對(duì)手。近日在接受美國(guó)科技雜志《連線》采訪時(shí),英偉達(dá)CEO黃仁勛再次表達(dá)了對(duì)華為的重視,點(diǎn)贊“華為盡管受到現(xiàn)有半導(dǎo)體處理技術(shù)的限制,仍然可以通過(guò)將許多芯片聚集在一起來(lái)構(gòu)建非常強(qiáng)大的系統(tǒng)!

這不僅是對(duì)華為技術(shù)實(shí)力的認(rèn)可,更是對(duì)整個(gè)AI芯片行業(yè)競(jìng)爭(zhēng)格局的一次重新評(píng)估。申萬(wàn)宏源的研究報(bào)告顯示,從2023年上半年的數(shù)據(jù)看,華為AI服務(wù)器出貨量已成為國(guó)產(chǎn)品牌第一,僅次于英偉達(dá),且仍在快速增長(zhǎng)。

華為的崛起并非是“忽如一夜春風(fēng)來(lái)”。2017年,華為發(fā)布全球首款移動(dòng)端AI芯片麒麟970,內(nèi)置獨(dú)立NPU,相比CPU獲得了約50倍能效和25倍性能優(yōu)勢(shì)。這意味著,麒麟970芯片可以用更少的能耗更快地完成AI計(jì)算任務(wù)。

一年后,華為又發(fā)布麒麟980,憑借7nm制程工藝、雙核NPU加持等特性,麒麟980打破了多項(xiàng)世界第一。但是,沒(méi)有一蹴而就的成果。麒麟980歷經(jīng)了36個(gè)月的研發(fā),才完成定制特殊基礎(chǔ)單元構(gòu)建高可靠性IP論證,再加上Soc工程化驗(yàn)證的時(shí)間,留給量產(chǎn)的周期僅半年左右。

根據(jù)這個(gè)時(shí)間表,麒麟研發(fā)團(tuán)隊(duì)實(shí)際上只能允許一次投片修正,否則就會(huì)影響芯片的正常流片、量產(chǎn)和終端適配,造成產(chǎn)品延期上市甚至是項(xiàng)目失敗。經(jīng)過(guò)2個(gè)大版本的迭代,5000多次的工程驗(yàn)證,花費(fèi)了數(shù)億美元,最終麒麟980成功量產(chǎn)。

麒麟980成為華為在手機(jī)端AI芯片布局的一個(gè)重要里程碑。在此基礎(chǔ)上,華為試圖覆蓋云、邊、端各種場(chǎng)景,形成從應(yīng)用到系統(tǒng)到芯片的閉環(huán)。

2018年10月,華為在其全聯(lián)接大會(huì)上首次提出全棧全場(chǎng)景AI解決方案,并“祭”出了兩顆AI芯片:華為昇騰(Ascend)910和310。從算力上看,昇騰910表現(xiàn)非常出色,半精度(FP16)算力可達(dá)256TFLOPS,整數(shù)精度(INT8)算力可達(dá)612TOPS。2023年最新發(fā)布的昇騰910B是昇騰910的升級(jí)款,算力已達(dá)到英偉達(dá)A100的性能水平。

由于其卓越的性能表現(xiàn),加上美國(guó)對(duì)英偉達(dá)芯片的出口禁令限制,國(guó)內(nèi)企業(yè)紛紛轉(zhuǎn)投昇騰系列的懷抱。據(jù)悉,2023年華為從中國(guó)主要互聯(lián)網(wǎng)公司獲得了至少5000顆昇騰910B芯片的訂單,這對(duì)英偉達(dá)在AI芯片市場(chǎng)的主導(dǎo)地位構(gòu)成了嚴(yán)峻的威脅。

算力比拼僅是一方面,生態(tài)建設(shè)方面,英偉達(dá)最寬的護(hù)城河CUDA也正遭猛烈進(jìn)攻。CUDA最大的特點(diǎn)就是,軟硬結(jié)合大幅提升了GPU的并行計(jì)算效率,具備低成本、低門(mén)檻、廣生態(tài)等優(yōu)勢(shì),兼容CUDA生態(tài)對(duì)于開(kāi)發(fā)者與客戶來(lái)說(shuō)更友好。但同時(shí),容也會(huì)成為限制產(chǎn)品發(fā)展的“天花板”,追隨英偉達(dá)生態(tài)難以實(shí)現(xiàn)突圍,自研生態(tài)才有望實(shí)現(xiàn)自主可控破局。

華為以自研CANN框架對(duì)標(biāo)CUDA,要直面英偉達(dá)用戶粘性的巨大挑戰(zhàn)。CUDA推出至今,擁有超400萬(wàn)開(kāi)發(fā)人員和超過(guò)3000個(gè)應(yīng)用程序,建立起了龐大的用戶群體與開(kāi)發(fā)者社區(qū)。

雖然CANN起步較晚,離CUDA還有很大差距,但華為也在努力追趕。目前華為CANN平臺(tái)已經(jīng)到了7.0版本,支持50+主流大模型,同時(shí)兼容主流加速庫(kù)及開(kāi)發(fā)套件。此外已經(jīng)支持Pytorch、Tensorflow等主流框架,PyTorch 2.1版本已同步昇騰NPU,意味著開(kāi)發(fā)者可直接在PyTorch 2.1上基于昇騰進(jìn)行模型開(kāi)發(fā)。

伴隨著“日拱一卒”的演進(jìn),華為AI芯片終于實(shí)現(xiàn)“從0到1”的突破,走向了巨頭的談判桌。但“從1到100”仍需企業(yè)和產(chǎn)業(yè)鏈上下游共同完善生態(tài),剩下就交給時(shí)間。

Part.3

國(guó)產(chǎn)AI芯片的“繁花”時(shí)代

目前國(guó)產(chǎn)AI芯片主要可以分為三類(lèi):其一是華為、阿里等大型科技企業(yè)自研的AI芯片,二是海光信息等國(guó)資背景的科技公司,三是寒武紀(jì)、壁仞科技、摩爾線程、燧原科技等創(chuàng)業(yè)型芯片公司。

華為作為ICT運(yùn)營(yíng)商,積累了完整的云技術(shù)生態(tài)和渠道銷(xiāo)售能力。在各省級(jí)行政區(qū)建立代表處、派駐城市總經(jīng)理的戰(zhàn)略打法,還一度被騰訊云和阿里云效仿。

阿里平頭哥

成立于2018年的平頭哥,由中天微和達(dá)摩院自研芯片業(yè)務(wù)整合而來(lái),依托中天微多年技術(shù)積累,結(jié)合阿里基礎(chǔ)設(shè)施事業(yè)部和達(dá)摩院的前沿算法研究,技術(shù)儲(chǔ)備深厚。

2019年9月,含光800問(wèn)世,這是平頭哥第一款通用AI推理芯片。含光800采用了自研的芯片架構(gòu),通過(guò)軟硬件的協(xié)同設(shè)計(jì)實(shí)現(xiàn)性能突破。在業(yè)界標(biāo)準(zhǔn)的ResNet-50測(cè)試中,含光800推理性能達(dá)到78563 IPS,比當(dāng)時(shí)業(yè)界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

含光800已經(jīng)大規(guī)模應(yīng)用在阿里內(nèi)部核心業(yè)務(wù)中,雖然不對(duì)外售賣(mài),但可以通過(guò)阿里云對(duì)外輸出AI算力。阿里云去年4月推出的大模型“通義千問(wèn)”,就使用了含光800芯片。

海光信息

主要從事高端處理器、加速器等計(jì)算芯片產(chǎn)品和系統(tǒng)的研究、開(kāi)發(fā),是少數(shù)幾家具備高端處理器研發(fā)能力的企業(yè)之一。海光信息的產(chǎn)品采用X86架構(gòu),分別有海光通用處理器(CPU)和海光協(xié)處理器(DCU)。

海光的“深算一號(hào)”是公司DCU系列的主要在售產(chǎn)品,目前廣泛應(yīng)用于數(shù)據(jù)中心、互聯(lián)網(wǎng)企業(yè),在大數(shù)據(jù)處理、人工智能、商業(yè)計(jì)算等領(lǐng)域,已經(jīng)商業(yè)化應(yīng)用數(shù)十萬(wàn)片!吧钏阋惶(hào)”具備大模型運(yùn)行能力,但它的水平只相當(dāng)于英偉達(dá)P100的水平。2023年第三季度海光推出了“深算二號(hào)”,據(jù)透露其性能翻了一番。不過(guò)和英偉達(dá)產(chǎn)品相比,仍有一定差距。

燧原科技

專(zhuān)注于人工智能云端算力產(chǎn)品,提供自主創(chuàng)新、全棧自研、具備完全自主知識(shí)產(chǎn)權(quán)的通用AI訓(xùn)練和推理產(chǎn)品,可廣泛用于云數(shù)據(jù)中心、超算中心、泛互聯(lián)網(wǎng)、傳統(tǒng)行業(yè)及智慧城市等多樣化場(chǎng)景。

成立五年多,燧原科技已推出燧思系列芯片、云燧訓(xùn)練和推理加速卡以及云燧智算機(jī)的全系列算力產(chǎn)品線;陟菰萍嫉淖灾鲃(chuàng)新芯片架構(gòu),采用12nm工藝制造的新一代燧思AI推理芯片計(jì)算能力與業(yè)內(nèi)7nmGPU相當(dāng)。

伴隨著大模型和生成式AI的興起,缺芯正從一個(gè)行業(yè)季節(jié)性的常態(tài),演變?yōu)槿蚋餍懈鳂I(yè)的痛點(diǎn),催促更多的國(guó)產(chǎn)AI芯片企業(yè)努力追趕甚至超越。

市場(chǎng)、企業(yè)、技術(shù)、產(chǎn)品都在變化,新的格局正在孕育當(dāng)中,國(guó)產(chǎn)AI芯片亟需找準(zhǔn)戰(zhàn)略規(guī)劃的前行方向,才能避免在這副生存角逐的棋局中被碾壓踢出。

原文標(biāo)題 : 英偉達(dá)背后的“諸神之爭(zhēng)”

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)