訂閱
糾錯
加入自媒體

新巨頭何時誕生?大模型等待“分水嶺”

2023-07-07 09:15
零壹財經
關注

 圖片來源:文心一言

來源 | 零壹財經

作者 | 沈拙言       

2023年以來,科技圈最熱的詞語就是ChatGPT及其背后的大模型技術。

此前有百度文心一言、阿里云通義千問、華為盤古、科大訊飛星火等,近期李開復入局建立零一萬物、火山引擎推出“火山方舟”。短短數(shù)月,各類企業(yè)研發(fā)和發(fā)布大模型應用已成潮流。

國內10億級參數(shù)規(guī)模以上大模型已超80個,并且還在快速增加。一場圍繞大模型的商業(yè)戰(zhàn)爭的備戰(zhàn)氛圍已經極為濃厚。

大巨頭公司也好,小巨人企業(yè)也罷,都需要這樣的動作展現(xiàn)自身對前沿科技的敏感度與長期以來的積累。早一步推出應用,便可早一日測試大模型與用戶交互上的寶貴數(shù)據,在未來競爭中“廣積糧,圖稱王”。

大模型的關鍵的還是AI領域要素——算法、算力、數(shù)據,以及場景/應用。算法代表策略,算力決定上限也設置了門檻,數(shù)據等同軍糧也象征著優(yōu)劣之分。三要素之外,場景/應用代表出兵方向。

 “百模大戰(zhàn)”一觸即發(fā), 要素齊備的巨頭公司是否會演變成技術能力的無限內卷?垂直賽道的小巨頭能否借助大模型夯實自己的領先地位?在獲得門票的新玩家中,誰有可能是行業(yè)統(tǒng)治地位的有力競爭者?

 01 

通用大模型“實力分水嶺”未現(xiàn)

大模型的玩家主要分為三類:一是在資源與場景上具備身位優(yōu)勢的互聯(lián)網(百度、阿里、騰訊等)和產業(yè)巨頭(中國電信與中國聯(lián)通等),二是專研AI的人工智能公司(商湯、云從、光年之外等),最后一類則是以上海人工智能實驗室、復旦大學、哈爾濱工業(yè)大學等為代表的科研院所單位。

根據公開數(shù)據,截至2023年7月初,我國10億級參數(shù)規(guī)模以上大模型已超80個,且還在快速增加。該參數(shù)量的大模型越多,標志著競爭門檻將逐步拔高。

目前已經發(fā)布的大模型絕大多數(shù)屬于通用大模型,原因主要有兩種:一是大模型競爭尚不明朗,純粹技術層面并未拉開代差,行業(yè)參與者都有機會稱霸江湖;二是面向公眾的應用型大模型仍未出現(xiàn),缺乏較為明確的方向指引,在國內大模型的“Chat GPT時刻”出現(xiàn)前,投身通用大模型是既主動又被動的無奈之選。

何況,大模型領域極有可能走出一個新巨頭。

周鴻祎認為,大模型必須“通用”,只有通用才能走進千家萬戶、賦能百行千業(yè),進而主導人工智能新革命。

話中未盡之處是,需要多少投入和配合才能成為引領新革命的主導者。不管大模型是藍海還是紅海市場,必然要存在大魚領銜、小魚配合的生態(tài)結構,而目前大魚和小魚之間的實力分水嶺仍未出現(xiàn)。

以當前局勢看,10億參數(shù)規(guī)模的大模型可以視為入局門檻,100億參數(shù)規(guī)模的大模型可認為具備逐鹿天下的能力,但即使是1000億參數(shù)規(guī)模的大模型也遠未達到一騎絕塵的領先水平。

參數(shù)量并非決定戰(zhàn)場局勢的壓倒性力量,資源調度能力、長期經驗積累、大額科研投入等因素都是大模型競爭中長期存在的核心差異點。

要對標Open AI,需要看清Chat GPT爆發(fā)背后是微軟在數(shù)據、算力、海量資金上的全面支持,才有了之后的厚積薄發(fā)。

大模型是長期投入的行業(yè),簡單來說就是“燒錢”。算力、算法與數(shù)據的積累非一夕之功,模型發(fā)布之后還需要反復訓練、敏捷迭代,最終不斷演變?yōu)?ldquo;成熟體”。

放到現(xiàn)實環(huán)境下,大模型的玩家是技術驅動還是利益驅動?Open AI是當下全球最知名的大模型公司,即便手握Chat GPT這一爆款產品,其商業(yè)化能力仍然堪憂。作為一家逼近300億美元市值的科技企業(yè),2023年身處AI浪潮中心,Open AI至今收入仍不過2億美元。

初期投入只是起始花費,之后每一次訓練都需要真金白銀往里砸,有多少公司能否接受大模型競爭中那少得可憐的投資回報率?Chat GPT的成功,證明了大模型在產品路徑上的打通,但并不意味著商業(yè)層面的巨大成功。

至少在投入產出比層面,互聯(lián)網巨頭相對優(yōu)勢更大,他們有足夠的動力和資源去支撐前期的戰(zhàn)略性虧損,一如當年的阿里云。

至于到底燒錢要燒多久,何時才能看到喜人的投資回報,大公司不知道,創(chuàng)業(yè)公司的VC也不知道。這是一場隨時可能離場的豪賭,而籌碼動輒數(shù)十億美金。

對于“人有我優(yōu)”的大模型玩家而言,優(yōu)先探索應用層,及早開放測試,誰能積累更為珍貴的交互數(shù)據,將是接下來競爭的破局點。

 02 

垂直之需與垂直之困

通用大模型的角逐,更多是基礎設施制定權的爭奪,而垂直大模型,則是在特定場景中依托開源大模型或API接口,在細分行業(yè)形成差異化競爭能力,更多聚焦在場景應用。

在通用大模型的戰(zhàn)場上,隨著時間推進,一些力有不逮的玩家會逐步掉隊,最終只會存在寥寥數(shù)個通用大模型,起到基礎設施的作用。同時,這些大模型還面臨著同質化問題,應用層仍然要靠垂直大模型發(fā)力。

通用大模型像是多個垂直大模型的集合,訓練場景越多,通用大模型的“通用性”越強。

作為國內最早發(fā)布類Chat GPT產品的公司,百度對大模型垂直應用層的需求十分緊迫。李彥宏表示:“比大模型數(shù)量更重要的是應用,是在垂直領域應用的突破。新的國際競爭戰(zhàn)略關鍵點,不是有多少個大模型,而是大模型上有多少原生的應用,這些應用在多大程度上提升了生產效率。”

按照李彥宏的比喻,大模型尤其是通用大模型就像是AI時代的操作系統(tǒng),所有的應用都將圍繞著大模型開發(fā),其上是應用層,包括各種各樣的AI原生應用。

歸根結底,所謂的“通用”只是一個相對概念,并不存在完全適用于所有領域、具備足夠行業(yè)深度的通用大模型。以Chat GPT為例,真正得以廣泛應用的仍是一些容錯率較高的行業(yè),即便大模型給出的解決方案出錯,錯誤也局限在較為有限的范圍內。而在重工業(yè)、航天、醫(yī)療等場景中,一次錯誤所造成的損失不可估量,即Chat GPT不能滿足特定場景的垂直性、專業(yè)性要求。

要兼顧垂直性與專業(yè)性要求,數(shù)據是硬傷,數(shù)據深度足夠且能形成穩(wěn)定護城河的行業(yè)更少。這些行業(yè)的數(shù)據是否便于獲得,已經獲得的數(shù)據能否滿足特定行業(yè)日新月異的要求,都很難具體評定。

互聯(lián)網巨頭擁有大量電商、社交、搜索等網絡數(shù)據,但數(shù)據類型不夠全面,數(shù)據質量也沒有保障,中文可供訓練的語料還需要做大量的挖掘工作。

近期在政務、公共安全、醫(yī)療等領域,垂直大模型正在陸續(xù)落地。例如,云知聲在智慧醫(yī)療領域自研“山海”大模型,結合前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智能語音交互技術,預計可提升醫(yī)生的電子病歷錄入效率超過400%,節(jié)約單個患者問診時間超過40%,提升醫(yī)生門診效率超過66%。

拓爾思基于自有的公文、政策文件、政務辦事指南等數(shù)據作為專業(yè)訓練數(shù)據,打造了政務專業(yè)大模型。

金融領域內,恒生電子2023年3月底開始籌劃、設計金融大模型產品。6月末,恒生電子和旗下子公司恒生聚源發(fā)布基于大語言模型技術打造的數(shù)智金融新品——金融智能助手光子和全新升級的智能投研平臺WarrenQ,恒生電子金融行業(yè)大模型LightGPT也首次對外亮相。

騰訊這種具備多個行業(yè)資源的互聯(lián)網巨頭則是多面下注。在6月下旬,騰訊公布的MaaS服務解決方案覆蓋了金融、文旅、政務、教育等10個行業(yè),共有超50個解決方案。

同時,垂直大模型所需要的數(shù)據往往并不局限在本行業(yè),某些業(yè)務也許需要另一個或多個行業(yè)的數(shù)據整合,其模型訓練和應用就依賴于企業(yè)的跨業(yè)合作或者互聯(lián)網巨頭的資源整合。

 03 

算力:力大磚飛?

在19世紀美國西部的淘金熱中,淘金者能真正賺到錢是概率性事件,而賣鏟子的人賺到錢則是必定性結果。

AI淘金熱中,大模型的戰(zhàn)場局勢還不明朗,玩家尚在前赴后繼,但“賣鏟人”已經贏麻了。英偉達靠AI芯片與大模型的潮流拉開了與競爭對手AMD的差距,市值步入“萬億美元俱樂部”。

Open AI CEO薩姆·奧爾特曼提出了新版摩爾定律,即全球AI的運算量每隔18個月就會提升一倍。維持這些運算量需要AI訓練芯片支持,而這一領域英偉達的市場份額超過90%。

英偉達的AI芯片產品被全球各大科技企業(yè)瘋狂搶購:2023年3月,微軟宣布已幫助OpenAI建設了一個新計算中心,配置了數(shù)萬塊A100;5月,Google推出了一個擁有2.6萬塊H100的計算集群ComputeEngineA3。另外,據國金證券信息,字節(jié)跳動今年已訂購了超過10億美元的GPU,到貨和沒到貨的A100與H800預計有10萬塊。騰訊發(fā)布的騰訊云新版高性能計算服務中心也采用了上萬塊H800芯片。

英偉達CFO克雷斯表示,目前AI 算力市場的需求已經超出了公司對未來數(shù)個季度的預期,訂單已經多到做不過來了。

當然,英偉達賺的錢,我們羨慕也沒用。

國內GPU賽道也在迎頭追趕,既有互聯(lián)網巨頭自研AI芯片,如百度AI芯片昆侖、騰訊視頻處理芯片“滄海”和AI芯片“紫霄等,也涌現(xiàn)出燧原科技、天數(shù)智芯、摩爾線程等研發(fā)通用GPU的新興公司。通用GPU用于各種通用任務,包括具有高度的并行計算能力和大規(guī)模的計算核心,是高性能GPU的“下位替代——平行替代”的主要產品,近年來也有大進步,與高性能GPU的差距也在逐步縮小中。

中國工程院院士鄔賀銓建議,在國家科技與產業(yè)計劃的協(xié)調下合理分工形成算力合力,開放國家實驗室的算力平臺支持各類大模型訓練,同時建議組建算力聯(lián)盟,集中已有高檔GPU的算力資源,提供大模型數(shù)據訓練所需算力。

除了高性能GPU之外,成本更低的算力平臺也被認為是新的市場機會。近期九章云極便透露將繼續(xù)與國資云廠商合作,把市場上大量的智算中心納入合作伙伴范疇,向客戶提供集軟硬件于一體的AI模型研發(fā)平臺,客戶的費用將與算力綁定。

算力是發(fā)展大模型的基礎,是必要條件而非充分條件,算力所能發(fā)揮的最大作用仍取決于使用方向。只有算法創(chuàng)新與數(shù)據資源建設、訓練框架迭代齊頭并進,才有創(chuàng)造“力大磚飛”的可能性。

 04 

政策:關鍵時刻的引導與規(guī)范

AI大爆炸時期,恰逢我國算法治理與算法備案的關鍵時刻。

早在2021年,《關于加強互聯(lián)網信息服務算法綜合治理的指導意見》就把算法備案管理作為監(jiān)管體系完善的重要一環(huán),此后的《互聯(lián)網信息服務算法推薦管理規(guī)定》和《互聯(lián)網信息服務深度合成管理規(guī)定》都明確規(guī)定或提及,“具有輿論屬性或者社會動員能力的算法推薦服務提供者應當履行備案手續(xù)”。

2023年4月,國家網信辦起草了《生成式人工智能服務管理辦法(征求意見稿)》,公開征求意見。6月,國務院印發(fā)的《國務院2023年度立法工作計劃》顯示,人工智能法草案等預備提請全國人大常委會審議。

《生成式人工智能服務管理辦法(征求意見稿)》提及,利用生成式人工智能產品向公眾提供服務前,應當按照《具有輿論屬性或社會動員能力的互聯(lián)網信息服務安全評估規(guī)定》向國家網信部門申報安全評估,并按照《互聯(lián)網信息服務算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)。

這也是當前尚未有大模型產品面向公眾的原因之一。

南開大學法學院副院長、中國新一代人工智能發(fā)展戰(zhàn)略研究院特約研究員陳兵教授認為,監(jiān)管前置并不必然會損害技術創(chuàng)新,但需要注意的是,由于事前審查會在一定程度上增加企業(yè)的合規(guī)成本,若事前審查范圍設置不當,可能會抑制生成式AI產品的研發(fā)與訓練效能,客觀上會導致生成式AI發(fā)展的降速。

由于人工智能風險事前無法極為完善的預估,事后監(jiān)管又有可能造成巨大損害,故而當前我國對人工智能發(fā)展采用全流程監(jiān)管。

在全流程監(jiān)管的規(guī)范下,大模型玩家的合規(guī)成本無疑會增加,備案制又促使著局內玩家優(yōu)先謀求備案以將產品早一步推廣至市場,客觀上加速大浪淘沙的速度。法規(guī)的逐步完善伴隨著行業(yè)洗牌、弱者掉隊的過程,也能讓撥云見日的時刻早一點到來。

       原文標題 : 新巨頭何時誕生?大模型等待“分水嶺”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號