訂閱
糾錯(cuò)
加入自媒體

AI大模型搶灘手機(jī)端?新巨頭何時(shí)誕生

 

導(dǎo)

8月14日,雷軍宣布小米科技戰(zhàn)略升級(jí),并公布了升級(jí)后的科技理念:選擇對(duì)人類文明有長(zhǎng)期價(jià)值的技術(shù)領(lǐng)域,堅(jiān)持長(zhǎng)期持續(xù)投入。

“深耕底層技術(shù),長(zhǎng)期持續(xù)投入,軟硬深度融合,AI全面賦能”,這是小米科技戰(zhàn)略升級(jí)的四個(gè)關(guān)鍵路徑與原則。雷軍表示,軟件硬件深度融合,是為用戶提供獨(dú)特體驗(yàn)的根本保證,而AI則是未來(lái)的生產(chǎn)力,也是小米長(zhǎng)期持續(xù)投入的底層賽道之一。

自2016年組建AI團(tuán)隊(duì)至今,小米人工智能團(tuán)隊(duì)人員規(guī)模已達(dá)3000多人。今年4月小米組建了AI大模型團(tuán)隊(duì),8月14日晚,雷軍正式宣布了小米的大模型戰(zhàn)略:全面擁抱大模型。據(jù)悉,小米旗下的智能語(yǔ)音助手小愛(ài)同學(xué)將接入大模型能力,并于14日開(kāi)啟邀請(qǐng)內(nèi)測(cè)。

雷軍稱,小米大模型技術(shù)的重點(diǎn)突破方向?yàn)?ldquo;輕量化、本地部署”,小米考慮的是優(yōu)先在手機(jī)上實(shí)現(xiàn)端側(cè)跑通,讓每個(gè)人都能更好在手機(jī)上使用大模型。

面對(duì)新一輪產(chǎn)業(yè)與技術(shù)變革帶來(lái)的時(shí)代巨變,大巨頭公司也好、小巨人企業(yè)也罷,都紛紛入局大模型賽道。當(dāng)前“百模大戰(zhàn)”進(jìn)展到什么階段,本文可以為您提供參考。

 來(lái)源 | 零壹智庫(kù)

2023年以來(lái),科技圈最熱的詞語(yǔ)就是ChatGPT及其背后的大模型技術(shù)。

此前有百度文心一言、阿里云通義千問(wèn)、華為盤古、科大訊飛星火等,近期李開(kāi)復(fù)入局建立零一萬(wàn)物、火山引擎推出“火山方舟”。短短數(shù)月,各類企業(yè)研發(fā)和發(fā)布大模型應(yīng)用已成潮流。

國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上大模型已超80個(gè),并且還在快速增加。一場(chǎng)圍繞大模型的商業(yè)戰(zhàn)爭(zhēng)的備戰(zhàn)氛圍已經(jīng)極為濃厚。

大巨頭公司也好,小巨人企業(yè)也罷,都需要這樣的動(dòng)作展現(xiàn)自身對(duì)前沿科技的敏感度與長(zhǎng)期以來(lái)的積累。早一步推出應(yīng)用,便可早一日測(cè)試大模型與用戶交互上的寶貴數(shù)據(jù),在未來(lái)競(jìng)爭(zhēng)中“廣積糧,圖稱王”。

大模型的關(guān)鍵的還是AI領(lǐng)域要素——算法、算力、數(shù)據(jù),以及場(chǎng)景/應(yīng)用。算法代表策略,算力決定上限也設(shè)置了門檻,數(shù)據(jù)等同軍糧也象征著優(yōu)劣之分。三要素之外,場(chǎng)景/應(yīng)用代表出兵方向。

 “百模大戰(zhàn)”爆發(fā),要素齊備的巨頭公司是否會(huì)演變成技術(shù)能力的無(wú)限內(nèi)卷?垂直賽道的小巨頭能否借助大模型夯實(shí)自己的領(lǐng)先地位?在獲得門票的新玩家中,誰(shuí)有可能是行業(yè)統(tǒng)治地位的有力競(jìng)爭(zhēng)者?

 01 

通用大模型“實(shí)力分水嶺”未現(xiàn)

大模型的玩家主要分為三類:一是在資源與場(chǎng)景上具備身位優(yōu)勢(shì)的互聯(lián)網(wǎng)(百度、阿里、騰訊等)和產(chǎn)業(yè)巨頭(中國(guó)電信與中國(guó)聯(lián)通等),二是專研AI的人工智能公司(商湯、云從、光年之外等),最后一類則是以上海人工智能實(shí)驗(yàn)室、復(fù)旦大學(xué)、哈爾濱工業(yè)大學(xué)等為代表的科研院所單位。

根據(jù)公開(kāi)數(shù)據(jù),截至2023年7月初,我國(guó)10億級(jí)參數(shù)規(guī)模以上大模型已超80個(gè),且還在快速增加。該參數(shù)量的大模型越多,標(biāo)志著競(jìng)爭(zhēng)門檻將逐步拔高。

目前已經(jīng)發(fā)布的大模型絕大多數(shù)屬于通用大模型,原因主要有兩種:一是大模型競(jìng)爭(zhēng)尚不明朗,純粹技術(shù)層面并未拉開(kāi)代差,行業(yè)參與者都有機(jī)會(huì)稱霸江湖;二是面向公眾的應(yīng)用型大模型仍未出現(xiàn),缺乏較為明確的方向指引,在國(guó)內(nèi)大模型的“Chat GPT時(shí)刻”出現(xiàn)前,投身通用大模型是既主動(dòng)又被動(dòng)的無(wú)奈之選。

何況,大模型領(lǐng)域極有可能走出一個(gè)新巨頭。

周鴻祎認(rèn)為,大模型必須“通用”,只有通用才能走進(jìn)千家萬(wàn)戶、賦能百行千業(yè),進(jìn)而主導(dǎo)人工智能新革命。

話中未盡之處是,需要多少投入和配合才能成為引領(lǐng)新革命的主導(dǎo)者。不管大模型是藍(lán)海還是紅海市場(chǎng),必然要存在大魚(yú)領(lǐng)銜、小魚(yú)配合的生態(tài)結(jié)構(gòu),而目前大魚(yú)和小魚(yú)之間的實(shí)力分水嶺仍未出現(xiàn)。

以當(dāng)前局勢(shì)看,10億參數(shù)規(guī)模的大模型可以視為入局門檻,100億參數(shù)規(guī)模的大模型可認(rèn)為具備逐鹿天下的能力,但即使是1000億參數(shù)規(guī)模的大模型也遠(yuǎn)未達(dá)到一騎絕塵的領(lǐng)先水平。

參數(shù)量并非決定戰(zhàn)場(chǎng)局勢(shì)的壓倒性力量,資源調(diào)度能力、長(zhǎng)期經(jīng)驗(yàn)積累、大額科研投入等因素都是大模型競(jìng)爭(zhēng)中長(zhǎng)期存在的核心差異點(diǎn)。

要對(duì)標(biāo)Open AI,需要看清Chat GPT爆發(fā)背后是微軟在數(shù)據(jù)、算力、海量資金上的全面支持,才有了之后的厚積薄發(fā)。

大模型是長(zhǎng)期投入的行業(yè),簡(jiǎn)單來(lái)說(shuō)就是“燒錢”。算力、算法與數(shù)據(jù)的積累非一夕之功,模型發(fā)布之后還需要反復(fù)訓(xùn)練、敏捷迭代,最終不斷演變?yōu)?ldquo;成熟體”。

放到現(xiàn)實(shí)環(huán)境下,大模型的玩家是技術(shù)驅(qū)動(dòng)還是利益驅(qū)動(dòng)?Open AI是當(dāng)下全球最知名的大模型公司,即便手握Chat GPT這一爆款產(chǎn)品,其商業(yè)化能力仍然堪憂。作為一家逼近300億美元市值的科技企業(yè),2023年身處AI浪潮中心,Open AI至今收入仍不過(guò)2億美元。

初期投入只是起始花費(fèi),之后每一次訓(xùn)練都需要真金白銀往里砸,有多少公司能否接受大模型競(jìng)爭(zhēng)中那少得可憐的投資回報(bào)率?Chat GPT的成功,證明了大模型在產(chǎn)品路徑上的打通,但并不意味著商業(yè)層面的巨大成功。

至少在投入產(chǎn)出比層面,互聯(lián)網(wǎng)巨頭相對(duì)優(yōu)勢(shì)更大,他們有足夠的動(dòng)力和資源去支撐前期的戰(zhàn)略性虧損,一如當(dāng)年的阿里云。

至于到底燒錢要燒多久,何時(shí)才能看到喜人的投資回報(bào),大公司不知道,創(chuàng)業(yè)公司的VC也不知道。這是一場(chǎng)隨時(shí)可能離場(chǎng)的豪賭,而籌碼動(dòng)輒數(shù)十億美金。

對(duì)于“人有我優(yōu)”的大模型玩家而言,優(yōu)先探索應(yīng)用層,及早開(kāi)放測(cè)試,誰(shuí)能積累更為珍貴的交互數(shù)據(jù),將是接下來(lái)競(jìng)爭(zhēng)的破局點(diǎn)。

 02 

垂直之需與垂直之困

通用大模型的角逐,更多是基礎(chǔ)設(shè)施制定權(quán)的爭(zhēng)奪,而垂直大模型,則是在特定場(chǎng)景中依托開(kāi)源大模型或API接口,在細(xì)分行業(yè)形成差異化競(jìng)爭(zhēng)能力,更多聚焦在場(chǎng)景應(yīng)用。

在通用大模型的戰(zhàn)場(chǎng)上,隨著時(shí)間推進(jìn),一些力有不逮的玩家會(huì)逐步掉隊(duì),最終只會(huì)存在寥寥數(shù)個(gè)通用大模型,起到基礎(chǔ)設(shè)施的作用。同時(shí),這些大模型還面臨著同質(zhì)化問(wèn)題,應(yīng)用層仍然要靠垂直大模型發(fā)力。

通用大模型像是多個(gè)垂直大模型的集合,訓(xùn)練場(chǎng)景越多,通用大模型的“通用性”越強(qiáng)。

作為國(guó)內(nèi)最早發(fā)布類Chat GPT產(chǎn)品的公司,百度對(duì)大模型垂直應(yīng)用層的需求十分緊迫。李彥宏表示:“比大模型數(shù)量更重要的是應(yīng)用,是在垂直領(lǐng)域應(yīng)用的突破。新的國(guó)際競(jìng)爭(zhēng)戰(zhàn)略關(guān)鍵點(diǎn),不是有多少個(gè)大模型,而是大模型上有多少原生的應(yīng)用,這些應(yīng)用在多大程度上提升了生產(chǎn)效率。”

按照李彥宏的比喻,大模型尤其是通用大模型就像是AI時(shí)代的操作系統(tǒng),所有的應(yīng)用都將圍繞著大模型開(kāi)發(fā),其上是應(yīng)用層,包括各種各樣的AI原生應(yīng)用。

歸根結(jié)底,所謂的“通用”只是一個(gè)相對(duì)概念,并不存在完全適用于所有領(lǐng)域、具備足夠行業(yè)深度的通用大模型。以Chat GPT為例,真正得以廣泛應(yīng)用的仍是一些容錯(cuò)率較高的行業(yè),即便大模型給出的解決方案出錯(cuò),錯(cuò)誤也局限在較為有限的范圍內(nèi)。而在重工業(yè)、航天、醫(yī)療等場(chǎng)景中,一次錯(cuò)誤所造成的損失不可估量,即Chat GPT不能滿足特定場(chǎng)景的垂直性、專業(yè)性要求。

要兼顧垂直性與專業(yè)性要求,數(shù)據(jù)是硬傷,數(shù)據(jù)深度足夠且能形成穩(wěn)定護(hù)城河的行業(yè)更少。這些行業(yè)的數(shù)據(jù)是否便于獲得,已經(jīng)獲得的數(shù)據(jù)能否滿足特定行業(yè)日新月異的要求,都很難具體評(píng)定。

互聯(lián)網(wǎng)巨頭擁有大量電商、社交、搜索等網(wǎng)絡(luò)數(shù)據(jù),但數(shù)據(jù)類型不夠全面,數(shù)據(jù)質(zhì)量也沒(méi)有保障,中文可供訓(xùn)練的語(yǔ)料還需要做大量的挖掘工作。

近期在政務(wù)、公共安全、醫(yī)療等領(lǐng)域,垂直大模型正在陸續(xù)落地。例如,云知聲在智慧醫(yī)療領(lǐng)域自研“山海”大模型,結(jié)合前端聲音信號(hào)處理、聲紋識(shí)別、語(yǔ)音識(shí)別、語(yǔ)音合成等全棧式智能語(yǔ)音交互技術(shù),預(yù)計(jì)可提升醫(yī)生的電子病歷錄入效率超過(guò)400%,節(jié)約單個(gè)患者問(wèn)診時(shí)間超過(guò)40%,提升醫(yī)生門診效率超過(guò)66%。

拓爾思基于自有的公文、政策文件、政務(wù)辦事指南等數(shù)據(jù)作為專業(yè)訓(xùn)練數(shù)據(jù),打造了政務(wù)專業(yè)大模型。

金融領(lǐng)域內(nèi),恒生電子2023年3月底開(kāi)始籌劃、設(shè)計(jì)金融大模型產(chǎn)品。6月末,恒生電子和旗下子公司恒生聚源發(fā)布基于大語(yǔ)言模型技術(shù)打造的數(shù)智金融新品——金融智能助手光子和全新升級(jí)的智能投研平臺(tái)WarrenQ,恒生電子金融行業(yè)大模型LightGPT也首次對(duì)外亮相。

騰訊這種具備多個(gè)行業(yè)資源的互聯(lián)網(wǎng)巨頭則是多面下注。在6月下旬,騰訊公布的MaaS服務(wù)解決方案覆蓋了金融、文旅、政務(wù)、教育等10個(gè)行業(yè),共有超50個(gè)解決方案。

同時(shí),垂直大模型所需要的數(shù)據(jù)往往并不局限在本行業(yè),某些業(yè)務(wù)也許需要另一個(gè)或多個(gè)行業(yè)的數(shù)據(jù)整合,其模型訓(xùn)練和應(yīng)用就依賴于企業(yè)的跨業(yè)合作或者互聯(lián)網(wǎng)巨頭的資源整合。

 03 

算力:力大磚飛?

在19世紀(jì)美國(guó)西部的淘金熱中,淘金者能真正賺到錢是概率性事件,而賣鏟子的人賺到錢則是必定性結(jié)果。

AI淘金熱中,大模型的戰(zhàn)場(chǎng)局勢(shì)還不明朗,玩家尚在前赴后繼,但“賣鏟人”已經(jīng)贏麻了。英偉達(dá)靠AI芯片與大模型的潮流拉開(kāi)了與競(jìng)爭(zhēng)對(duì)手AMD的差距,市值步入“萬(wàn)億美元俱樂(lè)部”。

Open AI CEO薩姆·奧爾特曼提出了新版摩爾定律,即全球AI的運(yùn)算量每隔18個(gè)月就會(huì)提升一倍。維持這些運(yùn)算量需要AI訓(xùn)練芯片支持,而這一領(lǐng)域英偉達(dá)的市場(chǎng)份額超過(guò)90%。

英偉達(dá)的AI芯片產(chǎn)品被全球各大科技企業(yè)瘋狂搶購(gòu):2023年3月,微軟宣布已幫助OpenAI建設(shè)了一個(gè)新計(jì)算中心,配置了數(shù)萬(wàn)塊A100;5月,Google推出了一個(gè)擁有2.6萬(wàn)塊H100的計(jì)算集群ComputeEngineA3。另外,據(jù)國(guó)金證券信息,字節(jié)跳動(dòng)今年已訂購(gòu)了超過(guò)10億美元的GPU,到貨和沒(méi)到貨的A100與H800預(yù)計(jì)有10萬(wàn)塊。騰訊發(fā)布的騰訊云新版高性能計(jì)算服務(wù)中心也采用了上萬(wàn)塊H800芯片。

英偉達(dá)CFO克雷斯表示,目前AI 算力市場(chǎng)的需求已經(jīng)超出了公司對(duì)未來(lái)數(shù)個(gè)季度的預(yù)期,訂單已經(jīng)多到做不過(guò)來(lái)了。

當(dāng)然,英偉達(dá)賺的錢,我們羨慕也沒(méi)用。

國(guó)內(nèi)GPU賽道也在迎頭追趕,既有互聯(lián)網(wǎng)巨頭自研AI芯片,如百度AI芯片昆侖、騰訊視頻處理芯片“滄海”和AI芯片“紫霄等,也涌現(xiàn)出燧原科技、天數(shù)智芯、摩爾線程等研發(fā)通用GPU的新興公司。通用GPU用于各種通用任務(wù),包括具有高度的并行計(jì)算能力和大規(guī)模的計(jì)算核心,是高性能GPU的“下位替代——平行替代”的主要產(chǎn)品,近年來(lái)也有大進(jìn)步,與高性能GPU的差距也在逐步縮小中。

中國(guó)工程院院士鄔賀銓建議,在國(guó)家科技與產(chǎn)業(yè)計(jì)劃的協(xié)調(diào)下合理分工形成算力合力,開(kāi)放國(guó)家實(shí)驗(yàn)室的算力平臺(tái)支持各類大模型訓(xùn)練,同時(shí)建議組建算力聯(lián)盟,集中已有高檔GPU的算力資源,提供大模型數(shù)據(jù)訓(xùn)練所需算力。

除了高性能GPU之外,成本更低的算力平臺(tái)也被認(rèn)為是新的市場(chǎng)機(jī)會(huì)。近期九章云極便透露將繼續(xù)與國(guó)資云廠商合作,把市場(chǎng)上大量的智算中心納入合作伙伴范疇,向客戶提供集軟硬件于一體的AI模型研發(fā)平臺(tái),客戶的費(fèi)用將與算力綁定。

算力是發(fā)展大模型的基礎(chǔ),是必要條件而非充分條件,算力所能發(fā)揮的最大作用仍取決于使用方向。只有算法創(chuàng)新與數(shù)據(jù)資源建設(shè)、訓(xùn)練框架迭代齊頭并進(jìn),才有創(chuàng)造“力大磚飛”的可能性。

 04 

政策:關(guān)鍵時(shí)刻的引導(dǎo)與規(guī)范

推薦閱讀 | 70部人工智能政策解讀:產(chǎn)業(yè)側(cè)重和方向差異

AI大爆炸時(shí)期,恰逢我國(guó)算法治理與算法備案的關(guān)鍵時(shí)刻。

早在2021年,《關(guān)于加強(qiáng)互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見(jiàn)》就把算法備案管理作為監(jiān)管體系完善的重要一環(huán),此后的《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》和《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》都明確規(guī)定或提及,“具有輿論屬性或者社會(huì)動(dòng)員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)履行備案手續(xù)”。

2023年4月,國(guó)家網(wǎng)信辦起草了《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》,公開(kāi)征求意見(jiàn)(注:該辦法已審議通過(guò),自2023年8月15日起施行)。6月,國(guó)務(wù)院印發(fā)的《國(guó)務(wù)院2023年度立法工作計(jì)劃》顯示,人工智能法草案等預(yù)備提請(qǐng)全國(guó)人大常委會(huì)審議。

《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》提及,利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前,應(yīng)當(dāng)按照《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》向國(guó)家網(wǎng)信部門申報(bào)安全評(píng)估,并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)。

這也是當(dāng)前尚未有大模型產(chǎn)品面向公眾的原因之一。

南開(kāi)大學(xué)法學(xué)院副院長(zhǎng)、中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院特約研究員陳兵教授認(rèn)為,監(jiān)管前置并不必然會(huì)損害技術(shù)創(chuàng)新,但需要注意的是,由于事前審查會(huì)在一定程度上增加企業(yè)的合規(guī)成本,若事前審查范圍設(shè)置不當(dāng),可能會(huì)抑制生成式AI產(chǎn)品的研發(fā)與訓(xùn)練效能,客觀上會(huì)導(dǎo)致生成式AI發(fā)展的降速。

由于人工智能風(fēng)險(xiǎn)事前無(wú)法極為完善的預(yù)估,事后監(jiān)管又有可能造成巨大損害,故而當(dāng)前我國(guó)對(duì)人工智能發(fā)展采用全流程監(jiān)管。

在全流程監(jiān)管的規(guī)范下,大模型玩家的合規(guī)成本無(wú)疑會(huì)增加,備案制又促使著局內(nèi)玩家優(yōu)先謀求備案以將產(chǎn)品早一步推廣至市場(chǎng),客觀上加速大浪淘沙的速度。法規(guī)的逐步完善伴隨著行業(yè)洗牌、弱者掉隊(duì)的過(guò)程,也能讓撥云見(jiàn)日的時(shí)刻早一點(diǎn)到來(lái)。

       原文標(biāo)題 : AI大模型搶灘手機(jī)端?新巨頭何時(shí)誕生

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)