訂閱
糾錯
加入自媒體

九問百度:大模型落地走向何方?

2024年將成為國內(nèi)大模型產(chǎn)業(yè)應(yīng)用爆發(fā)的元年。

文|周享玥 趙艷秋

編|;

01

一次至關(guān)重要的會議

今年大模型市場正在發(fā)生劇烈的變化。

2024年春節(jié)開工后第一天,國資委召開了“中央企業(yè)人工智能專題推進(jìn)會”,央國企一把手全部參加了會議。此前,央國企在大模型落地上差異巨大。“這次會議后,央國企及各地政府的變化是劇烈的。”一位行業(yè)資深人士說,“現(xiàn)在大家都在行動。”

“未來回望這次推進(jìn)會,我認(rèn)為它將被認(rèn)為是人工智能發(fā)展進(jìn)程上一次至關(guān)重要、意義重大的會議。”百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理忻舟告訴數(shù)智前線。百度執(zhí)行副總裁沈抖也參加了這次會議,向央國企負(fù)責(zé)人介紹大模型和產(chǎn)業(yè)應(yīng)用現(xiàn)狀。

會后,有央企重新撰寫了今年的數(shù)字化規(guī)劃,將人工智能做了重點補充。有大模型應(yīng)用企業(yè),則被東南沿海某市納入人工智能產(chǎn)業(yè)專班,參與梳理大模型落地場景,加速AI落地。

更多的政策在出臺:政府工作報告中提出了“人工智能+”行動;國務(wù)院印發(fā)了關(guān)于大規(guī)模設(shè)備更新的行動方案。“相當(dāng)于大部分工廠的設(shè)備全要升級了。”一位工業(yè)互聯(lián)網(wǎng)人士說。國家發(fā)改委有關(guān)負(fù)責(zé)人稱,這將是一個“年規(guī)模5萬億元以上的巨大市場”。

在一系列政策和動作之下,“2024年將成為國內(nèi)大模型產(chǎn)業(yè)應(yīng)用爆發(fā)的元年。”3月21日,在首鋼園區(qū)舉辦的百度智能云開年產(chǎn)品大會上,百度副總裁謝廣軍做出預(yù)測,并宣布千帆大模型平臺的一系列新產(chǎn)品和舉措,為大模型落地千行百業(yè),進(jìn)一步補充“彈藥”。

02

“氛圍起來了,我一天就睡5小時”

實際上,去年大模型的落地并不達(dá)預(yù)期,以至于去年下半年,投資市場變得謹(jǐn)慎。

但在這一年中,伴隨基礎(chǔ)大模型效果的改善,標(biāo)桿效應(yīng),應(yīng)用開發(fā)門檻的降低,再疊加政策層面的巨大推力,AI大模型不可逆的趨勢,已成為業(yè)界共識。

3月21日,百度副總裁謝廣軍也公布一組數(shù)字:千帆平臺服務(wù)企業(yè)用戶數(shù)已突破8萬,僅在一個月內(nèi)就增長上萬家,千帆ModelBuilder累計精調(diào)模型1.3萬個,通過AppBuilder開發(fā)的應(yīng)用數(shù)超16萬,不管是客戶數(shù)、精調(diào)模型數(shù)還是AI原生應(yīng)用數(shù)都有大幅增長。“我們判斷,2024年會成為AI原生應(yīng)用的元年。”謝廣軍表示。

“我現(xiàn)在一天就睡5小時,光戰(zhàn)略合作都忙不過來。”一位工業(yè)領(lǐng)域資深人士告訴數(shù)智前線,他們今年的目標(biāo)是落地至少幾百、上千個大模型項目。

另一位大模型服務(wù)商透露,去年是他們主動找客戶,但今年元旦過后,已變成“被動接洽需求”?蛻魯(shù)上,2024年一季度尚未結(jié)束,這家公司處在不同環(huán)節(jié)的需求數(shù)已有上百個,每周以10個的數(shù)量新增,“我們不得不開始篩選”。

03

企業(yè)最關(guān)心的三個問題變了

“去年不少to b大模型項目都驗收不了,因為客戶的預(yù)期拔得很高,認(rèn)為大模型是全能的。”一位服務(wù)商告訴數(shù)智前線,今年業(yè)界看到,客戶對大模型有了更深的理解,已變得理性,關(guān)注的Top3問題也隨之變化。

“客戶之前更關(guān)注大模型通用能力能有多好,以及智算中心的規(guī)劃建設(shè),但目前已逐步轉(zhuǎn)向產(chǎn)品驅(qū)動的應(yīng)用落地。”一位政務(wù)云人士表示。

“他們現(xiàn)在比較關(guān)心的是大模型落地的價值。”忻舟也告訴數(shù)智前線。“企業(yè)一旦驗證模型的價值后,第二步關(guān)心的就是如何降低成本,在一個能夠接受的效價比下,更好地去使用模型。”

技術(shù)的延續(xù)性也備受關(guān)注。“我經(jīng)常被問到,大模型的技術(shù)發(fā)展那么快,我們之前選型或采購的模型會不會過時?為它做的定制、數(shù)據(jù)標(biāo)注會不會失效?”忻舟表示,這也要求大模型廠商和服務(wù)商保證產(chǎn)品和服務(wù)的良好延續(xù)性。

04

用戶會為哪些場景買單?

針對企業(yè)最關(guān)注的落地價值,大家都在努力找殺手級應(yīng)用場景?陀^說,不管是C端還是B端,都還沒有一個殺手級應(yīng)用出現(xiàn)。“現(xiàn)在,大家都想借助這一波新機會,找到更多有價值的場景。”業(yè)內(nèi)人士說。

從目前落地的場景看,“除了規(guī)模龐大的設(shè)備更新市場,我們看到不少與文本相關(guān)的應(yīng)用。”忻舟說。比如,智能辦公中的內(nèi)容創(chuàng)作、PPT輔助創(chuàng)作;教育領(lǐng)域的作文批改、問題輔導(dǎo)和解答;營銷類的廣告文案生成;視頻大模型輔助娛樂和視頻內(nèi)容的生成......但大家在尋找更具顛覆性的場景。

企業(yè)為之買單的場景也與回本周期緊密相關(guān)。“一年能回本,客戶很容易接受;三五年回本,客戶就要考慮考慮;7年回本,肯定得政策強制要求了。”一位大模型服務(wù)商稱。他們提出了“小切口”的場景策略。

客戶類型也很關(guān)鍵。好多客戶都在做PoC,但讓客戶真正付錢,是一個很大的檻。上述服務(wù)商觀察,有兩類客戶愿意為大模型買單,一類是一直享受科技紅利的行業(yè),如金融;另一類則是傳統(tǒng)行業(yè),國家在推動他們做數(shù)字化轉(zhuǎn)型,而這些行業(yè)老齡化嚴(yán)重,迫切需要人工智能來解決實際困難。

05

不是性價比,是“效價比”

一旦大模型應(yīng)用到企業(yè)的生產(chǎn)環(huán)境中,客戶格外關(guān)注性價比。不過在大模型落地上,百度提出了“效價比”的概念。

“效價比最關(guān)鍵的是效,我們希望效果不變或效果降低程度在可控范圍內(nèi),它所花費的成本最低。”忻舟說。

謝廣軍舉例,提高效價比的方式有很多:在IaaS層,如何更高效的利用百舸AI異構(gòu)計算資源;在框架層,應(yīng)用飛槳深度學(xué)習(xí)框架中,加速模型的能力;在模型層,采用量化模型的方案。而在3月21日,百度發(fā)布三個輕量級大模型,來進(jìn)一步推升效價比。

06

輕量級大模型,開始流行

“模型不見得是參數(shù)規(guī)模越大越好。”謝廣軍說。一位大模型服務(wù)商在落地一些項目后也發(fā)現(xiàn),在很多垂類場景中,輕量級大模型也能達(dá)到通用大模型的效果,而推理成本更低,使用更簡單。“客戶不要太復(fù)雜的東西。”

輕量級大模型正成為一種趨勢。在海外,Meta發(fā)布的Llama系列模型,從70億、130億、330億到700億,不同場景選擇不同的模型組合,效果已被驗證。

3月21日,百度發(fā)布了三款輕量級模型,由大到小分別為ERNIE Speed、ERNIE Lite、ERNIE Tiny。雖然未公布參數(shù)規(guī)模,但謝廣軍介紹,這三款模型是百度經(jīng)過實踐,最適合做模型精調(diào)和場景的模型。

百度智能云AI平臺副總經(jīng)理李景秋介紹,ERNIESpeed定位“最適合微調(diào)的基座模型”,推理最高可支持128K。ERNIELite由ERNIE-Bot-Turbo升級而來,但成本較后者降低53%,適合低算力AI加速卡推理使用。而ERNIETiny的部署和精調(diào)成本在文心系列模型中最低,適用于檢索及推薦、意圖識別等高并發(fā)低延時場景,以及端側(cè)推理場景。

謝廣軍告訴數(shù)智前線,百度發(fā)布輕量級大模型,核心理念就是幫助客戶降本增效,在特定的場景下,通過精調(diào)使小尺寸的模型也能夠達(dá)到千億級別大模型的效率。當(dāng)輕量級大模型不能很好地解決客戶問題時,就讓旗艦?zāi)P蛠?ldquo;兜底”。

這實際契合了企業(yè)用戶對大模型的真實需求。一家落地了大模型的企業(yè)告訴數(shù)智前線,他們并不要求一定要用最頂尖的模型,而是更傾向于選擇最適合的模型。深圳齊心集團股份有限公司CTO于斌平也透露,他們此前曾試過文心4.0的大模型,效果驚艷,但其實略超出他們的業(yè)務(wù)場景需求,于是在最近切換成了“效價比”更高的ERNIE Speed。

一位資深人士則預(yù)測,大模型會和第二次工業(yè)革命中興起的電器一樣,“最終并非一個電器通用,而是會涌現(xiàn)出各種各樣的電器,從燈泡到電飯煲,它只會取決于不同場景下怎么樣的性價比最高,怎么樣的功能最強,客戶接受度最高。”

07

產(chǎn)品化,業(yè)界今年的大動作

為了進(jìn)一步提升效價比,加快落地,今年大模型企業(yè)和服務(wù)商一個明顯的動作,就是加快將確定性的東西產(chǎn)品化,“一旦產(chǎn)品化,推廣復(fù)制就會很快”。

百度在開年大會上,發(fā)布了兩個垂直場景大模型,ERNIECharacter和ERNIEFunctions,企業(yè)不需要額外精調(diào),可直接來開發(fā)智能助理。

其中,ERNIECharacter適合角色扮演類應(yīng)用場景,如游戲NPC、客服對話等;ERNIEFunctions則更適合對話、問答場景中的外部工具和業(yè)務(wù)函數(shù)調(diào)用。某旅游出行App用ERNIEFunctions打造了智能客服助手,在執(zhí)行訂票、查詢航班的多種方式調(diào)用下,準(zhǔn)確性達(dá)到85%,超過了GPT4。

“同時,不管是千帆ModelBuilder還是AppBuilder上,都會做很多預(yù)置場景。”忻舟說,“這也是百度產(chǎn)品化中的一個重要環(huán)節(jié)。”

在工業(yè)領(lǐng)域,一些服務(wù)商將大模型與工業(yè)系統(tǒng)結(jié)合,今年將出現(xiàn)大量軟硬件一體、成套的產(chǎn)品。由于產(chǎn)品化,一些模型落地從過去數(shù)個月,縮短到半個月。

08

大模型落地,有沒有方法論?

行業(yè)人士都在尋找落地路徑,在經(jīng)歷了一年的探索,大模型落地的一些關(guān)鍵點已浮出水面。

最關(guān)鍵的是快速閉環(huán)。一些服務(wù)商選擇小場景先切入,快速形成閉環(huán)來看效果。

“企業(yè)需要基礎(chǔ)設(shè)施和平臺,快速幫助他們?nèi)フ业綀鼍,并且快速將這些場景形成demo,快速試用并得到反饋,從而形成一個很好的閉環(huán)。”忻舟說。最初千帆大模型平臺的重點在推理工具鏈,發(fā)現(xiàn)企業(yè)處于找場景階段后,他們快速調(diào)整,推出千帆AppBuilder,讓企業(yè)一線業(yè)務(wù)人員通過它,能更便捷和低成本地去構(gòu)建場景和應(yīng)用。

3月21日,AppBuilder再度升級,組件工具已擴充到55個,同時還新增了一句話生成應(yīng)用功能,能讓開發(fā)者最快只需三步即可完成應(yīng)用的創(chuàng)建與開發(fā),進(jìn)一步拉低應(yīng)用門檻。

“一線聽得到炮火,更有能力去解決痛點。”一位政企服務(wù)商補充說,目前大家都在場景尋找和閉環(huán)的道路上。

09

五到十倍增長,可能估少了

過去一年間,價格已經(jīng)被首先“卷”了下來。

去年大模型剛在市場上出現(xiàn)時,模型、數(shù)據(jù)、算力等成本都非常之高,訓(xùn)練一個效果較好的基礎(chǔ)大模型,動輒需要幾百上千萬,甚至是上億元的投入。但隨著技術(shù)的進(jìn)步和使用量的增多,不管是訓(xùn)練成本還是推理成本,都有大幅降低。

一位工業(yè)大模型服務(wù)商告訴數(shù)智前線,現(xiàn)在做大模型私有化部署,成本已降到百萬元起,一些小的嵌入式產(chǎn)品甚至可以做到5萬元起。一位政務(wù)云人士透露,幾十萬到小一兩百萬元,是中腰部企業(yè)普遍能接受的價格區(qū)間。一些服務(wù)商最近推出大模型訓(xùn)推一體機,價格在幾十萬區(qū)間,預(yù)制了模型和場景,讓企業(yè)先用一兩臺將嘗試跑起來。

除了落地價格,在基礎(chǔ)大模型層面,雖然依然很卷,但已從百模大戰(zhàn),逐漸向幾家收斂。這在全球已經(jīng)發(fā)生,比如本周融了15億美元的明星企業(yè)Inflection,一部分團隊已加入微軟。

更多人將開始卷應(yīng)用,這將是今年競爭最為激烈的細(xì)分板塊之一。大模型服務(wù)商和開發(fā)者都非常忙碌。

至于市場走向,一位服務(wù)商稱,“不要對大模型落地有一點點疑惑了,無非是你的收入翻5倍、10倍還是20倍。”

忻舟則稱自己持樂觀但謹(jǐn)慎的態(tài)度。一方面,大模型整體市場屬于蓄勢待發(fā)的狀態(tài),“是漲5倍還是漲10倍,我覺得可能都估計的太少了,有可能是50倍、100倍甚至是1000倍的爆發(fā)式增長”。另一方面,整個市場就好比一杯剛從冰箱里拿出來的水,只要經(jīng)過輕微的擾動就會變化,還是一個不穩(wěn)定的狀態(tài),還要看業(yè)界的進(jìn)一步動作和進(jìn)展。

       原文標(biāo)題 : 九問百度:大模型落地走向何方?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號