訂閱
糾錯
加入自媒體

大模型的耐力游戲

撰文 | 吳坤諺

編輯 | 吳先之

2010年,世界上首款量產(chǎn)純電車型日產(chǎn)汽車(Nissan)聆風(fēng)上市的時候,沒人能想到日產(chǎn)汽車公司乃至整個日本汽車行業(yè)都將在十余年后的今天淪為陪跑。

類似這樣由領(lǐng)跑者淪為追隨者的案例并不鮮見,正如在大模型領(lǐng)域,意欲竊取百度、科大訊飛等一眾大模型先行者勝利果實的字節(jié)跳動。

眾所周知,百度、科大訊飛是國內(nèi)大模型賽道中先聲奪人的代表玩家,早在去年上半年便上線網(wǎng)頁測試版搶占用戶心智,以期在正式面向公眾服務(wù)的時候能快速積累用戶。然而據(jù)QuestMobile近日發(fā)布的數(shù)據(jù),2023年11月,文心一言、豆包與訊飛星火的日活分別是155.4萬、124.6萬、71.9萬。

不難看出,相比于早在2023上半年便上線網(wǎng)頁測試的百度與科大訊飛,8月才開啟邀測的豆包跑出了更快的增長速度。

甚至到了2024年2月19日,豆包在iOS免費榜上排名49,而文心一言排名為157,訊飛星火則排名400開外,類GPT應(yīng)用的前三把交椅之間已然存在不小的差距。

在今年1月的2024年年度全員會上,字節(jié)跳動CEO梁汝波提到內(nèi)部對GPT的討論始于2023。短短一年內(nèi),基于云雀大模型的AI應(yīng)用矩陣已經(jīng)形成,似有復(fù)現(xiàn)曾經(jīng)其作為爆款應(yīng)用工廠之勢。

豆包的勝利屬于抖音

字節(jié)一度在業(yè)內(nèi)享有“App工廠”之稱,這源于其算法推薦機制下,集中資源與頭條系流量大水漫灌的打法,可以“熱啟動”新的獨立應(yīng)用,快速積累用戶。

時過境遷,互聯(lián)網(wǎng)紅利見頂催生的聚合超級App不斷擠壓獨立App的生存空間,讓字節(jié)逐漸難以持續(xù)打造爆款A(yù)pp,但“算法+流量”的傳統(tǒng)打法仍不失其效果。如字節(jié)于2023年上線的新游《晶核》與《星球:重啟》均基于抖音的流量,通過這個打法快速撐起用戶與營收規(guī)模。

同樣的啟動路徑自然可以復(fù)現(xiàn)到大模型應(yīng)用上。更重要的是,國內(nèi)大模型賽道無論是模型層還是應(yīng)用層,都未能出現(xiàn)如ChatGPT、Character.AI一般站穩(wěn)生態(tài)位的玩家,“大力出奇跡”的打法似乎與時下亂局正合適。

據(jù)Tech星球報道,有消息人士透露豆包的月活已于去年12月增長至200萬,2024年1月份則在此基礎(chǔ)上翻了一番。我們亦自相關(guān)人士處了解到,豆包的月內(nèi)平均日活已經(jīng)完成了對文心一言的反超。

誠然,互聯(lián)網(wǎng)做的一直是注意力的生意,這是為何字節(jié)這套“老打法”能再獲戰(zhàn)果的原因。但在注意力極為稀缺的當(dāng)下,流量還不足以讓字節(jié)做到后發(fā)突圍。

要知道,業(yè)內(nèi)對AI應(yīng)用落地難的共識是其難以挖掘新的使用場景與功能,這同樣是豆包延續(xù)其“爆款”生命力的關(guān)鍵所在。就創(chuàng)新性來看,我們能輕易在豆包目前的產(chǎn)品形態(tài)中找到Character.AI這位前輩的影子。

豆包與Character.AI一般主打多樣化的智能體,除應(yīng)用內(nèi)置的“豆包”、“AI圖片生成”、“編程助理”等覆蓋高頻需求的智能體外,用戶亦可自行無代碼創(chuàng)建。

智能體的玩法可以較好地覆蓋用戶低頻需求,產(chǎn)品設(shè)計上偏向拓展C端規(guī)模。其他功能如語音交互以及AI聲音創(chuàng)建是不錯的亮點,但總體并未跳脫出Character.AI已被驗證的產(chǎn)品框架。相比之下,隔壁文心一言顯得更為成熟,不僅同樣引入了智能體玩法,同時還在發(fā)力建設(shè)AI交流社區(qū)以及商業(yè)化。

我們體驗發(fā)現(xiàn),文心一言App已將“社區(qū)”設(shè)置為一級入口,社區(qū)中的UGC內(nèi)容以文心一言生成的AIGC圖文為主,并加入了移動互聯(lián)網(wǎng)常見的贊評交流系統(tǒng)。此外,百度還在文心一言4.0訂閱制付費的基礎(chǔ)上推出了“靈感幣”作為補充,用戶可通過分享、拉新與充值的方式獲取更強的模型能力。這一系列變化,都指向了商業(yè)化。

反觀豆包目前尚不見商業(yè)化動作,社區(qū)建設(shè)同樣未曾上馬。至于文心一言目前在數(shù)據(jù)上(如iOS下載量)不如豆包好看,或是二者的流量分發(fā)效率不可同日而語的緣故。但不可否認的是,這恰好印證了此前外界對字節(jié)AI大模型進展較慢的固有印象。

早在2023年末,今年便被業(yè)內(nèi)公認為是AI應(yīng)用爆發(fā)的元年,多方向出擊的大廠與創(chuàng)業(yè)公司的草臺班子同臺角力,看似領(lǐng)先的豆包無疑面臨著更為激烈的競爭壓力。

還得靠內(nèi)容支棱起來

上文提到,豆包于模型能力產(chǎn)品化上的創(chuàng)新不多。除流量分發(fā)外,其規(guī);乃俣冗需自其他方面嘗試歸因。我們體驗后發(fā)現(xiàn),豆包在頂層設(shè)計上與其他廠商有明顯區(qū)別。

首先,持續(xù)占據(jù)抖音站內(nèi)“廣告位”的豆包已在生態(tài)上與抖音完全打通,用戶不僅可以通過抖音號快捷注冊登錄,更是可以在向豆包提問時,通過AI搜索抓取字節(jié)生態(tài)內(nèi)部分標(biāo)題中帶有關(guān)鍵詞的內(nèi)容。智能體的回答會較多參考抓取圖文、視頻的內(nèi)容,這也導(dǎo)致豆包在這類問題的回復(fù)上往往需要較多時間。

搜索的引入一定程度上緩解了對話模型“說胡話”的問題,另一方面,一般字節(jié)系內(nèi)容唯有在自家生態(tài)內(nèi)才能搜索,內(nèi)容的呈現(xiàn)本就是其互聯(lián)網(wǎng)服務(wù)的一部分。

這么看,字節(jié)的產(chǎn)品設(shè)計其實是一種對用戶的心智教育——文案、繪畫等高頻需求塑造了用戶對大模型應(yīng)用的工具型感知,而字節(jié)通過提供趣味內(nèi)容玩法,推動用戶感知向其擅長的內(nèi)容服務(wù)靠攏。換句話說,字節(jié)希望將豆包打造成一款偏向娛樂的產(chǎn)品,而非純粹的工具產(chǎn)品。

上文提到的AI聲音創(chuàng)建同樣是為增加應(yīng)用趣味性而設(shè)的功能,用戶可以通過錄制音頻來創(chuàng)建AI聲音,由此催生了多樣的交互玩法,例如模仿明星聲音并創(chuàng)建明星的智能體,以及春節(jié)期間足以擊穿所有年輕人的財神。

 

談及內(nèi)容,字節(jié)可就支棱起來了。字節(jié)的內(nèi)容體系經(jīng)歷了移動互聯(lián)網(wǎng)由圖文轉(zhuǎn)向視頻的歷史進程,無論是昨日的頭條系還是今日的抖音系都積攢了海量的信息,這不僅可以作為模型訓(xùn)練的“養(yǎng)料”,如今更是融入了模型應(yīng)用的產(chǎn)品服務(wù)中。

進一步說,不少喪失時效的長尾內(nèi)容的價值存在被再次激活的可能,這是內(nèi)容平臺進軍大模型的優(yōu)勢之一。

將大模型接入自家生態(tài)的條件也不是只有字節(jié)獨有,百度便早已將文心一言接入了多個產(chǎn)品線,如一度為業(yè)內(nèi)所遺忘的百度文庫。

只是上述兩者在具體玩法上可以說是背道而馳,字節(jié)選擇讓由豆包抓取生態(tài)內(nèi)內(nèi)容,讓生態(tài)服務(wù)模型應(yīng)用,而百度選擇讓應(yīng)用接入模型能力,讓模型反哺生態(tài)。

字節(jié)更在意的是如何將豆包打造成模型時代的爆款,而百度更在意的是如何通過模型來挖掘既有業(yè)務(wù)的潛力。不同的做法各有側(cè)重,這也一定程度上解釋了豆包如今在消費端的強勢表現(xiàn)。

字節(jié)的AI版圖

豆包僅是字節(jié)AI版圖中的一隅。

除了豆包這個面向國內(nèi)C端的AI對話應(yīng)用外,字節(jié)旗下還推出了AI工具集小悟空(原悟空搜索)、AI bot平臺扣子與抖音情緒機器人等,且以上應(yīng)用大多都已推出海外版。可以看出,發(fā)力AI的不僅有為創(chuàng)新AI應(yīng)用而創(chuàng)建的新部門Flow,還包括多條既有業(yè)務(wù)線的AI重構(gòu)。

字節(jié)最初涉足大模型領(lǐng)域的嘗試是火山引擎于去年6月推出的大模型服務(wù)平臺“火山方舟”,隨著豆包與其他一系列AI應(yīng)用逐漸打出市場聲量,意味著字節(jié)邁出了B端MaaS之外的第二只腳。

如果說以豆包為代表的智能體對話類應(yīng)用聲量漸起,對應(yīng)了字節(jié)AI戰(zhàn)略版圖的一面,那么更具技術(shù)深度與商業(yè)前景的文生視頻則是其圖景的另一面。

近日,OpenAI推出的文生視頻大模型Sora點燃了AI創(chuàng)投圈,能夠根據(jù)文本提示創(chuàng)建詳細的視頻,擴展現(xiàn)有視頻中的敘述以及從靜態(tài)圖像生成場景,最長能生成60秒視頻的Sora將AI軍備競賽的戰(zhàn)火帶至文生視頻領(lǐng)域。

就在Sora推出前后,字節(jié)的兩個動作耐人尋味:近日,原抖音集團CEO張楠宣布辭去集團CEO一職,未來把精力聚焦在剪映的發(fā)展上;另一方面,界面新聞報道稱在Sora發(fā)布前,字節(jié)便已推出可通過文本控制生成視頻中人物或物體的動作的模型產(chǎn)品Boximator,一度為市場解讀為Sora的“競品”。

將曾帶領(lǐng)字節(jié)系短視頻業(yè)務(wù)完成從0到1的張楠接手剪映,意味著其很可能就這款輔助視頻創(chuàng)作工具進行“二次創(chuàng)業(yè)”。實際上,早在本次人事調(diào)動前,剪映便推出了AI寫真、漫畫等新功能。降低普通人視頻創(chuàng)作門檻的產(chǎn)品設(shè)計與文生圖的應(yīng)用開發(fā)堆砌下,剪映本次文生視頻的轉(zhuǎn)向并不出人意料。

另一方面,盡管字節(jié)方面回應(yīng)稱Boximator目前還無法作為完善的產(chǎn)品落地,但這并不妨礙其可以被視作字節(jié)文生視頻業(yè)務(wù)的一塊拼圖。

由于Sora生成視頻的60秒時長恰好切中字節(jié)內(nèi)容護城河中的短視頻,其上述兩個動作也多為市場解讀成一種針對性的預(yù)判防御動作,防止Sora搶奪平臺既有創(chuàng)作工具的用戶。“預(yù)判”這一因素好似去年十二月沖擊國內(nèi)游戲產(chǎn)業(yè)的新規(guī)發(fā)布前,字節(jié)便提前鳴金收兵一般,頗有昨日重現(xiàn)的色彩。

實際上,字節(jié)未必是預(yù)判到了具體情況,而是對自身發(fā)展的前景與桎梏有著明確的感知。

就目前情況看,圖片、文案、代碼等基礎(chǔ)需求其實早已是昨日黃花,于此之上的模型應(yīng)用之爭可以說是亂成一鍋粥,但又決不出個高低來。早在去年下半年,賽道玩家們便有意向prompt工程、多輪對話記憶與長文本上發(fā)力,其原因恰是基礎(chǔ)需求實際上并不能很好地體現(xiàn)模型水平與能力。

基礎(chǔ)需求不過是字節(jié)可以“補課”追趕領(lǐng)域,而更具技術(shù)深度的文生視頻,才稱得上是大模型賽道競爭的勝負手。Sora的發(fā)布不過是2024年模型能力演進主線中的一位吹號人,告訴大家視頻時代已至。

或許字節(jié)跳動已經(jīng)追上了國內(nèi)大模型賽道的進度,但在世界范圍看,它還是一個追隨者。

       原文標(biāo)題 : 大模型的耐力游戲

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號