欧美一本大道香蕉综合视频,日本黄色网站在线免费观看网站

大模型的耐力游戲

2024-02-28 13:36

撰文 | 吳坤諺

編輯 | 吳先之

2010年，世界上首款量產(chǎn)純電車型日產(chǎn)汽車（Nissan）聆風(fēng)上市的時候，沒人能想到日產(chǎn)汽車公司乃至整個日本汽車行業(yè)都將在十余年后的今天淪為陪跑。

類似這樣由領(lǐng)跑者淪為追隨者的案例并不鮮見，正如在大模型領(lǐng)域，意欲竊取百度、科大訊飛等一眾大模型先行者勝利果實的字節(jié)跳動。

眾所周知，百度、科大訊飛是國內(nèi)大模型賽道中先聲奪人的代表玩家，早在去年上半年便上線網(wǎng)頁測試版搶占用戶心智，以期在正式面向公眾服務(wù)的時候能快速積累用戶。然而據(jù)QuestMobile近日發(fā)布的數(shù)據(jù)，2023年11月，文心一言、豆包與訊飛星火的日活分別是155.4萬、124.6萬、71.9萬。

不難看出，相比于早在2023上半年便上線網(wǎng)頁測試的百度與科大訊飛，8月才開啟邀測的豆包跑出了更快的增長速度。

甚至到了2024年2月19日，豆包在iOS免費榜上排名49，而文心一言排名為157，訊飛星火則排名400開外，類GPT應(yīng)用的前三把交椅之間已然存在不小的差距。

在今年1月的2024年年度全員會上，字節(jié)跳動CEO梁汝波提到內(nèi)部對GPT的討論始于2023。短短一年內(nèi)，基于云雀大模型的AI應(yīng)用矩陣已經(jīng)形成，似有復(fù)現(xiàn)曾經(jīng)其作為爆款應(yīng)用工廠之勢。

豆包的勝利屬于抖音

字節(jié)一度在業(yè)內(nèi)享有“App工廠”之稱，這源于其算法推薦機制下，集中資源與頭條系流量大水漫灌的打法，可以“熱啟動”新的獨立應(yīng)用，快速積累用戶。

時過境遷，互聯(lián)網(wǎng)紅利見頂催生的聚合超級App不斷擠壓獨立App的生存空間，讓字節(jié)逐漸難以持續(xù)打造爆款A(yù)pp，但“算法+流量”的傳統(tǒng)打法仍不失其效果。如字節(jié)于2023年上線的新游《晶核》與《星球：重啟》均基于抖音的流量，通過這個打法快速撐起用戶與營收規(guī)模。

同樣的啟動路徑自然可以復(fù)現(xiàn)到大模型應(yīng)用上。更重要的是，國內(nèi)大模型賽道無論是模型層還是應(yīng)用層，都未能出現(xiàn)如ChatGPT、Character.AI一般站穩(wěn)生態(tài)位的玩家，“大力出奇跡”的打法似乎與時下亂局正合適。

據(jù)Tech星球報道，有消息人士透露豆包的月活已于去年12月增長至200萬，2024年1月份則在此基礎(chǔ)上翻了一番。我們亦自相關(guān)人士處了解到，豆包的月內(nèi)平均日活已經(jīng)完成了對文心一言的反超。

誠然，互聯(lián)網(wǎng)做的一直是注意力的生意，這是為何字節(jié)這套“老打法”能再獲戰(zhàn)果的原因。但在注意力極為稀缺的當(dāng)下，流量還不足以讓字節(jié)做到后發(fā)突圍。

要知道，業(yè)內(nèi)對AI應(yīng)用落地難的共識是其難以挖掘新的使用場景與功能，這同樣是豆包延續(xù)其“爆款”生命力的關(guān)鍵所在。就創(chuàng)新性來看，我們能輕易在豆包目前的產(chǎn)品形態(tài)中找到Character.AI這位前輩的影子。

豆包與Character.AI一般主打多樣化的智能體，除應(yīng)用內(nèi)置的“豆包”、“AI圖片生成”、“編程助理”等覆蓋高頻需求的智能體外，用戶亦可自行無代碼創(chuàng)建。

智能體的玩法可以較好地覆蓋用戶低頻需求，產(chǎn)品設(shè)計上偏向拓展C端規(guī)模。其他功能如語音交互以及AI聲音創(chuàng)建是不錯的亮點，但總體并未跳脫出Character.AI已被驗證的產(chǎn)品框架。相比之下，隔壁文心一言顯得更為成熟，不僅同樣引入了智能體玩法，同時還在發(fā)力建設(shè)AI交流社區(qū)以及商業(yè)化。

我們體驗發(fā)現(xiàn)，文心一言App已將“社區(qū)”設(shè)置為一級入口，社區(qū)中的UGC內(nèi)容以文心一言生成的AIGC圖文為主，并加入了移動互聯(lián)網(wǎng)常見的贊評交流系統(tǒng)。此外，百度還在文心一言4.0訂閱制付費的基礎(chǔ)上推出了“靈感幣”作為補充，用戶可通過分享、拉新與充值的方式獲取更強的模型能力。這一系列變化，都指向了商業(yè)化。

反觀豆包目前尚不見商業(yè)化動作，社區(qū)建設(shè)同樣未曾上馬。至于文心一言目前在數(shù)據(jù)上（如iOS下載量）不如豆包好看，或是二者的流量分發(fā)效率不可同日而語的緣故。但不可否認的是，這恰好印證了此前外界對字節(jié)AI大模型進展較慢的固有印象。

早在2023年末，今年便被業(yè)內(nèi)公認為是AI應(yīng)用爆發(fā)的元年，多方向出擊的大廠與創(chuàng)業(yè)公司的草臺班子同臺角力，看似領(lǐng)先的豆包無疑面臨著更為激烈的競爭壓力。

還得靠內(nèi)容支棱起來

上文提到，豆包于模型能力產(chǎn)品化上的創(chuàng)新不多。除流量分發(fā)外，其規(guī)�；乃俣冗€需自其他方面嘗試歸因。我們體驗后發(fā)現(xiàn)，豆包在頂層設(shè)計上與其他廠商有明顯區(qū)別。

首先，持續(xù)占據(jù)抖音站內(nèi)“廣告位”的豆包已在生態(tài)上與抖音完全打通，用戶不僅可以通過抖音號快捷注冊登錄，更是可以在向豆包提問時，通過AI搜索抓取字節(jié)生態(tài)內(nèi)部分標(biāo)題中帶有關(guān)鍵詞的內(nèi)容。智能體的回答會較多參考抓取圖文、視頻的內(nèi)容，這也導(dǎo)致豆包在這類問題的回復(fù)上往往需要較多時間。

搜索的引入一定程度上緩解了對話模型“說胡話”的問題，另一方面，一般字節(jié)系內(nèi)容唯有在自家生態(tài)內(nèi)才能搜索，內(nèi)容的呈現(xiàn)本就是其互聯(lián)網(wǎng)服務(wù)的一部分。

這么看，字節(jié)的產(chǎn)品設(shè)計其實是一種對用戶的心智教育——文案、繪畫等高頻需求塑造了用戶對大模型應(yīng)用的工具型感知，而字節(jié)通過提供趣味內(nèi)容玩法，推動用戶感知向其擅長的內(nèi)容服務(wù)靠攏。換句話說，字節(jié)希望將豆包打造成一款偏向娛樂的產(chǎn)品，而非純粹的工具產(chǎn)品。

上文提到的AI聲音創(chuàng)建同樣是為增加應(yīng)用趣味性而設(shè)的功能，用戶可以通過錄制音頻來創(chuàng)建AI聲音，由此催生了多樣的交互玩法，例如模仿明星聲音并創(chuàng)建明星的智能體，以及春節(jié)期間足以擊穿所有年輕人的財神。

談及內(nèi)容，字節(jié)可就支棱起來了。字節(jié)的內(nèi)容體系經(jīng)歷了移動互聯(lián)網(wǎng)由圖文轉(zhuǎn)向視頻的歷史進程，無論是昨日的頭條系還是今日的抖音系都積攢了海量的信息，這不僅可以作為模型訓(xùn)練的“養(yǎng)料”，如今更是融入了模型應(yīng)用的產(chǎn)品服務(wù)中。

進一步說，不少喪失時效的長尾內(nèi)容的價值存在被再次激活的可能，這是內(nèi)容平臺進軍大模型的優(yōu)勢之一。

將大模型接入自家生態(tài)的條件也不是只有字節(jié)獨有，百度便早已將文心一言接入了多個產(chǎn)品線，如一度為業(yè)內(nèi)所遺忘的百度文庫。

只是上述兩者在具體玩法上可以說是背道而馳，字節(jié)選擇讓由豆包抓取生態(tài)內(nèi)內(nèi)容，讓生態(tài)服務(wù)模型應(yīng)用，而百度選擇讓應(yīng)用接入模型能力，讓模型反哺生態(tài)。

字節(jié)更在意的是如何將豆包打造成模型時代的爆款，而百度更在意的是如何通過模型來挖掘既有業(yè)務(wù)的潛力。不同的做法各有側(cè)重，這也一定程度上解釋了豆包如今在消費端的強勢表現(xiàn)。

字節(jié)的AI版圖

豆包僅是字節(jié)AI版圖中的一隅。

除了豆包這個面向國內(nèi)C端的AI對話應(yīng)用外，字節(jié)旗下還推出了AI工具集小悟空（原悟空搜索）、AI bot平臺扣子與抖音情緒機器人等，且以上應(yīng)用大多都已推出海外版。可以看出，發(fā)力AI的不僅有為創(chuàng)新AI應(yīng)用而創(chuàng)建的新部門Flow，還包括多條既有業(yè)務(wù)線的AI重構(gòu)。

字節(jié)最初涉足大模型領(lǐng)域的嘗試是火山引擎于去年6月推出的大模型服務(wù)平臺“火山方舟”，隨著豆包與其他一系列AI應(yīng)用逐漸打出市場聲量，意味著字節(jié)邁出了B端MaaS之外的第二只腳。

如果說以豆包為代表的智能體對話類應(yīng)用聲量漸起，對應(yīng)了字節(jié)AI戰(zhàn)略版圖的一面，那么更具技術(shù)深度與商業(yè)前景的文生視頻則是其圖景的另一面。

近日，OpenAI推出的文生視頻大模型Sora點燃了AI創(chuàng)投圈，能夠根據(jù)文本提示創(chuàng)建詳細的視頻，擴展現(xiàn)有視頻中的敘述以及從靜態(tài)圖像生成場景，最長能生成60秒視頻的Sora將AI軍備競賽的戰(zhàn)火帶至文生視頻領(lǐng)域。

就在Sora推出前后，字節(jié)的兩個動作耐人尋味：近日，原抖音集團CEO張楠宣布辭去集團CEO一職，未來把精力聚焦在剪映的發(fā)展上；另一方面，界面新聞報道稱在Sora發(fā)布前，字節(jié)便已推出可通過文本控制生成視頻中人物或物體的動作的模型產(chǎn)品Boximator，一度為市場解讀為Sora的“競品”。

將曾帶領(lǐng)字節(jié)系短視頻業(yè)務(wù)完成從0到1的張楠接手剪映，意味著其很可能就這款輔助視頻創(chuàng)作工具進行“二次創(chuàng)業(yè)”。實際上，早在本次人事調(diào)動前，剪映便推出了AI寫真、漫畫等新功能。降低普通人視頻創(chuàng)作門檻的產(chǎn)品設(shè)計與文生圖的應(yīng)用開發(fā)堆砌下，剪映本次文生視頻的轉(zhuǎn)向并不出人意料。

另一方面，盡管字節(jié)方面回應(yīng)稱Boximator目前還無法作為完善的產(chǎn)品落地，但這并不妨礙其可以被視作字節(jié)文生視頻業(yè)務(wù)的一塊拼圖。

由于Sora生成視頻的60秒時長恰好切中字節(jié)內(nèi)容護城河中的短視頻，其上述兩個動作也多為市場解讀成一種針對性的預(yù)判防御動作，防止Sora搶奪平臺既有創(chuàng)作工具的用戶。“預(yù)判”這一因素好似去年十二月沖擊國內(nèi)游戲產(chǎn)業(yè)的新規(guī)發(fā)布前，字節(jié)便提前鳴金收兵一般，頗有昨日重現(xiàn)的色彩。

實際上，字節(jié)未必是預(yù)判到了具體情況，而是對自身發(fā)展的前景與桎梏有著明確的感知。

就目前情況看，圖片、文案、代碼等基礎(chǔ)需求其實早已是昨日黃花，于此之上的模型應(yīng)用之爭可以說是亂成一鍋粥，但又決不出個高低來。早在去年下半年，賽道玩家們便有意向prompt工程、多輪對話記憶與長文本上發(fā)力，其原因恰是基礎(chǔ)需求實際上并不能很好地體現(xiàn)模型水平與能力。

基礎(chǔ)需求不過是字節(jié)可以“補課”追趕領(lǐng)域，而更具技術(shù)深度的文生視頻，才稱得上是大模型賽道競爭的勝負手。Sora的發(fā)布不過是2024年模型能力演進主線中的一位吹號人，告訴大家視頻時代已至。

或許字節(jié)跳動已經(jīng)追上了國內(nèi)大模型賽道的進度，但在世界范圍看，它還是一個追隨者。

原文標(biāo)題 : 大模型的耐力游戲