訂閱
糾錯
加入自媒體

Kimi搶了文心一言和豆包們的故事

2024-04-15 11:37
派財經
關注

 

出品|派財經原創(chuàng)(ID:paicj314)文|羅莉

近日,Kimi智能助手火了。

一個明顯的感知是,最近身邊的大學生、職場人士都開始談論起了Kimi。一位職場寶媽告訴派財經,她最近在嘗試用Kimi輔導娃寫作業(yè),“真的很方便,都不用下載APP小程序和網頁就能打開。”

根據AI產品榜aicpb.com統(tǒng)計,目前國內訪問量前十的產品中,Kimi在3月以12.61M的訪問量、環(huán)比321.58%的增長排在第二,僅次于文心一言。

成立近一年,短短五個月內Kmi的“長文本”輸入量提升了10倍。

3月18日下午,月之暗面曾宣布在大模型長上下文窗口技術上取得新的突破,Kimi智能助手支持無損上下文長度從最初的20多萬字,擴容到200萬字。該消息公布后,Kimi關注度一路走高,一度擠爆了服務器。3月22日,月之暗面回應稱,觀測到Kimi系統(tǒng)流量持續(xù)異常增高,流量增加的趨勢遠超對資源的預期規(guī)劃,并表示已經有多項應急措施正在實施,包括已經進行了5次擴容工作。

此前,月之暗面副總裁許欣然在會議室展示了幾份用于測試的文件。幾十萬字的《甄嬛傳》劇本,Kimi不僅能夠一口氣讀完,而且還能根據情節(jié)準確回答出細節(jié)問題,解析人物劇情走向;在迅速學習完頭部醫(yī)學書籍《中醫(yī)內科學》和《中醫(yī)診斷學》后,便可化身“老中醫(yī)”進行在線問診。

Kimi的成功破圈,讓國內一眾大模型廠商感到措手不及。

Kimi,真的強嗎?

Kimi用戶體驗如何?派財經對Kimi、文心一言、通義千問和豆包做了系列小測試。分別對其資料總結能力、檢索能力和創(chuàng)作能力進行了測驗。

首先是對資料總結、財報解讀能力測試:

派財經隨機上傳了一份阿里2024財年中期報告pdf,輸入解讀指令。根據生成內容來看,Kimi和通義千問給出的回答,羅列較為清晰,而文心一言則給出了概況,具體需要進一步指令才能繼續(xù)解讀,豆包給出了核心數據提煉回答。

其次是對用戶常用的資料檢索和整理功能測試:

派財經以“幫我閱讀馬斯克最新演講”為指令,分別詢問。根據生成內容來看,Kimi通過對7篇資料檢索解讀,給出了邏輯明確且詳細的觀點總結,豆包則直接搜索出了多個相關報道鏈接,文心一言和通義千問則給出了比較框架性的總結。

值得注意的是,派財經發(fā)現在已經創(chuàng)建的Kimi窗口上傳完本地文件和網之后,智能助手會自動關閉聯網模式,這一功能在其它三個智能助手界面尚未發(fā)現。

再是對創(chuàng)作能力,生成腳本等創(chuàng)作力測試:

派財經以“圍繞北京文旅為主題,寫一個短劇劇本”為指令,分別測試其創(chuàng)作能力。按照給出的基礎大綱來看,通義千問、Kimi和豆包給出了較為規(guī)范的劇本大綱框架,其中Kimi給出的最為規(guī)范且細節(jié),提到角色、場景、地點相對較詳細,在取名上也較為文藝。相較之下,文心一言給出的標題則較為直接,未交待劇本角色設定,但在場景、對話和獨白上更有“人味”。

綜上,在文生文應用上,Kimi的效果確實是看起來更有特色。

誰在為Kimi站臺?

Kimi智能助手是國內大模型獨角獸公司月之暗面面向C端用戶推出的一項產品。

月之暗面公司成立于2023年3月,創(chuàng)始人楊植麟畢業(yè)于清華,博士畢業(yè)于卡內基梅隆大學計算機專業(yè),曾就職于Google Brain和美國初創(chuàng)公司FAIR,師從蘋果公司人工智能負責人Ruslan Salakhutdinov,有多年創(chuàng)業(yè)經驗。

從技術能力上看,Kimi的強大基因最初就已經在創(chuàng)始人身上顯現。楊植麟是業(yè)內公認的長文本領域專家,在近五年的自研語言處理(NLP)領域影響力頗大。

在讀博士期間,楊植麟就以第一作者身份發(fā)表 Transformer-XL 和 XLNet 兩項工作,在谷歌學術上被引用近兩萬次,并在多個NLP任務上取得了當時的最佳效果。而Transformer-XL成為首個全面超越 RNN 的注意力語言模型,XLNet則在20項頂級會議中獲得最佳論文提名。在華人學者引用排名中,楊植麟的學術論文位居前10,在40歲以下排名第一。

楊植麟的學術研究能力,助力其團隊創(chuàng)造了Kimi獨特且表現優(yōu)秀的無損壓縮技術。

這種技術可減少參數對存儲的需求、推理的算力,以及數據傳輸的帶寬占用,從而高效率無損處理百萬級的長Token。而為了快速趕上長文本熱潮,其他大廠只能退而求其次,選擇檢索增強生成RAG技術。

Kimi的無損長上下文窗口的方案,是在逐字閱讀全文后給出答案。RAG技術是對全文關鍵信息進行檢索生成答案,但可能會丟失掉部分關鍵的信息。

這也就解釋了為何Kimi的長文本對話回答更準確,在用戶體驗度上美譽頗多。

但也有小紅書博主發(fā)筆記表示,在對Kimi的測試中發(fā)現,Kimi有一股RAG味。

“月之暗面”這個名字,來源于英國著名搖滾樂隊Pink Floyd的專輯《The Dark Side of the Moon》,在科研之外,楊植麟也是一名搖滾發(fā)燒友,他曾在樂隊中擔任鼓手角色。

資本市場眾星捧月。創(chuàng)業(yè)一年之內,月之暗面就已經完成了兩筆融資。最新一輪融資是在今年2月19日,融資額度超10億美金,投資方包括紅杉中國、小紅書、美團、阿里,老股東跟投。該筆融資成為國內AI大模型迄今為止單輪融資最高的金額。早在2023年6月,月之暗面就曾獲得來自包括紅杉中國、真格基金等頭部投資公司的3億美金融資。在兩輪融資之后,當前月之暗面估值達到了25億美元。

Kimi的走火,離不開阿里在底層的算力支持。有消息稱,最新10億美金融資中有8億美金來自阿里,部分資金以阿里提供的算力折算。當前,Kimi借調了阿里的英偉達(NVDA.O)A800以及A100 GPU處理器的機型進行擴容,未來Kimi算力側的支持,也將主要來自于阿里。

Kimi搶了文心一言和豆包們的故事

在對AI長文本探索上,Kimi絕對不是第一家,國內大模型頭部大廠,百度文心一言、阿里通義千問和360AI早已在做長文本的探索,抖音也在去年年底發(fā)力AI工具豆包。

在其他大模型大廠還在卷參數、開源和榜單的時候,Kimi切中了一個更貼近市場剛需的應用場景。將長文本作為標簽,通過大量的廣告營銷和用戶口碑,以“長文本”概念迅速占領用戶心智。上線之初,就通過突出文本處理字數,為自己貼上了“超大內存”的標簽,在PC硬件時代,不少C端用戶的認知是,內存越大,處理能力就越強。

在Kimi出圈之前,行業(yè)內在C端用戶市場教育上,百度的文心一言一家獨大,文心一言是大模型廠商中率先向社會全面開放的平臺。據相關數據統(tǒng)計,截至2023年9月,百度文心一言App的月活量達到最高峰值710萬。不過與Kimi不同的是除了2C之外,文心一言更大的精力放在研發(fā)行業(yè)大模型,垂直B端應用上。

其次是抖音的豆包在年初的初露頭角。依托于抖音的流量轉化池,字節(jié)跳動旗下的豆包APP在2024年1月活翻了一倍達到了400萬。

而新晉“網紅”Kimi的走紅要更快,據Similarweb數據,Kimi Chat網頁端數據最新峰值達34.6萬人次。根據AI產品榜,Kimi Chat的2月訪問量在國內榜排名第三,2月平均日活同比上升101.9%,全球增速榜排名第一,3月前二周繼續(xù)攀升。

Kimi上線的時間是2023年10月,當時可以支持無損上下文長度最多為20萬漢字。在5個月的時間內,月之暗面直接將長文本能力提高10倍。按照AI領域的計算標準,200萬漢字的長度大約為400萬token,在全球范圍內也屬于領先的標準。3月18日,月之暗面宣布在大模型長上下文窗口技術上取得新的突破,其自研的Kimi智能助手已支持200萬字超長無損上下文,并于今日開啟產品內測。

月之暗面方面表示,如今Kimi能夠一口氣精讀500個甚至數量更多的文件,幫助用戶快速分析所有文件的內容,并且支持通過自然語言進行信息查詢和篩選,大大提高信息處理效率。

在產品定位上,Kimi足夠堅定,面向C端用戶,主打長文本。AI搜索+文檔總結功能。

Kimi開始就為用戶敞開了大門,不僅能從網頁端入口進入,還能在APP和小程序端口打開,降低了使用大模型的門檻,這是業(yè)內B端大模型廠商無法匹敵的。

在選擇早期產品使用者集中在科研、法律、金融、媒體等垂直領域,而這部分垂直領域的KOL為Kimi帶來了自然流量與口碑積累。

Kimi在發(fā)力營銷同時,也有一部分“自來水”自發(fā)為Kimi站臺推廣。

將互聯網營銷公式帶入到了硬科技領域,Kimi的營銷開局頗為高調。在月之暗面發(fā)布的Kimi上線官宣文標題中提到,“歡迎與Moonshot AI共同開啟Looooooooooong LLM時代”,其中英文“long”用了接連十個“o”將Kimi的“長文本能力”直觀呈現出來。

Kimi提供的長文本閱讀能力和概括能力是兩大功能,面向C端用戶,致力于為用戶打造一個高學習力的免費私人助手。

一份上萬字的文獻,投喂給Kimi,只需要幾分鐘就能讀完全文并歸納總結出核心論點,極大程度為用戶提升了閱讀效率。

用戶投喂的各種資料又能反哺Kimi的語意語境學習理解能力,從而在不斷打磨中提高準確性。值得一提的是,在此類專業(yè)語料處理上的進步速度,Kimi甚至快于Open AI。主要由于當前Open AI對于C端用戶上傳文件仍然有所限制。

如果把Kimi智能助手類比做人類,它的突出之處在于具備較長時間段的記憶力,是一個記性超好的學霸,可以一次記住20萬字的上下文,一口氣讀完一本書或者一系列文章。相較國外綜合能力最強的學霸GPT4(可以記住2.5萬字)。Kimi的記憶力是GPT4的8倍。

有小紅書博主試著通過Kimi智能助手,訓練出在自媒體領域現象級創(chuàng)作者咪蒙,將50個文檔投喂給Kimi之后,一步步引導其分析咪蒙寫作的核心特點以及對待感情態(tài)度后,下指令讓其生成一篇關于“彩禮”的文章,成稿雖然簡短但頗具“咪蒙味”。

在Kimi走火之后,各大模型廠商紛紛“秀肌肉”。

據第三方機構的最新統(tǒng)計數據顯示,目前國內已經發(fā)布的大型語言模型數量已經超過了300個。這些大型模型的發(fā)布主體涵蓋了科技巨頭、國內頂尖的高等學府、以及各類科研機構,他們在資金投入、資源配置、人才聚集等方面都擁有絕對的優(yōu)勢。

國內互聯網大廠火速將相關功能進行了升級,卷起了長文本“長度”。

2023年10月30日,Kimi首發(fā)不到一個月,同為清華系校友的王小川的百川智能就推出了單次處理35萬漢字的Baichuan2-192K,打破了Kimi的20萬字記錄,隨后,李開復也發(fā)布了能夠處理40萬字的Yi-34B。

在Kimi宣布更新200萬字長文檔處理能力后,阿里宣布通義千問升級,免費開放1000萬字的長文檔處理功能,成為全球文檔處理容量第一的AI應用;隨后,百度文心一言、360智腦也都把500萬字長文本提上了日程。

目前,大模型最強王者OpenAI的GPT-4 Turbo-128k可處理文本能力約為10萬漢字,專攻長本文的Claude3-200K上下文處理能力約為16萬漢字。

一時間,各大模型廠商比起了誰更“長”,而文本處理能力越長就能代表能力強嗎?

此前,對于文本窗口的長度,楊植麟曾表示,不能只提升窗口,不能只看數字,要看它在這個窗口下能實現的推理能力、the faithfulness的能力(對原始信息的忠實度)、the instruction following的能力(遵循指令的能力)。

長文本能力能幫Kimi造血嗎?

Kimi火爆的表象之下,一個更為現實的問題暴露無遺,長文本能力能為Kimi造血嗎?

根據新浪科技提供的數據,考慮到廣告投放和算力成本,Kimi每個獲客用戶的成本達到12-13元,而按照近一個月將近18000的日均下載量計算,Kimi每日的獲客成本高達20萬元。而除了每日20萬的獲客成本外,Kimi需要燒錢的地方還有很多,比如不斷提升信息檢索能力、遵循復雜指令的能力,推動多模態(tài)模型研發(fā),以及實現音頻處理等其他需求。

接下來,付出了高額成本,能否將現有用戶留住,持續(xù)轉化將是對Kimi產品的一大考驗。為龐大的用戶群體提供穩(wěn)定的服務,同樣是一筆不小開支。

長文本能力短期內幫助Kimi出圈,但很難成為其獨家技術壁壘。Kimi的長文本處理能力與通義千問、360智腦等AI產品相比,并沒有非常明顯的優(yōu)勢。

雖然實現造血能力難,但Kimi的C端策略也有一定意義,通過長文本先征服用戶,進而讓更多B端客戶看到大模型底層應用能力的真正價值。

但從整體盈利角度來看,Kimi靠燒錢摸索出的獲客模式很容易被復制,對于將業(yè)務重心放在B端服務的大廠們來說,獲客成本反而是更低的。

行業(yè)內多數大模型公司均采取的是2B和2C兩條腿走路,通過推出行業(yè)大模型直接售賣B端解決方案,或是向公司、開發(fā)者售賣API,按照調用次數收費。此外,以文心一言為代表的一種C端打法是,面向C端用戶,為會員增值服務,在應用端按月/年向用戶收費,當前文心一言扔在試水階段,而后起之秀Kimi則仍然處于免費模式階段。

不過,有聲音認為,Kimi的出現對于國內大模型市場提供了新的思路,從基礎大模型的訓練和競爭逐步向更貼近客戶的產品功能和細節(jié)需求轉變。

有業(yè)內人士表示,當下這一輪人工智能革命本質上是自然語言處理(NLP)的技術革命,更是一次交互方式的革命。從文本向多模態(tài)發(fā)展是大模型必經之路。而視頻處理需要更大的參數量和存儲容量,對算力和算法的要求也更高。接下來Kimi的應用將從單模態(tài),向多模態(tài)化發(fā)展,即從單一的文本處理基礎上,增添聲音、圖像等信息處理技術。

亦有觀點認為,Kimi的出圈意味著在中文領域開啟了AI大模型應用元年,長文本時代已至。大模型在實現通往AGI(通用人工智能)路上又近了一步。然而需要厘清的是,長文本能力并非唯一標準,多模態(tài)學習、神經網絡架構創(chuàng)新、應用落地與生態(tài)建設、倫理與道德框架構建等各個維度都不可或缺。

一位初入職場的金融分析師向派財經感嘆道,Kimi的強大學習理解能力讓人感到威脅,“可能過不了多久,向我這樣的初級分析師就要被AI智能助手替代了。”這一擔憂并非空穴來鳳,在效率至上的資本市場,華爾街有個說法叫“20美金實習生”,時薪20美金的實習生工作未來一段時間大概率會被AI替代。

AI是否會替代職場人?在《所羅門的密碼:AI時代的價值、權力與信任》中,作者奧拉夫·格羅思、馬克·尼茲伯格曾給出過解釋,“最終,問題不在于工作是否會改變,工人是否會被取代。這甚至不需要超級智能就會實現。問題是這些轉變將會以多快的速度發(fā)生,我們能否跟上它們的步伐,特別是在教育和勞動力培訓方面。正如奧萊利媒體公司的創(chuàng)始人兼首席執(zhí)行官蒂姆·奧萊利(Tim O’Reilly),在他的視頻《我們?yōu)槭裁从肋h不會失業(yè)》中所說的那樣,我們的辦法總比困難多。但是,適應新的工作性質需要發(fā)揮想象力并做好準備。”

       原文標題 : Kimi搶了文心一言和豆包們的故事

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號