訂閱
糾錯(cuò)
加入自媒體

大模型新史:春秋將逝,戰(zhàn)國(guó)啟闔

國(guó)內(nèi)外頭部廠商紛紛加入這場(chǎng)“開源熱”,意味著“加速快跑”已成為行業(yè)共識(shí)。大家都希望跑在前面,成為李彥宏口中那剩下的1%。而留給后來者的機(jī)會(huì)窗口也正緩緩關(guān)閉。因?yàn)樵诟?jìng)爭(zhēng)空前激烈的大模型賽道上,所有參賽者都明白,這不是一場(chǎng)排位賽,而是一場(chǎng)淘汰賽。

作者/李長(zhǎng)懷  

兩千多年前,中國(guó)迎來第一次全國(guó)性大分裂,諸侯連年征戰(zhàn),天下格局也隨之動(dòng)蕩不定。

但正如常言所道,“天下大勢(shì),分久必合”,經(jīng)過近300年的兼并戰(zhàn)爭(zhēng),數(shù)百個(gè)諸侯紛紛覆滅,最終只剩下少數(shù)幾個(gè)主要國(guó)家,歷史進(jìn)入七國(guó)爭(zhēng)雄的戰(zhàn)國(guó)時(shí)期。

歷史不會(huì)簡(jiǎn)單重演,但總會(huì)飛來幾只似曾相識(shí)的燕子。這一次的“燕子”,名叫大模型。

從被稱為AIGC的“iPhone時(shí)刻”的ChatGPT誕生以來,正如智能手機(jī)的iPhone時(shí)刻不只屬于蘋果公司,而是帶來了一大批智能手機(jī)品牌的崛起一樣,大模型也迎來了“百模大戰(zhàn)”。

據(jù)GitHub的統(tǒng)計(jì)數(shù)據(jù),到2023年底,僅國(guó)內(nèi)已經(jīng)發(fā)布的大語言模型數(shù)量,即已接近300個(gè)。加上海外企業(yè),全球大模型數(shù)量已超過400個(gè)。

巧合的是,當(dāng)初東周王室分封的諸侯數(shù)量,也是400多個(gè)。

盡管大模型空前廣闊復(fù)雜的應(yīng)用場(chǎng)景,以及不同廠商在細(xì)分領(lǐng)域優(yōu)劣勢(shì)的客觀存在,決定了大模型不會(huì)像PC一樣出現(xiàn)Windows一統(tǒng)天下的格局,也不會(huì)像智能手機(jī)一樣僅由iOS、Android兩個(gè)主要玩家壟斷市場(chǎng);但大模型本身超強(qiáng)的適應(yīng)能力,也決定了百度李彥宏所說的“99%陪跑”,更有可能成為行業(yè)的未來景象。

新的歷史正在上演,而在敘事上,大模型研發(fā)者們,似乎已經(jīng)選擇了當(dāng)初谷歌打下Android江山的劇本。

去年12月,阿里云正式發(fā)布并開源“業(yè)界最強(qiáng)開源大模型”通義千問720億參數(shù)模型Qwen-72B。

1月17日,商湯科技與上海AI實(shí)驗(yàn)室聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)發(fā)布的新一代大語言模型書生·浦語2.0宣布開源。

1月29日,Meta發(fā)布的“Code Llama家族中體量最大、性能最好的模型版本” Code Llama70B,也選擇了開源。

1月30日,科大訊飛發(fā)布首個(gè)基于全國(guó)產(chǎn)化算力平臺(tái)”飛星一號(hào)”的開源大模型——星火開源-13B。

公開信息顯示,Meta的LLama、OPT,谷歌的T5、MT5、FLAN-T5以及UU2,Big Science的BLOOM、T0、BLOOMZ等國(guó)內(nèi)外主流大模型,均走上了開源道路。

艾倫人工智能研究所等5機(jī)構(gòu)最近公布的開源模型OLMo,更是將模型權(quán)重、完整訓(xùn)練代碼、數(shù)據(jù)集和訓(xùn)練過程全部予以公開,玩起了大模型的“真·完全開源”模式。

國(guó)內(nèi)外頭部廠商紛紛加入這場(chǎng)“開源熱”,意味著“加速快跑”已成為行業(yè)共識(shí)。大家都希望跑在前面,成為李彥宏口中那剩下的1%。而留給后來者的機(jī)會(huì)窗口也正緩緩關(guān)閉。因?yàn)樵诟?jìng)爭(zhēng)空前激烈的大模型賽道上,所有參賽者都明白,這不是一場(chǎng)排位賽,而是一場(chǎng)淘汰賽。

大模型的“戰(zhàn)國(guó)時(shí)代”,似乎已經(jīng)遙遙在望。

01

推開“戰(zhàn)國(guó)”的大門//

Android的發(fā)展歷程,堪稱互聯(lián)網(wǎng)行業(yè)底層操作系統(tǒng)開源的教科書。

作為一個(gè)開源系統(tǒng),Android較之此前占據(jù)優(yōu)勢(shì)的塞班、黑莓、WP,以至同樣出身名門的plam OS(惠普)、BADA OS(三星)、MeeGo(英特爾+諾基亞),本身并沒有多大突破。但是由于開發(fā)者可以自由訪問系統(tǒng)底層,通過其源代碼進(jìn)行二次開發(fā),App的開發(fā)門檻、周期都得以大幅縮短,并且可以根據(jù)自己的需求和風(fēng)格定制界面和功能,市場(chǎng)自然更容易接受。

手機(jī)廠商也樂得將更多的精力,投入到系統(tǒng)的打磨上,改善用戶的使用體驗(yàn)。因此,我們所熟知的小米、魅族、vivo、OPPO等手機(jī)廠商,基本都是基于Android的深度定制打造的自身操作系統(tǒng)。

回望模型,開源大模型的出現(xiàn),讓 AI 應(yīng)用的開發(fā)周期和成本大幅降低,加快人工智能的普及。以Meta發(fā)布的Code Llama70B為例,據(jù)稱,其API調(diào)用成本大約比 GPT-4 便宜了 30 倍。在Llama2 發(fā)布兩個(gè)月后,通過 Hugging Face 的 Llama 模型下載量就超過 3000 萬次。國(guó)內(nèi)興起的AIGC,不少應(yīng)用的基礎(chǔ)模型就是 Llama2。

正如Meta 首席科學(xué)家、深度學(xué)習(xí)三巨頭之一 Yann LeCun所說:“閉源證明了大模型路線的可行性,而開源則通過繁榮的生態(tài),讓大模型變得易用、可用。”

而這次大模型的“開源熱”,除了市場(chǎng)推廣邏輯的復(fù)刻外,還有更現(xiàn)實(shí)的利益考量,那就是算力資源的匱乏。

根據(jù)不同的機(jī)構(gòu)測(cè)算,GPT-4 的訓(xùn)練需要的 A100 數(shù)量大約在10000-25000 張的區(qū)間。“百模大戰(zhàn)”所消耗的算力規(guī)?上攵

更富邏輯性的說法則是,過去4年間,大模型參數(shù)量以年均400%的速度增長(zhǎng),AI算力需求增長(zhǎng)超過15萬倍,傳統(tǒng)算力基礎(chǔ)設(shè)施已無法滿足大模型、生成式AI的訓(xùn)練需求。

正是在這一背景下,業(yè)內(nèi)早就提出,AI大模型的合理發(fā)展路徑,應(yīng)該是“可能僅有少數(shù)企業(yè)會(huì)開發(fā)基礎(chǔ)大模型,其他各行各業(yè)將根據(jù)自身業(yè)務(wù)需求、數(shù)據(jù)量等,接入大模型平臺(tái),開發(fā)屬于自己的模型”。

國(guó)內(nèi)大模型的先發(fā)者百度CEO李彥宏更是直言:“好幾百個(gè)基礎(chǔ)模型,這是對(duì)社會(huì)資源巨大的浪費(fèi)。”

另一方面,“百模大戰(zhàn)”對(duì)于技術(shù)升級(jí)的意義或許也確實(shí)不大。盡管目前各家大模型在數(shù)據(jù)、算法等各個(gè)層面千差萬別,但核心的技術(shù)路線,事實(shí)上都是6年前誕生的Transformer 架構(gòu)。ChatGPT的名字中,GPT的T,指的就是Transformer。Copilot、 DALL·E 3 、 Midjourney、Runway……這一年不斷刷新我們認(rèn)知的 AI 產(chǎn)品,背后的核心技術(shù)架構(gòu)都是Transformer。

這也解釋了為什么ChatGPT之后,新的大模型會(huì)如此密集出現(xiàn)。ChatGPT的最大功績(jī),不是創(chuàng)造了新的AI工具,而是讓大家看到了AI革命性突破的確定路徑。這與前文提到的智能手機(jī)的iPhone時(shí)刻可謂異曲同工。

在同樣的架構(gòu)之下,訓(xùn)練出再多再好的大模型,最終意義或許就是刷個(gè)榜而已。

1月30日,上海人工智能實(shí)驗(yàn)室推出的大模型開源開放評(píng)測(cè)體系司南(OpenCompass2.0),發(fā)布了2023年度大模型評(píng)測(cè)榜單,榜單顯示,整體技術(shù)能力居于GPT4與GPT3.5之間的大模型數(shù)量,已多達(dá)7個(gè),其中不乏國(guó)產(chǎn)大模型身影。

OpenCompass2.0大語言模型中英雙語客觀評(píng)測(cè)前十名(采用百分制)。商用閉源模型通過API形式測(cè)試,開源模型直接在模型權(quán)重上測(cè)試。

但在實(shí)際應(yīng)用上,李彥宏表示:“國(guó)內(nèi)數(shù)百個(gè)大模型調(diào)用量加起來,還不如文心一個(gè)多。”

既然這樣,把資源集中在幾個(gè)更有實(shí)力的大模型上,的確是更優(yōu)選擇。

從政策上來看,開源也是行業(yè)大勢(shì)所趨。早在2017年,中國(guó)發(fā)布的《新一代人工智能發(fā)展規(guī)劃》就將開源、開放作為基本原則寫入了規(guī)劃。2023年,科技部副部長(zhǎng)吳朝暉也表示,中國(guó)堅(jiān)持開源協(xié)作,加強(qiáng)大模型技術(shù)持續(xù)創(chuàng)新,協(xié)同解決透明性、穩(wěn)定性等共性問題,加快形成大模型的產(chǎn)業(yè)生態(tài)。

因此,當(dāng)下大模型發(fā)展的“春秋時(shí)期”,是市場(chǎng)、企業(yè)、政策多方合力,共同用開源推開了“戰(zhàn)國(guó)”的大門。

02

“分晉”?“代齊”?//

開源將改變大語言模型的格局已毋庸置疑。如何應(yīng)對(duì)?相信誰也給不出終極答案。

但既然“似曾相識(shí)燕歸來”,我們不妨再次將眼光轉(zhuǎn)向兩千多年前的那個(gè)時(shí)代。

歷史從春秋轉(zhuǎn)入戰(zhàn)國(guó),有兩個(gè)標(biāo)志性的事件,一是三家分晉,二是田氏代齊。這兩大事件,也為大模型廠商們面對(duì)開源后加快的市場(chǎng)洗牌,提供了兩個(gè)有效的應(yīng)對(duì)思路。

三家分晉的最終成行,在于趙、魏、韓三家勢(shì)弱的公卿,通過聯(lián)合取勝,消滅了勢(shì)強(qiáng)的智家,從而各自分得了晉國(guó)的部分領(lǐng)土。對(duì)于大模型廠商來說,這意味著一種合縱抗敵,各得其利的思路。

海外比較具有代表性的案例當(dāng)屬Hugging Face開源社區(qū)。作為世界最大的大模型托管平臺(tái),Hugging Face近日推出了開源、可定制的AI 助手Hugging Chat Assistants。除了免費(fèi)之外,其與GPTs和GPT Store另一個(gè)重要區(qū)別在于:后兩者完全依賴于OpenAI的專有大模型GPT-4以及GPT-4 Vision/Turbo,而前者的用戶可以自由選擇多個(gè)開源LLM來驅(qū)動(dòng)AI助手。

Hugging Chat Assistants推出后不久,就受到AI社區(qū)許多開發(fā)者的稱贊,認(rèn)為它在某些方面“超越了GPTs”,成為其追趕閉源系統(tǒng)競(jìng)爭(zhēng)對(duì)手方面的不二法寶。

在國(guó)內(nèi),2023年9月5日,由重慶市大數(shù)據(jù)應(yīng)用發(fā)展管理局牽頭,華為、阿里、騰訊、百度、京東、科大訊飛等50多家國(guó)內(nèi)頭部大模型企業(yè)加入的,全國(guó)首個(gè)大模型聯(lián)盟智博會(huì)正式宣告成立,極大地推動(dòng)了大模型產(chǎn)業(yè)生態(tài)發(fā)展。這與Android系統(tǒng)發(fā)布當(dāng)天,Google公司宣布聯(lián)合摩托羅拉、高通、HTC和T-Mobile在內(nèi)的30多家公司,共同組建全球性的開放手機(jī)聯(lián)盟,以推動(dòng)Android普及,看上去頗有幾分相似。

回顧歷史,田氏代齊中的田氏,則是通過“有德于民”,而使“齊之民歸之如流水”,最終取代姜氏,掌握了齊國(guó)的政權(quán)。這種給與下游生態(tài)合作伙伴及客戶更多實(shí)惠,從而提升其合作意愿的思路,更適合有實(shí)力的大模型廠商。

譬如2023年9月5日召開的百度云智大會(huì)上,百度即宣布,推出大模型新生態(tài)政策,為伙伴提供資金、算力、技術(shù)、營(yíng)銷等全方位的強(qiáng)力支持。百度如今能做到“國(guó)內(nèi)數(shù)百個(gè)大模型調(diào)用量加起來,還不如文心一個(gè)多”的成績(jī),與此不無關(guān)系。

當(dāng)然,從大模型長(zhǎng)期發(fā)展的復(fù)雜性來說,需要考慮的因素遠(yuǎn)不止此。數(shù)據(jù)安全、許可協(xié)議標(biāo)準(zhǔn)、商業(yè)模式等等問題,在如今的發(fā)展階段,仍然處于未解之中。

但,Android先例在前,無論選擇“分晉”還是“代齊”路線,抑或其他,大模型廠商們通過開源加快搶占市場(chǎng)的用心,早已堅(jiān)不可摧。“春秋時(shí)代”戰(zhàn)事的終結(jié),也早已由此注定。

Android的命名靈感,來自一個(gè)充滿野心的科幻作品《未來夏娃》。在這部小說中,作者試圖創(chuàng)造出一個(gè)完美的機(jī)器生命。正是出于對(duì)作者利爾·亞當(dāng)科學(xué)精神的致敬,Android之父安迪·魯賓,將本書女主角的名字,用在了自己開發(fā)的操作系統(tǒng)之上。大模型廠商們,誰又將造出AI時(shí)代的“未來夏娃”,我們拭目以待。

       原文標(biāo)題 : 大模型新史:春秋將逝,戰(zhàn)國(guó)啟闔

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)