精品国产三级大全在线观看,国产日韩久久一级毛片

通用vs垂直，大模型進(jìn)入走近第一個賽點(diǎn)

2023-05-18 13:46

SHEN MOU

作者：張未

原創(chuàng)：深眸財(cái)經(jīng)（chutou0325）

AI大模型的戰(zhàn)場正在分化。

Chatgpt作為導(dǎo)火索，打開了AI2.0時代的大門，而AI2.0的特征便是“產(chǎn)業(yè)智能化、數(shù)字化”，能夠高效地替代人工，廣泛地運(yùn)用到各行各業(yè)，所以比起還在探索落地、已過了狂奔期的元宇宙，AI大模型的落地來得更實(shí)在些。

最典型的表現(xiàn)就是，AI大模型的出圈更廣泛，不止步于B端。比如，即便chatGPT發(fā)布半年有余，筆者在上海CBD樓下的咖啡廳還能聽到打工人談?wù)揷hatGPT的聲音；據(jù)媒體報(bào)道，也有部分企業(yè)將AIGC作為生產(chǎn)力工具。

正如阿里巴巴集團(tuán)董事會主席兼CEO、阿里云智能集團(tuán)CEO張勇所說：面向AI時代，所有產(chǎn)品都值得用大模型重做一次。

大廠、科研機(jī)構(gòu)和創(chuàng)業(yè)者，紛紛下場。

大廠有百度文心一言、華為盤古、360智腦、商湯日日新、阿里通義千問、京東靈犀、昆侖萬維天工等大模型先后登場，后續(xù)還有騰訊混元、科大訊飛星火等大模型排隊(duì)等著上線。

創(chuàng)業(yè)者也不乏名人，搜狗創(chuàng)始人王小川、美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場董事長李開復(fù)等人高調(diào)入場AI大模型。

持續(xù)了幾月有余的AI大模型熱，衍生出了兩條道路。

AI軍備競賽，大模型分化

AI大模型已經(jīng)進(jìn)入了競賽階段，并且路徑逐漸分化。

隨著AI大模型逐漸加熱，有媒體統(tǒng)計(jì)，2月初，東方財(cái)富上“ChatGPT”板塊還只有29只股票，如今已經(jīng)達(dá)到61支，數(shù)量還在不斷攀升中。據(jù)不完全統(tǒng)計(jì)，截至目前，我國已有超過40家公司、機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。

在其中，參與AI大模型這場“軍備競賽”的玩家們也發(fā)展出了兩個發(fā)展方向。垂直大模型和通用大模型，正成為目前人工智能領(lǐng)域的兩個主要發(fā)展方向。

垂直大模型是指針對特定領(lǐng)域或任務(wù)進(jìn)行優(yōu)化設(shè)計(jì)的模型，例如語音識別、自然語言處理、圖像分類等。

當(dāng)前有越來越多的企業(yè)加入垂直大模型的賽道。學(xué)而思宣布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā)，命名為MathGPT，面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu)；5月6日，淘云科技宣布推出兒童認(rèn)知大模型——阿爾法蛋兒童認(rèn)知大模型，為孩子在練表達(dá)、塑情商、啟創(chuàng)造、助學(xué)習(xí)等方面帶來全新交互體驗(yàn)。

通用大模型是指能夠處理多種任務(wù)和領(lǐng)域的模型，例如BERT、GPT等。

由于資金、人才等優(yōu)勢，大廠主要瞄準(zhǔn)通用大模型這個賽道。

大廠瞄準(zhǔn)通用大模型一方面是能夠?qū)I的能力與自身產(chǎn)品結(jié)合，比較有代表性的就是阿里、華為、百度等互聯(lián)網(wǎng)大廠和科技巨頭。

比如，繼微軟把GPT-4整合進(jìn)Office全家桶后，阿里“通義千問”也開始接入釘釘，用戶可以在文檔生成內(nèi)容，在視頻會議中能以參會者為單位，生成每個人的觀點(diǎn)和內(nèi)容。

像是百度的大模型也能結(jié)合自身業(yè)務(wù)，“文心一言”在對搜索引擎的迭代上能夠有質(zhì)的蛻變，能夠從用戶尋找答案，轉(zhuǎn)換為回答用戶問題，包括騰訊“混元”、網(wǎng)易“玉言”、京東“ChatJD”均能夠優(yōu)先應(yīng)用于自身產(chǎn)業(yè)。

另一方面，通用性大模型的適用性較廣，先跑贏者能夠建立起先發(fā)優(yōu)勢，成為AI2.0時代的領(lǐng)路人。畢竟，“跑得快的有肉吃，跑得慢的只能吃剩下的邊角料”，這個道理誰都懂。

垂直應(yīng)用大模型可謂是一股“清流”，由于垂直應(yīng)用大模型更符合垂類場景的需求、質(zhì)量比通用大模型更高，也讓眾多企業(yè)看到了其中的機(jī)會。比如深蘭、出門問問、有道等聚焦AI具體賽道的企業(yè)。

垂直大模型的發(fā)展主要體現(xiàn)在各個領(lǐng)域的模型性能持續(xù)提升，例如語音識別的錯誤率逐年下降，自然語言處理的語義理解能力不斷提升等。通用大模型則在多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)等方面取得了顯著進(jìn)展，已經(jīng)成為自然語言處理領(lǐng)域的重要研究方向。

比如，生物大模型能夠提高AI制藥效率。國外的研究報(bào)告顯示，ai可以將新藥研發(fā)的成功率提高16.7%，ai輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費(fèi)用，并在研發(fā)主要環(huán)節(jié)節(jié)約40%至60%的時間成本。根據(jù)英偉達(dá)公開資料，使用ai技術(shù)可使藥物早期發(fā)現(xiàn)所需時間縮短至三分之一，成本節(jié)省至兩百分之一。

在產(chǎn)業(yè)角度來看，通用模型就是“百科全書”，能夠有問必答，能夠適用不同的產(chǎn)業(yè)土壤，而垂直模型類似于單領(lǐng)域的專家，雖然專業(yè)，但受眾注定是少數(shù)人。

數(shù)據(jù)是致命傷

垂直大模型的優(yōu)勢在于不夠“大”：算力不夠大、算法難度低。

王小川在入局大模型賽道后，就一直強(qiáng)調(diào)未來發(fā)力的方向并不是像OpenAI一樣去做AGI（通用人工智能），而是垂直在某些特定的領(lǐng)域去做大模型，并實(shí)現(xiàn)落地應(yīng)用。

廣義上的大模型實(shí)際上是形容通用大模型，正如“大”模型之稱，大模型之所以“大”，就是因?yàn)閰?shù)眾多和數(shù)據(jù)量龐大，對算法、算力、數(shù)據(jù)存儲空間都有極大的要求，而這些不只是人才可以彌補(bǔ)的，還需要大量的資金。要知道，Open AI的成功也是微軟當(dāng)初用數(shù)十億美金堆出來的。巨大的資金需求，對大廠的研發(fā)決心也是一種考驗(yàn)。

過去5年，AI大模型的參數(shù)量幾乎每年提升一個數(shù)量級，例如GPT-4參數(shù)量是GPT-3的16倍，達(dá)到1.6萬億個；而隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入，大模型的數(shù)據(jù)量也在飛速膨脹。這意味著想要玩轉(zhuǎn)大模型，必須擁有大算力。

做垂直大模型的企業(yè)，對比大廠來說，資金、算力、數(shù)據(jù)較為匱乏，所以實(shí)際上和通用大模型玩家不在同一條起跑線上。

正如新能源車離不開電機(jī)、電池、電控這三大件，AI大模型則離不開算力、算法和數(shù)據(jù)的支持。

在算力、算法和數(shù)據(jù)中，數(shù)據(jù)是垂直大模型的難點(diǎn)。

三要素中，算法的研發(fā)難度相對較低，當(dāng)前的公司都有自己實(shí)現(xiàn)大模型的路徑算法，且有眾多開源項(xiàng)目可參考。

芯片決定算力，AI大模型整體需要較高性能的芯片完成對整體模型神經(jīng)網(wǎng)絡(luò)的訓(xùn)練建構(gòu)，而當(dāng)前的芯片自研較少，還是以外采為主，像當(dāng)前最適應(yīng)ChatGPT的芯片就來自英偉達(dá)的旗艦芯片H100和次旗艦芯片A100。

難點(diǎn)在于數(shù)據(jù)。高質(zhì)量的數(shù)據(jù)是助力AI訓(xùn)練與調(diào)優(yōu)的關(guān)鍵，足夠多、足夠豐富的數(shù)據(jù)，是生成式AI大模型的根基。

據(jù)OpenAI此前披露，僅ChatGPT3參數(shù)數(shù)量已達(dá)到1750億，訓(xùn)練資料達(dá)到45TB。

由于中國移動互聯(lián)網(wǎng)發(fā)展較為成熟，大量中文數(shù)據(jù)資源被存于各家企業(yè)或機(jī)構(gòu)里，較難共享。

“由于企業(yè)的很多業(yè)務(wù)數(shù)據(jù)、物流數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)等都是非常核心的私域數(shù)據(jù)，很難想象華星光電或者是中石油會把數(shù)據(jù)拿給人家去訓(xùn)練。”創(chuàng)新奇智CEO徐輝近日受證券時報(bào)采訪時也曾直言。

以AI制藥行業(yè)為例，生物大模型就面對被技術(shù)“卡脖子”的問題。藥物研發(fā)對高精度實(shí)驗(yàn)數(shù)據(jù)獲取成本較高，且公開數(shù)據(jù)庫中有大量無標(biāo)注數(shù)據(jù)，既要利用好大量無標(biāo)注數(shù)據(jù)，又要利用好少量高精度數(shù)據(jù)，所以對模型建構(gòu)提出了較高要求。

誰先賺到第一桶金？

無論何種模式，商業(yè)化都是核心問題。從目前擁有大模型的AI玩家來看，都在快速推進(jìn)賦能和商業(yè)化。

通用大模型和垂類大模型，雖走的路不同，但本質(zhì)還是“一家人”，處于同一個賽道中，所以避免不了競爭這個問題。

對于通用大模型而言，垂直大模型先落地，通用大模型的路會更窄。同樣，通用大模型先快速搶占市場后，業(yè)務(wù)線較窄的垂直大模型，要想賺錢就更為艱難。

在理想階段中，通用大模型無論是經(jīng)濟(jì)模型，還是普世價值，都是要優(yōu)于垂直大模型的�？墒�，現(xiàn)實(shí)生活不是烏托邦，通用大模型和垂類大模型誰跑得更快，還得看各企業(yè)之間的比拼。

從去年大熱的AIGC來看。相比在C端讓用戶以較低的門檻使用AI生成內(nèi)容，B端被部分市場人士認(rèn)為將是AIGC更主要的商業(yè)模式。

華為也更注重于自己的ToB業(yè)務(wù)。在發(fā)布會上，華為表示，華為盤古大模型主要以AI賦能產(chǎn)業(yè)，運(yùn)用在電力、金融、農(nóng)業(yè)等多個行業(yè)，其中CV大模型落地礦山，NLP大模型落地智能文檔檢索。

像是以搜索引擎為所長的百度，推出了類似GPT-3這樣具備搜索屬性的文心一言。

除了ChatGPT，實(shí)際上在AI大模型這陣風(fēng)吹起來之前就已有落地的場景了，這些“大”模型，實(shí)際以垂直大模型為主。

語言模型：如GPT、BERT等，主要應(yīng)用于自然語言處理領(lǐng)域，如機(jī)器翻譯、文本生成、情感分析等。

圖像模型：如ResNet、Inception等，主要應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域，如圖像分類、目標(biāo)檢測、圖像分割等。

推薦模型：如DNN、RNN等，主要應(yīng)用于推薦系統(tǒng)領(lǐng)域，如商品推薦、廣告推薦等。

聊天機(jī)器人：如Seq2Seq、Transformer等，主要應(yīng)用于智能客服、智能助手等場景。

金融風(fēng)控：如XGBoost、LightGBM等，主要應(yīng)用于銀行、證券等金融機(jī)構(gòu)的風(fēng)控場景，如信用評分、反欺詐等。

醫(yī)療影像診斷：如DeepLung、DeepLesion等，主要應(yīng)用于醫(yī)療影像診斷領(lǐng)域，如肺癌診斷、病理學(xué)分析等。

比起落地，更重要的是賺錢。

據(jù)國盛證券報(bào)告《ChatGPT 需要多少算力》估算，GPT-3 訓(xùn)練一次的成本約為 140 萬美元，對于一些更大的 LLM（大型語言模型），訓(xùn)練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT 在 1 月的獨(dú)立訪客平均數(shù) 1300 萬計(jì)算，其對應(yīng)芯片需求為 3 萬多片英偉達(dá)A100 GPU，初始投入成本約為 8 億美元，每日電費(fèi)在 5 萬美元左右。

通用大模型在落地場景更廣泛毋庸置疑，對于有底氣地通用大模型的玩家來說，商業(yè)化是其次，垂直類大模型，需要更快的商業(yè)化來兜底，所以垂直大模型的落地有更高的可能性和更快地普及速度。

誰能先形成絕對優(yōu)勢還沒有肯定的答案。AI大模型的這場“軍備競賽”，正如web1向web2的蝶變，企業(yè)爭分奪秒地向前跑，誰先抓住了機(jī)會，就抓住了市場。

* 圖片來源于網(wǎng)絡(luò)，侵權(quán)請聯(lián)系刪除

原文標(biāo)題 : 通用vs垂直，大模型進(jìn)入走近第一個賽點(diǎn)