訂閱
糾錯(cuò)
加入自媒體

大模型2.0時(shí)代的優(yōu)化與突破

作者

車行運(yùn)

大模型可以讓無(wú)人駕駛更智能

今年6月份,各大廠商紛紛升級(jí)自家的類ChatGPT產(chǎn)品。6月9日,訊飛推出星火認(rèn)知大模型升級(jí)版;6月13日,360在發(fā)布類ChatGPT產(chǎn)品之后,再次舉行360智腦大模型應(yīng)用發(fā)布會(huì)。

與2月左右發(fā)布的大模型不同,近期各家公司發(fā)布的升級(jí)版產(chǎn)品,更偏向應(yīng)用層目的是更容易走向千家萬(wàn)戶。

從目前發(fā)布的情況來(lái)看,360智腦已初步具備跨模態(tài)?成能?,除了可以完成文字生成文字、表格、圖片;圖片生成文字、圖片,以及視頻生成文本,文本剪視頻等基礎(chǔ)創(chuàng)作之外,還重新定義“數(shù)字人”,給用戶一種“有靈魂、有?設(shè)、有記憶”可定制的專屬“人工智能”。            

目前360智腦與用戶距離最近的應(yīng)用場(chǎng)景,是360現(xiàn)有的全家桶,周鴻祎在發(fā)布會(huì)表示,“360智腦4.0”會(huì)接入360安全衛(wèi)?、360瀏覽器、360搜索等,試圖重塑人機(jī)協(xié)作。

在發(fā)布會(huì)上,周鴻祎更改了此前觀點(diǎn),“我曾經(jīng)說(shuō)過(guò),國(guó)產(chǎn)大模型與ChatGPT之間的差距是兩年,現(xiàn)在我想收回這句話。”隨后補(bǔ)充最新觀點(diǎn),認(rèn)為目前國(guó)產(chǎn)大模型的水平與GPT3.5大打平,照此速度發(fā)展,追趕甚至超過(guò)GPT4將在轉(zhuǎn)瞬之間。

從發(fā)布初始版本至正式發(fā)布360智腦的四個(gè)月內(nèi),周鴻祎看到了會(huì)有如此巨大的轉(zhuǎn)變?

科技大廠圍獵大模型

在2023中關(guān)村論壇上發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,當(dāng)前,中國(guó)人工智能大模型正呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)。據(jù)不完全統(tǒng)計(jì),截至目前,參數(shù)在10億規(guī)模以上的大模型全國(guó)已發(fā)布了79個(gè)。

而科技大廠的大模型參數(shù)量較大:阿里通義千問(wèn)大模型參數(shù)在10萬(wàn)億級(jí)以上、騰訊混元大模型華為盤古大模型參數(shù)量均在萬(wàn)億級(jí)以上、百度文心一言大模型參數(shù)量在2千億級(jí)以上、京東言犀大模型的參數(shù)量為千億級(jí);垂直行業(yè)科技企業(yè)已經(jīng)上線的參數(shù)量普遍在千億級(jí)以上;而科研院校大模型的參數(shù)量在千億級(jí)及以下。

從大模型的布局體系來(lái)看,科技大廠在算力層、平臺(tái)層、模型層、應(yīng)用層進(jìn)行了四位一體的全面布局。百度、阿里、華為三家均從芯片到應(yīng)用進(jìn)行自主研發(fā)的全面布局,如百度的“昆侖芯+飛槳平臺(tái)+文心大模型+行業(yè)應(yīng)用”、阿里的“含光800芯片+M6-OFA底座+通義大模型+行業(yè)應(yīng)用”、華為的“昇騰芯片+MindSpore框架+盤古大模型+行業(yè)應(yīng)用”。

此外金山辦公5月31日還發(fā)布了WPS AI,目前,WPSAI已接入金山辦公旗下辦公組件輕文檔、文字、表格、演示、PDF,未來(lái)將錨定AIGC、閱讀理解和問(wèn)答、人機(jī)交互三個(gè)戰(zhàn)略方向發(fā)展,并接入金山辦公全線產(chǎn)品。

各家大廠迅速涌入這個(gè)賽道,主要是因?yàn)楸O(jiān)管層迅速跟進(jìn)出臺(tái)措施規(guī)范行業(yè)發(fā)展,有頂層架構(gòu)保駕護(hù)航,各家大廠自然可以放心投入研發(fā),并推出產(chǎn)品。

自今年3月大模型批量上線以來(lái),AI監(jiān)管政策逐漸明晰,這也給行業(yè)應(yīng)用指明了方向。

回顧整個(gè)行業(yè)發(fā)展歷程,4月11日,《生成式人工智能服務(wù)管理方法》征求意見(jiàn)稿發(fā)布;5 月 30 日,信通院正在聯(lián)合編制“紙鳶”開(kāi)放人工智能模型許可證,下一步將發(fā)布《紙鳶開(kāi)放人工智能模型許可證(征求意見(jiàn)稿)》。

隨后,一線城市配合發(fā)布了《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025 年)》;《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2023-2024 年)》。

在此背景下,周鴻祎認(rèn)為國(guó)產(chǎn)大模型將會(huì)迅速縮小和ChatGPT的差距,似乎也好理解了。

360智腦有何不同

按照周鴻祎的規(guī)劃,360大模型將在持續(xù)升級(jí)大模型的基礎(chǔ)上,兼顧場(chǎng)景化、產(chǎn)品化、平?化、垂直化。

這種發(fā)展戰(zhàn)略下,360智腦可以實(shí)現(xiàn)對(duì)消費(fèi)者(?戶個(gè)?AI助理)、中?微企業(yè)(SaaS化垂直應(yīng)?)、企業(yè)/政府/城市(私有化部署?模型)、?業(yè)(?業(yè)垂直?模型)等四個(gè)主要應(yīng)用場(chǎng)景的覆蓋。

上述四種不同場(chǎng)景的應(yīng)用,主要通過(guò)其他公司在360大模型API基礎(chǔ)上,結(jié)合不同行業(yè)需求推出特定產(chǎn)品。現(xiàn)階段,很多部門、企業(yè)內(nèi)部擁有大量獨(dú)占性IP,如果將其統(tǒng)統(tǒng)放到一個(gè)公開(kāi)大模型中,就會(huì)重現(xiàn)三星因GPT泄露芯片機(jī)密的事件,這就凸顯了專有類GPT產(chǎn)品的重要性。

想要更好滿足上述不同場(chǎng)景的需求,通用大模型需要在現(xiàn)有基礎(chǔ)上,完成從輸入文字輸出文字,到看懂圖像、視頻,并能產(chǎn)出圖像、視頻的轉(zhuǎn)變,相當(dāng)于讓大模型具備了“耳朵”和“眼睛”,為創(chuàng)建“數(shù)字人”打下基礎(chǔ)。

傳統(tǒng)數(shù)字人只需要按照既定腳本輸出,但在大模型時(shí)代,360的數(shù)字人可定制,因此?設(shè)、有記憶、有經(jīng)歷,目前在360數(shù)字??場(chǎng)平臺(tái)中,已經(jīng)有200多個(gè)??,分為數(shù)字名?和數(shù)字員?兩個(gè)種類。360希望未來(lái)可以讓每個(gè)?都有自己的AI助理,并有機(jī)會(huì)在虛擬空間內(nèi),跨越時(shí)空,和古人交流。

在演示會(huì)上,周鴻祎問(wèn)“諸葛亮”怎么看今天成為鬼畜素材,數(shù)字人以諸葛亮的口吻回復(fù):夫古今之命,乃實(shí)事所必然也。今之時(shí)勢(shì),天下紛擾不已。吾雖已老,仍志在天下。今者年輕人以吾為鬼畜素材,吾欣然接受此變化。并祝愿年輕朋友在未來(lái)的道路上勇往直前,開(kāi)創(chuàng)更加美好的未來(lái)。

同時(shí)周鴻祎還強(qiáng)調(diào),未來(lái)數(shù)字人的形態(tài)還會(huì)有??的?標(biāo)、規(guī)劃和分解的能?,從而可以調(diào)?各種垂直的模型完成任務(wù)。

不過(guò)這些功能其實(shí)都是在現(xiàn)有大模型應(yīng)用基礎(chǔ)上的優(yōu)化,并沒(méi)有開(kāi)辟一個(gè)全新的領(lǐng)域。但實(shí)際上,當(dāng)大模型取得突破后,最具創(chuàng)造性的應(yīng)用場(chǎng)景是無(wú)人駕駛。

無(wú)人駕駛有機(jī)會(huì)駛?cè)肟燔嚨?/strong>

回顧無(wú)人駕駛領(lǐng)域,自從2016年開(kāi)始,各大廠商都在布局這個(gè)領(lǐng)域,但是直到今年也沒(méi)有一家可以實(shí)現(xiàn)真正的無(wú)人駕駛。

目前一輛L2+級(jí)別的無(wú)人駕駛系統(tǒng)需要10+顆攝像頭;1-2顆激光雷達(dá);或3-5顆毫米波雷達(dá)提供的多維度數(shù)據(jù),人工標(biāo)注數(shù)據(jù)之后才能用于模型的訓(xùn)練。在可識(shí)別影像的大模型出現(xiàn)之后,人工標(biāo)注所需要的時(shí)間成本和物質(zhì)支出將會(huì)驟然下降。

據(jù)2023年4月毫末智行DriveGPT發(fā)布會(huì)顯示,目前要得到對(duì)諸如車道線、交通參與者、紅綠燈等信息,行業(yè)人工標(biāo)注的成本約每張圖為5元,毫末DriveGPT的成本為0.5元。我們認(rèn)為科技公司大模型訓(xùn)練成熟后,單張圖自動(dòng)標(biāo)注的邊際成本趨近于0,平均成本有望進(jìn)一步下降。

據(jù)愷望數(shù)據(jù)產(chǎn)品項(xiàng)目副總裁張鵬在2023年2月的介紹,目前數(shù)據(jù)標(biāo)注以人工標(biāo)注為主,機(jī)器標(biāo)注為輔,95%的數(shù)據(jù)標(biāo)注還是以人工為主。大模型的介入,可以極大地提升這個(gè)行業(yè)的效率。以特斯拉為例,2021年人工標(biāo)注團(tuán)隊(duì)為1000多人,2022年該團(tuán)隊(duì)裁員200余人。

除此之外,大模型時(shí)代,第三方科技巨頭有望通過(guò)提供完善的工具鏈,幫助整車廠構(gòu)建自己的自動(dòng)駕駛算法和數(shù)據(jù)閉環(huán)系統(tǒng),同時(shí)依靠大模型的數(shù)據(jù)生成能力縮小在數(shù)據(jù)領(lǐng)域的差距,自動(dòng)駕駛的安卓時(shí)代有望來(lái)臨。

目前,大模型已經(jīng)被用于賦能數(shù)據(jù)閉環(huán)、仿真、感知算法、規(guī)控算法等領(lǐng)域。而巨頭如微軟、英偉達(dá)在大模型和自動(dòng)駕駛爭(zhēng)相布局,或?qū)⒉脸鲂碌幕鸹ā?/p>

此外大模型的出現(xiàn)也促進(jìn)行業(yè)分工,避免“重復(fù)造輪子”,同時(shí)加速傳感器和芯片迭代,系統(tǒng)成本有望大幅下降。大模型開(kāi)發(fā)者和自動(dòng)駕駛產(chǎn)業(yè)鏈玩家有望全面受益。

百度Apollo為例,其首先利用圖文信息預(yù)訓(xùn)練一個(gè)原始模型,利用算法將街景圖像數(shù)據(jù)進(jìn)行物體識(shí)別并定位和分割,放入編碼器形成底庫(kù),即基于街景建立一個(gè)圖片和文字信息對(duì)應(yīng)的數(shù)據(jù)池。

其次可以通過(guò)文本、圖像等形式對(duì)特定的場(chǎng)景(如快遞車、輪椅、小孩等)進(jìn)行搜索和挖掘,對(duì)車端模型進(jìn)行定制化的訓(xùn)練,大幅提升存量數(shù)據(jù)的利用效果。

百度用半監(jiān)督方法,充分利用2D和3D數(shù)據(jù)訓(xùn)練一個(gè)感知大模型。通過(guò)在多個(gè)環(huán)節(jié)對(duì)小模型進(jìn)行蒸餾,提升小模型的性能,同時(shí)通過(guò)自動(dòng)標(biāo)注給小模型定制化的訓(xùn)練,用來(lái)增強(qiáng)遠(yuǎn)距離視覺(jué)3D感知能力、提升多模態(tài)感知模型的感知效果。

另一家頭部玩家商湯科技也曾公開(kāi)表示,可以用AIGC生成真實(shí)的交通場(chǎng)景以及困難樣本來(lái)訓(xùn)練自動(dòng)駕駛系統(tǒng),以多模態(tài)數(shù)據(jù)作為大模型的輸入,提升系統(tǒng)對(duì)Cornercase場(chǎng)景的感知能力上限。

同時(shí)自動(dòng)駕駛多模態(tài)大模型可做到感知決策一體化集成,在輸出端通過(guò)環(huán)境解碼器可對(duì)3D環(huán)境進(jìn)行重建,實(shí)現(xiàn)環(huán)境可視化理解;行為解碼器可生成完整的路徑規(guī)劃;動(dòng)機(jī)解碼器可用自然語(yǔ)言對(duì)推理過(guò)程進(jìn)行描述,使自動(dòng)駕駛系統(tǒng)變得更加安全可靠。

大模型實(shí)現(xiàn)上述功能后,未來(lái)無(wú)人駕駛門檻會(huì)越來(lái)越低,頭部廠商加速無(wú)人駕駛項(xiàng)目進(jìn)程的同時(shí),還可以讓更多新玩家加入這個(gè)領(lǐng)域,并開(kāi)拓除道路導(dǎo)航外,需要道路規(guī)劃功能的賽道,比如進(jìn)一步優(yōu)化掃地機(jī)器人的路徑規(guī)劃。

現(xiàn)在看,在經(jīng)歷二月至三月的大模型集中發(fā)布期、四月至五月的產(chǎn)品研發(fā)期和政策方向逐步明確后,六月已經(jīng)進(jìn)入AI大模型產(chǎn)品和應(yīng)用有望迎來(lái)集中發(fā)布期,這也直接導(dǎo)致OpenAIAPI降價(jià)。

在可預(yù)期的未來(lái),AI技術(shù)仍然在持續(xù)迭代,應(yīng)用也在持續(xù)推進(jìn),同時(shí)越來(lái)越多科技大廠推出產(chǎn)品切入這個(gè)賽道,還將繼續(xù)助推行業(yè)景氣度上升,并給用戶帶來(lái)更貼合市場(chǎng)需求的類GPT產(chǎn)品,比如擁有龐大用戶群的騰訊6月19日也發(fā)布了大模型領(lǐng)域的技術(shù)方案。

當(dāng)這些從業(yè)企業(yè)一起卷的時(shí)候,行業(yè)發(fā)展進(jìn)入快車道的同時(shí),也意味著C端用戶將會(huì)很快就能用上這個(gè)產(chǎn)品,至于會(huì)為誰(shuí)付款,就需要各家廠商自憑本事了。

         

© THE END

本文僅作為分享學(xué)習(xí)使用,不構(gòu)成任何投資建議。

本文由貝克街探案官原創(chuàng),未經(jīng)許可,請(qǐng)勿轉(zhuǎn)載。

       原文標(biāo)題 : 大模型2.0時(shí)代的優(yōu)化與突破

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)