segui久久综合精品,日本阿v网站在线,国产亚洲精品97在线观看

AI大模型內(nèi)卷加劇，商湯憑什么卷進來

2023-04-19 09:42

作者|小葳

出品|智能進化論

2023年，國內(nèi)大模型何其多。

目前，已宣布推出或即將推出大模型的國內(nèi)企業(yè)多達20余家，基本上能想到的相關(guān)企業(yè)都已入局。其中，既有資金雄厚的BAT、華為、字節(jié)等大廠，也有王慧文、王小川、周伯文等互聯(lián)網(wǎng)大佬領(lǐng)銜的初創(chuàng)企業(yè)，還有垂直領(lǐng)域的AI企業(yè)，比如商湯科技、科大訊飛等。

4月10日，商湯推出“日日新SenseNova”大模型體系，包括一系列生成式AI模型：大語言模型“商量”、文生圖AI平臺“秒畫”、AI數(shù)字人視頻生成平臺“如影”、3D內(nèi)容生產(chǎn)平臺“瓊宇”、“格物”，以及大模型數(shù)據(jù)標(biāo)注平臺“明眸”。

在大模型的輿論場上，商湯并不高調(diào)，而是直接搬出全套大模型產(chǎn)品，并迅速開放面向企業(yè)的試用通道。從發(fā)布會現(xiàn)場實時演示的效果看，商湯大模型的實力不容小覷。“一個專注CV的公司能在LLM上做出如此高成熟度產(chǎn)品，其開發(fā)團隊令人起敬。”一名知乎網(wǎng)友的觀點代表了一部分外界聲音。

同時，一些質(zhì)疑的聲音也出現(xiàn)了，比如有觀點認(rèn)為專注機器視覺賽道（CV）的獨角獸AI企業(yè)到底有沒有必要湊熱鬧搞大模型。畢竟大模型需要長期巨量燒錢，目前商業(yè)化模式有限，這會讓尚未盈利的AI企業(yè)面臨更大的虧損壓力。

那么，如何看待商湯進軍多模態(tài)大模型領(lǐng)域的布局？在日益擁擠的“中國版ChatGPT”競爭中，商湯又將走出怎樣與眾不同的生態(tài)位呢？

1 從大裝置到大模型，始終指向同一目標(biāo)

當(dāng)ChatGPT推動AI行業(yè)走過“iPhone時刻”，大模型的通用性已經(jīng)得到了成功驗證。

更重要的是，今年3月微軟發(fā)布的一篇論文指出，“GPT-4已經(jīng)可以被視為通用人工智能的一個早期的版本。”這一觀點也得到了相當(dāng)多專業(yè)人士的認(rèn)可。深度學(xué)習(xí)之父Geoffrey Hinton為代表的一些頂級科學(xué)家認(rèn)為，通用人工智能（AGI）不再遙不可及，而有可能在數(shù)十年內(nèi)逐步實現(xiàn)。

接下來，在大模型這一確定性的方向上，中外AI企業(yè)如何摸索出適合自己的道路，成為關(guān)鍵命題。

商湯對這個問題的答案是：堅定地走“大裝置+大模型”的道路。

了解商湯戰(zhàn)略的朋友會知道，商湯此時推出大模型并不是跟風(fēng)，而是自身在持續(xù)解決AI規(guī)�；涞氐缆飞系挠忠粋€關(guān)鍵節(jié)點。

此前，AI落地難的核心原因是一個場景一個模型的開發(fā)模式，導(dǎo)致落地成本高，模型復(fù)用率低，難以規(guī)�；瘶�(biāo)準(zhǔn)化。彼時，2020年問世的千億參數(shù)的GPT3已經(jīng)為大模型的通用性帶來一定突破。商湯的解法同理，向下層基礎(chǔ)設(shè)施扎根，希望用龐大的參數(shù)量×數(shù)據(jù)量跑出通用性。

2021年，商湯推出AI大裝置SenseCore，并在2022年完成重要擴建。AI大裝置可以理解為大算力基礎(chǔ)設(shè)施+大模型即服務(wù)（Model as a Service）。

目前AI大裝置構(gòu)建了27000塊GPU構(gòu)成的并行計算系統(tǒng)，實現(xiàn)了5.0exaFLOPS的算力輸出，是亞洲目前最大的智能計算平臺之一。商湯AI大裝置上的算力可以同步支持20個千億規(guī)模參數(shù)量的超大模型，并且以千卡規(guī)模來同時訓(xùn)練。

同時，AI大裝置還對外提供大模型即服務(wù)，包括自動化數(shù)據(jù)標(biāo)注、大模型并行訓(xùn)練、推理部署等等。目前AI大裝置最大的集群由4000塊芯片并聯(lián)組成，可以訓(xùn)練參數(shù)量超5000億的稠密模型，今年的目標(biāo)是能夠訓(xùn)練超過萬億參數(shù)的大模型。

投入這么大，AI大裝置的應(yīng)用情況如何呢？

2022年，商湯將AI大裝置的能力向行業(yè)客戶開放，通過提供高性能計算資源、豐富的預(yù)訓(xùn)練模型庫、易用的開發(fā)工具和專業(yè)技術(shù)支持，幫助客戶高效訓(xùn)練大模型。目前已經(jīng)有超過10個大模型研發(fā)任務(wù)得以實現(xiàn)，涵蓋了視覺、語言、多模態(tài)等領(lǐng)域的用戶自定義大模型開發(fā)。

面向企業(yè)開放后，AI大裝置已經(jīng)有了規(guī)模化的營收。根據(jù)商湯2022年年報，2022年AI大裝置對外服務(wù)產(chǎn)生的收入占比智慧商業(yè)（商湯四大業(yè)務(wù)板塊之一）整體收入超20%。按照2022年智慧商業(yè)收入14.64億元計算，AI大裝置已經(jīng)為商湯帶來近3億元營收。

看到這里你也許有些明白了，商湯并不是從零開始構(gòu)建大模型的。之所以能在短期內(nèi)迅速推出多種類型的大模型，離不開AI大裝置這個根基。而且實際上，商湯在大模型領(lǐng)域的布局要早于AI大裝置。

在最擅長的CV領(lǐng)域，2019年商湯就發(fā)布了10億參數(shù)的視覺大模型。2022年，商湯的視覺大模型已經(jīng)進化到了320億參數(shù)，也是世界上迄今為止最大的視覺模型。

自2021年起，商湯科技開始自研NLP大模型和多模態(tài)模型。在NLP領(lǐng)域，商湯的大語言模型達到了千億參數(shù)級別。

在多模態(tài)領(lǐng)域， 2022年3月，商湯科技聯(lián)合上海人工智能實驗室、清華大學(xué)、香港中文大學(xué)、上海交通大學(xué)發(fā)布了多模態(tài)多任務(wù)通用大模型“書生（INTERN）”，擁有30億參數(shù)。書生大模型已經(jīng)在通用視覺開源平臺OpenGVLab開源，是目前開源模型社區(qū)性能最強的多模態(tài)大模型。

在AIGC領(lǐng)域，商湯推出10億參數(shù)的AIGC模型，能夠支持文生圖和圖生圖的各種功能。曾在星際爭霸的比賽中超越DeepMind的AlphaStar的商湯決策智能模型，未來也將融入到多模態(tài)大模型中。

“未來商湯的通用人工智能大模型體系會覆蓋視覺感知、語言理解、內(nèi)容生成和推理決策四大方面。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。

目前，商湯的大模型已在在智慧城市、智慧商業(yè)、智能汽車和智慧生活四大板塊20多個場景實現(xiàn)了落地交付。比如，在自動駕駛領(lǐng)域，商湯在視覺大模型領(lǐng)域研發(fā)的BEVFormer++感知算法以絕對優(yōu)勢贏得了2022年Waymo挑戰(zhàn)賽主賽道冠軍。

綜上，商湯做大模型的目標(biāo)不是去搶奪面向個人用戶的“中國版ChatGPT”的噱頭，而是用“大裝置+大模型”加速AI商業(yè)化落地。

2 “日日新”的雙重驅(qū)動力

“AGI催生了新的研究范式，即基于一個強大的多模態(tài)基模型，通過強化學(xué)習(xí)和人類反饋不斷解鎖基模型新的能力，從而更高效地解決海量的開放式任務(wù)。AGI將實現(xiàn)從‘數(shù)據(jù)飛輪’到‘智慧飛輪’的演進，最終邁向人機共智。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。

具體到商湯“日日新”大模型，「智能進化論」認(rèn)為，其對于商湯而言至少有兩大方面的驅(qū)動力：

第一重驅(qū)動，通過豐富的AIGC大模型向外賦能，包括通過開放API的形式，降低各行各業(yè)應(yīng)用大模型的門檻；

目前商湯“日日新”系列大模型僅面向企業(yè)用戶開放試用。不過，從發(fā)布會實時演示來看，“日日新”大模型給人的初步印象是：整體能力全面，相當(dāng)于沒有“掛科”，而且在數(shù)字人視頻生成、3D內(nèi)容生成等方面令人驚艷，超出預(yù)期。

商湯版ChatGPT大語言模型“商量”，其多輪對話表現(xiàn)流暢，并有兩個細(xì)分領(lǐng)域的優(yōu)勢：問診與編程。編程助手可幫助開發(fā)者更高效地編寫和調(diào)試代碼；在健康咨詢方面，“商量”相當(dāng)于一個AI版的全科醫(yī)院分診臺，類似什么癥狀應(yīng)該看什么科室，可以為用戶提供個性化的醫(yī)療建議。此外，“商量”可以直接讀取PDF文件提取關(guān)鍵信息的功能也非常實用。

“秒畫SenseMirage”文生圖創(chuàng)作平臺，可支持6K高清圖的生成，還支持用戶自定義訓(xùn)練生成模型。

“如影SenseAvatar”AI數(shù)字人視頻生成平臺，僅需一段5分鐘的真人視頻素材，就可以生成出來聲音及動作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身，這將極大降低電商直播、在線教育等高頻應(yīng)用場景的人力成本。

“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺，可以高效低成本生成大規(guī)模三維場景和精細(xì)化的物件，能夠為元宇宙等虛實結(jié)合場景提供高品質(zhì)低成本的構(gòu)建技術(shù)。

第二重驅(qū)動，強化商湯已有的在CV、視覺感知領(lǐng)域的優(yōu)勢，加速AI技術(shù)落地。

在智能駕駛領(lǐng)域，基于視覺大模型，商湯開發(fā)了用于自動駕駛的BEV（Bird Eye View）感知算法，在Waymo挑戰(zhàn)賽上以絕對優(yōu)勢取得了冠軍�；诖怂惴�，商湯開發(fā)了業(yè)界首個感知決策一體化的端到端自動駕駛解決方案UniAD，可以為自動駕駛多模態(tài)模型帶來更強的環(huán)境、行為、動機解碼能力。

據(jù)悉，“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務(wù)，包括圖片生成，自然語言生成，視覺感知通用任務(wù)與標(biāo)注服務(wù)。通過調(diào)用API接口，企業(yè)用戶可以根據(jù)基模型進行微調(diào)，低門檻、低成本、高效率地實現(xiàn)各類AI應(yīng)用。

3 從單點到平臺，轉(zhuǎn)型加速時

值得注意的是，在堅定投身“大裝置+大模型”路線之時，商湯自身也處在業(yè)務(wù)結(jié)構(gòu)轉(zhuǎn)型的關(guān)鍵時期。

目前，商湯的業(yè)務(wù)邊界早已不局限于CV領(lǐng)域，而是正在成為一家通用AI基礎(chǔ)平臺公司。而且在此過程中，“大裝置+大模型”沒有削弱CV領(lǐng)域原本的優(yōu)勢，反而是增強了。

從商湯對AI大裝置的定位“AGI時代基礎(chǔ)設(shè)施的領(lǐng)導(dǎo)者”，可以看出，昔日CV四小龍之首的商湯已今非昔比。對于行業(yè)邊界的突破，此前商湯科技董事長兼CEO 徐立曾經(jīng)這樣對媒體表示，“當(dāng)我們實現(xiàn)了從物理世界與數(shù)字世界的融合，AI就變成了基礎(chǔ)設(shè)施，人人都可以用，也就不用區(qū)分行業(yè)了。”

不過，業(yè)務(wù)結(jié)構(gòu)的變化是轉(zhuǎn)型更有力的證明。透過2022年年報，商湯的四大核心業(yè)務(wù)呈現(xiàn)“兩升兩降”的明顯改變。其中，智慧城市、智慧商業(yè)兩大板塊業(yè)務(wù)收入下滑，智慧生活、智慧汽車兩大新興業(yè)務(wù)大幅增長，顯示出業(yè)務(wù)結(jié)構(gòu)更加多元健康發(fā)展的態(tài)勢。

比如，2022年智慧生活業(yè)務(wù)收入同比增長129.9%，創(chuàng)歷史新高，占總收入比重從2021年的8.8%提升至25.1%。智慧生活業(yè)務(wù)涵蓋了AI內(nèi)容生成（AIGC）、AI傳感器、AI ISP芯片、智慧醫(yī)療等多個產(chǎn)品線，均實現(xiàn)了商業(yè)化突破。2022年智能汽車業(yè)務(wù)收入同比增長58.9%，占總收入比重從2021年的3.9%上升至7.7%。

“日日新來自《禮記·大學(xué)》，湯之盤銘曰‘茍日新、日日新、又日新’。也就是每天都要新，而且新的要更新。這代表人工智能大模型，在以周為單位的數(shù)據(jù)輸入上，可以日日更新，能力日日增強。”徐立在發(fā)布會上這樣解釋日日新的來歷。

2023年是國內(nèi)AI大模型的爆發(fā)元年，站在當(dāng)下的時間節(jié)點，我們可能很難預(yù)測未來AI大模型領(lǐng)域的市場格局是寡頭壟斷還是百花齊放。

因為，這是一場長期的、全方位的比拼，考驗著每一位入局者的資金儲備、戰(zhàn)略意志、技術(shù)能力等核心實力。

也許，每一位玩家無需也不可能做到大而全，集中資源聚焦最有差異化優(yōu)勢的大模型，才是突圍之道。

文中圖片來自攝圖網(wǎng)

END

本文為「智能進化論」原創(chuàng)作品，

歡迎關(guān)注。

原文標(biāo)題 : AI大模型內(nèi)卷加劇，商湯憑什么卷進來