訂閱
糾錯(cuò)
加入自媒體

從谷歌推出Gecko到高通引入Llama 2,端側(cè)部署成為L(zhǎng)LM落地重要方向

2023-09-01 11:32
王吉偉
關(guān)注

▲ 圖片由AI生成

LLM強(qiáng)勢(shì)挺進(jìn)端側(cè),AI大語(yǔ)言模型端側(cè)部署如何影響超自動(dòng)化?

端側(cè)部署對(duì)大語(yǔ)言模型落地有什么好處?對(duì)超自動(dòng)化有什么影響?

產(chǎn)業(yè)上下游齊發(fā)力LLM挺進(jìn)端側(cè),大語(yǔ)言模型加速落地利好超自動(dòng)化

芯片、云服務(wù)、終端廠商齊發(fā)力,LLM決勝端側(cè),超自動(dòng)化受益其中

從谷歌推出Gecko到高通引入Llama 2,端側(cè)部署成為L(zhǎng)LM落地重要方向

大語(yǔ)言模型端側(cè)部署+LLM超自動(dòng)化,“賈維斯”智能管家照進(jìn)現(xiàn)實(shí)  

文/王吉偉

算力資源吃緊,成本居高不下,數(shù)據(jù)隱私泄露,用戶(hù)體驗(yàn)不佳……

以O(shè)penAI為代表的大語(yǔ)言模型爆發(fā)后,多重因素影響之下本地化部署成為L(zhǎng)LM落地的主流模式。LLM迫切需要部署在本地設(shè)備上,圍繞LLM端側(cè)部署的研究與探索空前高漲。

5月份,Google推出了可以在旗艦手機(jī)上離線(xiàn)運(yùn)行的PaLM2 輕量版Gecko。

從這一刻起,能夠在端側(cè)運(yùn)行的大語(yǔ)言模型成了廠商們的重要任務(wù)。畢竟LLM要落地,移動(dòng)終端是最好的載體之一,同時(shí)端側(cè)也有著巨大的市場(chǎng)空間。

于是,廠商們紛紛開(kāi)啟狂飆模式,踏上LLM的壓縮、蒸餾及優(yōu)化之路,要把自家的云端大模型先行裝進(jìn)手機(jī)。

也就是在此期間,高通提出了混合AI概念:AI處理必須分布在云端和終端進(jìn)行,才能實(shí)現(xiàn)AI的規(guī)模化擴(kuò)展并發(fā)揮其最大潛能。

端側(cè)的市場(chǎng)規(guī)模,加上混合AI趨勢(shì),就連微軟也與Meta結(jié)盟共同推出了可以部署在端側(cè)的開(kāi)源大語(yǔ)言模型Llama 2。

被稱(chēng)為“GPT-4最強(qiáng)平替”的Llama 2,可以讓開(kāi)發(fā)者以很低的成本為客戶(hù)提供自主大模型,將為開(kāi)發(fā)者們帶來(lái)更多可能性和創(chuàng)新機(jī)遇。

由此開(kāi)始,各家芯片廠商全力研發(fā)能夠適配各種大模型的芯片、技術(shù)以及解決方案。

雖然能夠支持LLM本地運(yùn)行的芯片還沒(méi)有量產(chǎn),但高通在世界人工智能大會(huì)期間于手機(jī)端使用SD十幾秒生成一張圖片的演示,迅速吸引多方眼球。

高通計(jì)劃2024年開(kāi)始在搭載驍龍平臺(tái)的終端上支持基于Llama 2的AI部署,聯(lián)發(fā)將在下半年發(fā)布的下一代旗艦SoC也將支持AI部署。

端側(cè)部署芯片蓄勢(shì)待發(fā),智能終端廠商披星戴月。

尤其是手機(jī)廠商,都在全力進(jìn)行面向LLM的研發(fā)與測(cè)試,目前基本都已發(fā)布基于云端的自有大語(yǔ)言模型,更想全力爭(zhēng)奪LLM端側(cè)部署的先發(fā)時(shí)刻。

產(chǎn)業(yè)鏈上下游雨點(diǎn)般的密集動(dòng)作,彰顯LLM正在快速挺進(jìn)端側(cè)。

關(guān)注王吉偉頻道的朋友知道,LLM也正在與超自動(dòng)化高速融合,并為超自動(dòng)帶來(lái)了從技術(shù)架構(gòu)到產(chǎn)品生態(tài)再到經(jīng)營(yíng)模式的轉(zhuǎn)變。

過(guò)去的LLM都在云端部署,就已為超自動(dòng)化帶來(lái)了這么大變化,F(xiàn)在LLM即將實(shí)現(xiàn)端側(cè)部署,又將為超自動(dòng)化帶來(lái)哪些影響?

本文,王吉偉頻道就跟大家聊聊這些。

手機(jī)廠商推出大模型

7月下旬,外媒爆料蘋(píng)果公司正在悄悄開(kāi)發(fā)人工智能工具,且已建立了自己的框架“Ajax”來(lái)創(chuàng)建大型語(yǔ)言模型。以“Ajax”為基礎(chǔ),蘋(píng)果還創(chuàng)建了一項(xiàng)聊天機(jī)器人服務(wù),內(nèi)部一些工程師將其稱(chēng)為“Apple GPT”。

一個(gè)月后,蘋(píng)果開(kāi)始全面招聘工程師和研究人員以壓縮LLM,使其能在iPhone和iPad上高效運(yùn)行。這一舉措標(biāo)志著蘋(píng)果公司正積極推動(dòng)人工智能的發(fā)展,并希望成為首批開(kāi)發(fā)出能在手機(jī)和設(shè)備上而非云端有效運(yùn)行的人工智能軟件的公司之一。

8月初,華為在HDC 2023 開(kāi)發(fā)者大會(huì)上表示手機(jī)小藝語(yǔ)音助手已升級(jí)支持大語(yǔ)言模型,可以像目前火熱的 AI 聊天機(jī)器人那樣輔助辦公和學(xué)習(xí)。

同時(shí)華為在發(fā)布HarmonyOS 4時(shí),也宣布已將AI大模型能力內(nèi)置在了系統(tǒng)底層。HarmonyOS 4由華為盤(pán)古大模型提供底層支持,希望給用戶(hù)帶來(lái)智慧終端交互、高階生產(chǎn)力效率、個(gè)性化服務(wù)的全新AI體驗(yàn)變革。

小米公司此前并未“官宣”進(jìn)入LLM賽道,但其大語(yǔ)言大模型MiLM-6B已經(jīng)悄然現(xiàn)身 C-Eval、CMMLU 大模型評(píng)測(cè)榜單。截至當(dāng)前,小米大模型在C-Eval總榜單排名第10、同參數(shù)量級(jí)排名第1。

在8月14日晚舉辦的小米年度演講中,雷軍表示小米AI大模型最新一個(gè)13億參數(shù)大模型已經(jīng)成功在手機(jī)本地跑通,部分場(chǎng)景可以媲美60億參數(shù)模型在云端運(yùn)行結(jié)果。小米旗下人工智能助手小愛(ài)同學(xué)已開(kāi)始升級(jí)AI大模型能力,在發(fā)布會(huì)當(dāng)天開(kāi)啟邀請(qǐng)測(cè)試。

OPPO已在8月13日宣布,基于AndesGPT打造的全新小布助手即將開(kāi)啟大型體驗(yàn)活動(dòng)。升級(jí)后的小布助手將具備AI大模型能力,擁有更強(qiáng)的語(yǔ)義理解對(duì)話(huà)能力,可以根據(jù)需求的文案撰寫(xiě)用戶(hù)需要的內(nèi)容,歸納總結(jié)等AI能力也將大大增強(qiáng)。

AndesGPT是OPPO 安第斯智能云團(tuán)隊(duì)打造的基于混合云架構(gòu)的生成式大語(yǔ)言模型。該團(tuán)隊(duì)在兩年前開(kāi)始對(duì)預(yù)訓(xùn)練語(yǔ)言模型進(jìn)行探索和落地應(yīng)用,自研了一億、三億和十億參數(shù)量的大模型OBERT。OBERT曾一度躍居中文語(yǔ)言理解測(cè)評(píng)基準(zhǔn)CLUE1.1總榜第五名,大規(guī)模知識(shí)圖譜問(wèn)答KgCLUE1.0排行榜第一名。

vivo也在今年5月研發(fā)了面向自然語(yǔ)言理解任務(wù)的文本預(yù)訓(xùn)練模型3MP-Text,曾一舉奪得 CLUE 榜單(中文語(yǔ)言理解基準(zhǔn)測(cè)評(píng))1億參數(shù)模型效果排名第一。有消息透露,vivo將在今年10月左右推出新的OriginOS 4.0系統(tǒng),新系統(tǒng)將內(nèi)置AI大模型。

榮耀是最早布局AI的手機(jī)廠商之一,其AI能力的進(jìn)階主要分為三個(gè)階段:第一階段是從0到1提出概念,將需求場(chǎng)景化,比如相機(jī)可以直接識(shí)別綠植、天空,AI能夠?qū)D像進(jìn)行對(duì)應(yīng)的優(yōu)化;第二階段,AI有了上下文理解與學(xué)習(xí),基于位置、時(shí)間對(duì)消費(fèi)者習(xí)慣進(jìn)行整合式機(jī)器的決策;第三階段就是把AI引入端側(cè)。

榮耀也曾公開(kāi)對(duì)外表示,將率先將 AI 大模型引入端側(cè)。

芯片廠商的LLM動(dòng)作

高通是LLM端側(cè)部署的堅(jiān)定推動(dòng)者。

6月初,高通發(fā)布了《混合AI是AI的未來(lái)》白皮書(shū)。高通認(rèn)為,隨著生成式 AI正以前所未有的速度發(fā)展以及計(jì)算需求的日益增長(zhǎng),AI 處理必須分布在云端和終端進(jìn)行,才能實(shí)現(xiàn)AI 的規(guī);瘮U(kuò)展并發(fā)揮其最大潛能。

云端和邊緣終端如智能手機(jī)、汽車(chē)、個(gè)人電腦和物聯(lián)網(wǎng)終端協(xié)同工作,能夠?qū)崿F(xiàn)更強(qiáng)大、更高效且高度優(yōu)化的 AI,混合AI將支持生成式AI應(yīng)用開(kāi)發(fā)者和提供商利用邊緣側(cè)終端的計(jì)算能力降低成本,因此混合AI才是AI的未來(lái)。(后臺(tái)發(fā)消息 混合 ,獲取該白皮書(shū))。在今年的世界人工智能大會(huì)上,高通展示了在終端側(cè)運(yùn)行生成式AI模型Stable Diffusion的技術(shù)演示,和終端側(cè)語(yǔ)言-視覺(jué)模型(LVM)ControlNet的運(yùn)行演示,參數(shù)量達(dá)到10億-15億,能夠在十幾秒內(nèi)完成一系列推理。

7月19日,Meta宣布與微軟合作共同推出開(kāi)源大語(yǔ)言模型Llama 2之后,高通隨即官宣了與Meta公司的合作,將實(shí)現(xiàn)在高通驍龍芯片上可以不聯(lián)網(wǎng)的情況下,運(yùn)行基于Llama 2模型的應(yīng)用和服務(wù)。

雙方通過(guò)合作,可以在智能手機(jī)、PC、AR / VR 頭顯設(shè)備、汽車(chē)等設(shè)備上,運(yùn)行Llama 2為代表的生成式 AI 模型,幫助開(kāi)發(fā)者減少云端運(yùn)行成本,為用戶(hù)提供私密、更可靠和個(gè)性化的體驗(yàn)。

高通計(jì)劃從2024年起,在搭載驍龍平臺(tái)的終端上支持基于Llama 2的AI部署。目前,開(kāi)發(fā)者已經(jīng)可以開(kāi)始使用高通AI軟件棧面向終端側(cè)AI進(jìn)行應(yīng)用優(yōu)化。

聯(lián)發(fā)科在4月28日官宣發(fā)布了全球首個(gè)繁體中文AI大型語(yǔ)言模型BLOOM-zh,該模型于2月份開(kāi)始內(nèi)測(cè),至發(fā)布時(shí)在大多數(shù)繁體中文基準(zhǔn)測(cè)試中優(yōu)于其前身,同時(shí)保持其英語(yǔ)能力。

與高通一樣,聯(lián)發(fā)科也在積極擁抱Llama 2。

8月24日,聯(lián)發(fā)科宣布將運(yùn)用Meta最新一代大型語(yǔ)言模型Llama2以及聯(lián)發(fā)科最先進(jìn)的人工智能處理單元(APU)和完整的AI開(kāi)發(fā)平臺(tái)(NeuroPilot),建立完整的終端運(yùn)算生態(tài)系統(tǒng),加速智能手機(jī)、汽車(chē)、智慧家庭、物聯(lián)網(wǎng)等終端裝置上的AI應(yīng)用開(kāi)發(fā)。

預(yù)計(jì)運(yùn)用Llama 2模型開(kāi)發(fā)的AI應(yīng)用,將在年底最新旗艦產(chǎn)品上亮相。

聯(lián)發(fā)科透露,其下一代旗艦SoC天機(jī)9300將于下半年推出,常規(guī)的性能提升之外,還將整合最新的APU,在手機(jī)等終端設(shè)備上帶來(lái)更強(qiáng)的AI能力,類(lèi)似ChatGPT的服務(wù)體驗(yàn)。

6月上旬,也有消息透露三星電子已在開(kāi)發(fā)自己的大型語(yǔ)言模型(LLM)以供內(nèi)部使用。

除了手機(jī)等端側(cè)設(shè)備,PC仍舊是重要的個(gè)人與企業(yè)生產(chǎn)力工具,英特爾也在不遺余力的對(duì)大語(yǔ)言模型進(jìn)行支持。

英特爾在6月份官宣了用Aurora超級(jí)計(jì)算機(jī)開(kāi)發(fā)的生成式AI模型Aurora genAI,參數(shù)量將多達(dá)1萬(wàn)億”。

英特爾提供了一系列AI解決方案,為AI社區(qū)開(kāi)發(fā)和運(yùn)行Llama 2等模型提供了極具競(jìng)爭(zhēng)力和極具吸引力的選擇。豐富的AI硬件產(chǎn)品組合與優(yōu)化開(kāi)放的軟件相結(jié)合,為用戶(hù)應(yīng)對(duì)算力挑戰(zhàn)提供了可行的方案。

英特爾還通過(guò)軟件生態(tài)的構(gòu)建和模型優(yōu)化,進(jìn)一步推動(dòng)新興的生成式AI場(chǎng)景在個(gè)人電腦的落地,廣泛覆蓋輕薄本、全能本、游戲本等。目前,英特爾正與PC產(chǎn)業(yè)眾多合作伙伴通力合作,致力于讓廣大用戶(hù)在日常生活和工作中,通過(guò)AI的輔助來(lái)提高效率,帶來(lái)革新性的PC體驗(yàn)。

AMD在6月中旬發(fā)布了最新款數(shù)據(jù)中心GPU——MI300X,但似乎并不被市場(chǎng)看好,大客戶(hù)并不買(mǎi)單。

倒是近期陳天奇TVM團(tuán)隊(duì)出品的優(yōu)化算法,實(shí)現(xiàn)在最新Llama2 7B 和13B模型中,用一塊 AMD Radeon RX 7900 XTX 速度可以達(dá)到英偉達(dá) RTX 4090的80%,或是3090Ti的94%。

這個(gè)優(yōu)化算法,讓更多人開(kāi)始關(guān)注AMD的GPU顯卡,也讓更多AMD個(gè)人玩家看到了用AMD芯片訓(xùn)練LLM的希望。目前,已經(jīng)有一些開(kāi)源LLM模型能夠支持A卡。

眾所周知,目前英偉達(dá)GPU是全球算力的主要構(gòu)建者。當(dāng)前想要玩轉(zhuǎn)大語(yǔ)言模型,從B端到C端都離不開(kāi)英偉達(dá),相關(guān)數(shù)據(jù)預(yù)測(cè)英偉達(dá)將占據(jù)AI芯片市場(chǎng)至少90%的市場(chǎng)份額。

Jon Peddie Research(JPR)最新GPU市場(chǎng)數(shù)據(jù)統(tǒng)計(jì)報(bào)告顯示,2023年第一季度桌面獨(dú)立顯卡的銷(xiāo)量約為630萬(wàn)塊,英偉達(dá)以84%的市場(chǎng)份額繼續(xù)占據(jù)主導(dǎo)地位,大約銷(xiāo)售了529萬(wàn)張桌面獨(dú)立顯卡;AMD以12%的市場(chǎng)份額排在第二,出貨量大概為76萬(wàn)張。

作為當(dāng)前最大的算力供應(yīng)商,英偉達(dá)在大語(yǔ)言模型以及生成式AI方面以及發(fā)布了很多戰(zhàn)略、解決方案及產(chǎn)品。

限于篇幅關(guān)于英偉達(dá)這里不做贅述,大家可以自行搜索了解。

LLM端側(cè)部署有什么好處?

從芯片廠商到終端廠商,都在搶灘登陸部署大語(yǔ)言模型,F(xiàn)在,他們又將目光聚焦到了LLM的端側(cè)部署,這其中的邏輯是什么呢?

在討論這個(gè)問(wèn)題之前,不妨先看看端側(cè)部署LLM有哪些好處。

近幾年LLM取得了長(zhǎng)足的進(jìn)展,卻面臨著一些挑戰(zhàn),比如計(jì)算資源限制、數(shù)據(jù)隱私保護(hù)以及模型的可解釋性等問(wèn)題,都是制約LLM走進(jìn)千行百業(yè)的重要因素。

LLM端側(cè)部署是指將大語(yǔ)言模型運(yùn)行在用戶(hù)的智能設(shè)備上,相對(duì)于LLM運(yùn)行云端服務(wù)器上,在端側(cè)運(yùn)行LLM有以下幾個(gè)好處:

首先,提高用戶(hù)體驗(yàn)。可以大幅減少網(wǎng)絡(luò)延遲,提高響應(yīng)速度,節(jié)省流量和電量。這對(duì)于一些實(shí)時(shí)性要求高的應(yīng)用場(chǎng)景比如語(yǔ)音識(shí)別、機(jī)器翻譯、智能對(duì)話(huà)等,是非常重要的。

其次,保障數(shù)據(jù)安全。能夠有效避免用戶(hù)的數(shù)據(jù)被上傳到云端,從而降低數(shù)據(jù)泄露的風(fēng)險(xiǎn),增強(qiáng)用戶(hù)的信任和滿(mǎn)意度。對(duì)于健康咨詢(xún),法律咨詢(xún),個(gè)人助理等涉及敏感信息的應(yīng)用場(chǎng)景,非常必要。

第三,增加模型靈活性。在端側(cè)部署LLM可以讓用戶(hù)根據(jù)自己的需求和喜好,定制和調(diào)整模型的參數(shù)和功能。這對(duì)于一些需要個(gè)性化和多樣化的應(yīng)用場(chǎng)景,有益于內(nèi)容創(chuàng)作、教育輔導(dǎo)、娛樂(lè)游戲等場(chǎng)景的業(yè)務(wù)與工作開(kāi)展。

AI 部署本地化具有必要性,優(yōu)勢(shì)包括更低的延遲、更小的帶寬、提高數(shù)據(jù)安全、保護(hù)數(shù)據(jù)隱私、高可靠性等。完整的大模型僅參數(shù)權(quán)重就能占滿(mǎn)一張80G的GPU,但是通過(guò)量化、知識(shí)蒸餾、剪枝等優(yōu)化,大模型可以在手機(jī)本地實(shí)現(xiàn)推理。

高通在其AI白皮書(shū)《混合AI是AI的未來(lái)》中已經(jīng)預(yù)測(cè)了LLM的未來(lái)發(fā)展方向,大語(yǔ)言模型挺進(jìn)端側(cè)已是大勢(shì)所趨。包括手機(jī)廠商等在內(nèi)的終端廠商對(duì)此需求巨大,產(chǎn)業(yè)鏈上游的芯片廠商自然要不遺余力地基于大語(yǔ)言模型做各種探索。

雖然高通、聯(lián)發(fā)科、Intel等芯片廠商已經(jīng)與Metad Llama 2展開(kāi)合作,但距離支持LLM端側(cè)運(yùn)行的移動(dòng)端芯片還沒(méi)有規(guī);慨a(chǎn)還有一段時(shí)間。

混合AI的趨勢(shì)下,LLM的本地化與網(wǎng)絡(luò)化運(yùn)行都是必需。因此在當(dāng)前這個(gè)空檔期,廣大終端廠商正在通過(guò)云端將大語(yǔ)言模型能力融合到語(yǔ)音助手輸入法等工具軟件上,以此讓用戶(hù)先行體驗(yàn)生成式AI帶來(lái)的諸多好處。

云端配合端側(cè)雙管齊下部署LLM,以本地終端算力支持大部分生成式AI應(yīng)用,必要時(shí)聯(lián)動(dòng)云端算力解決復(fù)雜應(yīng)用問(wèn)題,在將手機(jī)體驗(yàn)提升一大截的同時(shí),也能將算力成本降低更多。

由此,先由云端LLM提升用戶(hù)體驗(yàn),后面再通過(guò)端側(cè)部署LLM加強(qiáng)體驗(yàn),將會(huì)持續(xù)為用戶(hù)帶來(lái)更多的驚喜。如果LLM能夠在手機(jī)端部署,自然也能在其他終端上部署。

這意味著,在手機(jī)之外,包括筆記本電腦、智能家居、VR(Visual Reality,虛擬現(xiàn)實(shí))/AR(Augmented Reality,增強(qiáng)現(xiàn)實(shí))設(shè)備、汽車(chē)和其他物聯(lián)網(wǎng)終端,未來(lái)都會(huì)搭載能夠支持LLM的芯片,AIOT將會(huì)迎來(lái)AIOT大換血,可以想象這是一個(gè)多大量級(jí)的市場(chǎng)。

而這些產(chǎn)品,幾乎所有手機(jī)廠商都在做。

此外,手機(jī)端運(yùn)行LLM對(duì)硬件有一定的需求,CPU主頻越高算力也就越大。

IDC數(shù)據(jù)顯示,2023年一季度全球手機(jī)銷(xiāo)量中主處理器頻率超過(guò)2.8GHz 的占比36%,價(jià)格在1000 美金以上的占比13%,即旗艦機(jī)型占比較低。隨著LLM在手機(jī)端落地,加上廠商們的大語(yǔ)言模型、生成式AI等的噱頭營(yíng)銷(xiāo),有望推動(dòng)新一輪換機(jī)潮。

面向未來(lái)數(shù)十億美元的市場(chǎng)規(guī)模,所有智能終端廠商都將受益其中。

這對(duì)于從2019年就開(kāi)始持續(xù)下行并且用戶(hù)換機(jī)周期延長(zhǎng)的手機(jī)市場(chǎng)來(lái)說(shuō),著實(shí)是一場(chǎng)及時(shí)雨。而貼上AIGC標(biāo)簽的終端產(chǎn)品,也有望帶領(lǐng)消費(fèi)電子產(chǎn)業(yè)走出長(zhǎng)期的低迷而進(jìn)入一個(gè)新的經(jīng)濟(jì)周期。

端側(cè)部署對(duì)超自動(dòng)化有什么影響

超自動(dòng)化是一個(gè)以交付工作為目的的集合體,是RPA、流程挖掘、智能業(yè)務(wù)流程管理等多種技術(shù)能力與軟件工具的組合,也是智能流程自動(dòng)化、集成自動(dòng)化等概念的進(jìn)一步延伸。

超自動(dòng)化本身涉及到的關(guān)鍵步驟即發(fā)現(xiàn)、分析、設(shè)計(jì)、自動(dòng)化、測(cè)量、監(jiān)視和重新評(píng)估等均囊括在內(nèi),突出以人為中心,實(shí)現(xiàn)人、應(yīng)用、服務(wù)之間的關(guān)聯(lián)、組合以及協(xié)調(diào)的重要性。

自生成式AI爆發(fā)以后,超自動(dòng)化領(lǐng)域所轄的RPA、低/無(wú)代碼、流程挖掘、BPM、iPaaS等技術(shù)所涉及的廠商都在積極探索LLM自身的融合應(yīng)用,目前基本都已通過(guò)引入LLM以及基于開(kāi)源技術(shù)研發(fā)了自有領(lǐng)域模型。這些大模型正在與各種產(chǎn)品進(jìn)行深度交融,進(jìn)而變革產(chǎn)品形態(tài)與創(chuàng)新商業(yè)模式。

超自動(dòng)化是LLM落地的一個(gè)重要方向,畢竟自動(dòng)化是企業(yè)優(yōu)先考慮的增效降本工具及技術(shù)。尤其是端到端流程自動(dòng)化,已是廣大組織進(jìn)行數(shù)字化轉(zhuǎn)型的主要途徑。

引入生成式AI以后,超自動(dòng)化將從內(nèi)容生成自動(dòng)化和業(yè)務(wù)流程自動(dòng)化兩個(gè)方面同時(shí)賦能組織的長(zhǎng)效運(yùn)營(yíng)。生成式AI將會(huì)進(jìn)一步提升組織的業(yè)務(wù)流程自動(dòng)化效率,進(jìn)而實(shí)現(xiàn)更徹底的降本、提質(zhì)與增效。

LLM對(duì)超自動(dòng)化的影響,可以簡(jiǎn)單概括為提高效率和質(zhì)量、增強(qiáng)智能和靈活性、支持決策自動(dòng)化、拓展領(lǐng)域和范圍、增加創(chuàng)新和價(jià)值等幾個(gè)方面。

之前王吉偉頻道與大家討論的LLM與超自動(dòng)化融合,更多的集中于兩者在技術(shù)架構(gòu)融合后所造就的新產(chǎn)品、模式如何提升生產(chǎn)力及創(chuàng)造更多商業(yè)價(jià)值,沒(méi)有在LLM部署方面做更多探討,這里我們可以簡(jiǎn)單聊一聊這個(gè)話(huà)題。

大語(yǔ)言模型實(shí)現(xiàn)端側(cè)部署,相較于部署在云端的LLM,必然會(huì)讓超自動(dòng)化的實(shí)施與運(yùn)行達(dá)到更好的效果。

RPA作為企業(yè)管理軟件,因?yàn)橐恍┛蛻?hù)的私有化需求,很多時(shí)候都要將RPA部署在本地機(jī)房或者私有云環(huán)境。在大語(yǔ)言模型的引入上,一些對(duì)數(shù)據(jù)隱私要求比較高的客戶(hù)只能選擇本地化部署LLM,但部署在本地算力成本就成了首要問(wèn)題。

將來(lái)LLM能夠部署在端側(cè),這些客戶(hù)在算力資源上就獲得很大的釋放,PC端以及移動(dòng)端都能夠承擔(dān)一部分算力,可以極大降低算力成本。

因此LLM運(yùn)行在用戶(hù)的設(shè)備上,可以有效降低超自動(dòng)化運(yùn)行的網(wǎng)絡(luò)延遲,減少云端計(jì)算資源的消耗。

在成效方面,LLM的端側(cè)部署可以使超自動(dòng)化更加靈活和可定制,用戶(hù)能夠根據(jù)需求和場(chǎng)景選擇合適的AI模型,并且可以隨時(shí)更新和調(diào)整模型。端側(cè)部署也可以使超自動(dòng)化更加安全和可靠,畢竟用戶(hù)的數(shù)據(jù)不需要上傳到云端,從而避免了數(shù)據(jù)泄露或被篡改的風(fēng)險(xiǎn)。

當(dāng)然,LLM端側(cè)部署也面臨一些挑戰(zhàn),比如計(jì)算需求量大、對(duì)實(shí)時(shí)性要求高,受限于運(yùn)行環(huán)境、內(nèi)存、存儲(chǔ)空間等,這些正是LLM網(wǎng)絡(luò)側(cè)部署要解決的問(wèn)題。

由此,高通所倡導(dǎo)的多種部署方式相結(jié)合的混合AI就派上了大用場(chǎng),這也是LLM的端側(cè)部署為何會(huì)成為當(dāng)前大熱門(mén)的主要原因。

后記:LLM端側(cè)部署+超自動(dòng)化將“賈維斯”照進(jìn)現(xiàn)實(shí)

LLM在端側(cè)運(yùn)行,可以讓手機(jī)等終端設(shè)備在不聯(lián)網(wǎng)的情況下與用戶(hù)進(jìn)行更好的交互,并聯(lián)動(dòng)其他移動(dòng)端比如各種智能家居,以更好的服務(wù)用戶(hù)。

超自動(dòng)化產(chǎn)品架構(gòu)中早已引入了對(duì)話(huà)機(jī)器人(Chatbot),目的是通過(guò)語(yǔ)音口令自動(dòng)創(chuàng)建業(yè)務(wù)流程。但之前的機(jī)器人反應(yīng)不夠靈敏,無(wú)法與人更好的交互,也無(wú)法全面調(diào)動(dòng)RPA進(jìn)行流程創(chuàng)建,且只能構(gòu)建或者執(zhí)行簡(jiǎn)單的預(yù)制業(yè)務(wù)流程。

將LLM構(gòu)建于手機(jī)等移動(dòng)終端,基于大語(yǔ)言模型生成能力、語(yǔ)義理解能力和邏輯推理能力,用戶(hù)就可以通過(guò)多輪對(duì)話(huà)進(jìn)行業(yè)務(wù)流程的實(shí)時(shí)創(chuàng)建,進(jìn)而構(gòu)建更多復(fù)雜的業(yè)務(wù)流程,以更智能地處理多項(xiàng)業(yè)務(wù)。

這意味著,通過(guò)手機(jī)等終端以語(yǔ)音對(duì)話(huà)的方式構(gòu)建并執(zhí)行工作、生活及學(xué)習(xí)中的各項(xiàng)業(yè)務(wù)流程已經(jīng)成為可能,通過(guò)終端調(diào)用所在場(chǎng)景中的所有智能終端為個(gè)體服務(wù)也將成為現(xiàn)實(shí)。

目前市面已經(jīng)出現(xiàn)了類(lèi)似的產(chǎn)品,比如實(shí)在智能的TARS-RPA-Agent模式CahtRPA,就已經(jīng)做到通過(guò)對(duì)話(huà)實(shí)現(xiàn)如生成文本一樣流暢地生成并執(zhí)行業(yè)務(wù)流程。接下來(lái),將會(huì)有更多類(lèi)似產(chǎn)品出現(xiàn),這將極大地豐富各領(lǐng)域多場(chǎng)景的超自動(dòng)化應(yīng)用。

說(shuō)到這里,大家腦海中是不是已經(jīng)有一個(gè)機(jī)器人管家的形象了?

沒(méi)錯(cuò),以大語(yǔ)言模型為核心,以語(yǔ)言為接口,控制多AI模型系統(tǒng),構(gòu)建《鋼鐵俠》中“賈維斯”式的綜合智能管家,可以說(shuō)是每個(gè)人的夢(mèng)想。

而現(xiàn)在來(lái)看,將大語(yǔ)言模型進(jìn)一步構(gòu)建于端側(cè),云端與端側(cè)雙管齊下,再加上能夠生成各種復(fù)雜流程的超自動(dòng)化,使得這個(gè)夢(mèng)想已然照進(jìn)現(xiàn)實(shí)。

全文完

       原文標(biāo)題 : 從谷歌推出Gecko到高通引入Llama 2,端側(cè)部署成為L(zhǎng)LM落地重要方向

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)