訂閱
糾錯(cuò)
加入自媒體

2024年大模型行業(yè)研究報(bào)告

第一章 行業(yè)概況

1.1 簡(jiǎn)介

大模型是指具有大規(guī)模參數(shù)和復(fù)雜計(jì)算結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型。這些模型通常由深度神經(jīng)網(wǎng)絡(luò)構(gòu)建而成,擁有數(shù)十億甚至數(shù)千億個(gè)參數(shù)。大模型的設(shè)計(jì)目的是為了提高模型的表達(dá)能力和預(yù)測(cè)性能,能夠處理更加復(fù)雜的任務(wù)和數(shù)據(jù)。大模型在各種領(lǐng)域都有廣泛的應(yīng)用,包括自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和推薦系統(tǒng)等。大模型通過(guò)訓(xùn)練海量數(shù)據(jù)來(lái)學(xué)習(xí)復(fù)雜的模式和特征,具有更強(qiáng)大的泛化能力,可以對(duì)未見(jiàn)過(guò)的數(shù)據(jù)做出準(zhǔn)確的預(yù)測(cè)。

圖 大模型產(chǎn)業(yè)圖譜

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

1.2 分類(lèi)

按輸入數(shù)據(jù)類(lèi)型的不同:語(yǔ)言大模型(NLP),視覺(jué)大模型(CV)和多模態(tài)大模型。NLP通常用來(lái)處理文本數(shù)據(jù)和理解自然語(yǔ)言,例如GPT系列,文心一言等。CV通常用于圖像處理和分析,例如VIT系列,文心UFO等。多模態(tài)大模型能夠處理多種不同類(lèi)型數(shù)據(jù),例如DingoDB多模向量數(shù)據(jù)庫(kù)等。

按應(yīng)用領(lǐng)域的不同:三個(gè)層次,通用大模型L0,行業(yè)大模型L1和垂直大模型L2。通用大模型L0是指可以在多個(gè)領(lǐng)域和任務(wù)上通用的大模型。行業(yè)大模型L1是指針對(duì)特定行業(yè)或領(lǐng)域的大模型。垂直大模型L2是指針對(duì)特定任務(wù)或場(chǎng)景的大模型。

大模型市場(chǎng)容量及規(guī)模巨大,預(yù)計(jì)2028年將達(dá)到1179億元。

圖 我國(guó)大模型產(chǎn)業(yè)市場(chǎng)規(guī)模

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

第二章 產(chǎn)業(yè)鏈、商業(yè)模式及政策監(jiān)管2.1 產(chǎn)業(yè)鏈

大模型指參數(shù)規(guī)模較大的預(yù)訓(xùn)練模型。這些模型通常具有數(shù)十億甚至數(shù)千億個(gè)參數(shù),需要在大量硬件資源上進(jìn)行訓(xùn)練。大模型通過(guò)對(duì)數(shù)據(jù)進(jìn)行分布式表示,能夠捕捉到數(shù)據(jù)中的復(fù)雜關(guān)系,提高模型在各類(lèi)任務(wù)中的泛化能力。

從大模型行業(yè)產(chǎn)業(yè)鏈來(lái)看,上游主要包括硬件和軟件,硬件又包括芯片、服務(wù)器、通信網(wǎng)絡(luò)等;軟件又包括云計(jì)算、數(shù)據(jù)庫(kù)、中間件等。中游是指大模型行業(yè);下游是指大模型的應(yīng)用領(lǐng)域,包括游戲、辦公、傳媒影視、醫(yī)療、金融、電商、工業(yè)等,這些領(lǐng)域的多樣化需求將推動(dòng)大模型不斷進(jìn)行技術(shù)創(chuàng)新和優(yōu)化,提升模型的準(zhǔn)確性和效率。

圖 大模型產(chǎn)業(yè)鏈

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

通用大模型

如GPT、BERT等,能夠處理多種類(lèi)型的任務(wù),如文本生成、文本分類(lèi)、機(jī)器翻譯等。

圖 國(guó)內(nèi)通用大模型布局

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

多模態(tài)大模型

能夠處理多種模態(tài)的數(shù)據(jù),如圖像、文本、語(yǔ)音等,如CLIP、DALL-E等。

圖 2022-2023年主流多模態(tài)大模型

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

AI大模型

指具有巨大參數(shù)規(guī)模的人工智能模型。這些模型通過(guò)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的技術(shù)來(lái)學(xué)習(xí)和理解龐大的數(shù)據(jù)量。AI大模型的發(fā)展推動(dòng)了人工智能領(lǐng)域的快速發(fā)展,并在各個(gè)領(lǐng)域中展現(xiàn)出驚人的應(yīng)用潛力。

圖 AI大模型譜系圖

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

金融和投資大模型

2024年4月10日,在2024數(shù)字產(chǎn)業(yè)鏈金融行業(yè)峰會(huì)上,網(wǎng)商銀行宣布旗下的供應(yīng)鏈金融解決方案大雁系統(tǒng)升級(jí),AI大模型首次應(yīng)用于產(chǎn)業(yè)鏈金融場(chǎng)景,提升小微企業(yè)金融服務(wù)的覆蓋率和便捷性。

在該領(lǐng)域上,大模型系統(tǒng)幫助金融和投資機(jī)構(gòu)構(gòu)建更全面的企業(yè)圖譜。同時(shí),大模型有語(yǔ)義理解、生成能力,與大模型驅(qū)動(dòng)的Agent實(shí)時(shí)反饋能力疊加,能夠更好地刻畫(huà)小微企業(yè)的經(jīng)營(yíng)狀況和信用情況。

圖 金融大模型的價(jià)值與作用

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2.2 商業(yè)模式

目前大模型商業(yè)應(yīng)用尚處早期,以 API、PaaS、MaaS 三種模式為主。當(dāng)前全球大模型產(chǎn)業(yè)落地仍處于 早期探索階段,需要與下游場(chǎng)景企業(yè)合作建立大模型商業(yè)模式,但下游企業(yè)目前對(duì)于大模型的理解相對(duì) 有限,所需要的資源支撐比較薄弱?偟膩(lái)說(shuō),大模型落地可以通過(guò) API 接口調(diào)用付費(fèi)、或者大廠(chǎng)提供 落地所需的開(kāi)發(fā)工具、云平臺(tái)、服務(wù)等的 PaaS 模式,更進(jìn)一步是直接提供相關(guān)定制好的模型調(diào)用的 MaaS 模式。

應(yīng)用程序編程接口(Application Programming Interface,簡(jiǎn)稱(chēng):API),是一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開(kāi)發(fā)人員基于某軟件或硬件得以訪(fǎng)問(wèn)一組例程的能力,而又無(wú)需訪(fǎng)問(wèn)源碼,或理解內(nèi)部工作機(jī)制的細(xì)節(jié)。

近年來(lái)軟件的規(guī)模日益龐大,常常需要把復(fù)雜的系統(tǒng)劃分成小的組成部分,編程接口的設(shè)計(jì)十分重要。程序設(shè)計(jì)的實(shí)踐中,編程接口的設(shè)計(jì)首先要使軟件系統(tǒng)的職責(zé)得到合理劃分。良好的接口設(shè)計(jì)可以降低系統(tǒng)各部分的相互依賴(lài),提高組成單元的內(nèi)聚性,降低組成單元間的耦合程度,從而提高系統(tǒng)的維護(hù)性和擴(kuò)展性。

圖 通用大模型的主要商業(yè)模式

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

PaaS模式(Platform as a Service)是指平臺(tái)即服務(wù)。把服務(wù)器平臺(tái)作為一種服務(wù)提供的商業(yè)模式,通過(guò)網(wǎng)絡(luò)進(jìn)行程序提供的服務(wù)稱(chēng)之為SaaS(Software as a Service),是云計(jì)算三種服務(wù)模式之一,而云計(jì)算時(shí)代相應(yīng)的服務(wù)器平臺(tái)或者開(kāi)發(fā)環(huán)境作為服務(wù)進(jìn)行提供就成為了PaaS。

所謂PaaS實(shí)際上是指將軟件研發(fā)的平臺(tái)作為一種服務(wù),以SaaS的模式提交給用戶(hù)。因此,PaaS也是SaaS模式的一種應(yīng)用。但是,PaaS的出現(xiàn)可以加快SaaS的發(fā)展,尤其是加快SaaS應(yīng)用的開(kāi)發(fā)速度。在2007年國(guó)內(nèi)外SaaS廠(chǎng)商先后推出自己的PAAS平臺(tái)。

圖 未來(lái)PaaS市場(chǎng)增長(zhǎng)驅(qū)動(dòng)力強(qiáng)勁

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

SaaS軟件運(yùn)營(yíng)服務(wù)是(Software as a Service,簡(jiǎn)稱(chēng)SaaS)讓用戶(hù)能夠通過(guò)互聯(lián)網(wǎng)連接來(lái)使用基于云的應(yīng)用程序。常見(jiàn)示例有電子郵件、日歷和辦公工具。它不需要用戶(hù)將軟件產(chǎn)品安裝在自己的電腦或服務(wù)器上。

SaaS提供完整的軟件解決方案,用戶(hù)可以從云服務(wù)提供商處以即用即付方式進(jìn)行購(gòu)買(mǎi)。為組織租用應(yīng)用,組織用戶(hù)即可通過(guò)互聯(lián)網(wǎng)連接到該應(yīng)用(通常使用 Web瀏覽器)。所有基礎(chǔ)結(jié)構(gòu)、中間件、應(yīng)用軟件和應(yīng)用數(shù)據(jù)都位于服務(wù)提供商的數(shù)據(jù)中心內(nèi)。服務(wù)提供商負(fù)責(zé)管理硬件和軟件,并根據(jù)適當(dāng)?shù)姆⻊?wù)協(xié)議確保應(yīng)用和數(shù)據(jù)的可用性和安全性。SaaS讓組織能夠通過(guò)最低前期成本的應(yīng)用快速建成投產(chǎn)。

圖 2021 年全球公有云 SaaS 市場(chǎng)份額

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

大模型產(chǎn)業(yè)市場(chǎng)規(guī)模持續(xù)增長(zhǎng),市場(chǎng)前景廣闊。預(yù)計(jì)2028年市場(chǎng)規(guī)模將達(dá)到1179億元。2022~2028年復(fù)合增長(zhǎng)率約為60.11%,市場(chǎng)規(guī)模快速成長(zhǎng)。

圖 我國(guó)大模型產(chǎn)業(yè)市場(chǎng)規(guī)模

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2.3 技術(shù)發(fā)展

大模型的起源可以追溯到20世紀(jì)90年代,當(dāng)時(shí)人工智能領(lǐng)域還處于初創(chuàng)期,研究人員主要關(guān)注的是基于規(guī)則的專(zhuān)家和知識(shí)表示系統(tǒng)。數(shù)據(jù)資源的不斷增加和計(jì)算機(jī)性能的不斷提升,人們開(kāi)始意識(shí)到基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法在人工智能領(lǐng)域具有更大的潛力。大模型的概念逐漸浮出水面。

近十余年間,人工智能技術(shù)泛化能力、創(chuàng)新能力及應(yīng)用效能不斷提升,成為了推動(dòng)經(jīng)濟(jì)及社會(huì)發(fā)展的重要引擎。

2015年前后,人臉識(shí)別算法達(dá)到接近人眼的識(shí)別能力,被視為人工智能技術(shù)工業(yè)級(jí)應(yīng)用水平的代表性事件。

2022年,以ChatGPT為代表的大模型為用戶(hù)帶來(lái)了全新交互體驗(yàn)。通過(guò)其在內(nèi)容生成、文本轉(zhuǎn)化和邏輯推理等任務(wù)下的高效、易操作表現(xiàn),大模型正逐步成為當(dāng)前主流應(yīng)用程序的重要組成部分。

圖 大模型技術(shù)發(fā)展各時(shí)期

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2023年7月,OpenAI向用戶(hù)正式開(kāi)放了代碼解析插件Code Interpreter,使得ChatGPT和GPT-4可以根據(jù)用戶(hù)問(wèn)題來(lái)編寫(xiě)和執(zhí)行代碼,從而拓展了模型在數(shù)據(jù)分析、復(fù)雜計(jì)算與功能調(diào)用方面的能力。

圖 全球大模型技術(shù)發(fā)展脈絡(luò)

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2023年,大語(yǔ)言模型及其在人工智能領(lǐng)域的應(yīng)用已成為全球科技研究的熱點(diǎn),其在規(guī)模上的增長(zhǎng)尤為引人注目,參數(shù)量已從最初的十幾億躍升到如今的一萬(wàn)億。參數(shù)量的提升使得模型能夠更加精細(xì)地捕捉人類(lèi)語(yǔ)言微妙之處,更加深入地理解人類(lèi)語(yǔ)言的復(fù)雜性。在過(guò)去的一年里,大語(yǔ)言模型在吸納新知識(shí)、分解復(fù)雜任務(wù)以及圖文對(duì)齊等多方面都有顯著提升。隨著技術(shù)的不斷成熟,它將不斷拓展其應(yīng)用范圍,為人類(lèi)提供更加智能化和個(gè)性化的服務(wù),進(jìn)一步改善人們的生活和生產(chǎn)方式。

圖 大模型帶來(lái)語(yǔ)音技術(shù)發(fā)展的全新機(jī)會(huì)

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2023年被視為中國(guó)大模型的發(fā)展元年。3月16日,百度正式推出了基于百度新一代大語(yǔ)言模型的生成式AI產(chǎn)品“文心一言”,成為了率先“跑出來(lái)”的國(guó)內(nèi)大模型廠(chǎng)商。文心一言的問(wèn)世,也拉開(kāi)了國(guó)內(nèi)“百模大戰(zhàn)”的帷幕。此后,阿里、華為、騰訊、京東、科大訊飛、360、字節(jié)跳動(dòng)等科技公司紛紛發(fā)布了自家的大模型。文心一言發(fā)布8個(gè)月后的11月15日,李彥宏在深圳西麗湖論壇上表示,國(guó)內(nèi)目前已經(jīng)發(fā)布了238個(gè)大模型。這意味著,在這兩百多天里,平均每天都有一個(gè)大模型問(wèn)世。

圖 國(guó)內(nèi)大模型技術(shù)路線(xiàn)圖

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

2.4 政策監(jiān)管

大模型在快速發(fā)展的同時(shí)也帶來(lái)了一系列潛在的風(fēng)險(xiǎn)和挑戰(zhàn)。

一方面,大模型所需的海量數(shù)據(jù)、復(fù)雜參數(shù)以及工程難度放大了人工智能固有的技術(shù)風(fēng)險(xiǎn),如數(shù)據(jù)竊取、泄露等安全問(wèn)題,模型黑盒導(dǎo)致決策結(jié)果難預(yù)測(cè)和難解釋問(wèn)題,以及模型面對(duì)隨機(jī)擾動(dòng)和惡意攻擊的魯棒性問(wèn)題。

另一方面,大模型的多場(chǎng)景通用性也放大了隱私風(fēng)險(xiǎn)、歧視風(fēng)險(xiǎn)和濫用風(fēng)險(xiǎn)等應(yīng)用風(fēng)險(xiǎn)。這些問(wèn)題引發(fā)了全球范圍的關(guān)注,對(duì)人工智能治理能力與治理水平提出了新的挑戰(zhàn)。

目前,全球大模型治理正處于探索階段,從人工智能倫理準(zhǔn)則等基本共識(shí)出發(fā),逐步深入推動(dòng)大模型監(jiān)管政策法規(guī)和企業(yè)治理落地實(shí)踐。國(guó)際組織積極制定人工智能治理原則及倡議,重點(diǎn)關(guān)注大模型的治理和監(jiān)管問(wèn)題。

圖 2023年以來(lái)國(guó)內(nèi)大模型相關(guān)政策梳理

來(lái)源:資產(chǎn)信息網(wǎng) 千際投行 iFinD

在政策方面,2021年11月,聯(lián)合國(guó)教科文組織通過(guò)了《人工智能倫理問(wèn)題建議書(shū)》,旨在促使人工智能系統(tǒng)造福人類(lèi)、社會(huì)、環(huán)境和生態(tài)系統(tǒng)、防止危害,同時(shí)促進(jìn)和平利用人工智能系統(tǒng)。

2023年11月,在英國(guó)人工智能安全峰會(huì)期間,包括中國(guó)、美國(guó)、英國(guó)等 28 個(gè)國(guó)家和歐盟共同簽署了《布萊切利宣言》,確保人工智能以人為本、值得信賴(lài)并負(fù)責(zé)任,通過(guò)國(guó)際倫理和其他相關(guān)倡議促進(jìn)合作,應(yīng)用人工智能帶來(lái)的廣泛風(fēng)險(xiǎn)。

同年11月,世界互聯(lián)網(wǎng)大會(huì)發(fā)布了《發(fā)展負(fù)責(zé)任的生成式人工智能研究報(bào)告及共識(shí)文件》,就發(fā)展負(fù)責(zé)任的生成式人工智能提出十條共識(shí)。

在標(biāo)準(zhǔn)方面,ISO/IEC JTC1 /SC42人工智能分委會(huì)正在開(kāi)展人工智能可信賴(lài)國(guó)際標(biāo)準(zhǔn)研制工作,為指導(dǎo)利益相關(guān)方研發(fā)、使用可信賴(lài)人工智能相關(guān)技術(shù)和系統(tǒng)提供參考,主要標(biāo)準(zhǔn)包括 ISO/IEC TR 24028:2020《人工智能的可信賴(lài)概述》、ISO/IEC 38507:2022《組織使用人工智能的治理影響》等。

全球主要經(jīng)濟(jì)體加快推進(jìn)大模型治理和監(jiān)管相關(guān)政策制定步伐。中國(guó)在人工智能監(jiān)管方面主張“包容審慎的分類(lèi)分級(jí)監(jiān)管”原則,國(guó)家網(wǎng)信辦已于2023年7月10日頒布了首部面向大模型監(jiān)管的《生成式人工智能服務(wù)管理暫行辦法》,后續(xù)將進(jìn)一步針對(duì)生成式人工智能技術(shù)特點(diǎn)及其在有關(guān)行業(yè)和領(lǐng)域的服務(wù)應(yīng)用,制定相應(yīng)的分類(lèi)分級(jí)監(jiān)管規(guī)則或指引。

2023年10月8日,中國(guó)科技部發(fā)布《科技倫理審查辦法(試行)》,提出從事人工智能科技活動(dòng)的單位,研究?jī)?nèi)容涉及科技倫理敏感領(lǐng)域的,應(yīng)設(shè)立科技倫理(審查)委員會(huì),并建立倫理高風(fēng)險(xiǎn)科技活動(dòng)的清單制度,對(duì)可能產(chǎn)生較大倫理風(fēng)險(xiǎn)挑戰(zhàn)的新興科技活動(dòng)實(shí)施清單管理。

2023年10月18日,國(guó)家網(wǎng)信辦發(fā)布《全球人工智能治理倡議》,提出發(fā)展人工智能應(yīng)堅(jiān)持相互尊重、平等互利的原則,各國(guó)無(wú)論大小、強(qiáng)弱,無(wú)論社會(huì)制度如何,都有平等發(fā)展和利用人工智能的權(quán)利。

在標(biāo)準(zhǔn)方面,中國(guó)信息通信研究院已經(jīng)啟動(dòng)《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評(píng)估方法》系列標(biāo)準(zhǔn)研制的工作,全面覆蓋大模型的開(kāi)發(fā)、部署和應(yīng)用環(huán)節(jié),其中第四部分可信要求是目前國(guó)內(nèi)首項(xiàng)針對(duì)大模型領(lǐng)域的可信賴(lài)標(biāo)準(zhǔn)。

與此同時(shí),全國(guó)信息安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)已經(jīng)啟動(dòng)包括《信息安全技術(shù) 生成式人工智能服務(wù)安全基本要求》在內(nèi)的三項(xiàng)生成式人工智能安全國(guó)家標(biāo)準(zhǔn)編制工作,以支撐大模型的監(jiān)管落地。

歐盟現(xiàn)行人工智能立法仍主要集中在傳統(tǒng)人工智能,但已經(jīng)開(kāi)始關(guān)注通用人工智能以及生成式人工智能的問(wèn)題,主張尊重人格尊嚴(yán)、個(gè)人自由和保護(hù)數(shù)據(jù)及隱私安全。

2023年6月14日,歐洲議會(huì)投票通過(guò)《人工智能法案》,該法案基于風(fēng)險(xiǎn)等級(jí)將人工智能系統(tǒng)分成四類(lèi),并制定了不同程度的監(jiān)管要求。

2023年5月13日,美國(guó)白宮總統(tǒng)科技顧問(wèn)委員會(huì)(PCAST)成立生成式人工智能工作組,以幫助評(píng)估關(guān)鍵機(jī)遇和風(fēng)險(xiǎn),并就如何更好地確保這些技術(shù)的開(kāi)發(fā)和部署盡可能公平、負(fù)責(zé)任和安全提供意見(jiàn)。

2023年10月30日,美國(guó)總統(tǒng)拜登簽署人工智能行政令,旨在加強(qiáng)對(duì)人工智能潛在風(fēng)險(xiǎn)的監(jiān)管,發(fā)展安全、可靠和值得信賴(lài)的人工智能,促進(jìn)人工智能創(chuàng)新,確保美國(guó)在人工智能領(lǐng)域繼續(xù)領(lǐng)跑全球。

同時(shí)行政令在標(biāo)準(zhǔn)方面,提出美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)將制定嚴(yán)格的人工智能安全測(cè)試標(biāo)準(zhǔn),人工智能系統(tǒng)在公開(kāi)發(fā)布前需根據(jù)這些標(biāo)準(zhǔn)進(jìn)行廣泛的測(cè)試以確保安全。

1  2  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)