訂閱
糾錯(cuò)
加入自媒體

大模型的浪頭卷到了金融業(yè)

導(dǎo)語(yǔ):金融業(yè)數(shù)智化步入“深水區(qū)”。

出品丨數(shù)科社

作者丨林木

就在由ChatGPT引爆的國(guó)內(nèi)“千模大戰(zhàn)”激戰(zhàn)正酣之際,與AIGC有著諸多契合場(chǎng)景的金融領(lǐng)域踏上了一條探尋行業(yè)大模型的變革之路。

今年3月,彭博社針對(duì)金融業(yè)推出大型語(yǔ)言模型BloombergGPT,立即引起國(guó)內(nèi)市場(chǎng)對(duì)金融垂直領(lǐng)域大模型應(yīng)用的廣泛關(guān)注。繼各互聯(lián)網(wǎng)巨頭躬身入局后,金融科技賽道的頭部玩家們也開(kāi)始馬不停蹄的探路大語(yǔ)言模型。

5月,星環(huán)科技推出第一款面向金融量化領(lǐng)域的生成式大語(yǔ)言模型“無(wú)涯Infinity”,度小滿開(kāi)源國(guó)內(nèi)首個(gè)千億參數(shù)金融大模型“軒轅”;6月,恒生電子發(fā)布金融行業(yè)大模型LightGPT,將于9月底開(kāi)放試用接口;最近,馬上消費(fèi)的自研金融大模型箭在弦上即將發(fā)布……

在近百款大模型產(chǎn)品的激烈交鋒下,通用大模型的求解能力日益趨近同質(zhì)化,也讓大模型在特定行業(yè)的落地奔跑成為新賽點(diǎn)。

那么,“金融大模型”這條路究竟如何走通?又將給金融行業(yè)帶來(lái)哪些驚喜和挑戰(zhàn)?

01丨探路“金融大模型”

月初剛剛在上海落幕的WAIC上,“大模型”無(wú)疑成為今年廠商、與會(huì)者屢屢提及的熱詞。大會(huì)期間,來(lái)自各家廠商的30多個(gè)基礎(chǔ)大模型、垂直大模型集中亮相,讓眼下這場(chǎng)“千模大戰(zhàn)”的硝煙味又重了一分。

在讓人眼花繚亂的通用大模型之中,垂直于行業(yè)的大模型可謂是今年大會(huì)的亮點(diǎn)之一。馬上消費(fèi)CTO蔣寧在現(xiàn)場(chǎng)接受媒體采訪時(shí)表示,大語(yǔ)言模型技術(shù)出世后,對(duì)金融行業(yè)的人工智能技術(shù)應(yīng)用無(wú)異于“強(qiáng)心劑”。

在他看來(lái),金融行業(yè)有著數(shù)據(jù)密集型、技術(shù)密集型的天然屬性,一直在探索數(shù)據(jù)資產(chǎn)化,挖掘數(shù)據(jù)價(jià)值,同時(shí)又面臨著如銀行線下網(wǎng)點(diǎn)的價(jià)值傳遞效率問(wèn)題、用戶體驗(yàn)問(wèn)題,需要機(jī)構(gòu)持續(xù)創(chuàng)新。

基于這些行業(yè)特點(diǎn),也注定了大語(yǔ)言模型技術(shù)將會(huì)為其帶來(lái)新的賦能。3月底,BloombergGPT的發(fā)布標(biāo)志著ChatGPT引爆的AI熱潮已一路蔓延到了金融圈。

據(jù)彭博社發(fā)布的報(bào)告指出,這一專門訓(xùn)練用于金融領(lǐng)域的大語(yǔ)言模型(LLM),訓(xùn)練中在金融任務(wù)上的表現(xiàn)遠(yuǎn)超過(guò)現(xiàn)有模型,且在通用場(chǎng)景上的表現(xiàn)與現(xiàn)有模型也能一較高下。

這將意味著,LLM正在邁向結(jié)合具體行業(yè)和特定場(chǎng)景進(jìn)行垂直落地的新階段,不僅是其實(shí)現(xiàn)商業(yè)化躍遷的關(guān)鍵,更是整個(gè)產(chǎn)業(yè)大爆發(fā)的重要一步,這也引來(lái)國(guó)內(nèi)金融科技廠商迅速跟進(jìn)。

“對(duì)比于通用大模型的能力而言,金融行業(yè)非常需要垂直行業(yè)大模型!痹诓痪们罢匍_(kāi)的2023全球數(shù)字經(jīng)濟(jì)大會(huì)上,度小滿CTO許冬亮也給出了自己的看法。

他認(rèn)為,囿于金融行業(yè)在數(shù)據(jù)安全隱私、風(fēng)控、精度以及實(shí)時(shí)性等方面要求較高,使得通用大模型在金融能力上缺乏必要的訓(xùn)練數(shù)據(jù),從而對(duì)金融常識(shí)、生成的可控性和準(zhǔn)確性都達(dá)不到這個(gè)行業(yè)的最低要求,因此需要針對(duì)金融機(jī)構(gòu)定制的行業(yè)大模型去發(fā)揮效力。

作為搶先一步試水的頭部玩家之一,度小滿在5月下旬推出了國(guó)內(nèi)首個(gè)垂直金融行業(yè)的開(kāi)源大模型“軒轅”。該模型基于1760億參數(shù)的Bloom(決定輸入數(shù)據(jù)如何轉(zhuǎn)換為輸出內(nèi)容的變量)大模型基礎(chǔ)訓(xùn)練而來(lái),相較于通用大模型,在金融名詞理解、金融市場(chǎng)評(píng)論、金融數(shù)據(jù)分析和金融新聞理解等金融場(chǎng)景任務(wù)上的表現(xiàn)可圈可點(diǎn)。

下水的顯然不止度小滿一家。6月28日,恒生電子金融行業(yè)大模型LightGPT也首次對(duì)外亮相。恒生電子董事長(zhǎng)劉曙峰表示,大模型是信息技術(shù)的最新突破,刷新了人們對(duì)機(jī)器智能的認(rèn)知,同時(shí)也在刷新行業(yè)應(yīng)用傳統(tǒng)AI模型的模式。

在“千模大戰(zhàn)”背景下,隨著各路金融科技企業(yè)在大模型的不斷試水,金融業(yè)數(shù)智化的發(fā)展也悄然走向了一個(gè)從量變到質(zhì)變的新階段。

02丨生成式AI浪潮能力涌現(xiàn)

大模型時(shí)代,算力、算法、數(shù)據(jù)構(gòu)成了新范式的“三駕馬車”,其中,數(shù)據(jù)更可視為決定大模型質(zhì)量和商業(yè)化落地的核心要素。作為一個(gè)業(yè)務(wù)流程規(guī)范、數(shù)據(jù)和知識(shí)沉淀完備的行業(yè),金融業(yè)天然具有應(yīng)用大模型的基礎(chǔ)優(yōu)勢(shì)。

回顧過(guò)去十年金融業(yè)的發(fā)展浪潮,是一場(chǎng)涉及到整個(gè)金融產(chǎn)業(yè)的信息化和數(shù)字化革命,為人工智能的滲透融入奠定了基礎(chǔ)。近年來(lái),在智能營(yíng)銷、智能風(fēng)控、智能投研、智能客服等領(lǐng)域,基于機(jī)器學(xué)習(xí)驅(qū)動(dòng)的建模能力都是金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型翻涌的浪花。

當(dāng)下以生成式AI為代表的第二波人工智能浪潮席卷至金融業(yè),大模型所積聚的“三駕馬車”也已從量變走向質(zhì)變。

在近日恒生聚源主辦的“大模型在金融行業(yè)的應(yīng)用與展望”研討會(huì)上,恒生電子高級(jí)副總裁、恒生聚源董事長(zhǎng)王鋒表示:“傳統(tǒng)的AI模型,參數(shù)量少,通過(guò)大量的數(shù)據(jù)標(biāo)注、大規(guī)模的模板配置來(lái)實(shí)現(xiàn)。換一個(gè)場(chǎng)景就要再重新來(lái)過(guò)一遍,泛化性不足,被詬病為有多少人工,才有多少智能。而大模型基于GPT——生成式預(yù)訓(xùn)練tranformer技術(shù)路線,通過(guò)預(yù)訓(xùn)練、微調(diào)、獎(jiǎng)勵(lì)模型、強(qiáng)化學(xué)習(xí)四個(gè)主要步驟和千億級(jí)別參數(shù)規(guī)模,做到了令人驚艷的效果,也就是我們所說(shuō)的能力涌現(xiàn)!

這種能力涌現(xiàn)如今正賦能在金融云產(chǎn)品的方方面面。

如在AI開(kāi)發(fā)層面,大模型展現(xiàn)出強(qiáng)大的代碼自動(dòng)化生成能力,顛覆了傳統(tǒng)的“手工作坊式”模型,極大提升了機(jī)器學(xué)習(xí)的開(kāi)發(fā)效率和生產(chǎn)模式;在智能交互方面,大模型的語(yǔ)音識(shí)別率不僅精準(zhǔn),還能憑借著深度語(yǔ)義理解與生成能力,快速解答客戶復(fù)雜且專業(yè)性的問(wèn)題;在分析決策方面,有著強(qiáng)大信息挖掘能力的大模型,能在風(fēng)險(xiǎn)決策、信用評(píng)估、反欺詐等場(chǎng)景,觸及小模型無(wú)法覆蓋到的區(qū)域。

申萬(wàn)宏源證券研究所所長(zhǎng)助理劉洋認(rèn)為,在算力、算法、數(shù)據(jù)“三駕馬車”的推動(dòng)下,工程化能力變得尤為重要,特別是在券商、基金這樣的垂類大模型應(yīng)用場(chǎng)景下,率先為客戶提供服務(wù)的廠商將搶占先機(jī)。

因此,金融大模型的落地應(yīng)用也成了市場(chǎng)當(dāng)下所聚焦的關(guān)鍵一步。

03丨落地商業(yè)化尚需時(shí)日

盡管業(yè)內(nèi)普遍認(rèn)為,大模型將是開(kāi)啟金融領(lǐng)域“iPhone時(shí)刻”的按鈕,但擺在眼前的事實(shí)是,現(xiàn)下的“金融大模型”主要停留在工具層和應(yīng)用層,更類似于業(yè)務(wù)流程優(yōu)化助手,在核心金融業(yè)務(wù)場(chǎng)景的落地之路任重而道遠(yuǎn)。

作為一個(gè)受到強(qiáng)監(jiān)管的行業(yè),金融業(yè)首先對(duì)于技術(shù)應(yīng)用的安全性、穩(wěn)定性、可控性等要求遠(yuǎn)比其他行業(yè)更為嚴(yán)格。尤其是在考慮到數(shù)據(jù)的安全與合規(guī)問(wèn)題,意味著前期的數(shù)據(jù)采集和“清洗”等工作,廠商可能需要花費(fèi)更多的時(shí)間和精力。

在馬上消費(fèi)CTO蔣寧看來(lái),挑戰(zhàn)主要現(xiàn)有大模型難以在金融特定領(lǐng)域?qū)崿F(xiàn)落地的挑戰(zhàn)主要來(lái)自四個(gè)方面:

一是當(dāng)前的大模型在面對(duì)動(dòng)態(tài)且不可預(yù)期變化的金融各項(xiàng)業(yè)務(wù)時(shí),還并不能做到每一份決策都穩(wěn)定、精確;二是金融行業(yè)往往希望為用戶提供個(gè)性化的服務(wù)體驗(yàn),但這需要個(gè)人隱私數(shù)據(jù)和大模型相融合,涉及到合規(guī)和安全問(wèn)題;三是金融行業(yè)一直存在的“數(shù)據(jù)孤島”問(wèn)題,大模型要求構(gòu)建增強(qiáng)學(xué)習(xí)的網(wǎng)絡(luò)化平臺(tái),并持續(xù)貢獻(xiàn)數(shù)據(jù)和反饋,但目前背后市場(chǎng)的數(shù)據(jù)生態(tài)是割裂的,仍然需要持續(xù)性的探索;四是金融行業(yè)大模型應(yīng)用對(duì)底層設(shè)備、基礎(chǔ)架構(gòu)等軟硬件設(shè)施提出更高的要求。

對(duì)于上述挑戰(zhàn),他認(rèn)為可從強(qiáng)化學(xué)習(xí)和持續(xù)學(xué)習(xí)技術(shù)、魯棒性決策、組合式AI系統(tǒng)技術(shù)等三個(gè)大模型領(lǐng)域的關(guān)鍵技術(shù)入手。

他進(jìn)一步解釋道,強(qiáng)化和持續(xù)學(xué)習(xí)會(huì)讓系統(tǒng)越用越聰明,這就在于大模型幕后自適應(yīng)的生態(tài)能力建設(shè),魯棒性決策則是實(shí)現(xiàn)關(guān)鍵決策的持續(xù)穩(wěn)定和合規(guī)可信的核心環(huán)節(jié),組合式AI系統(tǒng)技術(shù)可以有效結(jié)合各種垂直領(lǐng)域的判別式模型的可用性和專業(yè)性,助其真正發(fā)揮大模型的泛化能力優(yōu)勢(shì)。

基于上述認(rèn)知,馬上消費(fèi)在探路金融大模型方面制定了“三橫三豎”戰(zhàn)略。據(jù)蔣寧透露,目前公司已開(kāi)發(fā)了智能生成報(bào)表的工具產(chǎn)品,在智能客服場(chǎng)景上也有所涉獵,并即將發(fā)布自研的金融大模型。

最后關(guān)于行業(yè)最受掣肘的數(shù)據(jù)質(zhì)量和合規(guī)問(wèn)題,奇富科技首席算法科學(xué)家費(fèi)浩峻此前在接受《中國(guó)經(jīng)營(yíng)報(bào)》采訪時(shí)表示,對(duì)于數(shù)據(jù)質(zhì)量問(wèn)題,可以從數(shù)字化改造的源頭進(jìn)行標(biāo)準(zhǔn)化建設(shè),并且設(shè)置有嚴(yán)格一致性的評(píng)估指標(biāo)和方法。而在合規(guī)方面,商用級(jí)需要重點(diǎn)解決的問(wèn)題是輕量級(jí)和易用性。

顯然,對(duì)于剛剛邁入數(shù)智化“深水區(qū)”的金融業(yè)而言,尚需要一個(gè)適應(yīng)到不斷完善的過(guò)程,這也需要身處水中的廠商們擁抱合作互通,共同迎接大模型時(shí)代的到來(lái)。

       原文標(biāo)題 : 大模型的浪頭卷到了金融業(yè)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)