訂閱
糾錯(cuò)
加入自媒體

AI比人類更懂中文 阿里拿下FewCLUE雙料冠軍

2021-07-28 14:27
快科技
關(guān)注

AI人工智能是現(xiàn)在的熱門,很多服務(wù)都上了AI客服,如何讓AI用最少的樣本來(lái)理解自然語(yǔ)言是個(gè)難題,國(guó)內(nèi)還有中文語(yǔ)言理解的需要。在日前的中文語(yǔ)言理解權(quán)威評(píng)測(cè)基準(zhǔn)CLUE評(píng)測(cè)中,阿里的AI模型就拿到了雙料冠軍。

日前, 中文語(yǔ)言理解權(quán)威評(píng)測(cè)基準(zhǔn)CLUE公布了小樣本學(xué)習(xí)評(píng)測(cè)榜單FewCLUE的最新結(jié)果,阿里巴巴在大模型和無(wú)參數(shù)限制模型兩項(xiàng)賽事中雙雙刷新榜單最好紀(jì)錄,僅次于“人類”,并在極少(一個(gè)類別僅十余個(gè))樣本條件下,超過(guò)了新聞文本分類上的人類識(shí)別精確度。

這證明了AI小樣本學(xué)習(xí)在NLP任務(wù)上具備超越人類的能力。

AI比人類更懂中文 阿里拿下FewCLUE雙料冠軍

FewCLUE是CLUE最新推出的一項(xiàng)中文小樣本學(xué)習(xí)評(píng)測(cè)榜單,包括大模型和無(wú)參數(shù)限制模型雙賽道,用來(lái)評(píng)估預(yù)訓(xùn)練模型是否能夠通過(guò)小樣本學(xué)習(xí)來(lái)掌握特定的自然語(yǔ)言處理任務(wù)。基于這項(xiàng)評(píng)估,科研人員可以更精準(zhǔn)的衡量預(yù)訓(xùn)練模型的泛化性和準(zhǔn)確率。

眾所周知,預(yù)訓(xùn)練模型在特定自然語(yǔ)言處理任務(wù)上要取得高精度的成本非常高,科研人員進(jìn)而轉(zhuǎn)向攻關(guān)小樣本學(xué)習(xí)技術(shù),希望用較低的成本實(shí)現(xiàn)可觀的識(shí)別精確度。

據(jù)悉,阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI和和達(dá)摩院共同提出了一種大模型+小樣本的聯(lián)合方案,在大規(guī)模通用預(yù)訓(xùn)練基礎(chǔ)之上,將億級(jí)知識(shí)圖譜融入預(yù)訓(xùn)練模型,打造了強(qiáng)大的底座KGBert,結(jié)合Fuzzy-PET少樣本學(xué)習(xí),在多個(gè)任務(wù)上比預(yù)訓(xùn)練微調(diào)技術(shù)提升近25%了準(zhǔn)確率,甚至在一個(gè)小樣本學(xué)習(xí)任務(wù)上的精準(zhǔn)度超過(guò)了人類。

例如,在智能客服場(chǎng)景下的用戶需求識(shí)別,僅需人工標(biāo)注幾十條樣本,就能讓需求識(shí)別的準(zhǔn)確率達(dá)到90%。

值得一提的是,這項(xiàng)小樣本學(xué)習(xí)技術(shù)已在阿里巴巴的實(shí)際場(chǎng)景落地且有很好的業(yè)務(wù)表現(xiàn),目前阿里云智能客服云小蜜僅用20條樣本就可以做到快速冷啟動(dòng),實(shí)現(xiàn)精準(zhǔn)問(wèn)答,準(zhǔn)確率超過(guò)80%,并在政務(wù)、金融、通用線多個(gè)業(yè)務(wù)場(chǎng)景落地。開發(fā)者可基于PAI直接調(diào)用行業(yè)解決方案,也可以二次開發(fā)打造自己的模型。

阿里云PAI是國(guó)際領(lǐng)先的機(jī)器學(xué)習(xí)平臺(tái),過(guò)去幾年陸續(xù)打破多項(xiàng)國(guó)內(nèi)外AI記錄:2019年10月,英文多輪閱讀榜單QuAC取得第一;2020年3月,中文CLUE分類榜單取得第一;2020年8月,英文SuperGLUE取得國(guó)內(nèi)第一,世界第二。

“我們希望通過(guò)算法與工程的協(xié)同設(shè)計(jì)構(gòu)建端到端的大規(guī)模AI工程能力,用云上AI平臺(tái)PAI服務(wù)各行各業(yè)!卑⒗锇桶透笨偛谩⒗镌朴(jì)算平臺(tái)負(fù)責(zé)人賈揚(yáng)清表示:“目前,PAI支持從數(shù)據(jù)標(biāo)注、模型設(shè)計(jì)、分布式訓(xùn)練、模型管理和模型服務(wù)等AI資產(chǎn)管理的各方面需求,全面提升AI落地企業(yè)應(yīng)用的效率。”

來(lái)源:快科技

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)