訂閱
糾錯(cuò)
加入自媒體

中文NL2SQL準(zhǔn)確率超92% 產(chǎn)學(xué)研攜手推動(dòng)智能交互發(fā)展

2019-10-15 16:16
來(lái)源: 粵訊

10月12日,由追一科技主辦、南京大學(xué)計(jì)算機(jī)軟件新技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室協(xié)辦的“首屆中文NL2SQL挑戰(zhàn)賽”總決賽答辯暨頒獎(jiǎng)典禮在南京大學(xué)舉行。經(jīng)過(guò)最終決賽的5強(qiáng)選手隊(duì)伍現(xiàn)場(chǎng)分享答辯和現(xiàn)場(chǎng)評(píng)委考評(píng),國(guó)防科技大學(xué)選手團(tuán)隊(duì)奪得冠軍,國(guó)雙科技團(tuán)隊(duì)獲得亞軍,觀安信息與妙盈科技聯(lián)合團(tuán)隊(duì)獲得季軍,華南理工大學(xué)與佛羅里達(dá)大學(xué)的選手隊(duì)伍,以及浙江大學(xué)的團(tuán)隊(duì)則獲得優(yōu)勝獎(jiǎng)。

中文NL2SQL準(zhǔn)確率超92% 產(chǎn)學(xué)研攜手推動(dòng)智能交互發(fā)展

由眾多人工智能權(quán)威專家組成的評(píng)委團(tuán),包括中國(guó)移動(dòng)研究院首席科學(xué)家馮俊蘭、復(fù)旦大學(xué)教授肖仰華、新加坡南洋理工大學(xué)副教授毛可智、南京大學(xué)教授俞揚(yáng)、追一科技CTO劉云峰等產(chǎn)學(xué)研多方代表,在決賽現(xiàn)場(chǎng)對(duì)選手們的技術(shù)方案,進(jìn)行了專業(yè)的分析點(diǎn)評(píng),從而產(chǎn)生最終結(jié)果。

隨著NLP基礎(chǔ)能力發(fā)展,自然語(yǔ)言轉(zhuǎn)換可執(zhí)行的SQL語(yǔ)句,訪問(wèn)數(shù)據(jù)庫(kù)等一系列復(fù)雜的人機(jī)交互正逐漸成為可能。此次大賽短短幾個(gè)月里,頂級(jí)選手模型方案準(zhǔn)確率達(dá)到92%以上,刷新業(yè)界記錄。

中文NL2SQL準(zhǔn)確率超92% 產(chǎn)學(xué)研攜手推動(dòng)智能交互發(fā)展

追一科技CTO劉云峰

“此次挑戰(zhàn)賽參與規(guī)模、選手表現(xiàn)遠(yuǎn)超預(yù)期,顯示出NL2SQL在學(xué)術(shù)和產(chǎn)業(yè)應(yīng)用上的潛力,數(shù)據(jù)庫(kù)的交互創(chuàng)新,正在受到越來(lái)越多關(guān)注。”追一科技聯(lián)合創(chuàng)始人兼CTO劉云峰表示,追一科技將與更多院校、企業(yè)界同仁攜手,共同推動(dòng)中文NLP研究與應(yīng)用突破。

新一代數(shù)據(jù)庫(kù)交互

NL2SQL(自然語(yǔ)言轉(zhuǎn)結(jié)構(gòu)化查詢語(yǔ)句)作為新興的研究領(lǐng)域,在國(guó)外由SalesForce耶魯大學(xué)等發(fā)布了WikiSQL和Spider數(shù)據(jù)集,但在國(guó)內(nèi)市場(chǎng),目前還處于起步階段。此次NL2SQL挑戰(zhàn)賽是國(guó)內(nèi)首次舉辦。

“大數(shù)據(jù)價(jià)值變現(xiàn)最大難題就是訪問(wèn)門檻太高”,嘉賓評(píng)委代表、復(fù)旦大學(xué)教授肖仰華表示,利用自然語(yǔ)言訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)里的數(shù)據(jù),一直是數(shù)據(jù)庫(kù)業(yè)內(nèi)夢(mèng)想。太多的數(shù)據(jù)“沉睡”在關(guān)系表格里,使得這一愿望更變得日益迫切。

中文NL2SQL準(zhǔn)確率超92% 產(chǎn)學(xué)研攜手推動(dòng)智能交互發(fā)展

NL2SQL挑戰(zhàn)賽點(diǎn)評(píng)評(píng)委、復(fù)旦大學(xué)教授肖仰華

作為此次比賽的主辦方,追一科技聯(lián)合創(chuàng)始人兼CTO劉云峰也表示,追一在服務(wù)企業(yè)的過(guò)程中的發(fā)現(xiàn),很多企業(yè)的知識(shí)和數(shù)據(jù)都是以關(guān)系型數(shù)據(jù)庫(kù)的形式存儲(chǔ),例如銀行用戶的消費(fèi)記錄、基金公司的基金屬性、保險(xiǎn)公司的保單記錄等等,如果想更好地利用,“亟需將自然語(yǔ)言轉(zhuǎn)換成可執(zhí)行的機(jī)器語(yǔ)言技術(shù)”。

劉云峰認(rèn)為,NL2SQL正是非常好的技術(shù)實(shí)現(xiàn)路徑,“這也是追一科技發(fā)起比賽的原因!

期間,追一科技發(fā)布了業(yè)內(nèi)首個(gè)大規(guī)模的中文數(shù)據(jù)集,包括4870張表格數(shù)據(jù)、近50000條標(biāo)注數(shù)據(jù)以及相應(yīng)的SQL語(yǔ)句,并獲得很多學(xué)界專家、產(chǎn)業(yè)界伙伴的支持,通過(guò)“產(chǎn)學(xué)研”等多方聯(lián)動(dòng),希望提供一個(gè)平臺(tái),來(lái)推動(dòng)NL2SQL研究和應(yīng)用。

產(chǎn)學(xué)研參與

據(jù)了解,本次比賽吸引了海內(nèi)外1457支隊(duì)伍參與,包括院校、機(jī)構(gòu)和企業(yè)開(kāi)發(fā)者。

其中,學(xué)生及科研人員占比48%,企業(yè)技術(shù)員工占比52%。學(xué)生參賽隊(duì)伍來(lái)自眾多知名院校,如北京大學(xué)、清華大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)、南京大學(xué)、浙江大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、哈爾濱工業(yè)大學(xué)、西安交通大學(xué)等。以及來(lái)自海外CMU、墨爾本大學(xué)、新加坡國(guó)立大學(xué)等頂級(jí)院校參與。

企業(yè)界的開(kāi)發(fā)愛(ài)好者,則成為比賽的另一只重要力量。來(lái)自中國(guó)移動(dòng)、平安集團(tuán)、搜狗、達(dá)闥科技、中興通訊、網(wǎng)宿科技、國(guó)雙科技、捷通華聲等眾多企業(yè)的技術(shù)人員,也成為參賽隊(duì)伍的重要力量。

院校與院校、企業(yè)與企業(yè)等聯(lián)合“組隊(duì)”挑戰(zhàn),成為比賽的一大亮點(diǎn)。比如5強(qiáng)中的華南理工與佛羅里達(dá),上海觀安信息與妙盈科技等,均為聯(lián)合戰(zhàn)隊(duì)。

“眾人拾柴火焰高”,劉云峰表示,這次比賽也是搭建一個(gè)橋梁,讓學(xué)界、技術(shù)創(chuàng)業(yè)者、市場(chǎng)多方更好地聯(lián)動(dòng),“讓企業(yè)釘子找到‘錘子’,讓學(xué)術(shù)和技術(shù)創(chuàng)業(yè)者的錘子找到‘釘子’!

作為高校嘉賓代表,南京大學(xué)人工智能創(chuàng)新研究院院長(zhǎng)詹德川表示,除了選手的熱情和參與,更看重比賽的交流機(jī)會(huì),“學(xué)界和產(chǎn)業(yè)界可以進(jìn)行深入的交流!彼瑫r(shí)表示,產(chǎn)學(xué)研攜手,“AI的熱情不會(huì)進(jìn)入冬天” 。此次活動(dòng)中,南京大學(xué)計(jì)算機(jī)軟件新技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室與追一科技合作,協(xié)辦比賽,助力產(chǎn)學(xué)研合作。

中文NL2SQL準(zhǔn)確率超92% 產(chǎn)學(xué)研攜手推動(dòng)智能交互發(fā)展

南京大學(xué)人工智能創(chuàng)新研究院院長(zhǎng)詹德川

經(jīng)過(guò)多方努力,短短幾個(gè)月里,NL2SQL中文領(lǐng)域研究快速突破。

比賽初期,準(zhǔn)確率尚為60%多,至8月份初賽結(jié)束時(shí),榜上頭部分?jǐn)?shù)已經(jīng)達(dá)到89%,接近WikiSQL成績(jī)。復(fù)賽結(jié)束時(shí),選手最高成績(jī)達(dá)到92%,刷新業(yè)界記錄。并且,最終晉級(jí)決賽的5支隊(duì)伍,個(gè)個(gè)都在“90分”以上。

“最終選手的成績(jī),完全超出了我們對(duì)于比賽的預(yù)期!弊鳛樵u(píng)委代表,肖仰華表示,實(shí)際上中文自然語(yǔ)言轉(zhuǎn)SQL的挑戰(zhàn)更大,選手們的成績(jī),不但讓人驚喜,而且表現(xiàn)了深厚理論功底,對(duì)深度學(xué)習(xí)、自然語(yǔ)言處理思路和模型的嫻熟。

中文NL2SQL準(zhǔn)確率超92% 產(chǎn)學(xué)研攜手推動(dòng)智能交互發(fā)展

中國(guó)移動(dòng)研究院首席科學(xué)家馮俊蘭

作為來(lái)自產(chǎn)業(yè)界的專家評(píng)委,馮俊蘭表示,NL2SQL 是自然語(yǔ)言處理的一個(gè)非常重要的應(yīng)用領(lǐng)域,涉及到多個(gè)自然語(yǔ)言處理領(lǐng)域的核心問(wèn)題,非常開(kāi)心看到這么多高水平的隊(duì)伍參賽,并取得了非常好的成績(jī),也看了產(chǎn)、學(xué)、研在這個(gè)方向上共同提升技術(shù)的熱情。

應(yīng)用前景

如火如荼比賽背后,NL2SQL應(yīng)用潛力,也受到了越來(lái)越多的矚目。

業(yè)內(nèi)人士表示, NL2SQL在銀行、保險(xiǎn)、證券、電商、汽車、地產(chǎn)等數(shù)據(jù)富礦領(lǐng)域,有很大的應(yīng)用潛力,可以大大地降低數(shù)據(jù)庫(kù)訪問(wèn)和使用門檻,提升人機(jī)交互體驗(yàn),并更好地挖掘數(shù)據(jù)價(jià)值。

“今天在AI與數(shù)據(jù)庫(kù)交互上,我們又一次看到了突破,新的想象空間!睂(duì)于此次比賽的舉行,創(chuàng)新工場(chǎng)董事長(zhǎng)兼首席執(zhí)行官李開(kāi)復(fù)也表示,期待看到追一和更多NLP開(kāi)發(fā)愛(ài)好者,不斷探索努力,推進(jìn)NLP創(chuàng)新和普惠應(yīng)用。

“此次挑戰(zhàn)賽參與規(guī)模遠(yuǎn)超預(yù)期,顯示出NL2SQL在學(xué)術(shù)和產(chǎn)業(yè)應(yīng)用上的潛力,數(shù)據(jù)庫(kù)的交互創(chuàng)新,正在受到越來(lái)越多關(guān)注!弊芬豢萍悸(lián)合創(chuàng)始人兼CTO劉云峰博士表示,追一科技將與更多院校、企業(yè)界同仁攜手,共同推動(dòng)中文NLP研究與應(yīng)用突破。


聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)