侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

中科院自動(dòng)化所王飛躍教授團(tuán)隊(duì)研究成果入選第五屆中國(guó)科協(xié)優(yōu)秀科技論文

本文來(lái)源:智車(chē)科技

/ 導(dǎo)讀 /

2020年9月30日,中國(guó)科協(xié)公布了第五屆優(yōu)秀科技論文評(píng)選結(jié)果,中科院自動(dòng)化所王飛躍教授團(tuán)隊(duì)的李力教授牽頭發(fā)表于《自動(dòng)化學(xué)報(bào)》的“平行學(xué)習(xí)-機(jī)器學(xué)習(xí)的一個(gè)新型理論框架”一文榜上有名。本屆遴選計(jì)劃共收錄96篇論文,均為發(fā)表在我國(guó)科技期刊上的優(yōu)秀論文代表。

第五屆科協(xié)優(yōu)秀論文遴選計(jì)劃公示表

論文概述

隨著計(jì)算能力的提高和計(jì)算理論的創(chuàng)新, 機(jī)器學(xué)習(xí)在過(guò)去 30 年中取得了長(zhǎng)足的發(fā)展 , 正受到越來(lái)越多人的關(guān)注,與此同時(shí), 機(jī)器學(xué)習(xí)也面臨越來(lái)越多的問(wèn)題, 傳統(tǒng)機(jī)器學(xué)習(xí)理論框架的不足被逐漸發(fā)現(xiàn)和確認(rèn), 新的機(jī)器學(xué)習(xí)理論框架不斷被提出。

中科院自動(dòng)化所王飛躍研究員于2004年提出了平行系統(tǒng)的思想, 試圖用一種適合復(fù)雜系統(tǒng)的計(jì)算理論與方法解決社會(huì)經(jīng)濟(jì)系統(tǒng)中的重要問(wèn)題. 其主要觀點(diǎn)是利用大型計(jì)算模擬、 預(yù)測(cè)并誘發(fā)引導(dǎo)復(fù)雜系統(tǒng)現(xiàn)象, 通過(guò)整合人工社會(huì), 計(jì)算實(shí)驗(yàn)和平行系統(tǒng)等方法, 形成新的計(jì)算研究體系。

近年來(lái), 我們嘗試將平行系統(tǒng)的思想擴(kuò)展并引入到機(jī)器學(xué)習(xí)領(lǐng)域建立一種新型理論框架以更好地解決數(shù)據(jù)取舍、行動(dòng)選擇等傳統(tǒng)機(jī)器學(xué)習(xí)理論不能很好解決的問(wèn)題。在本文中,我們將對(duì)這一理論框架的結(jié)構(gòu)和方法進(jìn)行闡述?蚣苁疽鈭D如下:

圖1  平行學(xué)習(xí)的理論框架圖

平行學(xué)習(xí)大致可以分為預(yù)測(cè)學(xué)習(xí)(Predictive Learning)、描述學(xué)習(xí)(Descriptive learning)、指示學(xué)習(xí)(Prescriptive Learning)三個(gè)互相耦合關(guān)聯(lián)的階段。

在數(shù)據(jù)處理階段,平行學(xué)習(xí)首先從原始數(shù)據(jù)中選取特定的“小數(shù)據(jù)”,結(jié)合先驗(yàn)知識(shí),使用預(yù)測(cè)學(xué)習(xí)產(chǎn)生大量新的數(shù)據(jù)。這些人工數(shù)據(jù)和特定的原始小數(shù)據(jù)一起構(gòu)成解決問(wèn)題所需要學(xué)習(xí)的“大數(shù)據(jù)”集合,通過(guò)描述學(xué)習(xí)的方式產(chǎn)生一個(gè)人工系統(tǒng)。

在行動(dòng)學(xué)習(xí)階段,平行學(xué)習(xí)沿用強(qiáng)化學(xué)習(xí)的思路,使用狀態(tài)遷移來(lái)刻畫(huà)系統(tǒng)的動(dòng)態(tài)變化,通過(guò)指示學(xué)習(xí)的方式在人工系統(tǒng)中對(duì)行動(dòng)空間進(jìn)行探索。通過(guò)學(xué)習(xí)提取,我們可以得到“小知識(shí)”——應(yīng)用于某些具體場(chǎng)景或任務(wù)的精準(zhǔn)知識(shí),并將其應(yīng)用于平行控制和平行決策。而平行控制和平行決策將引導(dǎo)系統(tǒng)進(jìn)行特定的數(shù)據(jù)采集,獲得新的原始數(shù)據(jù),并再次進(jìn)行新的平行學(xué)習(xí),使系統(tǒng)在數(shù)據(jù)和行動(dòng)之間構(gòu)成一個(gè)閉環(huán)。

以平行學(xué)習(xí)在自動(dòng)泊車(chē)中的應(yīng)用為例。首先通過(guò)獲取真實(shí)系統(tǒng)中的泊車(chē)數(shù)據(jù), 結(jié)合計(jì)算實(shí)驗(yàn)與預(yù)測(cè)學(xué)習(xí)生成人工數(shù)據(jù),形成泊車(chē)的“大數(shù)據(jù)”。使用這些數(shù)據(jù),通過(guò)描述學(xué)習(xí)的方式構(gòu)造人工系統(tǒng),該系統(tǒng)是真實(shí)車(chē)輛的平行系統(tǒng),接受控制序列作為輸入,輸出車(chē)輛的移動(dòng)軌跡。在這一人工系統(tǒng)中,我們可以使用指示學(xué)習(xí)的方式探索可能的泊車(chē)方案,學(xué)習(xí)到的策略會(huì)控制真實(shí)車(chē)輛進(jìn)行泊車(chē),進(jìn)而獲得更多的數(shù)據(jù)。完整流程如下圖所示

圖2  平行學(xué)習(xí)在自動(dòng)泊車(chē)中的應(yīng)用

平行的核心思想是從小數(shù)據(jù)產(chǎn)生大數(shù)據(jù),再?gòu)拇髷?shù)據(jù)提煉小規(guī)則即精準(zhǔn)知識(shí)。平行學(xué)習(xí)是這一思想在機(jī)器學(xué)習(xí)領(lǐng)域中的具體實(shí)現(xiàn)。平行學(xué)習(xí)已在虛擬場(chǎng)景生成、無(wú)人駕駛車(chē)輛的智能控制與測(cè)試、社會(huì)計(jì)算和情報(bào)處理等領(lǐng)域得到了較好的應(yīng)用。期待本文拋磚引玉,引起業(yè)內(nèi)專(zhuān)家學(xué)者興趣,共同對(duì)機(jī)器學(xué)習(xí)理論做出更加深入的革新。

關(guān)于“優(yōu)秀科技論文遴選計(jì)劃”

“優(yōu)秀科技論文遴選計(jì)劃”是中國(guó)科協(xié)基于鼓勵(lì)科技工作者多出科研精品和原創(chuàng)性研究成果、促進(jìn)更多優(yōu)秀成果在我國(guó)科技期刊首發(fā)、進(jìn)而助推世界一流科技期刊建設(shè)而設(shè)的大型年度評(píng)選活動(dòng)。遴選工作由中國(guó)科協(xié)統(tǒng)一部署,面向10個(gè)學(xué)科集群評(píng)選推介發(fā)表在我國(guó)正式出版的科技期刊上、且在國(guó)際學(xué)術(shù)界有影響、在科技前沿有突破和建樹(shù)、對(duì)原始創(chuàng)新有引領(lǐng)作用、對(duì)國(guó)家經(jīng)濟(jì)社會(huì)建設(shè)有重大貢獻(xiàn)的優(yōu)秀論文,對(duì)從源頭上推動(dòng)我國(guó)期刊質(zhì)量的提升,維護(hù)我國(guó)科技期刊的成果首發(fā)權(quán),掌握學(xué)術(shù)評(píng)價(jià)主導(dǎo)權(quán)、進(jìn)而提升我國(guó)在國(guó)際科技界的話語(yǔ)權(quán),更好地提升科技創(chuàng)新能力有重要的推動(dòng)作用。

- End -

 

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)