侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

基于端到端的自動(dòng)駕駛系統(tǒng)只能做demo嗎?

劍橋大學(xué)工程系團(tuán)隊(duì)創(chuàng)辦的Wayve憑借機(jī)器學(xué)習(xí)算法,只需要使用攝像頭和基本的衛(wèi)星導(dǎo)航就可以實(shí)現(xiàn)自動(dòng)駕駛汽車在陌生的道路上行駛。

自從2016年,英偉達(dá)公開了用于自動(dòng)駕駛汽車的端到端深度學(xué)習(xí)技術(shù)之后,已經(jīng)有不計(jì)其數(shù)的公司、單位甚至愛好者用此技術(shù)做出自動(dòng)駕駛的demo。簡單網(wǎng)絡(luò)結(jié)構(gòu),可以實(shí)現(xiàn)攝像頭輸入到剎車油門方向盤輸出的直接映射。然而這種低門檻也注定了它可以解決的問題并不多,很難應(yīng)對(duì)具體駕駛環(huán)境上的復(fù)雜性。有專家甚至認(rèn)為端到端不適合開發(fā)實(shí)用無人駕駛系統(tǒng),可以做demo,大規(guī)模商用可能非常困難。

端到端只配做demo嗎?由劍橋大學(xué)團(tuán)隊(duì)創(chuàng)辦的Wayve無人駕駛軟件公司卻不這么認(rèn)為。他們沒有用高精地圖,也沒有用激光雷達(dá)等昂貴的傳感器,當(dāng)然也沒有給汽車手工輸入規(guī)則,只訓(xùn)練20小時(shí)數(shù)據(jù),就可以在從未跑過的道路上駕駛。

Wayve 研發(fā)團(tuán)隊(duì)認(rèn)為既然是自動(dòng)駕駛,就不需要手工編碼一些規(guī)定,要充分的展現(xiàn)其智能的特性。團(tuán)隊(duì)采用了當(dāng)下大熱的深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)算法,建立了一個(gè)可以像人類一樣慢慢學(xué)習(xí)駕駛的自動(dòng)駕駛系統(tǒng)。

經(jīng)過探索、優(yōu)化和評(píng)估三個(gè)步驟進(jìn)行迭代,采用深度確定性策略梯度(Deep deterministic policy gradients,DDPG),來解決車道保持問題。

現(xiàn)有技術(shù)的圖像分類體系結(jié)構(gòu)具有數(shù)百萬個(gè)參數(shù),而Wayve團(tuán)隊(duì)的網(wǎng)絡(luò)構(gòu)架是一個(gè)深度網(wǎng)絡(luò),有4個(gè)卷積層和3個(gè)完全連接層,總共只有不到1萬個(gè)參數(shù),所有處理都在汽車GPU上執(zhí)行。

在強(qiáng)化學(xué)習(xí)仿真測(cè)試中,通過隨機(jī)生成曲線車道,以及道路紋理和車道標(biāo)記,然后根據(jù)收集的數(shù)據(jù)優(yōu)化策略,再不斷重復(fù)。

結(jié)合了圖像翻譯和行為克隆的端到端零鏡頭框架

大多數(shù)自駕車公司使用模擬來驗(yàn)證他們的系統(tǒng),而Wayve讓自動(dòng)駕駛汽車在仿真中廣泛學(xué)習(xí)如何處理罕見的邊緣情況。Wayve訓(xùn)練汽車進(jìn)行模擬駕駛,并將學(xué)到的知識(shí)轉(zhuǎn)化到現(xiàn)實(shí)世界。

Wayve沒有將模擬和現(xiàn)實(shí)世界視為兩個(gè)不同的領(lǐng)域,而是設(shè)計(jì)了一個(gè)框架,將兩者結(jié)合起來,既可以在模擬中訓(xùn)練轉(zhuǎn)向決策,又可以在現(xiàn)實(shí)世界中展現(xiàn)出類似的行為而無需進(jìn)行真正的演示。

Wayve的模型由一對(duì)最初用于圖像轉(zhuǎn)換的卷積變分自動(dòng)編碼器式的網(wǎng)絡(luò)組成,用于圖像翻譯,即無監(jiān)督圖像到圖像的翻譯網(wǎng)絡(luò)(Unsupervised Image-to-Image Translation Networks, UNIT))。在兩個(gè)域之間沒有任何已知的對(duì)齊或?qū)?yīng)關(guān)系的情況下,模型能夠在它們之間進(jìn)行轉(zhuǎn)換。下圖是一個(gè)捕捉場景主要布局的例子。值得注意的是,模擬器的視覺保真度在學(xué)習(xí)駕駛時(shí)并不是最重要的,他們的模擬世界就像卡通一樣,依舊可以很好的完成仿真模擬。Wayve研究稱,內(nèi)容保真度比視覺保真度更重要。但是,有效地模擬其他交通參與者的行為仍然是一個(gè)巨大的挑戰(zhàn)。

基于真實(shí)世界的駕駛數(shù)據(jù)和精心設(shè)計(jì)的邊緣案例來模擬場景

汽車由基于模型的深層強(qiáng)化學(xué)習(xí)系統(tǒng)驅(qū)動(dòng),該算法從離線收集的真實(shí)數(shù)據(jù)中學(xué)習(xí)預(yù)測(cè)模型。這讓模型學(xué)習(xí)并使用預(yù)測(cè)模型所想象的新場景數(shù)據(jù)來訓(xùn)練駕駛。

Wayve致力于開發(fā)更豐富,更強(qiáng)大的時(shí)態(tài)預(yù)測(cè)模型,并相信這是構(gòu)建智能安全自動(dòng)駕駛汽車的關(guān)鍵。

目前,該系統(tǒng)已經(jīng)部署在 JaguarI-PACE 車上。這輛車贏得了2019年度歐洲年度車型的稱號(hào),未來將在整個(gè)英國和歐洲大陸收集數(shù)據(jù)。當(dāng)下,讓數(shù)據(jù)逐漸積累,其驅(qū)動(dòng)算法可能達(dá)到人類駕駛員質(zhì)量的95%,能夠處理交通燈,環(huán)形交叉路口,十字路口等。

盡管有人會(huì)覺得端到端的自動(dòng)駕駛系統(tǒng),既不聰明也不靈活,發(fā)生問題難以解釋,然而Wayve在用其強(qiáng)大的算法證明這種深度學(xué)習(xí)的技術(shù)不只可以做demo,未來也可以保證安全,也可以商用。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)