国产一区a久久不射电影网,欧美成aⅴ人高清免费

端到端將重塑智駕？獲10億美金融資，解密英國AI獨角獸Wayve

2024-05-11 16:31

XEV研究所

關(guān)注

‍作者 |張馬也

編輯 |德新

就在前兩天，英國AI公司W(wǎng)ayve宣布獲得新一輪10.5億美元融資，投資方為軟銀、英偉達和現(xiàn)有投資人微軟，可以說是頂級豪華陣容。

作為一家英國公司，Wayve這輪融資也創(chuàng)造了英國AI公司有史以來最大的單筆融資。甚至英國首相也在一份聲明中表示，它「鞏固了英國作為人工智能超級大國的地位」。

在通用人工智能領(lǐng)域，Open.ai在過去兩年成為全球頂級的熱門標(biāo)的；而智能駕駛領(lǐng)域，曾經(jīng)獲得過10億美金級融資的公司不多，只有Waymo、Argo、Cruise等少數(shù)幾家。

Wayve的巨額融資也勾起人們對于未來的強烈好奇：它有沒有可能成為智能駕駛領(lǐng)域的Open.ai，又或者說，成為端到端這代技術(shù)上的Waymo/Cruise？

到目前為止，Wayve已完成三輪融資，累計融資金額超過13億美元。除了資本大鱷和商業(yè)巨頭，有「深度學(xué)習(xí)三巨頭」美譽、現(xiàn)Meta首席人工智能科學(xué)家Yann LeCun，也是Wayve的投資人。

Wayve上一次引發(fā)關(guān)注是在不久前3月份，原Mobileye中國區(qū)的負責(zé)人 Erez Dagan加入Wayve擔(dān)任總裁，主要負責(zé)產(chǎn)品、業(yè)務(wù)和戰(zhàn)略。

本輪融資后，Wayve將加速推出首款用于量產(chǎn)車輛的自動駕駛軟件，包括L2+智駕軟件以及實現(xiàn)完全自動駕駛的軟件系統(tǒng)。Erez加入后，其重點關(guān)注的方向也是面向OEM的交付。據(jù)說，Wayve正在與全球前幾大車廠商洽談合作。

一、自動駕駛2.0：押注端到端

Wayve由Alex Kendall（聯(lián)創(chuàng)兼現(xiàn)任CEO）和Amar Shah（已離開）于2017年共同創(chuàng)立，兩為均來自劍橋大學(xué)。

其公司總部英國倫敦，目前約有300名左右的員工。

Wayve稱自己是第一個在公共道路上，開發(fā)和測試端到端深度學(xué)習(xí)自動駕駛系統(tǒng)的公司。

2015年，Alex Kendall與Vijay Badrinarayanan（現(xiàn)任AI副總裁）、Roberto Cipolla等人，一起提出了SegNet，這是第一個使用端到端深度學(xué)習(xí)進行語義分割的實時方法，無需高精地圖即可理解復(fù)雜環(huán)境。

從2017年開始，Wayve就在汽車上對神經(jīng)網(wǎng)絡(luò)強化學(xué)習(xí)的一些早期成果進行了應(yīng)用。公司把這套系統(tǒng)在道路上進行了模擬部署，隨后逐漸擴大規(guī)模，最終實現(xiàn)在倫敦市中心的交通環(huán)境下進行真實駕駛。

Wayve將自己的智駕系統(tǒng)稱為AV2.0。

Wayve認為，基于傳統(tǒng)機器學(xué)習(xí)方法的AV1.0架構(gòu)，所面臨的根本問題是技術(shù)可擴展性。

因為它依賴復(fù)雜的傳感器、高精度地圖和手工編碼的規(guī)則，使得系統(tǒng)成本居高不下，在行為預(yù)測、規(guī)劃和處理長尾場景問題上，效果很難提升。

AV2.0不依賴傳統(tǒng)的高清地圖和手工編碼的規(guī)則，而是專注于構(gòu)建數(shù)據(jù)驅(qū)動的學(xué)習(xí)型駕駛系統(tǒng)，而且可以擴展、適應(yīng)、推廣到系統(tǒng)從未見過的場景。

AV2.0的特點如下：

采用端到端深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)；

無需高精地圖；

以安全為核心設(shè)計，符合行業(yè)安全期望；

傳感器靈活性，兼容純視覺到包括雷達和激光雷達的多種架構(gòu)；

通過數(shù)據(jù)驅(qū)動進行泛化擴展；

在全球范圍內(nèi)，經(jīng)濟適用；

其中最重要的，就是端到端架構(gòu)。

它拋棄傳統(tǒng)的「感知 - 規(guī)劃 - 執(zhí)行」的架構(gòu)，將車輛傳感器原始的輸入數(shù)據(jù)，直接轉(zhuǎn)換為駕駛操作輸出。

在行業(yè)內(nèi)，端到端的方法已經(jīng)得到了初步的驗證。特斯拉此前發(fā)布的FSD v12，就采用了端到端架構(gòu)。國內(nèi)外很多用戶試用過后，普遍的評價是，基本達到了人類駕駛的水準(zhǔn)。

這種方法的核心是自我監(jiān)督學(xué)習(xí)。就像大語言模型LLM預(yù)測下一個單詞一樣，駕駛系統(tǒng)可以從原始的、未標(biāo)記的數(shù)據(jù)中進行無監(jiān)督學(xué)習(xí)。

自動駕駛和大型語言模型之間有許多相似之處，從根本上講，它們都是大型的、高數(shù)據(jù)量的、復(fù)雜的決策問題。輸入模型的數(shù)據(jù)越多，AI模型的特定應(yīng)用就越豐富，越具有表現(xiàn)力，無需人工輸入即可對大量駕駛記錄進行訓(xùn)練。

二、核心技術(shù)棧：解決可解釋性，建立人機信任

Wayve為自動駕駛的迭代升級開發(fā)了一個快速、連續(xù)和無縫的學(xué)習(xí)循環(huán)系統(tǒng)Fleet Learning Loop，不斷記錄數(shù)據(jù)、訓(xùn)練模型、評估性能和部署更新的模型，以此循環(huán)。

在量產(chǎn)車隊中，它能從OEM的各種車輛中收集真實世界的駕駛數(shù)據(jù)，然后上傳到云端處理，再將迭代后的模型部署到車端，升級車輛的自動駕駛功能。

Wayve還一直在開發(fā)智能駕駛基礎(chǔ)模型（foundation model for driving）。該模型利用多模態(tài)數(shù)據(jù)，包括文本和非駕駛視頻源，來優(yōu)化對駕駛環(huán)境的內(nèi)部表征。

Wayve認為，這能增強AI模型的駕駛能力，允許從不同來源交叉學(xué)習(xí)與駕駛相關(guān)的概念，并提高與駕駛?cè)蝿?wù)目標(biāo)的一致性。

簡單來說，就是通過從多個數(shù)據(jù)源學(xué)習(xí)，可以提高車輛對傳感器流中最有意義和可操作性的方面的理解，從而提高智能駕駛的流暢度和安全性。

除此之外，Wayve還開發(fā)了LINGO和GAIA兩個模型，用來解決智駕場景的可解釋性和信任等問題。

行業(yè)內(nèi)對端到端架構(gòu)的其中一大擔(dān)憂是它是一個黑盒方案，其過程不可解釋。LINGO能用自然語言描述自己的駕駛決策，并解釋決策的原因。

例如在行駛過程中，LINGO做出了繞行路邊�？寇囕v的判斷時，它可以向用戶輸出判斷依據(jù)：由于交通堵塞，我正在緩慢靠近；我正在經(jīng)過一輛停在路邊的車；因為前方道路暢通，所以我加速前進。

Wayve在去年下半年推出過LINGO-1，當(dāng)時該模型以視覺和語言信息為輸入，但只能輸出語言結(jié)果。LINGO-2的輸入和輸出都可以是視覺和語言信息，甚至也包括駕駛行為，也就是能控制車輛的行駛。

按官方說法，LINGO-2是一種將視覺、語言和行動綜合起來，以解釋和確定駕駛行為的駕駛模型，是第一個在公開道路上測試的，閉環(huán)「視覺-語言-行動」駕駛模型（VLAM）。

LINGO-2 架構(gòu)

LINGO-2 的亮點在于：通過語言提示，調(diào)整駕駛行為。

可以使用一些限定的導(dǎo)航命令，如「靠邊停車」、「右轉(zhuǎn)」等，讓LINGO-2調(diào)整車輛的行為。這也能幫助模型訓(xùn)練，并且增強人車交互。

LINGO-2在指令的要求下停車

LINGO-2回答場景問題，并解釋駕駛操作

通過直接將語言和動作聯(lián)系起來，LINGO可以一定程度上揭示出AI系統(tǒng)如何做出決策，使得自動駕駛模型不再是一個「黑盒子」。

更重要的是，LINGO可以增強人類對智能駕駛系統(tǒng)的信任。

目前，LINGO-2還只在Ghost Gym模擬器中進行了驗證，在現(xiàn)實世界中用語言控制汽車的行為是否可以可靠、安全地完成，還需要更多研究。

三、將世界模型融入駕駛模型

對于長尾場景，Wayve給出的一個解決方法是GAIA-1，一個為智能駕駛打造的生成式世界模型。

GAIA-1架構(gòu)

GAIA-1首先是一個多模態(tài)生成模型，利用視頻、文本和動作輸入，生成逼真的駕駛場景視頻。它能夠?qū)︓囕v的行為和其他基本場景特征，進行細粒度控制。無論是改變車輛的行為，還是修改整體場景，模型都能完成。

這樣，GAIA-1可以作為仿真模擬中的重要一環(huán)，生成無限的數(shù)據(jù)，來訓(xùn)練和驗證自動駕駛系統(tǒng)，解決極端場景，特別是在獲取真實世界數(shù)據(jù)成本高或風(fēng)險大的情況下。

GAIA-1可根據(jù)各種提示，生成駕駛場景

它還是一個真實的世界模型，可以學(xué)習(xí)、理解駕駛中的重要概念，比如什么是卡車、公共汽車、行人、騎自行車的人、道路布局、建筑物和交通信號燈。

所謂世界模型，是對環(huán)境及其未來動態(tài)的表征，能實現(xiàn)對周圍環(huán)境的結(jié)構(gòu)化理解，就像人類對自己周圍的環(huán)境進行建模理解一樣。

將世界模型整合到駕駛模型中，使得自動駕駛車輛能夠預(yù)測未來事件，從而提前規(guī)劃行動，在復(fù)雜或未知的情況下做出更加明智的決策。

目前版本的GAIA-1擁有超過90億個可訓(xùn)練參數(shù)，訓(xùn)練數(shù)據(jù)集包含了2019年至2023年在倫敦收集的4700小時的專有駕駛數(shù)據(jù)。模型可以預(yù)測視頻序列中的后續(xù)幀，從而在不需要任何標(biāo)簽的情況下，實現(xiàn)自回歸預(yù)測能力。

四、邁向商業(yè)化量產(chǎn)

目前，Wayve在商業(yè)化上的作為不多。

此前，它一直在英國生鮮配送公司Ocado的車上訓(xùn)練模型，這家公司也是投資方之一，曾投資了1360萬美元。

據(jù)稱，Wayve已經(jīng)在全球100多個城市開始了系統(tǒng)測試。

本輪融資后，Wayve將加速推出首款用于量產(chǎn)車輛的自動駕駛軟件，包括L2+智駕系統(tǒng)，以及實現(xiàn)完全自動駕駛的軟件系統(tǒng)。

它也在與全球前幾大車廠商洽談合作，但具體名單未知。

原Mobileye中國區(qū)的負責(zé)人Erez Dagan加入Wayve擔(dān)任總裁，其重要的關(guān)注方向也是面向OEM的交付。Erez在Mobileye工作了20年，是全世界第一款純視覺ADAS產(chǎn)品的創(chuàng)始團隊成員，后來擔(dān)任產(chǎn)品和戰(zhàn)略執(zhí)行副總裁，并在Mobileye被收購后擔(dān)任英特爾集團副總裁。

聯(lián)系到此前馬斯克表示，特斯拉將于今年8月8日發(fā)布Robotaxi，種種跡象似乎表明完全自動駕駛的技術(shù)路線正在逐漸清晰。

Wayve的目標(biāo)甚至不止于此。在最近Techcrunch的一次采訪中，Alex Kendall說到，Wayve的駕駛大模型不僅在駕駛數(shù)據(jù)上進行訓(xùn)練，還對互聯(lián)網(wǎng)規(guī)模的文本和其他來源進行訓(xùn)練，甚至使用英國政府的PDF文檔來訓(xùn)練模型。

Wayve正在構(gòu)建具身AI（Embodied AI）基礎(chǔ)模型，一個基于非常多樣化的數(shù)據(jù)進行訓(xùn)練的通用系統(tǒng)，能夠在復(fù)雜的現(xiàn)實世界環(huán)境中感知、行動、學(xué)習(xí)和適應(yīng)人類行為。智能駕駛只是這一系統(tǒng)目前最大的應(yīng)用場景。

原文標(biāo)題 : 端到端將重塑智駕？獲10億美金融資，解密英國AI獨角獸Wayve