侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

這家自動(dòng)駕駛公司共標(biāo)記了2億英里的行駛數(shù)據(jù),他們希望業(yè)內(nèi)能數(shù)據(jù)共享

總部位于舊金山的Scale公司是向自動(dòng)駕駛車輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,近日他們拿到了千萬美元的B輪投資,Lyft、通用汽車(General Motors)、Zoox、Voyage、nuTonomy和 Embark 都是他們的客戶,Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車輛的行駛數(shù)據(jù),而他們希望將數(shù)據(jù)開源。

隨著機(jī)器視覺、人臉識(shí)別、語言處理與大數(shù)據(jù)分析等技術(shù)的日臻成熟,出行生態(tài)不斷智能化。計(jì)算機(jī)視覺為自動(dòng)駕駛汽車點(diǎn)亮了眼睛,通過視覺感知,無人車可以標(biāo)注并識(shí)別出車輛、車道線以及行人動(dòng)物等。當(dāng)一臺(tái)計(jì)算機(jī)學(xué)習(xí)而不標(biāo)記的訓(xùn)練數(shù)據(jù),它被稱為無監(jiān)督學(xué)習(xí)。計(jì)算機(jī)通過無人監(jiān)督的學(xué)習(xí)得到正確的答案,但它需要很長(zhǎng)時(shí)間需要訓(xùn)練大量的數(shù)據(jù)才能達(dá)到識(shí)別的效果。而當(dāng)計(jì)算機(jī)用標(biāo)記的訓(xùn)練數(shù)據(jù)學(xué)習(xí)時(shí),被稱為監(jiān)督學(xué)習(xí),比如標(biāo)記數(shù)據(jù)是貓的圖像,同時(shí)會(huì)將單詞“cat”作為元數(shù)據(jù)附加到其圖像上,這種方法極大地加速了學(xué)習(xí)過程。

創(chuàng)建標(biāo)記的訓(xùn)練數(shù)據(jù)的過程已經(jīng)成為一個(gè)重要且成本高昂的業(yè)務(wù),國(guó)內(nèi)外也有很多創(chuàng)業(yè)公司在做相關(guān)的服務(wù),但這些標(biāo)記數(shù)據(jù)集來自哪里?

今天的大多數(shù)標(biāo)注數(shù)據(jù)都是人類注釋的,成千上萬的圖像都是由人工標(biāo)記的,這是一個(gè)非常緩慢而低效的過程。它需要人坐在計(jì)算機(jī)屏幕前操作注釋器,點(diǎn)擊圖像,逐個(gè)標(biāo)記它們。并且,隨著圖像數(shù)量的增加,這個(gè)過程會(huì)變得更加昂貴且容易出錯(cuò)。

總部位于舊金山的Scale公司正是向自動(dòng)駕駛車輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,以加速數(shù)據(jù)標(biāo)記處理。該公司由麻省理工學(xué)院(MIT)的21歲計(jì)算機(jī)科學(xué)家Alexandr Wang于2016年創(chuàng)立。

Scale的最初目標(biāo)是擴(kuò)展標(biāo)記訓(xùn)練數(shù)據(jù)的過程。解決這個(gè)問題共分為兩個(gè)部分:一個(gè)是編組成千上萬人工標(biāo)記數(shù)據(jù)的任務(wù);第二個(gè)是創(chuàng)建一套復(fù)雜的工具,使這些貼標(biāo)機(jī)的效率和準(zhǔn)確度提高了10倍。Alexandr 和他的團(tuán)隊(duì)在創(chuàng)辦兩年來,組建了一支由工程師和技術(shù)人員組成的世界級(jí)技術(shù)團(tuán)隊(duì),正在改變這一領(lǐng)域。當(dāng)?shù)貢r(shí)間8月7日,Scale宣布其融得了由Index Ventures、Accel和Y Combinator領(lǐng)投的1800萬美金。

Scale結(jié)合使用了人工數(shù)據(jù)標(biāo)記員和機(jī)器學(xué)習(xí)算法,對(duì)來自Lyft、通用汽車(General Motors)、Zoox、Voyage、nuTonomy和 Embark 等客戶的原始、未標(biāo)記的數(shù)據(jù)進(jìn)行分類,然后以可擴(kuò)展數(shù)據(jù)集的方式返還。該公司的員工負(fù)責(zé)審查來自汽車的圖像、雷達(dá)、激光雷達(dá)數(shù)據(jù)(以及其他傳感器數(shù)據(jù)),確保自動(dòng)駕駛車輛能夠正確識(shí)別道路上的行人、騎自行車車手以及其他物體,并且根據(jù)需要進(jìn)行修正。Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車輛的行駛數(shù)據(jù),并且最近將其工作擴(kuò)展道路機(jī)器人、無人機(jī)、虛擬助手以及嚴(yán)重依賴AI的“其他解決方案”。

Scale API如何訓(xùn)練自主車輛

這家初創(chuàng)公司開發(fā)了自動(dòng)化系統(tǒng),可以從自動(dòng)駕駛汽車看到的內(nèi)容中獲取數(shù)據(jù)并對(duì)其進(jìn)行檢查來標(biāo)記必要的實(shí)物。創(chuàng)建標(biāo)簽的過程有助于自動(dòng)駕駛汽車內(nèi)的軟件學(xué)會(huì)識(shí)別特定場(chǎng)景,以便更好地為未來做好準(zhǔn)備。

Scale 針對(duì)圖像推出一系列注釋類型,其發(fā)布的傳感器融合標(biāo)注API(Sensor Fusion Annotation API),能夠支持所有主流傳感器的高級(jí)3D感知,包括激光雷達(dá)(30米內(nèi)稠密3D場(chǎng)景理解)、相機(jī)(70米內(nèi)圖像目標(biāo)識(shí)別)和Radar(150米內(nèi)稀疏場(chǎng)景理解),以幫助汽車制造商和自動(dòng)駕駛汽車公司加速感知算法的開發(fā)。

在Scale中,提供圖像注釋服務(wù)之一是Cuboid Annotation,它使用包圍汽車,卡車,行人,交通錐等物體的長(zhǎng)方體投影來注釋二維圖像。通過一些附加信息,可以將這些二維框注釋轉(zhuǎn)換為完整的三維框,包括高度,寬度,深度,旋轉(zhuǎn)和相對(duì)定位信息。

目前其社區(qū)推出的標(biāo)簽類型主要有:

像素方式語義分割

多邊形注釋

點(diǎn)注釋

行注釋

像素方式語義分割

像素方式語義分割

多邊形注釋

線注釋

另外,Scale API還提供用于OCR和圖像轉(zhuǎn)錄、分類、比較和數(shù)據(jù)收集的API。

RADAR在150米范圍內(nèi)探測(cè)場(chǎng)景的屏幕截圖

借助傳感器融合標(biāo)注API,用戶可以上傳未標(biāo)記的相機(jī)、激光雷達(dá)和Radar數(shù)據(jù),生成可用于訓(xùn)練3D感知模型的標(biāo)注數(shù)據(jù)。激光雷達(dá)和Radar標(biāo)注是指,采用長(zhǎng)方體包圍特定對(duì)象的3D點(diǎn)云,并得到這些框的位置和大小。該API支持所有用于3D感知的主流傳感器,為自動(dòng)駕駛技術(shù)提供數(shù)據(jù)支持。

手動(dòng)立方體注釋

除了注釋二維圖像,Scale公司也同通過手工注釋立方體。通過手動(dòng)立方體調(diào)整,縮放器只需繪制一個(gè)2D框,表示長(zhǎng)方體的一側(cè)和長(zhǎng)方體的另一側(cè):

這通常不是一個(gè)“真正的”長(zhǎng)方體,因?yàn)樗跀?shù)學(xué)上是不精確的!罢嬲摹遍L(zhǎng)方體的正面可能不是一個(gè)完美的90度矩形,特別是如果它沒有正面朝向相機(jī)。通過調(diào)整,給定上面的長(zhǎng)方體注釋,以及一些附加信息(即相機(jī)參數(shù)和方向),會(huì)自動(dòng)生成更準(zhǔn)確的注釋:

正面不再是完美的矩形,而是梯形,左邊緣略小,更好地反映了汽車相機(jī)的相對(duì)方向。右側(cè)的頂部/底部邊緣現(xiàn)在會(huì)聚合到地平線上的一個(gè)點(diǎn)。從3D空間中的這八個(gè)點(diǎn)可以很容易地推斷出所得長(zhǎng)方體的位置,尺寸和方向。通過這些屬性,人們可以訓(xùn)練模型,從單個(gè)圖像中預(yù)測(cè)類似長(zhǎng)方體的物體的3d坐標(biāo)。通過這種方式,可以創(chuàng)建一個(gè)系統(tǒng),僅需要使用Scale API生成的攝像機(jī)圖像和注釋來識(shí)別世界上汽車的位置。

Scale倡導(dǎo)數(shù)據(jù)共享

顯然,標(biāo)記是Scale API的重要業(yè)務(wù)組成部分。正如Wired指出的那樣,錯(cuò)誤地將行人標(biāo)記為車輛可能會(huì)使自動(dòng)駕駛汽車的軟件混淆到不斷出錯(cuò)的程度,甚至可能導(dǎo)致事故。Scale已經(jīng)將標(biāo)簽作為開發(fā)自動(dòng)駕駛汽車的必要和不可或缺的一部分。 不幸的是,標(biāo)簽不會(huì)彼此共享。Scale的客戶群包括Cruise,Nuro,Lyft,Zoox,Nutonomy,Starsky Robotics和Embark都將數(shù)據(jù)發(fā)送到Scale這里。但是,這些數(shù)據(jù)并沒有相互分享,這是一種資源的浪費(fèi)。自動(dòng)駕駛汽車需要使用更多真實(shí)的標(biāo)記數(shù)據(jù)集測(cè)試來保證不穩(wěn)定的情況。所以,Scale希望數(shù)據(jù)能夠共享,構(gòu)建更廣泛的數(shù)據(jù)集。

21歲的創(chuàng)始人兼首席執(zhí)行官Alexandr Wang 認(rèn)為“現(xiàn)在,每家公司都在自己的道路上并且保密自己的數(shù)據(jù),實(shí)際上,這些邊緣情況可能需要在整個(gè)行業(yè)中共享或標(biāo)準(zhǔn)化!


聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)