這家自動(dòng)駕駛公司共標(biāo)記了2億英里的行駛數(shù)據(jù),他們希望業(yè)內(nèi)能數(shù)據(jù)共享
總部位于舊金山的Scale公司是向自動(dòng)駕駛車輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,近日他們拿到了千萬美元的B輪投資,Lyft、通用汽車(General Motors)、Zoox、Voyage、nuTonomy和 Embark 都是他們的客戶,Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車輛的行駛數(shù)據(jù),而他們希望將數(shù)據(jù)開源。
隨著機(jī)器視覺、人臉識(shí)別、語言處理與大數(shù)據(jù)分析等技術(shù)的日臻成熟,出行生態(tài)不斷智能化。計(jì)算機(jī)視覺為自動(dòng)駕駛汽車點(diǎn)亮了眼睛,通過視覺感知,無人車可以標(biāo)注并識(shí)別出車輛、車道線以及行人動(dòng)物等。當(dāng)一臺(tái)計(jì)算機(jī)學(xué)習(xí)而不標(biāo)記的訓(xùn)練數(shù)據(jù),它被稱為無監(jiān)督學(xué)習(xí)。計(jì)算機(jī)通過無人監(jiān)督的學(xué)習(xí)得到正確的答案,但它需要很長(zhǎng)時(shí)間需要訓(xùn)練大量的數(shù)據(jù)才能達(dá)到識(shí)別的效果。而當(dāng)計(jì)算機(jī)用標(biāo)記的訓(xùn)練數(shù)據(jù)學(xué)習(xí)時(shí),被稱為監(jiān)督學(xué)習(xí),比如標(biāo)記數(shù)據(jù)是貓的圖像,同時(shí)會(huì)將單詞“cat”作為元數(shù)據(jù)附加到其圖像上,這種方法極大地加速了學(xué)習(xí)過程。
創(chuàng)建標(biāo)記的訓(xùn)練數(shù)據(jù)的過程已經(jīng)成為一個(gè)重要且成本高昂的業(yè)務(wù),國(guó)內(nèi)外也有很多創(chuàng)業(yè)公司在做相關(guān)的服務(wù),但這些標(biāo)記數(shù)據(jù)集來自哪里?
今天的大多數(shù)標(biāo)注數(shù)據(jù)都是人類注釋的,成千上萬的圖像都是由人工標(biāo)記的,這是一個(gè)非常緩慢而低效的過程。它需要人坐在計(jì)算機(jī)屏幕前操作注釋器,點(diǎn)擊圖像,逐個(gè)標(biāo)記它們。并且,隨著圖像數(shù)量的增加,這個(gè)過程會(huì)變得更加昂貴且容易出錯(cuò)。
總部位于舊金山的Scale公司正是向自動(dòng)駕駛車輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,以加速數(shù)據(jù)標(biāo)記處理。該公司由麻省理工學(xué)院(MIT)的21歲計(jì)算機(jī)科學(xué)家Alexandr Wang于2016年創(chuàng)立。
Scale的最初目標(biāo)是擴(kuò)展標(biāo)記訓(xùn)練數(shù)據(jù)的過程。解決這個(gè)問題共分為兩個(gè)部分:一個(gè)是編組成千上萬人工標(biāo)記數(shù)據(jù)的任務(wù);第二個(gè)是創(chuàng)建一套復(fù)雜的工具,使這些貼標(biāo)機(jī)的效率和準(zhǔn)確度提高了10倍。Alexandr 和他的團(tuán)隊(duì)在創(chuàng)辦兩年來,組建了一支由工程師和技術(shù)人員組成的世界級(jí)技術(shù)團(tuán)隊(duì),正在改變這一領(lǐng)域。當(dāng)?shù)貢r(shí)間8月7日,Scale宣布其融得了由Index Ventures、Accel和Y Combinator領(lǐng)投的1800萬美金。
Scale結(jié)合使用了人工數(shù)據(jù)標(biāo)記員和機(jī)器學(xué)習(xí)算法,對(duì)來自Lyft、通用汽車(General Motors)、Zoox、Voyage、nuTonomy和 Embark 等客戶的原始、未標(biāo)記的數(shù)據(jù)進(jìn)行分類,然后以可擴(kuò)展數(shù)據(jù)集的方式返還。該公司的員工負(fù)責(zé)審查來自汽車的圖像、雷達(dá)、激光雷達(dá)數(shù)據(jù)(以及其他傳感器數(shù)據(jù)),確保自動(dòng)駕駛車輛能夠正確識(shí)別道路上的行人、騎自行車車手以及其他物體,并且根據(jù)需要進(jìn)行修正。Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車輛的行駛數(shù)據(jù),并且最近將其工作擴(kuò)展道路機(jī)器人、無人機(jī)、虛擬助手以及嚴(yán)重依賴AI的“其他解決方案”。
Scale API如何訓(xùn)練自主車輛
這家初創(chuàng)公司開發(fā)了自動(dòng)化系統(tǒng),可以從自動(dòng)駕駛汽車看到的內(nèi)容中獲取數(shù)據(jù)并對(duì)其進(jìn)行檢查來標(biāo)記必要的實(shí)物。創(chuàng)建標(biāo)簽的過程有助于自動(dòng)駕駛汽車內(nèi)的軟件學(xué)會(huì)識(shí)別特定場(chǎng)景,以便更好地為未來做好準(zhǔn)備。
Scale 針對(duì)圖像推出一系列注釋類型,其發(fā)布的傳感器融合標(biāo)注API(Sensor Fusion Annotation API),能夠支持所有主流傳感器的高級(jí)3D感知,包括激光雷達(dá)(30米內(nèi)稠密3D場(chǎng)景理解)、相機(jī)(70米內(nèi)圖像目標(biāo)識(shí)別)和Radar(150米內(nèi)稀疏場(chǎng)景理解),以幫助汽車制造商和自動(dòng)駕駛汽車公司加速感知算法的開發(fā)。
在Scale中,提供圖像注釋服務(wù)之一是Cuboid Annotation,它使用包圍汽車,卡車,行人,交通錐等物體的長(zhǎng)方體投影來注釋二維圖像。通過一些附加信息,可以將這些二維框注釋轉(zhuǎn)換為完整的三維框,包括高度,寬度,深度,旋轉(zhuǎn)和相對(duì)定位信息。
目前其社區(qū)推出的標(biāo)簽類型主要有:
像素方式語義分割
多邊形注釋
點(diǎn)注釋
行注釋
像素方式語義分割
像素方式語義分割
多邊形注釋
線注釋
另外,Scale API還提供用于OCR和圖像轉(zhuǎn)錄、分類、比較和數(shù)據(jù)收集的API。
RADAR在150米范圍內(nèi)探測(cè)場(chǎng)景的屏幕截圖
借助傳感器融合標(biāo)注API,用戶可以上傳未標(biāo)記的相機(jī)、激光雷達(dá)和Radar數(shù)據(jù),生成可用于訓(xùn)練3D感知模型的標(biāo)注數(shù)據(jù)。激光雷達(dá)和Radar標(biāo)注是指,采用長(zhǎng)方體包圍特定對(duì)象的3D點(diǎn)云,并得到這些框的位置和大小。該API支持所有用于3D感知的主流傳感器,為自動(dòng)駕駛技術(shù)提供數(shù)據(jù)支持。
手動(dòng)立方體注釋
除了注釋二維圖像,Scale公司也同通過手工注釋立方體。通過手動(dòng)立方體調(diào)整,縮放器只需繪制一個(gè)2D框,表示長(zhǎng)方體的一側(cè)和長(zhǎng)方體的另一側(cè):
這通常不是一個(gè)“真正的”長(zhǎng)方體,因?yàn)樗跀?shù)學(xué)上是不精確的!罢嬲摹遍L(zhǎng)方體的正面可能不是一個(gè)完美的90度矩形,特別是如果它沒有正面朝向相機(jī)。通過調(diào)整,給定上面的長(zhǎng)方體注釋,以及一些附加信息(即相機(jī)參數(shù)和方向),會(huì)自動(dòng)生成更準(zhǔn)確的注釋:
正面不再是完美的矩形,而是梯形,左邊緣略小,更好地反映了汽車相機(jī)的相對(duì)方向。右側(cè)的頂部/底部邊緣現(xiàn)在會(huì)聚合到地平線上的一個(gè)點(diǎn)。從3D空間中的這八個(gè)點(diǎn)可以很容易地推斷出所得長(zhǎng)方體的位置,尺寸和方向。通過這些屬性,人們可以訓(xùn)練模型,從單個(gè)圖像中預(yù)測(cè)類似長(zhǎng)方體的物體的3d坐標(biāo)。通過這種方式,可以創(chuàng)建一個(gè)系統(tǒng),僅需要使用Scale API生成的攝像機(jī)圖像和注釋來識(shí)別世界上汽車的位置。
Scale倡導(dǎo)數(shù)據(jù)共享
顯然,標(biāo)記是Scale API的重要業(yè)務(wù)組成部分。正如Wired指出的那樣,錯(cuò)誤地將行人標(biāo)記為車輛可能會(huì)使自動(dòng)駕駛汽車的軟件混淆到不斷出錯(cuò)的程度,甚至可能導(dǎo)致事故。Scale已經(jīng)將標(biāo)簽作為開發(fā)自動(dòng)駕駛汽車的必要和不可或缺的一部分。 不幸的是,標(biāo)簽不會(huì)彼此共享。Scale的客戶群包括Cruise,Nuro,Lyft,Zoox,Nutonomy,Starsky Robotics和Embark都將數(shù)據(jù)發(fā)送到Scale這里。但是,這些數(shù)據(jù)并沒有相互分享,這是一種資源的浪費(fèi)。自動(dòng)駕駛汽車需要使用更多真實(shí)的標(biāo)記數(shù)據(jù)集測(cè)試來保證不穩(wěn)定的情況。所以,Scale希望數(shù)據(jù)能夠共享,構(gòu)建更廣泛的數(shù)據(jù)集。
21歲的創(chuàng)始人兼首席執(zhí)行官Alexandr Wang 認(rèn)為“現(xiàn)在,每家公司都在自己的道路上并且保密自己的數(shù)據(jù),實(shí)際上,這些邊緣情況可能需要在整個(gè)行業(yè)中共享或標(biāo)準(zhǔn)化!
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
11月19日立即報(bào)名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 蔡司新能源汽車三電質(zhì)量解決方案
-
精彩回顧立即查看>> 蔡司新能源汽車三電質(zhì)量解決方案
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會(huì)暨展覽會(huì)
-
精彩回顧立即查看>> 【線下會(huì)議】全數(shù)會(huì)2024電子元器件展覽會(huì)
推薦專題
- 1 “作弊器”不靈了?智駕的激光雷達(dá),正在被攝像頭替代
- 2 被逼墻角的Mobileye,祭出 CAIS 大旗,挑戰(zhàn)端到端大模型智能駕駛
- 3 4 激光雷達(dá)與純視覺方案,哪個(gè)才是自動(dòng)駕駛最優(yōu)選?
- 5 激光雷達(dá)即將降價(jià),純視覺回到鄙視鏈底層?
- 6 如何跑贏汽車智能化下半場(chǎng)?
- 7 從小鵬、理想、蔚來布局看自動(dòng)駕駛發(fā)展趨勢(shì)
- 8 智能駕駛的百生相,你是該信呢?還是該信呢?
- 9 比亞迪技術(shù)魚池大戰(zhàn)豐田工具箱,誰將主導(dǎo)未來汽車市場(chǎng)?
- 10 全網(wǎng)最詳解! 美國(guó)禁止中國(guó)智駕究竟包括哪些?
- IE工程師(汽車智聯(lián)) 惠州碩貝德無線科技股份有限公司
- 現(xiàn)場(chǎng)技術(shù)支持工程師(汽車) 易思維(杭州)科技股份有限公司
- 銷售經(jīng)理(汽車新能源行業(yè)) 廣州瑞松智能科技股份有限公司
- 結(jié)構(gòu)工程師-汽車電子事業(yè)部(J10116) 深圳奧尼電子股份有限公司
- 銷售總監(jiān)-汽車電子方向 深圳市智立方自動(dòng)化設(shè)備股份有限公司
- 項(xiàng)目經(jīng)理(汽車內(nèi)飾&汽車電子) 伯恩光學(xué)(惠州)有限公司
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市