GPT-4誕生1年,OpenAI把它放到了機(jī)器人上
作者:一號(hào)
編輯:美美
ChatGPT擁有了身體,機(jī)器人也有了靈魂。
從OpenAI在去年3月14日拿出GPT-4后,已經(jīng)過(guò)了整整一年。顯然,在GPT-4誕生之后的這一年,一切都迭代得太快了,從GPT-4展現(xiàn)多模態(tài)能力,到千行百業(yè)都在談?wù)揂I,再到Sora引爆AI生成視頻的市場(chǎng)。
資深機(jī)器人專(zhuān)家Eric Jang在不久之前還預(yù)言,“ChatGPT曾在一夜之間出現(xiàn)。我認(rèn)為,有智慧的機(jī)器人技術(shù)也將如此。”
他或許沒(méi)錯(cuò),在一年后的今天,一家名為Figure的公司在X上上傳了一段人形機(jī)器人的視頻。
在視頻中,F(xiàn)igure的人形機(jī)器人Figure 01,能夠完全與人類(lèi)流暢對(duì)話,理解人類(lèi)的想法,同時(shí)根據(jù)理解進(jìn)行抓取和放置的操作,并解釋自己這么做的原因。而這只是OpenAI宣布和Figure共同合作推進(jìn)人形機(jī)器人領(lǐng)域前沿的第十三天。
這段Demo迅速吸引了廣大網(wǎng)友的眼球,有人感嘆,AGI的曙光似乎就在眼前了。
沒(méi)弄虛未作假,這些都是機(jī)器人自學(xué)的
視頻發(fā)布之后,F(xiàn)igure AI的掌門(mén)人Brett Adock,在X上來(lái)了一番精彩解讀。
視頻中Figure展示了端到端神經(jīng)網(wǎng)絡(luò)(end-to-end neural networks)框架下與人類(lèi)對(duì)話的應(yīng)用。在此過(guò)程中沒(méi)有任何遠(yuǎn)程操作。并且機(jī)器人的速度也有了顯著的提升,開(kāi)始接近人類(lèi)的速度。
那具體是怎么做到的呢?
首先,F(xiàn)igure AI會(huì)將機(jī)器人攝像頭拍攝到的圖像和通過(guò)板載麥克風(fēng)記錄到的語(yǔ)言轉(zhuǎn)錄成文本輸入到一個(gè)由OpenAI訓(xùn)練的大模型中,這是一個(gè)能夠同時(shí)處理圖像和文本信息的模型。
然后,這個(gè)模型會(huì)處理整個(gè)對(duì)話的歷史記錄,包括以往的圖像,然后通過(guò)文本到語(yǔ)音的方式,生成語(yǔ)音進(jìn)行響應(yīng),向人類(lèi)回話。
這個(gè)模型還同時(shí)負(fù)責(zé)決定執(zhí)行哪種已學(xué)習(xí)的閉環(huán)行為來(lái)響應(yīng)給定的命令,它將特定的神經(jīng)網(wǎng)絡(luò)權(quán)重加載到GPU上,并執(zhí)行相應(yīng)的策略。
這樣做之后,F(xiàn)igure 01就有了很多有趣的新功能。例如描述它周?chē)沫h(huán)境、在做決定的時(shí)候運(yùn)用常識(shí)進(jìn)行推理,并且會(huì)理解一些含糊的高級(jí)指令,例如當(dāng)人類(lèi)說(shuō)“我餓了”的時(shí)候,它會(huì)將桌面上唯一的食物——蘋(píng)果,遞給人類(lèi),并用簡(jiǎn)單的英語(yǔ)說(shuō)明它為什么這么做。
而關(guān)于Figure 01通過(guò)學(xué)習(xí)掌握的精細(xì)雙手操作技能,這些所有的行為都是由神經(jīng)網(wǎng)絡(luò)的視覺(jué)-運(yùn)動(dòng)轉(zhuǎn)換器策略驅(qū)動(dòng),能將像素直接映射到動(dòng)作。這些網(wǎng)絡(luò)以每秒10幀的速率接收機(jī)載圖像,并以200hz的頻率生成24-DOF動(dòng)作,包括手腕姿勢(shì)和手指關(guān)節(jié)角度。
簡(jiǎn)單來(lái)說(shuō),預(yù)訓(xùn)練模型會(huì)首先對(duì)圖像和文本進(jìn)行常識(shí)推理,然后給出動(dòng)作計(jì)劃;接著,機(jī)器人再基于已學(xué)習(xí)的視覺(jué)-動(dòng)作執(zhí)行策略,做出快速的反應(yīng)行動(dòng)。同時(shí)通過(guò)全身控制器確保動(dòng)作的安全性和穩(wěn)定性,保持機(jī)器人的平衡。
Figure,眾人看好的具身智能公司
人工智能的后半場(chǎng),以機(jī)器人為代表的具身智能將成為新的智能增長(zhǎng)點(diǎn)。
英偉達(dá)CEO黃仁勛曾說(shuō),“具身智能將引領(lǐng)下一波人工智能浪潮”。這樣的觀點(diǎn)正在被越來(lái)越多的公司所贊同。當(dāng)前,生成式AI的競(jìng)爭(zhēng)已經(jīng)從連續(xù)對(duì)話走向長(zhǎng)文本以及多模態(tài),各家科技公司和機(jī)構(gòu)也開(kāi)始投資具身智能。
而這家名為Figure的具身智能公司,除了被OpenAI看好,還拿到了多方的投資,成為了硅谷備受關(guān)注的新星。
公開(kāi)資料顯示,F(xiàn)igure成立于2022年,成立之初就瞄準(zhǔn)了通用人形機(jī)器人領(lǐng)域。在3月1日,它宣布完成了驚人的6.75億美元B輪融資,公司估值達(dá)到了26億美元。而它的投資方,幾乎占據(jù)了硅谷的半壁江山。除了OpenAI,微軟、英特爾、英偉達(dá)、亞馬遜創(chuàng)始人貝索斯以及“木頭姐”等,都是它的投資方。
而在獲得融資之后,F(xiàn)igure也沒(méi)有讓人失望。在今年1月,它們的產(chǎn)品Figure就通過(guò)端到端神經(jīng)網(wǎng)絡(luò),僅用10小時(shí)就掌握了制作咖啡的技能。1個(gè)月后,它又展示了把箱子搬運(yùn)到傳送帶的新技能,而現(xiàn)在,它又學(xué)會(huì)了理解人類(lèi)的意圖。
當(dāng)然,在商業(yè)化的道路上,F(xiàn)igure也在積極探索。目前,F(xiàn)igure已經(jīng)和寶馬制造公司簽訂了商業(yè)協(xié)議,F(xiàn)igure 01已經(jīng)開(kāi)始在寶馬位于南卡羅來(lái)納州斯帕坦堡的汽車(chē)工廠接受測(cè)試。
從ChatGPT到Figure 01,OpenAI想的依舊是AGI
盡管OpenAI在2021年夏天悄悄關(guān)閉了其機(jī)器人團(tuán)隊(duì),但顯然,OpenAI對(duì)于機(jī)器人領(lǐng)域的關(guān)注并未減少。
除了Figure,OpenAI在一年之前就投資了挪威一家名為1X Technologies的機(jī)器人制造商。與此同時(shí),OpenAI還被彭博社爆料,說(shuō)它投資了一家新成立的機(jī)器人AI公司Physical Intelligence,他們的創(chuàng)始團(tuán)隊(duì)分別來(lái)自谷歌研究團(tuán)隊(duì)、加州大學(xué)伯克利分校以及斯坦福大學(xué)教授等。而這家公司也是研究未來(lái)能夠成為通用機(jī)器人系統(tǒng)的人工智能。
顯然,將OpenAI大模型融入Figure 01是OpenAI有意的戰(zhàn)略布局。
對(duì)于計(jì)算機(jī)視覺(jué)、機(jī)器人等領(lǐng)域來(lái)說(shuō),具身智能是一個(gè)很有挑戰(zhàn)的目標(biāo):如果AI智能體(機(jī)器人)不僅能夠接收來(lái)自數(shù)據(jù)集的靜態(tài)圖像,還能夠在三維的世界中,無(wú)論是虛擬還是真實(shí)的,四處移動(dòng)并與環(huán)境進(jìn)行交互,那么我們將能迎來(lái)一次重大的突破,即從識(shí)別圖像等機(jī)器學(xué)習(xí)的簡(jiǎn)單能力,轉(zhuǎn)變到學(xué)習(xí)如何通過(guò)多個(gè)步驟執(zhí)行復(fù)雜的類(lèi)人任務(wù)。
而當(dāng)機(jī)器人能夠執(zhí)行類(lèi)人任務(wù)后,通過(guò)數(shù)據(jù)的迭代升級(jí),將會(huì)越來(lái)越像人。而到了那個(gè)時(shí)候,也許AGI能夠取得突破,這也是OpenAI一直以來(lái)的目標(biāo)。
一年之前,OpenAI發(fā)布了GPT-4,向世界證明了大模型的威力,而在一年后的今天,F(xiàn)igure 01的表現(xiàn),也許會(huì)是機(jī)器人領(lǐng)域的GPT-4時(shí)刻。不過(guò),正與OpenAI爭(zhēng)得不可開(kāi)交的馬斯克,他的Optimus也是機(jī)器人領(lǐng)域的佼佼者,這兩者之間還會(huì)有什么樣的故事,我們拭目以待。
原文標(biāo)題 : 新火種AI|GPT-4誕生1年,OpenAI把它放到了機(jī)器人上
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專(zhuān)題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣(mài)
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿(mǎn)
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市