訂閱
糾錯(cuò)
加入自媒體

人形機(jī)器人,距離“轉(zhuǎn)正上崗”還差幾步?

圖片

人形機(jī)器人還需通過“實(shí)習(xí)期”。

作者 | 劉亮

編輯 | 趣解商業(yè)科技組

想象一下這個(gè)畫面:一個(gè)凌晨的車間,幾排整齊的人形機(jī)器人沙沙作響地做著流水線任務(wù)。這個(gè)場(chǎng)景放在幾年前只出現(xiàn)在科幻電影里,不過在今天已經(jīng)實(shí)現(xiàn)了。

前不久,人形機(jī)器人企業(yè)Figure推出第二代人形機(jī)器人Figure02,在軟硬件上比起一代都有突破進(jìn)展,更是搭載了“金主爸爸”OpenAI定制的語音推理模型,實(shí)現(xiàn)自然語言的交互,F(xiàn)在的它,已經(jīng)進(jìn)入寶馬車廠開始“打工”了,可以無休止地狂干20個(gè)小時(shí)。

圖片

圖源:微博截圖

“炸裂”新品的發(fā)布又把人形機(jī)器人推到了輿論中心,從去年底優(yōu)必選(9880.HK)上市到今年WAIC上特斯拉Optimus新一代的亮相,再到近期Figure02的推出,人形機(jī)器人的發(fā)展在這兩年可謂進(jìn)展神速。

但是,脫下“創(chuàng)新技術(shù)”這層外殼,人形機(jī)器人的量產(chǎn)難度到底在哪里?從研發(fā)到商業(yè)化應(yīng)用又需要面對(duì)什么挑戰(zhàn)呢?

01.為什么是“人形”

人形機(jī)器人,最近又火了。

被微軟、英偉達(dá)和OpenAI投資的人形機(jī)器人企業(yè)Figure在前幾天發(fā)布了號(hào)稱“地表最強(qiáng)”新款人形機(jī)器人Figure02。據(jù)“趣解商業(yè)”了解,和上一代相比,F(xiàn)igure02進(jìn)行了外觀的重構(gòu),機(jī)器人的外皮承擔(dān)了壓力,采用了外骨骼結(jié)構(gòu),這樣子機(jī)器人的電源和算力布線就集成在機(jī)體內(nèi)部,由此提高了機(jī)器人的性能;迭代后的Figure02手部具有16個(gè)自由度,能夠承受與人類相當(dāng)?shù)牧α俊?/span>

軟件方面,新一代機(jī)器人也搭載了投資人OpenAI定制的語音到語音推理模型,這樣子人類就可以直接用語音和機(jī)器人交互。

圖片

圖源:微博截圖

其實(shí)機(jī)器人發(fā)展到現(xiàn)在,在我們?nèi)粘I钪械臐B透率已經(jīng)非常高了,比如在商場(chǎng)里常見的大型清掃機(jī)器人、物流流水線上的物流機(jī)器人等;專項(xiàng)機(jī)器人如此完善的今天,我們?yōu)槭裁催要做人形機(jī)器人?

而且,為什么一定要是“人形”?

答案其實(shí)很簡(jiǎn)單,因?yàn)橹挥?ldquo;人形機(jī)器人”才最有可能接近“全能機(jī)器人”。

我們生活的世界中,所有的場(chǎng)景、設(shè)備、工具都是服務(wù)于人類的形態(tài)設(shè)計(jì)的,所以各種單項(xiàng)的機(jī)器人可以拆解某一種具體的場(chǎng)景去使用,比如物流機(jī)器人可以做扛、放重物,工業(yè)機(jī)器人可以擰螺絲、掃地機(jī)器人可以打掃,但是出了這個(gè)特定的領(lǐng)域,這個(gè)機(jī)器人就成了一塊“高科技板磚”。

圖片

圖源:罐頭圖庫

而只有人形機(jī)器人能夠不受場(chǎng)景的限制,融入人類生活的各個(gè)方面。人形機(jī)器人最大的特點(diǎn)是自由度高,具備較強(qiáng)的自主性和多功能性;例如,在工業(yè)制造中,人形機(jī)器人可以替代人類從事重復(fù)、繁雜和危險(xiǎn)的工作減少事故發(fā)生。我們可以將現(xiàn)在各種機(jī)器人理解成發(fā)展人形機(jī)器人的一個(gè)初級(jí)形態(tài),而人形機(jī)器人才是終極形態(tài)。

為了實(shí)現(xiàn)這個(gè)終極形態(tài),人形機(jī)器人需要做三件事:感知、運(yùn)動(dòng)、思考。

就拿跨越障礙物這件事情來說,得先“感知”到障礙物,然后“思考”是走過去、跳過去還是跨過去,最后“運(yùn)動(dòng)”或者說行動(dòng)來實(shí)現(xiàn)跨越。這對(duì)普通人來說只是下意識(shí)的行為,對(duì)人形機(jī)器人就是一個(gè)復(fù)雜的訓(xùn)練過程。

現(xiàn)在大部分的人形機(jī)器人的問題都出在“思考”這個(gè)環(huán)節(jié)上,畢竟感知和運(yùn)動(dòng)可以通過傳感器布局、機(jī)器人關(guān)節(jié)設(shè)計(jì)的完善來在硬件上下功夫,不過“思考”這件事情實(shí)在是太復(fù)雜了。

以往大家的訓(xùn)練方式都是“打標(biāo)簽”,比如教人工智能學(xué)習(xí)什么叫做“西瓜”就把各式各樣的西瓜打上標(biāo)簽,人工智能在看到符合這個(gè)標(biāo)簽的物體的時(shí)候就可以給出相應(yīng)的認(rèn)知。不過這樣的訓(xùn)練方式放在有局限性的領(lǐng)域中還好,放在更大的領(lǐng)域中就很難做到窮盡。

圖片

圖源:罐頭圖庫

現(xiàn)在有了大模型,就打開了一種新的訓(xùn)練思路。大模型加上傳感器數(shù)據(jù),可以訓(xùn)練機(jī)器人更好地了解世界的規(guī)律。

比如同樣都是去冰箱里拿飲料,拿瓶裝可樂和袋裝牛奶的方式就不一樣,大模型學(xué)習(xí)可以讓機(jī)器人“理解”可樂可以直接捏起來而袋裝牛奶就要輕輕拎起來的區(qū)別。

更重要的是,大模型可以訓(xùn)練機(jī)器人對(duì)自然語言的理解,比如你說“我餓了”,現(xiàn)在的機(jī)器人未必懂它需要做什么,但大模型訓(xùn)練之后,機(jī)器人就可以為你跳轉(zhuǎn)到外賣平臺(tái)的界面,更甚者可以給你去炒盤菜。對(duì)自然語言的深入理解,幫助機(jī)器人更好地理解人類,也能更大地減輕人類與機(jī)器人的交互難度。

可以說,大模型的應(yīng)用又給人形機(jī)器人的發(fā)展推向了next level。

02.多方入局

在大模型的加持下,2023年被稱為“人形機(jī)器人元年”。

從融資表現(xiàn)來看,據(jù)“IT桔子”數(shù)據(jù),2023年人形機(jī)器人領(lǐng)域融資事件有23起,總金額達(dá)到54.71億元,是過去十年以來的巔峰。而截至當(dāng)前,2024年人形機(jī)器人領(lǐng)域已經(jīng)有14起融資事件,總金額接近24億元。

圖片

圖源:IT桔子

從產(chǎn)品來看,2023年開始至今,不論是新銳的產(chǎn)品還是企業(yè)都在涌現(xiàn)。比如2023年成立的星動(dòng)紀(jì)元,由清華大學(xué)交叉信息研究院孵化,致力于具身智能以及人形通用機(jī)器人技術(shù)和產(chǎn)品的研發(fā);同年成立的開普勒,自研算法實(shí)現(xiàn)人形機(jī)器人預(yù)設(shè)動(dòng)作與端到端全自主規(guī)劃相結(jié)合模式及精準(zhǔn)控制...

圖片

圖源:罐頭圖庫

還有趕在今年元旦之前上市的機(jī)器人賽道老牌選手優(yōu)必選,更是以“人形機(jī)器人第一股”的姿態(tài)給整個(gè)產(chǎn)業(yè)的資本化再次推上快車道。

以優(yōu)必選為例,這些三方供應(yīng)商是整個(gè)領(lǐng)域的主力軍。這些企業(yè)基本都會(huì)以某種使用場(chǎng)景為切入來進(jìn)行人形機(jī)器人的研發(fā),比如優(yōu)必選更專注于工業(yè)制造、達(dá)闥更多面向家庭服務(wù)。作為整個(gè)產(chǎn)業(yè)鏈的中游,三方供應(yīng)商最重要的自然是爭(zhēng)取下游的訂單,趁早“進(jìn)廠”;所以,市場(chǎng)化、商業(yè)化就對(duì)他們非常重要。比如,今年2月,優(yōu)必選的Walker S已經(jīng)在合肥蔚來汽車工廠進(jìn)行“實(shí)調(diào)”;據(jù)“趣解商業(yè)”了解,優(yōu)必選已經(jīng)和數(shù)十家國內(nèi)頭部新能源汽車企業(yè)接觸,推進(jìn)人形機(jī)器人需求對(duì)接。

圖片

圖源:微博截圖

而這些“被進(jìn)廠”的下游企業(yè)當(dāng)中,也有部分開始自己搞人形機(jī)器人的選手。

特斯拉,就是一個(gè)代表。機(jī)器人作為馬斯克的“宏圖計(jì)劃”當(dāng)中非常濃墨重彩的一筆,其機(jī)器人的代表作Optimus也一直都有進(jìn)展,如今已經(jīng)可以雙臂與腿配合完成基礎(chǔ)瑜伽動(dòng)作,與此同時(shí)保持軀干的穩(wěn)定性;還可以通過純視覺輸入,以正常的速度拿起積木,并能按照藍(lán)、綠兩類顏色正確分類,在對(duì)面發(fā)生人為移動(dòng)積木的動(dòng)作時(shí),Optimus依舊能以自身原本的節(jié)奏順利完成任務(wù),且在積木擺放出錯(cuò)時(shí),自主調(diào)整正面朝上,完成糾錯(cuò)。

圖片

圖源:微博截圖

小米也早在2022年就發(fā)布了“Cyber one”,近期又聯(lián)手機(jī)器人泰斗王田苗,投資了一家名為"小雨智造"的具身智能科技公司,這也是小米首次對(duì)外投資具身智能領(lǐng)域公司;而本田入局機(jī)器人領(lǐng)域都已經(jīng)三十多年的時(shí)間,推出的ASIMO甚至在2002年就跑去和紐交所董事長(zhǎng)握手去了。

和中游供應(yīng)商有差別的是,下游企業(yè)的研發(fā)出了實(shí)用性還有品牌效應(yīng),尤其是這幾位都是現(xiàn)在典型的造車企業(yè),在汽車智能化勢(shì)不可擋的趨勢(shì)下,對(duì)于智能機(jī)器人的研究能讓車企更敏銳地捕捉前沿技術(shù),也展現(xiàn)自己的技術(shù)實(shí)力。

在去年的 1024 小鵬汽車科技日上,小鵬汽車董事長(zhǎng)兼CEO何小鵬推出了小鵬汽車自研的人形態(tài)雙足機(jī)器人 PX5;據(jù)“趣解商業(yè)”了解,小鵬團(tuán)隊(duì)耗時(shí) 5 個(gè)月,實(shí)現(xiàn)了自研雙足機(jī)器人的穩(wěn)定行走。

8月12日,何小鵬在微博上發(fā)布一則視頻,展示了一只機(jī)器手訂購MONA M03的過程。何小鵬還表示:“AI及大型硬件的新進(jìn)展今年內(nèi)我們將跟大家同步,敬請(qǐng)期待。”雖然微博透露的信息不多,但也能看出小鵬在積極布局機(jī)器人賽道。

圖片

圖源:微博截圖

在實(shí)用性上,中游廠商更重視“開源”,因?yàn)橐?ldquo;開張賣錢”,而下游廠家就更重視“節(jié)流”。馬斯克就表示Optimus量產(chǎn)之后也會(huì)率先進(jìn)入到特斯拉的生產(chǎn)流水線。用人形機(jī)器人代替工人擰螺絲,可以收獲一個(gè)24小時(shí)待機(jī)、不會(huì)疲勞、不會(huì)鬧情緒的“完美打工人”,成本降低、效率提升,最終實(shí)現(xiàn)的就是生產(chǎn)成本的控制。

當(dāng)然,下游廠商研發(fā)的人形機(jī)器人足夠穩(wěn)定后也可以進(jìn)行商業(yè)化,從而成為整個(gè)企業(yè)收入的一個(gè)增長(zhǎng)部分;不過從底層邏輯來說,雖然都是爭(zhēng)先“進(jìn)廠”,但中游和下游的側(cè)重點(diǎn)還是略微不同。

03.何時(shí)量產(chǎn)

不論是中游還是下游選手,雖然都熱熱鬧鬧的,但也各有各的麻煩。

特斯拉的人形機(jī)器人已經(jīng)開始拖延量產(chǎn)時(shí)間了。去年就表示Optimus要在2024年底前實(shí)現(xiàn)量產(chǎn)的馬斯克在不久前發(fā)推稱特斯拉明年會(huì)小批量的生產(chǎn)人形機(jī)器人,然后預(yù)期在2026年實(shí)現(xiàn)量產(chǎn)以及對(duì)其他企業(yè)客戶的交付;也就是說整個(gè)機(jī)器人的進(jìn)展推后了幾乎一年。

小米的“Cyber One”在2022年亮相之后最后一次展示是在2023世界機(jī)器人大會(huì)上,而且展示的也是2022年的老版本,之后也沒傳來什么突破性的消息。

“預(yù)計(jì)優(yōu)必選人形機(jī)器人進(jìn)入汽車工廠將在2024年底實(shí)現(xiàn)小規(guī)模交付。”優(yōu)必選董事會(huì)主席、執(zhí)行董事兼行政總裁周劍表示。不過在交付之前,已經(jīng)上市的優(yōu)必選還要面對(duì)市值滑坡的困境。

截至8月14日,優(yōu)必選的報(bào)收86.25港元/股,相比今年3月7日最高峰的股價(jià)328港元/股,不到半年時(shí)間跌幅已經(jīng)超過了70%;市值也由高峰的超1300億港元跌到了361.87億港元,蒸發(fā)近千億港元。

圖片

圖源:百度股市通截圖

那么,人形機(jī)器人的困境到底在哪里?

首先是技術(shù)難關(guān)。有媒體曾經(jīng)報(bào)道,國內(nèi)一線研發(fā)專家在人形機(jī)器人系列電話會(huì)上提出了人形機(jī)器人量產(chǎn)的四個(gè)技術(shù)痛點(diǎn):

1.手部和腿部硬件集成難度大,需要更高的損失峰值功率和驅(qū)動(dòng)能力;

2.腿部行走算法穩(wěn)定性難以保證,學(xué)術(shù)界尚未出現(xiàn)真正意義上的類人走行算法;

3.手部精細(xì)化感知難度大,涉及到手的21-26個(gè)自由度;

4.雙臂協(xié)同、混合智能操控和避讓等算法難度大,需要高維度的規(guī)劃。

圖片

圖源:罐頭圖庫

其次是在成本層面。機(jī)器人的量產(chǎn)還得考慮軟硬件的成本控制,如何隨規(guī)模效應(yīng)逐漸均攤成本。

但這邊成本控制都還不成熟,那邊市場(chǎng)定價(jià)就已經(jīng)卷起來了。今年5月,宇樹科技發(fā)布的G1人形機(jī)器人售價(jià)只要9.9萬元,用得著和用不著機(jī)器人的都沉默了,因?yàn)槿诵螜C(jī)器人的定價(jià)當(dāng)時(shí)還動(dòng)輒在百萬元的區(qū)間。結(jié)果大家還沒為9.9萬元這個(gè)定價(jià)吃驚多久,3.65萬元售價(jià)的眾擎機(jī)器人發(fā)布的專業(yè)級(jí)雙足機(jī)器人SA01整機(jī)或散件套裝上市,主要面向科研教育市場(chǎng)發(fā)售。

圖片

圖源:微博截圖

這種兩極分化的情況就讓很多機(jī)器人廠商十分為難了,而這背后反應(yīng)的實(shí)際是人形機(jī)器人下游市場(chǎng)需求不明確的情況。這也是大部分高新技術(shù)產(chǎn)品市場(chǎng)化的問題,由于高新技術(shù)產(chǎn)品對(duì)技術(shù)創(chuàng)新有極高要求,結(jié)果滿足要求的產(chǎn)品又太貴,所以中游廠家只能推出一個(gè)又一個(gè)便宜的版本。

還有就是,人形機(jī)器人在非結(jié)構(gòu)化場(chǎng)景中的應(yīng)用受限;由于機(jī)器人通用性不足,無法靈活應(yīng)對(duì)突發(fā)事件。人形機(jī)器人的商業(yè)化落地,最需要的是一個(gè)迫切又確切的場(chǎng)景;以現(xiàn)在的局面來看,高端制造需求下的工業(yè)化場(chǎng)景,以及人口老齡化趨勢(shì)下的生活化場(chǎng)景是商業(yè)化價(jià)值最高的場(chǎng)景。但是市場(chǎng)上仍缺少一個(gè)產(chǎn)品的典范,讓大家能更直觀地看到人形機(jī)器人的商業(yè)價(jià)值。

人形機(jī)器人能否真正取代人類的部分重復(fù)勞作,還有很長(zhǎng)一段路要走;但人形機(jī)器人必然是未來的趨勢(shì),誰能把這個(gè)“故事”具象化,誰才是贏家。

       原文標(biāo)題 : 人形機(jī)器人,距離“轉(zhuǎn)正上崗”還差幾步?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)