訂閱
糾錯
加入自媒體

在可預(yù)見的未來,人形機(jī)器人正在加速到來?

文/陳根

進(jìn)入2023年,機(jī)器人產(chǎn)業(yè)似乎迎來了歷史性的“創(chuàng)新大爆炸”時刻,其中,人形機(jī)器人的發(fā)展,更是備受市場關(guān)注。

在2023世界機(jī)器人大會上,160余家國內(nèi)外機(jī)器人企業(yè)攜近600件展品參展,其中60款新品為全球首發(fā)。展會上十余款人形機(jī)器人的展示,更是讓大眾看到了產(chǎn)業(yè)在人形機(jī)器人上積蓄已久的蓬勃活力。

人形機(jī)器人正在成為機(jī)器人行業(yè)發(fā)展的一個必然趨勢,相較于其他形態(tài)的機(jī)器人,人形機(jī)器人最大的特點,就是像人。

那么,作為人類的聰明苦力,機(jī)器人為什么非得是“人形的”?大模型的突破與爆發(fā),又將給人形機(jī)器人帶來什么機(jī)遇和挑戰(zhàn)?

為什么我們需要人形機(jī)器人?

顯然,相較于其他形態(tài)的機(jī)器人,人形機(jī)器人最大的特點,就是像人。其實這種形態(tài)主要就是為了滿足我們?nèi)祟惖那楦信c審美需求,并且基于我們?nèi)祟惸苄刨嚨男螒B(tài)才能最大程度的走入我們生活。

事實上,從“機(jī)器人”這個詞的起源來看,機(jī)器人”就和“人形”有著緊密的聯(lián)系。一般認(rèn)為,“機(jī)器人”一詞來自生于波西米亞的劇作家卡雷爾·卡佩克(Karel Capek)在1921年的劇作《羅薩姆的萬能機(jī)器人》(Rossum’s Universal Robots)。在這部作品中,一位哲學(xué)家研制出一種人造勞工,這些人造勞工外貌與人類相差無幾,被資本家大批制造來充當(dāng)勞動力。

因此,大部分人認(rèn)為,卡佩克就是“機(jī)器人”一詞的創(chuàng)造者。雖然在卡佩克之前,就有人設(shè)想和制造過類似于機(jī)器人的概念和物件,比如中國古代多個朝代都有人制作類機(jī)器人的物件、達(dá)芬奇設(shè)計的一款能動的騎士,只不過,后來這些都被逐步納入卡佩克使用的“機(jī)器人”這個詞匯之下。

也讓我們看到,在機(jī)器人一開始的設(shè)想里,基于人形的機(jī)器人就被認(rèn)為能夠更好地充當(dāng)人類的勞動力。馬斯克不止一次強調(diào),人類文明所面臨的最大風(fēng)險之一就是人力短缺,人類更應(yīng)該將精力放在腦力勞動而不是體力勞動上。然而,要讓機(jī)器人更好地充當(dāng)人類勞動力,就需要讓機(jī)器人也適應(yīng)我們?nèi)祟惖纳睢R驗槲覀兊纳鐣歉鶕?jù)人類本身來設(shè)計的,而一個像是人類的機(jī)器人,就能夠很好滿足這一條件。

比如,我們之所以把機(jī)器人做成人形,不用輪胎而用雙腳行走,正是為了適應(yīng)移動時的環(huán)境。人類希望機(jī)器人的活動范圍不被局限于路面上,而是能夠像人一樣的靈活行動,為了更好的替代人類的職業(yè)。

而具備人形并且能直立行走的類人機(jī)器人,在我們?nèi)祟惿鐣c生活中就能更自然的應(yīng)對樓梯和我們的各種建筑設(shè)計,還可以跟我們?nèi)祟愐粯樱匀绲膽?yīng)對生活空間中存在著各種可以在步行過程中跨越的高低差。盡管如今全社會都為了照顧輪椅使用者而努力推廣無障礙設(shè)施,但人的行動范圍里仍免不了存在障礙物。因此,對于機(jī)器人來說,僅僅像掃地機(jī)那樣避開地板上的障礙物顯然是不夠的,機(jī)器人還要時不時上下樓梯。

只有基于人形的機(jī)器人,才能夠最大程度的對應(yīng)我們?nèi)祟惖纳鐣,才能實現(xiàn)最高效率的勞動力。也就是說,把機(jī)器人做成“人形”的理由之一,就在于機(jī)器人執(zhí)行任務(wù)時所處的環(huán)境其實是遷就人類的體型建造起來的。衣服、桌椅、杯子、手機(jī)、汽車等等,人們眼中的這個世界,全都是為了方便人類這種“人形”生物才如此設(shè)計的。如果出現(xiàn)了新形態(tài)的機(jī)器人,人們就必須重新設(shè)計一套機(jī)器人能夠適應(yīng)的全新環(huán)境。

另一方面,則是需求所致。在很多領(lǐng)域,機(jī)器人作為服務(wù)者,只有人類的外表才更容易被接受。比如,產(chǎn)后護(hù)理、幼兒陪伴、老人看護(hù)等——人類與人形機(jī)器人更容易產(chǎn)生情感上的交流,才能更被信賴。 

大模型給人形機(jī)器人帶來了什么?

當(dāng)然,人形機(jī)器人的發(fā)展也受制于技術(shù),以至于在過去的幾十年里,人形機(jī)器人都沒有得到什么真正的突破,而這次AI大模型的爆發(fā),卻給了人形機(jī)器人一個新的機(jī)會。那么,為什么說以GPT為代表的AI大模型的爆發(fā),對于人形機(jī)器人來說是一次重大突破?

究其原因,雖然在更早以前,智能算法就賦予了人形機(jī)器人一定的“智能”,但根本上來說,智能算法在類人語言邏輯層面并沒有真正的突破,這就使得基于智能算法的人形機(jī)器人和智能依舊沒有什么關(guān)系,依然停留在大數(shù)據(jù)統(tǒng)計分析層面,超出標(biāo)準(zhǔn)化的問題,機(jī)器人就不再智能,而變成了“智障”。

可以說,在以GPT為代表的AI大模型出現(xiàn)以前,市場上的機(jī)器人在很大程度上還只能做一些數(shù)據(jù)的統(tǒng)計與分析,包括一些具有規(guī)則性的讀聽寫工作,所擅長的工作就是將事物按不同的類別進(jìn)行分類,與理解真實世界的能力之間,還不具備邏輯性、思考性。

因為人體的神經(jīng)控制系統(tǒng)是一個非常奇妙系統(tǒng),是人類幾萬年訓(xùn)練下來所形成的,而此前的機(jī)器人不論是在單純的AI思考性方面,還是在與機(jī)器人硬件的協(xié)調(diào)控制方面,都還只是處于起步階段。也就是說,在ChatGPT、GPT-4這種生成式語言大模型出現(xiàn)之前,我們所有的人工智能技術(shù),從本質(zhì)上來說還不是智能,只是基于深度學(xué)習(xí)與視覺識別的一些大數(shù)據(jù)檢索而已。

但GPT技術(shù)卻為機(jī)器人應(yīng)用和發(fā)展打開了新的想象空間。GPT為機(jī)器人帶來最核心的進(jìn)化就是對話理解能力,就是具備與擁有了類人的語言邏輯能力。

那么為什么說具備類人的語言邏輯能力,擁有對話理解能力是GPT為機(jī)器人帶來的最核心、也最重要的進(jìn)化?因為語言理解不僅能讓機(jī)器人幫助我們安排日常的生活和工作,而且還能幫助人類去直面一下科研的挑戰(zhàn),比如對大量的科學(xué)文獻(xiàn)進(jìn)行提煉和總結(jié)。

無論是誰,僅憑自己的力量,都不可能緊跟科學(xué)界的發(fā)展速度。比如,在醫(yī)學(xué)領(lǐng)域,每天都有數(shù)千篇論文發(fā)表。哪怕是在自己的?祁I(lǐng)域內(nèi),目前也沒有哪位醫(yī)生或研究人員能將這些論文都讀一個遍。但是如果不閱讀這些論文,不閱讀這些最新的研究成果,醫(yī)生就無法將最新理論應(yīng)用于實踐,就會導(dǎo)致臨床所使用的治療方法陳舊。在臨床中,一些新的治療手段無法得到應(yīng)用,正是因為醫(yī)生沒時間去閱讀相關(guān)內(nèi)容,根本不知道有新手段的存在。如果有一個能對大量醫(yī)學(xué)文獻(xiàn)進(jìn)行自動合成的機(jī)器人,就會掀起一場真正的革命。

GPT之所以被認(rèn)為具有顛覆性,其中最核心的原因就在于其具備了理解人類語言的能力,這在過去我們是無法想象的,我們幾乎想象不到有一天基于硅基的智能能夠真正被訓(xùn)練成功,能夠理解我們?nèi)祟惖恼Z言。

不久前,在聯(lián)合國在日內(nèi)瓦舉辦的“AI for Good”全球峰會上,九個人形機(jī)器人相繼亮相,并且跟人類進(jìn)行了溝通與對話。機(jī)器人不僅展現(xiàn)出了自己的情緒,還能和人類記者談笑風(fēng)生,似乎對于這種場合已經(jīng)非常熟練。一個穿著護(hù)士制服、留著可愛波波頭的醫(yī)療機(jī)器人還說:“我將與人類一起工作,提供幫助和支持,并且不會取代任何現(xiàn)有的工作”。 

人形機(jī)器人的機(jī)遇和挑戰(zhàn)

可以說,ChatGPT的成功,也為人形機(jī)器人帶來了發(fā)展的拐點,但在機(jī)遇到來的同時,挑戰(zhàn)也在到來。

比如,ChatGPT雖然為機(jī)器人帶來類人的對話理解能力,但ChatGPT在模仿人類神經(jīng)元的過程中,在模仿人類學(xué)習(xí)與語言邏輯能力的過程中,也把我們?nèi)祟惖囊恍⿶毫?xí)給模仿了過去,比如人類一本正經(jīng)胡說八道的能力。也就所謂的AI幻覺,而目前,AI幻覺仍無解法。

此外,ChatGPT顯然還不具備,或者說還未達(dá)到我們?nèi)祟惖倪@樣一種閱讀與文字理解能力了,因為它的背后還是基于強大的算法,還是基于計算機(jī)對于01的編碼為基礎(chǔ)的一種運算識別機(jī)制。但是這種機(jī)制已經(jīng)具備了相當(dāng)?shù)睦斫鉁?zhǔn)確性與邏輯性,這也正是大語言模型讓我們感到意外的地方,就是基于強大的算力,它已經(jīng)具備了相當(dāng)程度的理解能力和學(xué)習(xí)能力。

當(dāng)我們給它提供一段文字,一篇文章的時候,它就能夠從中非?焖俚目偨Y(jié)與提煉出要點,并且這些學(xué)習(xí)與理解的能力與速度,遠(yuǎn)超我們?nèi)祟惖哪芰Α>拖裎覀內(nèi)祟惖乃伎己蛯W(xué)習(xí)一樣,比如,我們能夠通過閱讀一本書來產(chǎn)生新穎的想法和見解,人類發(fā)展到今天,已經(jīng)從世界上吸收了大量數(shù)據(jù),這些數(shù)據(jù)以不可估量、無數(shù)的方式改變了我們大腦中的神經(jīng)連接。

AI大型語言模型也能夠做類似的事情,并有效地引導(dǎo)它們自己的智能。可以預(yù)見,以GPT比人類更為強大的學(xué)習(xí)能力,再結(jié)合參數(shù)與模型的優(yōu)化,GPT將很快在一些專業(yè)領(lǐng)域成為專家級水平,它們的進(jìn)化速度也會超越我們的想象。

而將這種能夠理解自然語言、具備自主進(jìn)化能力的AI大模型接入機(jī)器人,就解決了人形機(jī)器人的一個非常核心的問題,那就是智能大腦。因為智能機(jī)器人的兩大核心:一是智能大腦;二是靈活的物理形態(tài)。這兩項技術(shù)都獲得了突破,并實現(xiàn)商業(yè)化應(yīng)用的時候,也就意味著真正的人機(jī)協(xié)同時代全面到來。

目前,醫(yī)療領(lǐng)域的人形機(jī)器人正在加速發(fā)展。谷歌和亞馬遜都已經(jīng)做出布局,谷歌聲稱自己發(fā)布了首個全科醫(yī)療大模型——Med-PaLM M,不僅懂臨床語言、懂影像,還懂基因組學(xué)。亞馬遜則發(fā)布了AI 醫(yī)療應(yīng)用HealthScribe,HealthScribe可以幫助總結(jié)醫(yī)生就診的情況并創(chuàng)建臨床文檔,包括轉(zhuǎn)錄并分析醫(yī)患討論、添加人工智能生成的見解等。

可以說,醫(yī)療機(jī)器人很快就會真正落地,從問診機(jī)器人到手術(shù)機(jī)器人 ,醫(yī)療行業(yè)將會經(jīng)歷一場全面的AI化。這不僅將非常有效的解決當(dāng)前醫(yī)生醫(yī)療水平之間的差異,還會最大程度的解決就醫(yī)難的問題。大部分的常規(guī)疾病的診斷都將可以由機(jī)器人醫(yī)生所取代。在這樣的基礎(chǔ)上,可以預(yù)見,未來必然會出現(xiàn)基于人形機(jī)器人技術(shù),打造一個基檢查、診斷、手術(shù),也就是內(nèi)外科為一體的全能型機(jī)器人醫(yī)生。

而在服務(wù)業(yè)領(lǐng)域,基于人形的智能機(jī)器人將有望取代保姆、保安之類的職業(yè)。不僅可以當(dāng)助手、管家、廚司,還可以為我們提供專業(yè)的護(hù)理服務(wù)。盡管目前的智能大腦可以還不具備超級智能的能力,還不具備自我意識的能力,但這絲毫不影響智能機(jī)器人以其強大、專業(yè)、友好的知識能力成為我們可信賴的朋友。

可以說,人形機(jī)器人將很快走入我們的生活,以后我們不再需要擔(dān)心養(yǎng)老、不用擔(dān)心保姆、不用擔(dān)心找不到女朋友或者男朋友,人形機(jī)器人統(tǒng)統(tǒng)可以幫助我們搞定;甚至不久后,交警、城管、法官、治安巡邏、廚司之類工作,或許就不再需要人類,統(tǒng)統(tǒng)由人形機(jī)器人上崗取代。

       原文標(biāo)題 : 陳根:在可預(yù)見的未來,人形機(jī)器人正在加速到來?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號