国产精品视频免费看,小辣椒精品福利视频导航

在可預(yù)見的未來，人形機(jī)器人正在加速到來？

2023-09-12 11:14

文/陳根

進(jìn)入2023年，機(jī)器人產(chǎn)業(yè)似乎迎來了歷史性的“創(chuàng)新大爆炸”時刻，其中，人形機(jī)器人的發(fā)展，更是備受市場關(guān)注。

在2023世界機(jī)器人大會上，160余家國內(nèi)外機(jī)器人企業(yè)攜近600件展品參展，其中60款新品為全球首發(fā)。展會上十余款人形機(jī)器人的展示，更是讓大眾看到了產(chǎn)業(yè)在人形機(jī)器人上積蓄已久的蓬勃活力。

人形機(jī)器人正在成為機(jī)器人行業(yè)發(fā)展的一個必然趨勢，相較于其他形態(tài)的機(jī)器人，人形機(jī)器人最大的特點，就是像人。

那么，作為人類的聰明苦力，機(jī)器人為什么非得是“人形的”？大模型的突破與爆發(fā)，又將給人形機(jī)器人帶來什么機(jī)遇和挑戰(zhàn)？

為什么我們需要人形機(jī)器人？

顯然，相較于其他形態(tài)的機(jī)器人，人形機(jī)器人最大的特點，就是像人。其實這種形態(tài)主要就是為了滿足我們?nèi)祟惖那楦信c審美需求，并且基于我們?nèi)祟惸苄刨嚨男螒B(tài)才能最大程度的走入我們生活。

事實上，從“機(jī)器人”這個詞的起源來看，“機(jī)器人”就和“人形”有著緊密的聯(lián)系。一般認(rèn)為，“機(jī)器人”一詞來自生于波西米亞的劇作家卡雷爾·卡佩克（Karel Capek）在1921年的劇作《羅薩姆的萬能機(jī)器人》（Rossum’s Universal Robots）。在這部作品中，一位哲學(xué)家研制出一種人造勞工，這些人造勞工外貌與人類相差無幾，被資本家大批制造來充當(dāng)勞動力。

因此，大部分人認(rèn)為，卡佩克就是“機(jī)器人”一詞的創(chuàng)造者。雖然在卡佩克之前，就有人設(shè)想和制造過類似于機(jī)器人的概念和物件，比如中國古代多個朝代都有人制作類機(jī)器人的物件、達(dá)芬奇設(shè)計的一款能動的騎士，只不過，后來這些都被逐步納入卡佩克使用的“機(jī)器人”這個詞匯之下。

這也讓我們看到，在機(jī)器人一開始的設(shè)想里，基于人形的機(jī)器人就被認(rèn)為能夠更好地充當(dāng)人類的勞動力。馬斯克不止一次強調(diào)，人類文明所面臨的最大風(fēng)險之一就是人力短缺，人類更應(yīng)該將精力放在腦力勞動而不是體力勞動上。然而，要讓機(jī)器人更好地充當(dāng)人類勞動力，就需要讓機(jī)器人也適應(yīng)我們?nèi)祟惖纳睢Ｒ驗槲覀兊纳鐣歉鶕?jù)人類本身來設(shè)計的，而一個像是人類的機(jī)器人，就能夠很好滿足這一條件。

比如，我們之所以把機(jī)器人做成人形，不用輪胎而用雙腳行走，正是為了適應(yīng)移動時的環(huán)境。人類希望機(jī)器人的活動范圍不被局限于路面上，而是能夠像人一樣的靈活行動，為了更好的替代人類的職業(yè)。

而具備人形并且能直立行走的類人機(jī)器人，在我們?nèi)祟惿鐣c生活中就能更自然的應(yīng)對樓梯和我們的各種建筑設(shè)計，還可以跟我們?nèi)祟愐粯樱匀绲膽?yīng)對生活空間中存在著各種可以在步行過程中跨越的高低差。盡管如今全社會都為了照顧輪椅使用者而努力推廣無障礙設(shè)施，但人的行動范圍里仍免不了存在障礙物。因此，對于機(jī)器人來說，僅僅像掃地機(jī)那樣避開地板上的障礙物顯然是不夠的，機(jī)器人還要時不時上下樓梯。

只有基于人形的機(jī)器人，才能夠最大程度的對應(yīng)我們?nèi)祟惖纳鐣�，才能實現(xiàn)最高效率的勞動力。也就是說，把機(jī)器人做成“人形”的理由之一，就在于機(jī)器人執(zhí)行任務(wù)時所處的環(huán)境其實是遷就人類的體型建造起來的。衣服、桌椅、杯子、手機(jī)、汽車等等，人們眼中的這個世界，全都是為了方便人類這種“人形”生物才如此設(shè)計的。如果出現(xiàn)了新形態(tài)的機(jī)器人，人們就必須重新設(shè)計一套機(jī)器人能夠適應(yīng)的全新環(huán)境。

另一方面，則是需求所致。在很多領(lǐng)域，機(jī)器人作為服務(wù)者，只有人類的外表才更容易被接受。比如，產(chǎn)后護(hù)理、幼兒陪伴、老人看護(hù)等——人類與人形機(jī)器人更容易產(chǎn)生情感上的交流，才能更被信賴。

大模型給人形機(jī)器人帶來了什么？

當(dāng)然，人形機(jī)器人的發(fā)展也受制于技術(shù)，以至于在過去的幾十年里，人形機(jī)器人都沒有得到什么真正的突破，而這次AI大模型的爆發(fā)，卻給了人形機(jī)器人一個新的機(jī)會。那么，為什么說以GPT為代表的AI大模型的爆發(fā)，對于人形機(jī)器人來說是一次重大突破？

究其原因，雖然在更早以前，智能算法就賦予了人形機(jī)器人一定的“智能”，但根本上來說，智能算法在類人語言邏輯層面并沒有真正的突破，這就使得基于智能算法的人形機(jī)器人和智能依舊沒有什么關(guān)系，依然停留在大數(shù)據(jù)統(tǒng)計分析層面，超出標(biāo)準(zhǔn)化的問題，機(jī)器人就不再智能，而變成了“智障”。

可以說，在以GPT為代表的AI大模型出現(xiàn)以前，市場上的機(jī)器人在很大程度上還只能做一些數(shù)據(jù)的統(tǒng)計與分析，包括一些具有規(guī)則性的讀聽寫工作，所擅長的工作就是將事物按不同的類別進(jìn)行分類，與理解真實世界的能力之間，還不具備邏輯性、思考性。

因為人體的神經(jīng)控制系統(tǒng)是一個非常奇妙系統(tǒng)，是人類幾萬年訓(xùn)練下來所形成的，而此前的機(jī)器人不論是在單純的AI思考性方面，還是在與機(jī)器人硬件的協(xié)調(diào)控制方面，都還只是處于起步階段。也就是說，在ChatGPT、GPT-4這種生成式語言大模型出現(xiàn)之前，我們所有的人工智能技術(shù)，從本質(zhì)上來說還不是智能，只是基于深度學(xué)習(xí)與視覺識別的一些大數(shù)據(jù)檢索而已。

但GPT技術(shù)卻為機(jī)器人應(yīng)用和發(fā)展打開了新的想象空間。GPT為機(jī)器人帶來最核心的進(jìn)化就是對話理解能力，就是具備與擁有了類人的語言邏輯能力。

那么為什么說具備類人的語言邏輯能力，擁有對話理解能力是GPT為機(jī)器人帶來的最核心、也最重要的進(jìn)化？因為語言理解不僅能讓機(jī)器人幫助我們安排日常的生活和工作，而且還能幫助人類去直面一下科研的挑戰(zhàn)，比如對大量的科學(xué)文獻(xiàn)進(jìn)行提煉和總結(jié)。

無論是誰，僅憑自己的力量，都不可能緊跟科學(xué)界的發(fā)展速度。比如，在醫(yī)學(xué)領(lǐng)域，每天都有數(shù)千篇論文發(fā)表。哪怕是在自己的�？祁I(lǐng)域內(nèi)，目前也沒有哪位醫(yī)生或研究人員能將這些論文都讀一個遍。但是如果不閱讀這些論文，不閱讀這些最新的研究成果，醫(yī)生就無法將最新理論應(yīng)用于實踐，就會導(dǎo)致臨床所使用的治療方法陳舊。在臨床中，一些新的治療手段無法得到應(yīng)用，正是因為醫(yī)生沒時間去閱讀相關(guān)內(nèi)容，根本不知道有新手段的存在。如果有一個能對大量醫(yī)學(xué)文獻(xiàn)進(jìn)行自動合成的機(jī)器人，就會掀起一場真正的革命。

而GPT之所以被認(rèn)為具有顛覆性，其中最核心的原因就在于其具備了理解人類語言的能力，這在過去我們是無法想象的，我們幾乎想象不到有一天基于硅基的智能能夠真正被訓(xùn)練成功，能夠理解我們?nèi)祟惖恼Z言。

不久前，在聯(lián)合國在日內(nèi)瓦舉辦的“AI for Good”全球峰會上，九個人形機(jī)器人相繼亮相，并且跟人類進(jìn)行了溝通與對話。機(jī)器人不僅展現(xiàn)出了自己的情緒，還能和人類記者談笑風(fēng)生，似乎對于這種場合已經(jīng)非常熟練。一個穿著護(hù)士制服、留著可愛波波頭的醫(yī)療機(jī)器人還說：“我將與人類一起工作，提供幫助和支持，并且不會取代任何現(xiàn)有的工作”。

人形機(jī)器人的機(jī)遇和挑戰(zhàn)

可以說，ChatGPT的成功，也為人形機(jī)器人帶來了發(fā)展的拐點，但在機(jī)遇到來的同時，挑戰(zhàn)也在到來。

比如，ChatGPT雖然為機(jī)器人帶來類人的對話理解能力，但ChatGPT在模仿人類神經(jīng)元的過程中，在模仿人類學(xué)習(xí)與語言邏輯能力的過程中，也把我們?nèi)祟惖囊恍⿶毫?xí)給模仿了過去，比如人類一本正經(jīng)胡說八道的能力。也就所謂的AI幻覺，而目前，AI幻覺仍無解法。

此外，ChatGPT顯然還不具備，或者說還未達(dá)到我們?nèi)祟惖倪@樣一種閱讀與文字理解能力了，因為它的背后還是基于強大的算法，還是基于計算機(jī)對于0和1的編碼為基礎(chǔ)的一種運算識別機(jī)制。但是這種機(jī)制已經(jīng)具備了相當(dāng)?shù)睦斫鉁?zhǔn)確性與邏輯性，這也正是大語言模型讓我們感到意外的地方，就是基于強大的算力，它已經(jīng)具備了相當(dāng)程度的理解能力和學(xué)習(xí)能力。

當(dāng)我們給它提供一段文字，一篇文章的時候，它就能夠從中非�？焖俚目偨Y(jié)與提煉出要點，并且這些學(xué)習(xí)與理解的能力與速度，遠(yuǎn)超我們?nèi)祟惖哪芰Α＞拖裎覀內(nèi)祟惖乃伎己蛯W(xué)習(xí)一樣，比如，我們能夠通過閱讀一本書來產(chǎn)生新穎的想法和見解，人類發(fā)展到今天，已經(jīng)從世界上吸收了大量數(shù)據(jù)，這些數(shù)據(jù)以不可估量、無數(shù)的方式改變了我們大腦中的神經(jīng)連接。

AI大型語言模型也能夠做類似的事情，并有效地引導(dǎo)它們自己的智能。可以預(yù)見，以GPT比人類更為強大的學(xué)習(xí)能力，再結(jié)合參數(shù)與模型的優(yōu)化，GPT將很快在一些專業(yè)領(lǐng)域成為專家級水平，它們的進(jìn)化速度也會超越我們的想象。

而將這種能夠理解自然語言、具備自主進(jìn)化能力的AI大模型接入機(jī)器人，就解決了人形機(jī)器人的一個非常核心的問題，那就是智能大腦。因為智能機(jī)器人的兩大核心：一是智能大腦；二是靈活的物理形態(tài)。這兩項技術(shù)都獲得了突破，并實現(xiàn)商業(yè)化應(yīng)用的時候，也就意味著真正的人機(jī)協(xié)同時代全面到來。

目前，醫(yī)療領(lǐng)域的人形機(jī)器人正在加速發(fā)展。谷歌和亞馬遜都已經(jīng)做出布局，谷歌聲稱自己發(fā)布了首個全科醫(yī)療大模型——Med-PaLM M，不僅懂臨床語言、懂影像，還懂基因組學(xué)。亞馬遜則發(fā)布了AI 醫(yī)療應(yīng)用HealthScribe，HealthScribe可以幫助總結(jié)醫(yī)生就診的情況并創(chuàng)建臨床文檔，包括轉(zhuǎn)錄并分析醫(yī)患討論、添加人工智能生成的見解等。

可以說，醫(yī)療機(jī)器人很快就會真正落地，從問診機(jī)器人到手術(shù)機(jī)器人，醫(yī)療行業(yè)將會經(jīng)歷一場全面的AI化。這不僅將非常有效的解決當(dāng)前醫(yī)生醫(yī)療水平之間的差異，還會最大程度的解決就醫(yī)難的問題。大部分的常規(guī)疾病的診斷都將可以由機(jī)器人醫(yī)生所取代。在這樣的基礎(chǔ)上，可以預(yù)見，未來必然會出現(xiàn)基于人形機(jī)器人技術(shù)，打造一個基檢查、診斷、手術(shù)，也就是內(nèi)外科為一體的全能型機(jī)器人醫(yī)生。

而在服務(wù)業(yè)領(lǐng)域，基于人形的智能機(jī)器人將有望取代保姆、保安之類的職業(yè)。不僅可以當(dāng)助手、管家、廚司，還可以為我們提供專業(yè)的護(hù)理服務(wù)。盡管目前的智能大腦可以還不具備超級智能的能力，還不具備自我意識的能力，但這絲毫不影響智能機(jī)器人以其強大、專業(yè)、友好的知識能力成為我們可信賴的朋友。

可以說，人形機(jī)器人將很快走入我們的生活，以后我們不再需要擔(dān)心養(yǎng)老、不用擔(dān)心保姆、不用擔(dān)心找不到女朋友或者男朋友，人形機(jī)器人統(tǒng)統(tǒng)可以幫助我們搞定；甚至不久后，交警、城管、法官、治安巡邏、廚司之類工作，或許就不再需要人類，統(tǒng)統(tǒng)由人形機(jī)器人上崗取代。

原文標(biāo)題 : 陳根：在可預(yù)見的未來，人形機(jī)器人正在加速到來？