訂閱
糾錯(cuò)
加入自媒體

【年度專(zhuān)題】AI+AR,將促成下一代計(jì)算平臺(tái)的飛躍

2024-01-17 11:38
VR陀螺
關(guān)注

文/VR陀螺 萬(wàn)里

近期百度公布了2023年百度沸點(diǎn)年度關(guān)鍵詞,不出意外,生成式AI赫然在列。

去年一年當(dāng)中,各大科技巨頭相繼發(fā)布了其AI大模型,GPT-4、LLaMA、PaLM2、Runway Gen 2、文心一言、Meta AI、Gemini......AI大模型產(chǎn)品無(wú)疑是目前科技圈最重要的“興奮劑“,而其更新迭代速度也讓很多人眼花繚亂。

目前AI已然成為電子消費(fèi)市場(chǎng)的核心訴求之一,這點(diǎn)在我們今天要聊的AR眼鏡市場(chǎng)也同樣如此。

在早些時(shí)候,AR眼鏡的重要議題仍停留在“AR眼鏡能否成為下一代計(jì)算平臺(tái)?”而到了現(xiàn)在,社會(huì)更關(guān)注的議題已經(jīng)變成“未來(lái)眼鏡形態(tài)的智能終端能否成為AI的絕佳載體?”

無(wú)論是新的計(jì)算平臺(tái),又或是新的AI計(jì)算終端,AR眼鏡都成為了其中不容忽視的關(guān)鍵一環(huán)。

本文將回顧2023年以來(lái)一眾AR廠(chǎng)商關(guān)于A(yíng)I應(yīng)用場(chǎng)景的探索,并展望“AI+AR”兩者的發(fā)展趨勢(shì)。

圖源:VR陀螺

 AI+AR是眾望所歸,當(dāng)前AR眼鏡的  AI能力仍集中于語(yǔ)音交互 

從2023這一年的發(fā)展來(lái)看,AI對(duì)于A(yíng)R眼鏡的重要性已無(wú)需多言。關(guān)于這點(diǎn)我們可以先從AR行業(yè)大咖發(fā)聲中略窺一二:

Meta CEO 扎克伯格:我認(rèn)為智能眼鏡將成為未來(lái)的一個(gè)重要平臺(tái)......之前團(tuán)隊(duì)不少人認(rèn)為智能眼鏡只有當(dāng)真正實(shí)現(xiàn)3D全息圖、內(nèi)置顯示器等才會(huì)真正普及,但是這需要很長(zhǎng)的時(shí)間。如今得益于A(yíng)I的進(jìn)步,內(nèi)置的AI助手將能看到你所看到的,聽(tīng)到你所聽(tīng)到的,AI將與其他AR功能同樣重要。

Snap CEO Evan Spiegel:我相信我們都在腦海中對(duì)自己想要?jiǎng)?chuàng)造的東西有一個(gè)愿景。然而,通常情況下,這些工具不夠復(fù)雜,無(wú)法讓我們將想象的圖像、視頻或AR體驗(yàn)變?yōu)楝F(xiàn)實(shí)。我認(rèn)為AI將有助于彌合我們的想象力和我們可以在手機(jī)或AR眼鏡上實(shí)際創(chuàng)造的東西之間的差距。

圖源:Snap

雷鳥(niǎo)創(chuàng)新 CEO 李宏偉:我們相信,AI 會(huì)是 AR 眼鏡上第一個(gè) Killer APP......AI 和 AR 的結(jié)合可以給未來(lái)的鏡像世界打造非常好的內(nèi)容基礎(chǔ)。未來(lái)元宇宙的內(nèi)容很大程度上會(huì)是 3D 內(nèi)容,3D 內(nèi)容的產(chǎn)生比較復(fù)雜,而 AI 大模型可以在這一方面發(fā)揮特別重要的作用。

李未可科技 創(chuàng)始人兼CEO 茹憶:AR眼鏡有望成為“下一代計(jì)算終端”,而AI的交互能力,也將成為AR眼鏡的核心能力。二者的深度結(jié)合,將使AR眼鏡成為一個(gè)真正意義上無(wú)縫融入人們生活的智能設(shè)備,而不僅僅是一個(gè)離頭最近的玩具。同時(shí),在A(yíng)I 和AR的深度融合方面,李未可正在打造的是 AI Agent,它也并非是一個(gè)更智能的助理或是更方便的交互模式如此簡(jiǎn)單,AI Agent 將是融合手機(jī)上所有Apps 的能力,成為 AR眼鏡的一個(gè)系統(tǒng)。

圖源:李未可科技

如果回顧2023年所發(fā)布的AR眼鏡產(chǎn)品,可以發(fā)現(xiàn)其中大多數(shù)產(chǎn)品都與AI進(jìn)行了靠攏,并且嘗試基于A(yíng)I為用戶(hù)帶來(lái)更優(yōu)秀的使用體驗(yàn)。如果展開(kāi)來(lái)看,其中不乏隱性的AI能力構(gòu)建,比如基于A(yíng)I算法提升語(yǔ)音識(shí)別準(zhǔn)確率、在交互場(chǎng)景中通過(guò)AI提升手勢(shì)識(shí)別以及SLAM的魯棒性等。而對(duì)于用戶(hù)而言,最容易感知的莫過(guò)于A(yíng)R廠(chǎng)商基于A(yíng)I為我們帶來(lái)的新功能以及場(chǎng)景探索。

2023 AR眼鏡及其AI玩法盤(pán)點(diǎn)(圖源:VR陀螺)

以下是常見(jiàn)的AI功能玩法:

語(yǔ)音助手:這是目前AR眼鏡設(shè)備最為常見(jiàn)的AI體驗(yàn),當(dāng)設(shè)備接入ChatGPT或者類(lèi)似的大型自然語(yǔ)言模型后,眼鏡支持上下文語(yǔ)意理解,并且能夠以更趨近于真人的方式回復(fù)用戶(hù)。舉例而言,李未可Meta Lens S3搭載了大型語(yǔ)言模型AI系統(tǒng),你可以通過(guò)語(yǔ)音的方式與設(shè)備閑聊、獲得一些健身、旅游行程方面的建議等。你可以面向設(shè)備詢(xún)問(wèn)各種五花八門(mén)的問(wèn)題,有時(shí)候還會(huì)獲得一些意想不到的回復(fù)。

Meta Lens S3的“吐槽垃圾桶”功能(圖源:VR陀螺)

物體識(shí)別:這也是AR眼鏡常見(jiàn)功能之一,較為典型的產(chǎn)品是Ray-Ban Meta,它將在今年引入建筑識(shí)別、菜單/路牌翻譯等功能。國(guó)內(nèi)雷鳥(niǎo)X2、ARKnovv A1等產(chǎn)品也內(nèi)置了識(shí)物功能,不過(guò)基于當(dāng)前體驗(yàn)來(lái)看,設(shè)備的物體識(shí)別準(zhǔn)確率還有待提升。

海外的Envision Glasses則另辟蹊徑為眼鏡開(kāi)發(fā)了一項(xiàng)人臉識(shí)別功能,它可以識(shí)別生活中親朋好友的面孔,用以解決一些患有視障或者臉盲癥的用戶(hù)群體的社交問(wèn)題。

雷鳥(niǎo)X2識(shí)圖功能(圖源:VR陀螺)

生活/辦公助理:目前已經(jīng)有部分AI智能終端顯露出了“AI Agent"的苗頭,在這一方面Ai Pin走在了前列。Ai Pin與用戶(hù)的社交生活進(jìn)行了深度綁定,如用戶(hù)可通過(guò)語(yǔ)音指令驅(qū)動(dòng)設(shè)備向親友發(fā)送符合心意的聊天回復(fù);AI可以幫助用戶(hù)快速整理郵件并提取有價(jià)值的信息;AI可以提供生日禮物購(gòu)買(mǎi)建議并快速下單等。

除Ai Pin外,我們也可以從Rokid設(shè)備中看到類(lèi)似的用例。Rokid在去年Rokid Jungle活動(dòng)期間亮相了空間搜索功能,當(dāng)用戶(hù)搜索網(wǎng)頁(yè)、視頻等內(nèi)容時(shí),系統(tǒng)會(huì)根據(jù)信息的權(quán)重呈現(xiàn)出不同的排列方式,該功能不但兼顧了AR的使用直覺(jué),同時(shí)也通過(guò)AI功能進(jìn)一步提升了用戶(hù)對(duì)于信息的獲取效率。

圖源:Rokid

圖生圖:目前AR眼鏡設(shè)備關(guān)于“AI生成內(nèi)容”的玩法仍以文生文體驗(yàn)為主,文生圖、文生視頻等體驗(yàn)則相對(duì)稀缺。ARKnovv A1是目前為數(shù)不多的支持AI圖生圖的眼鏡產(chǎn)品,眼鏡可以對(duì)其拍攝畫(huà)面進(jìn)行“二創(chuàng)”以生成風(fēng)格多樣化的圖片,并支持導(dǎo)出到社交平臺(tái)。該功能背后依賴(lài)于開(kāi)源大模型Stable Diffution。

ARKnovv A1的AR創(chuàng)作功能(圖源:VR陀螺)

 多模態(tài)AI是眾望所歸  全天候AI是北極星指標(biāo) 

如果說(shuō)2023年是“AI+AR”的小試牛刀,那么2024年便是其進(jìn)一步爆發(fā)的節(jié)點(diǎn)。有消息指出,在新的一年中,華為、科大訊飛等更多廠(chǎng)商會(huì)進(jìn)一步入局AR眼鏡市場(chǎng),以實(shí)現(xiàn)市場(chǎng)占位。從功能來(lái)看,預(yù)計(jì)“AI+AR”將會(huì)迎來(lái)以下新變化:

多模態(tài)AI

目前AR眼鏡所采用的多為單模態(tài)AI大模型,這使得產(chǎn)品的玩法相對(duì)單一,難以實(shí)現(xiàn)更復(fù)雜的多元信息處理能力。未來(lái)我們有望看到多模態(tài)AI在眼鏡終端的進(jìn)一步應(yīng)用落地。

所謂多模態(tài)AI,指的是能同時(shí)處理文本、圖像、音視頻、代碼等多種信息的人工智能,它的信息處理方式更接近于人類(lèi)的“所看、所聽(tīng)、所想”。近期谷歌所發(fā)布的Gemini正是多模態(tài)AI的代表之一,從演示視頻中我們可以發(fā)現(xiàn)Gemini可以“理解”用戶(hù)在紙上所畫(huà)的內(nèi)容,并能結(jié)合用戶(hù)的對(duì)話(huà)交流給予相應(yīng)的反饋。

Gemini演示視頻(圖源:谷歌)

無(wú)獨(dú)有偶,Meta也正在為Ray-Ban Meta引入多模態(tài)AI能力,去年年底扎克伯格展示了基于智能眼鏡的一個(gè)服裝搭配使用場(chǎng)景:當(dāng)眼鏡鏡頭對(duì)準(zhǔn)衣服,AI不僅可以識(shí)別襯衫的樣式,并且還能進(jìn)一步給出相應(yīng)的穿搭建議。在這么一個(gè)簡(jiǎn)單的場(chǎng)景中,其實(shí)需要調(diào)用自然語(yǔ)言處理、圖片識(shí)別、推理等多種能力,這些都是單模態(tài)AI所難以實(shí)現(xiàn)的。

可以預(yù)見(jiàn),未來(lái)多模態(tài)AI將有望成為AR眼鏡的標(biāo)配,甚至我們可以進(jìn)一步推測(cè):AR眼鏡產(chǎn)品的攝像頭將會(huì)成為至關(guān)重要的模組之一,攝像頭或許會(huì)在A(yíng)R眼鏡上率先落地,其優(yōu)先級(jí)甚至?xí)哂诠鈱W(xué)屏幕。

圖源:Meta

更強(qiáng)的生產(chǎn)力屬性:

除智能手表、智能手機(jī)以外,AR眼鏡同樣是一個(gè)絕佳的隨身攜帶可穿戴式設(shè)備。當(dāng)前智能手機(jī)主要作為用戶(hù)信息中樞、智能手表從中探索出來(lái)的核心應(yīng)用場(chǎng)景是信息輔助以及健康檢測(cè)。AR眼鏡的殺手級(jí)應(yīng)用無(wú)疑是“AI Agent”,因?yàn)樗邆淞伺c用戶(hù)一樣以第一視角感知、記錄世界的能力(這些是其他設(shè)備所欠缺的)。隨著AI能力的提升,AR眼鏡無(wú)疑會(huì)化身為更強(qiáng)大的私人助理。

未來(lái)AI+AR將會(huì)更為深度的參與到我們的工作以及學(xué)習(xí)流程,比如谷歌去年上線(xiàn)的Google Lens搜題答題功能,借助AI可以快速分析一些K12課程題目并且給予解答;此外,在會(huì)議場(chǎng)景中,在A(yíng)I技術(shù)的幫助下,我們有望使用AR眼鏡快速生成會(huì)議紀(jì)要等。

圖源:谷歌

LBS玩法的進(jìn)一步落地:

走出戶(hù)外一直都是AR眼鏡所倡導(dǎo)的核心價(jià)值之一,當(dāng)前的AR眼鏡已不乏相應(yīng)的探索,比如ARKnovv A1的探店、 Ray-Ban Meta的建筑識(shí)物等。

而李未可科技Meta Lens系列產(chǎn)品更是直接選擇從騎行、徒步、城市旅游等大戶(hù)外場(chǎng)景切入,通過(guò)AR+LBS以為這類(lèi)用戶(hù)群體構(gòu)建更好的運(yùn)動(dòng)體驗(yàn)。

如Meta Lens S3內(nèi)置的 AI 助手可在騎行時(shí)起到領(lǐng)航員的作用;在CityWalk場(chǎng)景下,眼鏡除導(dǎo)航外還可以識(shí)別街景信息,并為用戶(hù)介紹沿途景點(diǎn)和推薦美食。除此之外,Meta Lens 3配備了一枚拍攝按鈕,方便用戶(hù)能在旅途過(guò)程中通過(guò)第一視角記錄生活。

圖源:李未可科技

隨著光學(xué)以及AI等技術(shù)的升級(jí),未來(lái)AR眼鏡有望進(jìn)一步拓寬其LBS娛樂(lè)玩法。如扎克伯格曾在Meta Connect 2023期間提到了一個(gè)“網(wǎng)球裁判”的眼鏡用例,在網(wǎng)球運(yùn)動(dòng)中,如果雙方對(duì)于球是否出界等意見(jiàn)有分歧,則可以進(jìn)一步參考AI的意見(jiàn)。

目前Snap、谷歌、蘋(píng)果等廠(chǎng)商都在積極完善其地圖服務(wù),如Snap的基于地圖的社交、蘋(píng)果近期對(duì)地圖AR導(dǎo)航功能加大了投入,未來(lái)這些LBS體驗(yàn)也會(huì)進(jìn)一步遷移到AR眼鏡終端。

圖源:蘋(píng)果

全天候AI:

基于續(xù)航方面考慮,目前AR眼鏡的AI功能都需要基于喚醒詞或者按鍵的方式激活,這種體驗(yàn)方式距離真正的“AI Agent”顯然還有很遠(yuǎn)距離。在理想情況下,AI應(yīng)該能夠全天候陪伴我們,隨時(shí)響應(yīng)我們的需求,并且它還能像計(jì)步器一樣通過(guò)不斷記錄用戶(hù)所觸達(dá)的外在信息最終讓產(chǎn)品更了解我們。

Meta CTO Andrew Bosworth也曾表達(dá)了類(lèi)似的愿景:“未來(lái)眼鏡將會(huì)擁有功耗足夠低的傳感器,它能夠檢測(cè)到觸發(fā)意識(shí)的事件,從而觸發(fā)人工智能,這才是我們真正的夢(mèng)想。”目前距離全天候AI顯然還有很長(zhǎng)的路要走,這是值得未來(lái)持續(xù)努力的重要方向。

如今的AR眼鏡類(lèi)產(chǎn)品續(xù)航普遍在4小時(shí)以?xún)?nèi),而Meta Lens 3表現(xiàn)會(huì)稍好,達(dá)到了6-8小時(shí)。為了解決全天候使用的問(wèn)題,Ray-Ban Meta等產(chǎn)品采用的是結(jié)合充電盒補(bǔ)電的方式,而Ai Pin則設(shè)計(jì)了電池外置磁吸方案,可進(jìn)行快速換電。

圖源:Meta

 潛在的問(wèn)題: 算力、隱私與產(chǎn)品形態(tài)之爭(zhēng) 

無(wú)可否認(rèn),AR眼鏡仍處于非常早期的階段,反映在出貨量上,AR產(chǎn)品國(guó)內(nèi)只有數(shù)十萬(wàn)臺(tái)區(qū)間,遠(yuǎn)不及智能眼鏡的零頭;反映在產(chǎn)品形態(tài)方面,其仍處于探索期,產(chǎn)品百花齊放,如包含了分體式、一體式方案,其中又涉及了觀(guān)影、信息輔助、拍攝等場(chǎng)景的探索。

AR眼鏡仍未成熟,發(fā)展路上仍需要解決諸多問(wèn)題:

算力問(wèn)題:

以一體式AR眼鏡為例,其搭載的主處理器芯片種類(lèi)頗多:如INMO Go搭載的是炬芯科技ATS3085芯片、雷鳥(niǎo)X2搭載的是驍龍XR2、MYVU探索版搭載的是驍龍SW5100等。

高通于去年發(fā)布了專(zhuān)門(mén)面向于A(yíng)R眼鏡的最新芯片平臺(tái)驍龍AR1,這是一款低功耗芯片,并且采用第三代Hexagon NPU,支持終端側(cè)部署視覺(jué)搜索、實(shí)時(shí)翻譯等AI能力。目前Ray-Ban Meta以及雷鳥(niǎo)X2 Lite已經(jīng)搭載該處理器,不排除今年會(huì)有更多眼鏡產(chǎn)品采用該方案。

不過(guò)另一邊,伴隨著高通XR2 Gen 2以及AR1的發(fā)布,我們也可以預(yù)見(jiàn)未來(lái)較長(zhǎng)一段時(shí)間頭顯以及眼鏡設(shè)備功能的分野:頭顯具備更強(qiáng)的性能,用以支撐更復(fù)雜的游戲應(yīng)用體驗(yàn),而AR眼鏡(特別是一體式AR眼鏡)則會(huì)更聚焦于A(yíng)I信息輔助、拍照等輕量化玩法。在算力薄弱的情況下如何進(jìn)一步引入具有龐大參數(shù)的AI模型會(huì)是一大考驗(yàn)。

圖源:高通

隱私問(wèn)題:

早在十多年前Google Glass推出時(shí),社會(huì)各界便開(kāi)始對(duì)“掛在眼前的攝像頭”這一類(lèi)產(chǎn)品感到警惕。伴隨著AR眼鏡出貨量的提升,由此導(dǎo)致的隱私問(wèn)題將會(huì)持續(xù)存在并且日益嚴(yán)重。

關(guān)于如何減輕由AR眼鏡攝像頭所引發(fā)的隱私困擾,當(dāng)前AR眼鏡廠(chǎng)商的思路主要有兩種,一類(lèi)是Ray-Ban Meta和Ai Pin等產(chǎn)品,它們傾向于加入一個(gè)無(wú)法關(guān)閉的相機(jī)指示燈,這樣可以在設(shè)備相機(jī)工作時(shí)起到提醒路人的作用。而還有一種設(shè)計(jì)思路則會(huì)傾向于將攝像頭盡量設(shè)計(jì)得小巧,以更好隱藏于機(jī)身當(dāng)中。

Ray-Ban Meta左側(cè)的相機(jī)指示燈(圖源:Meta)

產(chǎn)品形態(tài)問(wèn)題:

IDC 2024年中國(guó)智能終端十大洞察報(bào)告指出,預(yù)計(jì)2024年中國(guó)市場(chǎng)上搭載AI功能的終端設(shè)備將超70%,AI終端占比將達(dá)55%。除了AR眼鏡外,AI能力也還在PC、智能手機(jī)以及智能手表等品類(lèi)中不斷得到強(qiáng)化。

有關(guān)AI硬件的終極形態(tài)的爭(zhēng)論不絕于耳,眼鏡會(huì)是其中一種理想形態(tài),但也有可能不是唯一解。

2023年最值得關(guān)注的AI產(chǎn)品自然離不開(kāi)Ai Pin,它在智能手表以及智能眼鏡等可穿戴式設(shè)備的基礎(chǔ)之上開(kāi)辟了一個(gè)全新的賽道,它主打集成AI的私人助理,并且有意通過(guò)投影方案來(lái)弱化海量信息對(duì)于用戶(hù)的視覺(jué)侵?jǐn)_。目前用戶(hù)對(duì)于這款產(chǎn)品褒貶不一,后續(xù)市場(chǎng)表現(xiàn)有待進(jìn)一步觀(guān)察。

目前一眾智能手機(jī)廠(chǎng)商也已經(jīng)選擇擁抱AI,如近期OPPO發(fā)布了安第斯大模型(AndesGPT),模型最高包含上千億個(gè)參數(shù),可以靈活端側(cè)部署于未來(lái)的智能手機(jī)、智能手表、平板電腦等產(chǎn)品中。

當(dāng)前AR眼鏡的一大困境在于內(nèi)容生態(tài)的薄弱,這點(diǎn)反映在A(yíng)I體驗(yàn)上也同樣如此,導(dǎo)航、翻譯、識(shí)物....這些功能在手機(jī)側(cè)也已經(jīng)具有完善的解決方案,未來(lái)AR眼鏡如何走出差異化路線(xiàn)則是值得持續(xù)關(guān)注的問(wèn)題。

圖源:OPPO

 結(jié)語(yǔ) 

當(dāng)前AR眼鏡市場(chǎng)似乎已經(jīng)來(lái)到了指數(shù)級(jí)爆發(fā)增長(zhǎng)的前沿,IDC預(yù)測(cè)2024年中國(guó)AR市場(chǎng)出貨量將增長(zhǎng)101%;有人則認(rèn)為AR眼鏡會(huì)在2030年徹底取代我們的手機(jī)電腦。

目前AR核心光學(xué)技術(shù)不斷迎來(lái)捷報(bào),而市場(chǎng)的”AI軍備競(jìng)賽“又在加速著AGI的到來(lái)。在A(yíng)I的加持之下,今年的AR市場(chǎng),無(wú)疑是肉眼可見(jiàn)的令人期待。

       原文標(biāo)題 : 【年度專(zhuān)題】AI+AR,將促成下一代計(jì)算平臺(tái)的飛躍

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)