訂閱
糾錯(cuò)
加入自媒體

數(shù)字人下半場(chǎng):奔向“真”生產(chǎn)力

如果說(shuō)2023年,大家關(guān)心數(shù)字人,更多在于好奇心和新鮮感。如今的2024年,人們則更加看重其是否真正解決行業(yè)中的某些痛點(diǎn)。 

隨著技術(shù)的深入發(fā)展,數(shù)字人正在成為生產(chǎn)生活中不可或缺的一部分,除教育、文娛、直播領(lǐng)域外,在工業(yè)、醫(yī)療等領(lǐng)域也在發(fā)揮越來(lái)越重要的作用,成為真正的生產(chǎn)力。

“大家好,我們又見(jiàn)面了。”今年商湯科技的年會(huì),已故的創(chuàng)始人湯曉鷗如期出現(xiàn)在舞臺(tái)上。他時(shí)不時(shí)和現(xiàn)場(chǎng)的觀眾逗趣,抑或是在臺(tái)上走來(lái)走去,甚至喝水。無(wú)論面部表情、肢體如何變化,都像真人一樣。除此之外,還可以看到,頭發(fā)絲、額頭、眼鏡等物件會(huì)隨著人物的移動(dòng)和舞臺(tái)光互動(dòng)。

一時(shí)間,「湯曉鷗“復(fù)活”」的詞條以及視頻在各大網(wǎng)絡(luò)迅速傳播,引起廣泛關(guān)注。公眾在對(duì)這一現(xiàn)象感到驚奇的同時(shí),對(duì)其背后的技術(shù)實(shí)現(xiàn)表現(xiàn)出濃厚的興趣。據(jù)悉,這一數(shù)字人是由商湯科技的如影AI數(shù)字人生成平臺(tái)所創(chuàng)造,官方宣稱(chēng)其與真實(shí)人物的相似度介于90%至95%之間。

湯曉鷗數(shù)字人的問(wèn)世,在一定程度上類(lèi)似于電影《流浪地球2》中通過(guò)數(shù)字化手段實(shí)現(xiàn)角色永生的情節(jié)。其不僅象征著數(shù)字人技術(shù)的一個(gè)重要進(jìn)展,也意味著該技術(shù)已經(jīng)達(dá)到了一個(gè)新的發(fā)展階段,再次以不一樣的視角站上舞臺(tái)。

在過(guò)去的一年里,數(shù)字人這個(gè)行業(yè)曾一度成為資本市場(chǎng)的寵兒,但隨著熱潮的退去,市場(chǎng)逐漸回歸理性。今年,隨著技術(shù)的不斷突破和應(yīng)用場(chǎng)景的拓展,再次點(diǎn)燃了市場(chǎng)對(duì)數(shù)字人的熱情。Sora文生視頻技術(shù)的推出,更是為數(shù)字人行業(yè)的復(fù)興注入了一劑強(qiáng)心針。

進(jìn)入2024年,數(shù)字人行業(yè)的發(fā)展已經(jīng)呈現(xiàn)出新的面貌。與2023年的盲目追捧不同,市場(chǎng)和企業(yè)開(kāi)始更加關(guān)注數(shù)字人技術(shù)的實(shí)際應(yīng)用和商業(yè)價(jià)值。數(shù)字人不再是單純的技術(shù)展示,而是在各個(gè)領(lǐng)域展現(xiàn)出其獨(dú)特的實(shí)用性和創(chuàng)新潛力。

如果過(guò)去大家關(guān)心數(shù)字人,更多在于好奇心和新鮮感。當(dāng)下人們則更加看重其是否真正解決行業(yè)中的某些痛點(diǎn)。

隨著技術(shù)的深入發(fā)展,數(shù)字人將成為我們生活中不可或缺的一部分,除教育、文娛、直播領(lǐng)域外,在工業(yè)、醫(yī)療等領(lǐng)域也將發(fā)揮越來(lái)越重要的作用,成為真正的生產(chǎn)力。

一、數(shù)字人,走過(guò)“AI周期年”

“你會(huì)發(fā)現(xiàn)客戶(hù)越來(lái)越專(zhuān)業(yè)了,不再會(huì)提出一些天馬行空的需求了。”作為商湯科技數(shù)字文娛市場(chǎng)總監(jiān),徐柏琦每天都能感知到行業(yè)的變化、客戶(hù)的變化。

一直以來(lái),數(shù)字人都無(wú)法避開(kāi)成本高昂這一問(wèn)題。2023年初,大模型的爆火救活了因元宇宙遇冷的數(shù)字人。

隨著深度學(xué)習(xí)算法的進(jìn)步,數(shù)字人的制作成本大幅降低,從之前的萬(wàn)元、幾十萬(wàn)元降低到了千元級(jí)別。

“小樣本數(shù)智人12小時(shí)就能夠出來(lái)demo,并且成本已降至千元級(jí)別。”2023年4月份,騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊曾在媒體采訪(fǎng)時(shí)提到。

大跳水的價(jià)格使得該行業(yè)成為新的“掘金地”。業(yè)內(nèi)人士統(tǒng)計(jì),截止2023年2月,市面上大概有一千多家代理商在賣(mài)各種數(shù)字人。

在2023年初,各大企業(yè)和科技公司也紛紛投入巨資,試圖在這一新興領(lǐng)域占據(jù)一席之地。

例如,中國(guó)國(guó)際傳播集團(tuán)與世優(yōu)科技合作,推出了數(shù)字解說(shuō)員“阿央”。世優(yōu)科技利用實(shí)時(shí)數(shù)字人和實(shí)時(shí)渲染技術(shù),使“阿央”具備了豐富的面部表情和肢體語(yǔ)言,為展臺(tái)增添了前沿科技的未來(lái)感。

中國(guó)郵政儲(chǔ)蓄銀行與科藍(lán)軟件合作,推出了內(nèi)置數(shù)字人的科藍(lán)智能高柜數(shù)幣機(jī)器人“小藍(lán)”。這款機(jī)器人集成了智能語(yǔ)音、人臉識(shí)別等技術(shù),通過(guò)數(shù)據(jù)分析用戶(hù)需求,提供了一系列智能化服務(wù),有效提升了用戶(hù)體驗(yàn),并助力銀行打造創(chuàng)新型智慧網(wǎng)點(diǎn)。

除此之外,創(chuàng)業(yè)團(tuán)隊(duì)、AI公司和一些此前做智能客服營(yíng)銷(xiāo)的數(shù)字化服務(wù)商都在這一賽道頻繁動(dòng)作。大廠(chǎng)也在彼時(shí)不斷“秀肌肉”。

其中,一些廠(chǎng)商也因此帶來(lái)了新的增長(zhǎng),例如2023年京東言犀數(shù)字人智能客服京小智使用商家數(shù)量超36萬(wàn),中小商家數(shù)較2022年同期增加102%。

然而,隨著時(shí)間的推移,數(shù)字人產(chǎn)業(yè)開(kāi)始遭遇挑戰(zhàn)。

一方面,投入成本與其帶來(lái)的價(jià)值遲遲無(wú)法得到正向反饋,市場(chǎng)推廣費(fèi)用使得許多企業(yè)難以為繼;另一方面,消費(fèi)者對(duì)于數(shù)字人的新鮮感逐漸消退,對(duì)產(chǎn)品的實(shí)際應(yīng)用效果提出了更高要求。

“我們很多客戶(hù)都希望讓數(shù)字人能夠符合細(xì)分場(chǎng)景人設(shè)的需求,而不僅僅是回答問(wèn)題。”徐柏琦對(duì)產(chǎn)業(yè)家說(shuō)。

數(shù)字人產(chǎn)品已然從最初的好奇和嘗試,轉(zhuǎn)向了對(duì)其長(zhǎng)期價(jià)值和實(shí)用性的考量。

此外,隨著技術(shù)的不斷進(jìn)步,市場(chǎng)上出現(xiàn)了更多替代品,使得數(shù)字人不再是唯一的選擇。例如在客服領(lǐng)域逐漸出現(xiàn)“逆向發(fā)展”,數(shù)字人客服的繁雜流程以及較低體驗(yàn)感,使得消費(fèi)者轉(zhuǎn)而選擇傳統(tǒng)的人工服務(wù);更甚有其他虛擬助手或聊天機(jī)器人雖不具備數(shù)字人的逼真外觀,但它們能夠提供更直觀、便捷的文本或語(yǔ)音交互,執(zhí)行簡(jiǎn)單的任務(wù),逐漸成為數(shù)字人的替代品。

彼時(shí)的數(shù)字人,更像一個(gè)有著華麗外殼的“累贅”。

更為重要的是,隨著代理商和套殼廠(chǎng)商的涌入,市場(chǎng)上出現(xiàn)了大量質(zhì)量參差不齊的數(shù)字人產(chǎn)品,導(dǎo)致了市場(chǎng)的混亂和消費(fèi)者的信任危機(jī)。為了規(guī)范市場(chǎng),監(jiān)管政策開(kāi)始密集下發(fā),平臺(tái)也收緊了對(duì)虛擬人直播的條件,這在一定程度上抑制了行業(yè)的過(guò)熱發(fā)展。

技術(shù)標(biāo)準(zhǔn)不統(tǒng)一、應(yīng)用場(chǎng)景有限、用戶(hù)接受度不一等。這些問(wèn)題促使市場(chǎng)參與者和投資者開(kāi)始更加理性地評(píng)估數(shù)字人的實(shí)際應(yīng)用價(jià)值和商業(yè)潛力,市場(chǎng)逐漸從初期的過(guò)度熱情轉(zhuǎn)向冷靜和審慎。

總結(jié)來(lái)看,數(shù)字人產(chǎn)業(yè)的遇冷并非意味著其發(fā)展前景黯淡,而是市場(chǎng)和產(chǎn)業(yè)發(fā)展的一個(gè)自然調(diào)整過(guò)程。對(duì)于企業(yè)和研究者而言,關(guān)鍵在于如何平衡技術(shù)創(chuàng)新與市場(chǎng)需求,持續(xù)提供真正有價(jià)值的產(chǎn)品和服務(wù),以實(shí)現(xiàn)數(shù)字人產(chǎn)業(yè)的長(zhǎng)遠(yuǎn)發(fā)展。

正如徐柏琦所言:“這是數(shù)字人行業(yè)回歸本質(zhì)的象征。”

二、數(shù)字人,距離生產(chǎn)力還有多遠(yuǎn)?

數(shù)字人逐漸回歸理性背后,一個(gè)值得思考的問(wèn)題是,數(shù)字人距離生產(chǎn)力還有多遠(yuǎn)?

就目前而言,數(shù)字人已經(jīng)在文娛、直播、營(yíng)銷(xiāo)、企業(yè)形象等領(lǐng)域逐漸滲透,有了大量的落地實(shí)例。

具體來(lái)看,在文娛領(lǐng)域,數(shù)字人可以舉辦虛擬演唱會(huì),如初音未來(lái)和洛天依等虛擬偶像的在線(xiàn)演唱會(huì);在新聞播報(bào)、天氣預(yù)報(bào)、網(wǎng)絡(luò)直播等領(lǐng)域,數(shù)字人可以作為虛擬主播或主持人,提供24小時(shí)不間斷的內(nèi)容輸出;在游戲和角色扮演中,數(shù)字人可以作為玩家的虛擬角色或NPC(非玩家角色),提供豐富的互動(dòng)和故事情節(jié);在營(yíng)銷(xiāo)領(lǐng)域,利用數(shù)據(jù)分析和機(jī)器學(xué)習(xí),數(shù)字人可以為用戶(hù)提供個(gè)性化的產(chǎn)品推薦和購(gòu)物建議;在企業(yè)形象領(lǐng)域,數(shù)字人可以作為企業(yè)的虛擬客服或接待員,提供24/7的客戶(hù)咨詢(xún)服務(wù),提升客戶(hù)服務(wù)體驗(yàn)。

以商湯如影為例,其在去年開(kāi)啟“如影繁星計(jì)劃”,面向金融、教育醫(yī)療、銀行保險(xiǎn)、直播電商等各個(gè)領(lǐng)域,定位為基于數(shù)字人為企業(yè)提升效率。

可以發(fā)現(xiàn),數(shù)字人的發(fā)展已經(jīng)使其在某些領(lǐng)域成為生產(chǎn)力的一部分,特別是在提供標(biāo)準(zhǔn)化服務(wù)和內(nèi)容創(chuàng)作方面,重復(fù)性高、模式化的任務(wù)執(zhí)行上,可以提高效率,降低成本,增強(qiáng)用戶(hù)體驗(yàn)。

不過(guò),雖然數(shù)字人技術(shù)已經(jīng)取得了一定的進(jìn)展,但同樣存在一些局限性。

“數(shù)字人的應(yīng)用,還是主要解決具體行業(yè)中的一些痛點(diǎn)。”在徐柏琦看來(lái),數(shù)字人目前更像一個(gè)效能工具、助手的角色,例如在出海場(chǎng)景中,幫助跨境電商直播、解決語(yǔ)言問(wèn)題。

其實(shí),盡管數(shù)字人可以模擬人類(lèi)的情感表達(dá),但它們?nèi)匀粺o(wú)法真正理解和體驗(yàn)人類(lèi)的情感,因此在深層次的情感交流方面存在局限。此外,數(shù)字人在即興創(chuàng)作和表演方面的能力有限,通常需要預(yù)先編程或使用特定的AI算法來(lái)生成內(nèi)容。

數(shù)字人的局限性,更在于其在實(shí)時(shí)分析市場(chǎng)反饋并快速調(diào)整營(yíng)銷(xiāo)策略方面可能存在延遲,需要人工干預(yù)。

這意味著,數(shù)字人想要成為真正的生產(chǎn)力,仍需服務(wù)商們?cè)诩夹g(shù)完善、用戶(hù)接受度提升方面取得更多突破。

目前在數(shù)字人領(lǐng)域,技術(shù)服務(wù)商主要分為三大陣營(yíng)。一是以京東云、阿里云、騰訊云、百度云、華為云為代表的云廠(chǎng)商。其產(chǎn)品主要包括虛擬主播、虛擬客服、虛擬偶像等在內(nèi)的多種虛擬數(shù)字人形態(tài)。主要應(yīng)用于廣告營(yíng)銷(xiāo)、電商直播、虛擬偶像、游戲、社交媒體等領(lǐng)域。

二是以商湯科技、科大訊飛、小冰公司等為代表的AI技術(shù)廠(chǎng)商。其專(zhuān)注于人工智能技術(shù)的研發(fā),擁有先進(jìn)的AI算法和深度學(xué)習(xí)能力,能夠提供高度智能化的數(shù)字人產(chǎn)品。其產(chǎn)品主要包括AI驅(qū)動(dòng)的數(shù)字人解決方案,如智能客服、虛擬助手等。

三是以魔琺科技為代表的虛擬現(xiàn)實(shí)內(nèi)容生產(chǎn)商。專(zhuān)注于虛擬現(xiàn)實(shí)內(nèi)容的創(chuàng)造和數(shù)字人的視覺(jué)效果,提供高質(zhì)量的建模和渲染服務(wù)。產(chǎn)品多專(zhuān)注于數(shù)字人的建模、渲染、動(dòng)作捕捉等技術(shù)服務(wù)。主要服務(wù)于影視、游戲、廣告、虛擬偶像等領(lǐng)域。

可以發(fā)現(xiàn),云廠(chǎng)擁有強(qiáng)大的技術(shù)背景和龐大的用戶(hù)基礎(chǔ),能夠快速推廣數(shù)字人技術(shù),并在多個(gè)應(yīng)用場(chǎng)景中實(shí)現(xiàn)集成。在數(shù)據(jù)收集、云計(jì)算、AI研發(fā)等方面的技術(shù)積累構(gòu)成了較高的門(mén)檻;AI廠(chǎng)商在自然語(yǔ)言處理、圖像識(shí)別、機(jī)器學(xué)習(xí)等領(lǐng)域的技術(shù)積累構(gòu)成了較高的門(mén)檻;虛擬現(xiàn)實(shí)內(nèi)容生產(chǎn)商在3D建模、動(dòng)畫(huà)制作、視覺(jué)效果設(shè)計(jì)等方面的專(zhuān)業(yè)技術(shù)和創(chuàng)新能力構(gòu)成了較高的門(mén)檻。

值得注意的是,雖然數(shù)字人服務(wù)商們各有優(yōu)勢(shì),但服務(wù)商們將資源分散投入到多個(gè)方向,試圖覆蓋更廣泛的應(yīng)用場(chǎng)景。這種分散可能導(dǎo)致缺乏深度開(kāi)發(fā)和優(yōu)化,從而影響數(shù)字人在特定領(lǐng)域的生產(chǎn)力發(fā)揮。

總而言之,虛擬客服、助手、主播等領(lǐng)域已經(jīng)明顯具備生產(chǎn)力屬性。個(gè)性化服務(wù)、多模態(tài)交互數(shù)字人的生產(chǎn)力正在逐漸實(shí)現(xiàn)。而高度逼真的社交互動(dòng)數(shù)字人想要真正實(shí)現(xiàn)生產(chǎn)力仍需要廠(chǎng)商們不斷建設(shè)和運(yùn)維。

三、難點(diǎn),期待和未來(lái)的智能體

事實(shí)上,數(shù)字人能否真正成為生產(chǎn)力,與數(shù)字人應(yīng)用和發(fā)展過(guò)程中,企業(yè)、服務(wù)商和技術(shù)開(kāi)發(fā)者面臨的一系列挑戰(zhàn)不無(wú)關(guān)系。

在企業(yè)側(cè),引入數(shù)字人時(shí),首先面臨的是如何將這些技術(shù)集成到現(xiàn)有的業(yè)務(wù)流程中。這不僅需要確保技術(shù)兼容性,還涉及到成本控制問(wèn)題。

對(duì)于中小企業(yè)而言,數(shù)字人的初期投資可能是一個(gè)不小的負(fù)擔(dān)。此外,用戶(hù)對(duì)數(shù)字人的接受程度也直接影響到其應(yīng)用的廣泛性和有效性。

服務(wù)商側(cè)的難點(diǎn)則在于如何提供標(biāo)準(zhǔn)化而又能滿(mǎn)足個(gè)性化需求的服務(wù)。數(shù)字人技術(shù)的快速發(fā)展要求服務(wù)商不斷創(chuàng)新,如何雙手抓適應(yīng)市場(chǎng)的變化是個(gè)極大地挑戰(zhàn)。同時(shí),技術(shù)兼容性問(wèn)題也是服務(wù)商需要解決的關(guān)鍵點(diǎn)。

從技術(shù)側(cè)來(lái)看,實(shí)現(xiàn)自然流暢的人機(jī)交互是一大挑戰(zhàn),尤其是在語(yǔ)義理解和情感表達(dá)方面。此外,高質(zhì)量的實(shí)時(shí)渲染需要強(qiáng)大的計(jì)算能力,這對(duì)硬件設(shè)備提出了更高的要求。

盡管存在難點(diǎn),但數(shù)字人的應(yīng)用也帶來(lái)了顯著的效益。在企業(yè)側(cè),數(shù)字人能夠?qū)崿F(xiàn)24/7的自動(dòng)化服務(wù),顯著提升工作效率。數(shù)字人作為品牌形象大使,也能增強(qiáng)品牌的現(xiàn)代感和科技感。

服務(wù)商通過(guò)提供多樣化的數(shù)字人服務(wù),能夠滿(mǎn)足不同行業(yè)和企業(yè)的需求。技術(shù)輸出幫助企業(yè)快速實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,而多樣化的服務(wù)模式也為服務(wù)商帶來(lái)了新的收入來(lái)源。

技術(shù)進(jìn)步為數(shù)字人的發(fā)展提供了強(qiáng)有力的支持。隨著AI和圖形技術(shù)的發(fā)展,數(shù)字人的表現(xiàn)力和交互能力不斷提升。算法的優(yōu)化也使得數(shù)字人的制作和運(yùn)營(yíng)更加高效和成本可控。

可以預(yù)想,未來(lái)數(shù)字人或?qū)⒛軌蜃灾鲗W(xué)習(xí)和適應(yīng),不斷優(yōu)化自身的服務(wù)和交互能力,理解和表達(dá)更復(fù)雜的人類(lèi)情感,提供更加人性化的交互體驗(yàn)。

在應(yīng)用層面,數(shù)字人將能夠適配更多行業(yè)領(lǐng)域,提供定制化服務(wù)?缙脚_(tái)交互的能力也將得到加強(qiáng),實(shí)現(xiàn)真正的全渠道覆蓋。

后期運(yùn)維運(yùn)營(yíng)方面,數(shù)字人的運(yùn)維將更加自動(dòng)化和智能化,減少人工干預(yù),提高穩(wěn)定性和效率。實(shí)時(shí)更新的能力將使數(shù)字人能夠根據(jù)實(shí)時(shí)數(shù)據(jù)和用戶(hù)反饋進(jìn)行自我更新和優(yōu)化。

數(shù)字人還將成為人機(jī)交互的新入口,提供更加直觀和便捷的操作體驗(yàn)。

在更遠(yuǎn)的視角下,數(shù)字人將成為無(wú)處不在的智能體,深入到日常生活和工作的各個(gè)方面,提供全方位的支持和服務(wù)。高度集成的生態(tài)系統(tǒng)將使數(shù)字人與各種應(yīng)用和服務(wù)無(wú)縫集成,形成一個(gè)互聯(lián)互通的智能生態(tài)系統(tǒng)。

當(dāng)前,以商湯如影平臺(tái)為代表的數(shù)字人技術(shù)正在持續(xù)克服技術(shù)發(fā)展的障礙。在確保數(shù)字人可信度方面,商湯如影采用了特定的編碼規(guī)則和算法,將水印信息嵌入圖像、視頻或音頻資料中。這種做法有助于確認(rèn)數(shù)字內(nèi)容的版權(quán)所有者身份,并追蹤潛在的數(shù)據(jù)泄露源頭,從而增強(qiáng)了數(shù)字人生成過(guò)程中素材和成果的安全性。

總之,數(shù)字人作為新興的技術(shù)應(yīng)用,雖然面臨著一系列的挑戰(zhàn),但其潛力巨大,未來(lái)可期。用湯曉鷗的話(huà)來(lái)說(shuō):“也許前路一片迷霧,你現(xiàn)在不知那只手抓住的是答案,也許十年、二十年,或者更久以后,你才會(huì)翻開(kāi)前序,而我們只是一群選擇出發(fā)并堅(jiān)信趕路的人。”

       原文標(biāo)題 : 數(shù)字人下半場(chǎng):奔向“真”生產(chǎn)力

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)