訂閱
糾錯
加入自媒體

數(shù)字人被百度玩明白了

2022-07-08 16:26
霞光社
關注

數(shù)字人被百度玩明白了

作者 | 郭照川

編輯 | 麻吉

一直以來,數(shù)字人被認為是元宇宙的入口。

7月6日,在2022百度世界大會的預溝通會上,一位紅發(fā)少女率先登場,以兼具“科技感”和“專業(yè)度”的虛擬形象,在此次會議全程擔任了關鍵的串詞、控場、提問和嘉賓介紹工作。

實用型虛擬數(shù)字人正在走進大眾視野,百度旗下數(shù)字人度曉曉就是其中之一。雖然她的“主業(yè)”是百度App的虛擬AI助手,但度曉曉同時又被賦予了實用性的“多重身份”:

她既是參加過國內頂尖藝術院校畢業(yè)展的“AI畫家”,又是成功挑戰(zhàn)過高考命題作文的“AI作家”,還是創(chuàng)作過歌曲、接過廣告、發(fā)行過MV的“AI偶像”。

作畫、譜曲、做主持、寫作文、陪聊天......百度硬核技術支持下的數(shù)字人特有的創(chuàng)造性和交互性,讓人不得不相信現(xiàn)實世界與“元宇宙”的邊界正在被打破,數(shù)字人則將成為與日常生活密切聯(lián)結的有力輔助。

擁有個性化交互能力的數(shù)字人,真的存在嗎?元宇宙發(fā)展到現(xiàn)在,最先進的數(shù)字人又被賦予了哪些意想不到的能力?

數(shù)字人被百度玩明白了

圖源:2022百度世界大會預溝通會

數(shù)字人被百度玩明白了

從二次元到“N次元”

談到虛擬人物,難離“二次元”。

從初代虛擬偶像初音未來,到許多傳統(tǒng)行業(yè)的數(shù)字代言人形象,基本上都是由二次元人物設計脫胎而來。

對于“二次元”來說,創(chuàng)造是最難的。雖然這些數(shù)字人外觀設計得十分完美,但應用路徑也非常單一,哪怕是超寫實數(shù)字人形象,都脫離不了無法實現(xiàn)交互、本身無法創(chuàng)造的局限。

而在今年的西安美術學院的本科畢業(yè)展上,有一系列命名為“無界”的畫作,打破了傳統(tǒng)數(shù)字人的創(chuàng)造“結界”。

這一系列作品的創(chuàng)作者,是百度數(shù)字人度曉曉。雖然畫面由AI數(shù)字人所繪,但也被美院教授認證為 “已經達到了本科美術生的基本要求”。其商業(yè)價值同樣不可小覷,這些繪畫數(shù)字藏品其中的四幅,在獲展出之前就已經賣出了超過17萬元的高價。

今年6月7日高考結束后,度曉曉又以全國新高考Ⅰ卷作文《本手、妙手、俗手》為題,在40秒的時間內完成了審題、邏輯、創(chuàng)作等步驟,創(chuàng)作出了40多篇不同的高考作文,還被高考研究專家申怡老師,評判為可以打出48分的“高分作文”。

不久前,“#國內首個可交互虛擬偶像度曉曉”還登上了熱搜。她作為百度數(shù)字人作詞、編曲了歌曲《每分 每秒 每天》,還和龔俊數(shù)字人一起舉辦了新歌發(fā)布會直播。知名樂評人耳帝也認為,度曉曉背后的人工智能創(chuàng)造內容確實可以“提高創(chuàng)作效率、降低門檻、輔助創(chuàng)作”。

在AI內容創(chuàng)作能涉及的領域內,度曉曉幾乎無處不在,于是她也被大家笑稱為元宇宙時代“最卷數(shù)字人”。除了能寫會畫的“數(shù)字才女”度曉曉,百度旗下另一位數(shù)字人希加加,也吸引了不少關注目光。

希加加一度被稱為“第一個吃到漢堡的數(shù)字人”。在成都和大連的繁華街頭,希加加成為數(shù)字人新品推薦官,從麥當勞門店上方的巨大屏幕中閃身而出,抓住了一只大漢堡,一瞬間虛擬與現(xiàn)實的連接讓人過目難忘。

數(shù)字人被百度玩明白了

圖源:麥當勞

她不僅成為了“00號太空數(shù)字乘客”,登上了我國第一艘數(shù)字載人飛船,還接下了和Qee熊、FE賽車一起合作設計的許多任務,儼然像一個賽博朋克的新員工了。

目前數(shù)字人真正落地后,展示出來的實際使用價值,已經超出了我們想象中的認知邊界——從被動的二次元單薄形象,演變?yōu)槟軅鋵嵗斫饽芰,能實現(xiàn)創(chuàng)意作品的自動生成的數(shù)字人物,給世界帶來越來越多的驚喜。

從被設定問答程序的單一“二次元”,到富有創(chuàng)意、適用場景更多元的“N次元”,度曉曉和希加加等百度“AI數(shù)字人家族”的出場,讓數(shù)字人賽道的前景變得更加驚艷。

數(shù)字人被百度玩明白了

告別“虛火”,鋪開實際應用價值

隨著“元宇宙”和“Web 3.0”概念崛起,數(shù)字人成為當下最熱的風口之一。

根據(jù)艾媒咨詢數(shù)據(jù),2021年中國數(shù)字人產業(yè)市場規(guī)模和核心市場規(guī)模分別達到1074.9億元和62.2億元,預計2025年將達到6402.7億元和480.6億元。光是2021年全年,虛擬數(shù)字人相關投資就有16筆。

2022年第一個月,虛擬人領域百起融資金額累計已經超過了4億元人民幣。曾經推出知名虛擬IP“翎”的魔琺科技,也在今年4月剛剛完成了B輪和C輪共計1.3億美元的融資。

伴隨著市場對數(shù)字人的極高期望,也出現(xiàn)了很多質疑聲音。

許多人認為目前元宇宙以及數(shù)字人尚處在非常早期的階段,反而是風刮得太猛,導致只剩下“概念橫行”“一把虛火”。此類看法并非空穴來風,當下依然存在著許多行業(yè)隱憂,例如數(shù)字人AI驅動技術不達標、實際應用場景不足、制作成本太高等等。

然而,隨著數(shù)字人的應用場景和技術提升,此次百度數(shù)字人也展示出了其特殊性:

度曉曉和希加加與市面的上其他數(shù)字人的不同,她們最大的突破點就在于已經實現(xiàn)了“可交互”——無論是度曉曉還是希加加,都可以在多樣化的實際應用場景中高度擬真,實現(xiàn)像真人一樣互動。

度曉曉已經具備了對話能力。閑來無事,用戶可以像真人一樣隨時和她聊天,或者讓她唱歌來聽,獨特的情感交互系統(tǒng)讓她像一個隨時在身邊的虛擬助手,又像一個真實存在的可靠伙伴。

數(shù)字人被百度玩明白了

圖源:百度APP

甚至面對不同的人的交互方式,個人性格和愛好,度曉曉也會呈現(xiàn)出不一樣的理解和反饋。也就是說,在你身邊的數(shù)字助理度曉曉,無時無刻都和你共同處于向更優(yōu)秀的自己的進化之中。

除了對話,度曉曉還能真正做到“理解”用戶,區(qū)分閑聊與搜索意圖,滿足用戶提出的更多生活需求。例如當你告訴度曉曉“想要看電影”時,她會像朋友一樣給你推薦影片。而如果你的需求是“想要喝咖啡”,她甚至能自動跳轉到咖啡小程序,方便你下單一杯咖啡外賣。

虛擬朋友穿插進整個生命過程的陪伴,滿足能交互、有回應、滿足多種功能需求,才是理想中數(shù)字人的“最終形態(tài)”。

數(shù)字人被百度玩明白了

數(shù)字人之戰(zhàn):大廠實力圖鑒

各家互聯(lián)網大廠,紛紛在數(shù)字人領域瘋狂加碼。

不久前,字節(jié)跳動收購了虛擬社交公司“波粒子科技”,也是看上了其擁有的虛擬人物形象自定義核心技術,意在為元宇宙再添一張牌。近年來專注于智能語音和AI技術的科大訊飛,也在去年年底上線虛擬人交互系統(tǒng)1.0,試圖拓寬人工智能生態(tài)。

事實上,百度在很早之前喊出了“All in AI”的口號,2020年就已經籌備上線的度曉曉,誕生于元宇宙浪潮發(fā)端之初,一開始就具備了AI驅動下的視覺識別和語音識別能力,背后百度又有AIGC(AI generated content,人工智能創(chuàng)造內容)內容技術的支持。

百度旗下的虛擬人家族,在互聯(lián)網大廠的元宇宙賽道競爭中的優(yōu)勢也很明顯。

根據(jù)第三方機構發(fā)布的榜單,百度憑借多年以來語音、視覺等AI能力的積累,在數(shù)字人綜合實力方面排名第一,尤其在數(shù)字人大規(guī)模落地領域,有著強大領先實力。

一方面,百度數(shù)字人背后擁有知識增強大模型“文心大模型”。

度曉曉、希加加都是具備AIGC能力的數(shù)字人,度曉曉創(chuàng)作的AI畫制成的數(shù)字藏品,在百度上線24小時內就賣出了8700多份。而這種平均每幅畫用時只需要數(shù)十秒的數(shù)字人創(chuàng)作,完全顛覆了當下已知的內容生產模式。

這樣令人驚異的AIGC高效輸出能力,則是依托于百度文心大模型。數(shù)字人的繪畫創(chuàng)作技能,靠的就是文心大模型-跨模態(tài)圖文生成模型ERNIE-ViLG。

另一方面,百度AI算法得到突破,使得數(shù)字人的制作成本極大收縮,降低了批量生產數(shù)字人的門檻。

百度集團副總裁袁佛玉,在2022百度世界大會的預溝通會上也表示,“隨著百度AI算法的突破,能讓數(shù)字人制作成本十倍、百倍地下降,還能讓數(shù)字人生產周期,從動輒幾個月,縮短到小時級別!

這一切,都讓數(shù)字人大規(guī)模應用落地,甚至讓實現(xiàn)“人均一個數(shù)字人小助手”的元宇宙未來理想成為可能。這也正是今年百度世界大會的主題“AI深耕,萬物生長”所闡釋的,在出行、產業(yè)、生活等領域,人工智能都將發(fā)揮前所未有的作用。

7月21日,度曉曉、希加加等百度AI數(shù)字人家族成員,都將深度參與到百度2022世界大會之中。

今年的百度世界大會,更像是一場對于尖端人工智能技術的一次創(chuàng)新式全民科普。擁有強大創(chuàng)造實力,具備陪伴和交互能力,且能實現(xiàn)可控成本批量復制的數(shù)字人,已經為我們打開了元宇宙的大門。

       原文標題 : 數(shù)字人被百度玩明白了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號