侵權(quán)投訴
訂閱
糾錯
加入自媒體

AI定制化合成服務(wù):語音合成技術(shù)推向普通用戶

近日,百度地圖推出了定制化語音導(dǎo)航功能,簡單說就是用戶根據(jù)提示采集原聲,十幾分鐘后你將獲得屬于自己定制化的語音導(dǎo)航音頻包。所以說用戶除了郭德綱、林志玲、羅振宇……這一票人之外還有更多選擇。其實我們在使用明星導(dǎo)航音頻包時會發(fā)現(xiàn),除了很多“左轉(zhuǎn)”“紅綠燈路口”這類常規(guī)交通詞匯外,很多涉及地名的、地標(biāo)的詞是可以聽的出是合成的。而現(xiàn)在“語音合成”技術(shù)推向普通用戶,就有了這些AI定制化合成服務(wù)。

單從使用AI合成的相關(guān)App來看,不禁聯(lián)想到那個“一夜而紅”的ZAO,還有國外的Deepfake,AI脫衣軟件DeepNude等等。而國內(nèi)專注于人工智能領(lǐng)域的企業(yè)越來越多,例如:商湯科技、曠視科技這兩艘“AI巨輪”的業(yè)務(wù)主要是對政府及企業(yè)的;而科大訊飛、大疆、華為、小米、優(yōu)必選科技的部分硬件類業(yè)務(wù)是to C類的;極鏈科技是專注于視頻領(lǐng)域的人工智能企業(yè),業(yè)務(wù)面向品牌主及流量方,也就是to B類的。

對于廣大 C端 用戶來說,AI合成技術(shù)正在通過各種智能設(shè)備實現(xiàn)并應(yīng)用。比如地圖AR增強,定制化音頻服務(wù)、定制化視頻服務(wù)、專屬智能客服等。

其實剛才提到過的曾經(jīng)爆火的這些App應(yīng)用,“ZAO”、“Deepfake”、“DeepNude”技術(shù)上有些共同之處,但是娛樂的點不同!癉eepNude”涉及色情內(nèi)容,并上升到人身攻擊最終被禁止。網(wǎng)友用“Deepfake”在網(wǎng)上大量惡搞政府首腦,比如特朗普的惡搞視頻眾多。

而離我們最近的“ZAO”,在有了前車之鑒后,看的出在盡可能規(guī)避可能產(chǎn)生的負(fù)面效果,視頻素材內(nèi)容由平臺方把控。但不可避免的是在用戶對照片進(jìn)行授權(quán)所涉及的隱私問題,因為不單純是上傳照片即可,而是需要用戶多角度的認(rèn)證,有些“恐慌”確實不可避免,因為掃臉支付、掃臉登陸等功能已經(jīng)被廣泛應(yīng)用,這是用戶最直接的對“ZAO”開發(fā)者的質(zhì)疑。隨后不久背后的公司陌陌科技被有關(guān)部門談話并要求整改,目前來看在ios的熱度及下載量仍然穩(wěn)定在前三名。

不再處于風(fēng)口浪尖,“ZAO”進(jìn)入了平穩(wěn)期,而大家對其盈利模式以及產(chǎn)品定位仍有疑問,似乎并沒看到一個清晰的變現(xiàn)方式。雖說當(dāng)前“視頻社交”火爆,但是僅憑陌陌的用戶帶動還是比較乏力的。App自身沒有社交屬性,只是單純的內(nèi)容產(chǎn)出,和其他的分發(fā)渠道聯(lián)合顯得很必要。而問題又來了,這些內(nèi)容只適合小范圍內(nèi)私域傳播,用戶不愿意擴散是關(guān)鍵。沒有爆炸傳播的潛質(zhì),所以營銷能力也被削弱;蛟S只是曇花一現(xiàn),但是對于用戶來說,拍照合成視頻的趣味性還是非常強的,但關(guān)于變現(xiàn)場景仍需要一段較長的摸索期。

工具類軟件更能被大家接受認(rèn)可,微信中音頻轉(zhuǎn)文字功能用起來很方便,并且通過計算機的學(xué)習(xí),準(zhǔn)確度也在不斷提高。而科大訊飛推出的「訊飛聽見」是目前將音頻轉(zhuǎn)文字業(yè)務(wù)做的較為成熟的平臺。業(yè)務(wù)細(xì)分為機器快轉(zhuǎn)和中文人工精轉(zhuǎn)兩種服務(wù),可直接收費變現(xiàn)。和百度地圖的定制版語音導(dǎo)航類似,屬于上傳后的AI處理,非在線轉(zhuǎn)化。

地圖app,作為一個相對高頻使用的工具類應(yīng)用,除了在滿足常規(guī)通行服務(wù)外,正在發(fā)現(xiàn)更多的To C服務(wù)場景。比如google地圖推出的AR導(dǎo)航功能,已經(jīng)開始測試應(yīng)用,用于幫助用戶以在線實景增強的方式判斷方向及路線。華為也正在布局地圖服務(wù),在Cyberverse數(shù)據(jù)平臺上發(fā)了Map Kit,而相關(guān)AR技術(shù)的應(yīng)用是在景區(qū)、博物館之類的場景做實景增強標(biāo)注和講解服務(wù)。在2017年高德地圖就推出了景區(qū)語音導(dǎo)游服務(wù),發(fā)展至今已經(jīng)比較成熟。

AI+音樂,在線音頻也一直被關(guān)注。今年7月抖音對外宣布了收購英國AI初創(chuàng)公司Jukedeck,這家公司正在研發(fā)一種技術(shù),將用人工智能創(chuàng)作音樂,對歌詞自動配樂等方面。通過AI對音樂的深度學(xué)習(xí),滿足用戶自由選擇音樂類型、曲風(fēng)、時長等要求,讓每一個用戶都能體驗到音樂創(chuàng)作的樂趣。

可以發(fā)現(xiàn),相比5年前,AI合成技術(shù)已經(jīng)不再那么神秘。而那些曾經(jīng)“紅”極一時的深度偽造類App,通常在道德、隱私、風(fēng)險等方面游走規(guī)則的邊緣,似乎滿足人們原始“窺視”、“色情”、“臆想”需求的功能成了火熱表相之下的底色,或許這并不是開發(fā)者的初心,但是從環(huán)節(jié)上把控內(nèi)容的方向,依舊很有必要。

另外隱私問題開始被用戶所注重,但是隨著智能手機的普及應(yīng)用,智能化的服務(wù)的增多,包括面部解鎖、刷臉交易、刷臉登陸等。過去很長一段時間用戶對App應(yīng)用上的用戶數(shù)據(jù)留痕,可能無暇顧及,但是當(dāng)下面部信息已經(jīng)成為了個人服務(wù)的入口,并且直接關(guān)聯(lián)用戶隱私、數(shù)據(jù)信息以及財產(chǎn)的安全性。

總體來看,AI合成技術(shù)的工具類應(yīng)用是比較被用戶認(rèn)可的,無論是功能性還是體驗度,相對傳統(tǒng)服務(wù)有了較大提升。專業(yè)技術(shù)對普通用戶的門檻正在降低,服務(wù)、效率、準(zhǔn)確率、費用等因素會成為工具類應(yīng)用的競爭點。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

安防 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號