百度推“DeepVoice”最終版:半小時即可學會一種口音
最近,百度終于推出了DeepVoice的“最終版”,并聲稱最終版可以在每半個小時內完成對10000種語音的數(shù)據學習。
DeepVoice作為一個完全有深度神經網絡構建的高質量語音轉文本系統(tǒng),能夠用于智能手機地圖與語音軟件;能夠實現(xiàn)游戲角色由玩家自己合成聲音,從而替代原聲配音;還能夠用于音樂合成供娛樂消遣。但目前百度DeepVoice產出的口音,其合成感還是很明顯。
百度于今年2月份推出的DeepVoice第一代,與神經文本到語音(TTS)系統(tǒng)不同,它只能學習較短的句子,并且系統(tǒng)每次只能學習一種聲音,在數(shù)個小時后才能掌握。
在今年5月份推出的DeepVoice2,模仿口音時間有所提高,大約一個小時內即可模仿出一種口音。單系統(tǒng)即可以學習數(shù)百種不同的口音,同時實現(xiàn)高音質。
如今推出的DeepVoice最終版,效率極大提高,可以在半個小時內完成對10000種語音數(shù)據的學習。但是,百度表示“最終版”仍然有進步空間,他們要制造出一種能夠掌握多種口音或能捕捉字符間細微差別的系統(tǒng),以使得語音合成系統(tǒng)用處更廣泛,學習聲音真實程度更高,錯誤率降低。
除了百度之外,Google、Apple和Amazon都有相關的語音合成研發(fā)產品。Google旗下的DeepMind,一直在進行一個名叫WaveNet的類似項目。最新版本的WaveNet已經能夠在掌握口音方面做到真實、高效,甚至可以像真人那樣產生“唇音”?梢姡俣鹊恼Z音合成軟件的研發(fā)之路還很長遠。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-10.29立即報名>> 2024德州儀器嵌入式技術創(chuàng)新發(fā)展研討會
-
10月31日立即下載>> 【限時免費下載】TE暖通空調系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月14日立即報名>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市