訂閱
糾錯
加入自媒體

谷歌正在研究能夠讓計算機合成語音更加自然的技術(shù)

3月28日,據(jù)國外媒體報道,谷歌研究院正在探索讓機器合成語音更加自然的方法。谷歌大腦和機器感知團隊的成員本周二在博客中公布了一些能讓語音更具有表現(xiàn)力的方法示例。

同時,谷歌發(fā)布了“云端文本轉(zhuǎn)語音”服務(wù)的測試版,提供了與谷歌助手同樣的語音合成服務(wù)。該服務(wù)采用了DeepMind的WaveNet技術(shù),這個技術(shù)可以被用于生成非常自然的聲音。

有報道顯示,谷歌研究員近期發(fā)表了兩篇論文,提出了新的發(fā)音方法,介紹了如何模仿語音中的重音或語調(diào)。這兩篇論文的技術(shù)都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系統(tǒng),使用神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,模仿人類語音。

Tacotron在大部分情況下都可以模擬真人聲音,但是卻無法模仿說話中的重音和自然語調(diào)。Tacotron的聯(lián)合發(fā)明人Wang Yuxuan參與了其中一篇論文研究。研究通過將人類語音片段嵌入計算機語音風(fēng)格,使合成語音中實現(xiàn)了重音等效果。另一篇論文的研究則使用無監(jiān)督訓(xùn)練和識別語音模式,并模仿某些語音風(fēng)格。

在語音技術(shù)研發(fā)上,去年蘋果Siri被眾多消費者認為是更加具有表現(xiàn)力的聲音。同時去年四月,亞馬遜Alexa面向語音應(yīng)用開發(fā)者提供了SSML標(biāo)簽,在語音助手中增加了更豐富的表達,例如停頓、輕語,以及一些感嘆詞等。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號