訂閱
糾錯(cuò)
加入自媒體

百度手機(jī)輸入法8.0正式發(fā)布能識別不同人聲:對比訊飛輸入法誰更AI?

百度手機(jī)輸入法8.0正式發(fā)布,新版給用戶帶來了能識別不同人物聲紋的語音速記,還有一個(gè)好玩的AR表情功能,那么這些功能的具體表現(xiàn)如何?我們一起來測試一下它吧。

百度手機(jī)輸入法語音速記怎么用

首先說說百度手機(jī)輸入法8的語音速記功能。這個(gè)功能隱藏在了輸入法輸入面板的百度圖標(biāo)(工具)中,點(diǎn)擊后就可以看到語音速記工具。

↑↑↑語音速記工具

語音速記被分為了單人模式與多人模式,其中多人模式最多支持3個(gè)人的聲音辨識。當(dāng)用戶使用多人模式進(jìn)行語音速記的時(shí)候,百度手機(jī)輸入法將自動的將兩個(gè)或三個(gè)人的講話分開來記錄。

↑↑↑模式選擇圖3 人數(shù)選擇

百度手機(jī)輸入法單人速記測試

我們先來看看單人語音速記,百度手機(jī)輸入法采用的是邊錄音邊識別顯示語音的操作。小編使用新聞聯(lián)播里的某段新聞進(jìn)行測試,識別率還不錯(cuò)。但由于播音員語速較快,語音識別還是有不少錯(cuò)誤的。

而修改文字內(nèi)容的操作就比較的人性化,當(dāng)用戶點(diǎn)擊需要修改的文字,會自動跳轉(zhuǎn)到該文字對應(yīng)的錄音節(jié)點(diǎn)上,用戶點(diǎn)擊“播放”按鈕就可收聽該句的錄音。

然后小編用標(biāo)準(zhǔn)普通話念了一段新聞,來看看百度手機(jī)輸入法的表現(xiàn)如何。

測試原文:很多用戶網(wǎng)友反映,摩拜出現(xiàn)故障,掃碼后不能解鎖,押金還被清零了。記者在北京地區(qū)試著體驗(yàn)了一下,掃碼摩拜后,出現(xiàn)一行代碼,然后賬戶內(nèi)押金、余額、月卡全部清零。

測試結(jié)果:很多用戶網(wǎng)有反應(yīng)。膜拜出現(xiàn)故障。掃碼后不能解鎖。押金還被清零了。記者在北京地區(qū)試著體驗(yàn)了一下。掃碼,膜拜后。出現(xiàn)一行代碼。然后賬戶內(nèi)押金,余額,月卡全部清零。

小結(jié):除了網(wǎng)友變成網(wǎng)有,摩拜變成了膜拜,其它的都正確識別了。

百度手機(jī)輸入法多人速記測試

再來看看多人模式,小編選擇了2人模式,采用新聞聯(lián)播的快訊播放片段來進(jìn)行測試。

一開始時(shí),百度手機(jī)輸入法還是將男女兩個(gè)播音員的新聞播報(bào)混合在了一起,小編正奇怪,等讀了兩三個(gè)速報(bào)新聞后,百度手機(jī)輸入法就自動將男女播音員的語音分開識別了,之前混在一起的識別文字也自動進(jìn)行了分類。

小編猜測可能是聲紋識別需要一段時(shí)間的學(xué)習(xí)。在進(jìn)行第二次測試時(shí),百度手機(jī)輸入法就直接將男女播音員的文字區(qū)分開來了。

那么識別效果如何呢?同樣可能因?yàn)椴ヒ魡T的語速較快,語音識別正確率一般。而男女兩人的聲音識別自動區(qū)分也有時(shí)會區(qū)分錯(cuò)誤,出現(xiàn)了同一個(gè)播音員的聲音被設(shè)別為了不同人的識別錯(cuò)誤。

再來看看真人語音識別測試:

男聲:舒克開著直升飛機(jī)來到一片花叢上空,他看見許多蜜蜂在采蜜。

女聲:“今天的蜜真多,都運(yùn)不回去了,怎么辦呀?”一只蜜蜂對大家說。

男聲:“是呀,怎么辦呀?”大家都很著急。

女聲:舒克把頭探出窗外:“我來幫你們運(yùn)吧!”

結(jié)果就是,百度手機(jī)輸入法正確的識別輸出了小編說讀文字,可惜的是兩人讀音并沒有很好的區(qū)分開來,出現(xiàn)了將一個(gè)人的讀音區(qū)別為兩人的錯(cuò)誤。

好玩的AR表情功能 DIY個(gè)性表情包就這么簡單

接下來就是一個(gè)百度手機(jī)輸入法“不務(wù)正業(yè)”的AR表情功能,這個(gè)功能隱藏在了百度手機(jī)輸入法輸入面板的表情符號中,點(diǎn)擊后可選擇多個(gè)人物模板,選擇自己喜歡的人物頭像,然后就進(jìn)入AR表情制作界面,將手機(jī)前攝像頭對著自己的人臉,就可識別出用戶的表情與動作,接著,模版人物就會跟隨模仿用戶的動作表情了。

點(diǎn)擊下方的錄制按鈕可以將動作錄制為GIF表情,還能往表情里添加文字,生成的GIF表情可保存到本地,并可收藏到百度手機(jī)輸入法的表情中。

對比測試 語音識別哪家強(qiáng)

接下來就拿百度手機(jī)輸入法與訊飛輸入法簡單測試對比一下。受測試環(huán)境,測試人員等因素影響,此測試僅供參考。

測試一 新聞聯(lián)播語音識別

測試原文:從昨天開始,今年首場大范圍雨雪天氣波及全國23個(gè)省份,降水范圍將超過400萬平方公里,今天中央氣象臺發(fā)布暴雪橙色預(yù)警,預(yù)計(jì)中東部的雨雪仍會持續(xù)。

測試結(jié)果:百度手機(jī)輸入法錯(cuò)了一個(gè)淤血(雨雪),訊飛完全正確。

測試二 有背景音樂的古詩詞朗誦

小編采用了小伴龍里的古詩詞朗讀,一篇為輕微背景音的《黃鶴樓送孟浩然之廣陵》,一篇為較大背景音的《登鸛雀樓》

輕微背景音測試:

較大背景音測試:

測試結(jié)果:在背景音的影響下,兩個(gè)輸入法都出現(xiàn)了識別錯(cuò)誤的情況,而在背景音較大的情況下,兩輸入法都無法正確識別語音。

總結(jié)

百度手機(jī)輸入法8給用戶帶來了實(shí)用的語音速記功能,在一定程度上可以減輕記錄人員的負(fù)擔(dān),將語音正確的識別轉(zhuǎn)換為文字,對比以前已經(jīng)有了較大的進(jìn)步,不過還需不斷的改進(jìn)。

此外,語音識別的準(zhǔn)確率與識別速度在玩手游時(shí)可是重要的標(biāo)準(zhǔn)哦,準(zhǔn)確率高,識別快就是個(gè)非常好的交流助手哦,據(jù)小編測試,只要使用人的普通話標(biāo)準(zhǔn),百度手機(jī)輸入法的準(zhǔn)確識別率會相當(dāng)不錯(cuò)。

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號