訂閱
糾錯
加入自媒體

從語音識別到語義識別,中間還有多長的路要走?

2017-12-16 08:33
來源: 與非網

  最近科技圈刮起一股收購風,前面博通收購高通還在如火如荼的進行,這周蘋果就宣布收購音樂識別軟件Shazam。Shazam這個軟件,通過手機麥克風收錄音頻片段,能夠識別音樂、電影、電視節(jié)目甚至是廣告。那么蘋果公司整合這項技術做什么?很大可能是為了其人工智能助理軟件Siri。

  Siri使用自然語言處理技術,是AI技術的一大體系,而隨著近年定義和產業(yè)分工越發(fā)精細,語言識別漸漸分成了語音識別和語義識別兩個支系。語音和語義雖只有一字之差,卻有很大的不同。

  打個簡單的比方,語音識別相當于是人的耳朵,而語義識別則是大腦,語音識別幫助機器獲取和輸出信息,那么語義識別則是對這些信息進行識別加工。

  在這里,小編舉個例子來幫助大家更好的理解上面的話:

  爸爸沒法舉起他的兒子,因為他很重。

  問:誰重?

  爸爸沒法舉起他的兒子,因為他很虛弱。

  問:誰虛弱?

  可以看到,這兩個句子結構完全一致,后面的“他”指的到底是爸爸還是爸爸的兒子?這對于我們來說輕而易舉,因為我們有能清楚的通過我們積累的知識知道:爸爸舉不起兒子,要么兒子太重,爸爸舉不起;要么兒子不重,但是爸爸力氣小,比較虛弱,因此舉不起兒子。

  但是對于一個只會語音識別的機器來說,它不會去思考句子中的“他”到底指的兒子還是爸爸,事實上,它也“想不清楚”。但是通過語義識別,機器會對聽到的信息進行加工理解,從而給出正確的答案。

  與語音識別相比,顯然語義識別顯然要更深一個層次,用到的技術也更為復雜。

  本文中,小編就給大家介紹一下人工智能中,自然語言識別這一重要支系。

  語音識別發(fā)展史

  語音是最自然的交流方式,自從1877年愛迪生發(fā)明了留聲機,人們就開始了與機器的交談,但是主要還是與人交流,而非機器本身。

  1950年,計算機科學之父阿蘭·圖靈在《Mind》雜志上發(fā)表了題為《計算的機器和智能》的論文,首次提出了機器智能的概念,論文還提出了一種驗證機器是否有智能的方法:讓人和機器進行交流,如果人無法判斷自己交流的對象是人還是機器,就說明這個機器有智能了,這就是后來鼎鼎有名的人工智能圖靈測試。

  到20世紀80年代,語音識別技術能夠將口語轉化為文本。

  2001年,計算機語音識別達到了80%的準確度。從那時起,我們就可以提取口語語言的含義并作出回應。然而,多數(shù)情況下,語音技術仍然不能像鍵盤輸入那樣帶給我們足夠好的交流體驗。

  近幾年來,語音識別又取得了巨大的技術進步?拼笥嶏w董事長劉慶峰在一次演講中,在演講的同時使用著最新的智能語音識別技術——可以讓他演講的內容實時以中英文雙字幕的形式呈現(xiàn)在大屏幕上,反應迅速、幾乎沒錯。識別精確度超過95%。隨著這項技術的進步,語音優(yōu)先的基礎設施變得越來越重要,亞馬遜、蘋果、谷歌、微軟和百度都迅速部署了聲音優(yōu)先軟件、軟件構建快和平臺。

1  2  3  下一頁>  
聲明: 本文系OFweek根據(jù)授權轉載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號