訂閱
糾錯
加入自媒體

語音能力引擎日均調(diào)用100億次,百度大腦“喚醒”了什么?

剛剛結(jié)束的百度大腦語音能力引擎論壇,向外界披露了這樣一個數(shù)字:百度大腦的語音能力引擎日均調(diào)用量已經(jīng)超過100億次。

對照國內(nèi)8.54億的網(wǎng)民規(guī)模,平均每個人要和百度大腦的語音能力引擎每天接觸12次,場景涉及輸入法的語音輸入、智能音箱的語音對話、百度地圖的語音導(dǎo)航、與各種機器人的有趣互動……無論是覆蓋范圍還是使用頻次,早已超過99%的互聯(lián)網(wǎng)服務(wù)。

可能在不少人的印象里,人工智能還是遙不可及的新事物,百度大腦用數(shù)據(jù)告訴了我們這樣一個事實:人工智能并不遙遠,甚至已經(jīng)是生活中不可或缺的一部分。

語音能力引擎日均調(diào)用100億次,百度大腦“喚醒”了什么?

01 日均調(diào)用100億次的背后

如果僅僅盯著數(shù)字來看,100億不可謂不龐大,也奠定了百度大腦語音應(yīng)用規(guī)模第一的成績。但比數(shù)字本身更有價值的是,百度大腦如何做到語音能力引擎日均調(diào)用量超過100億次的規(guī)模,以及100億次的語音到底“喚醒”了什么?

第一個問題的答案是開放。截止到目前,百度大腦已經(jīng)開放了云、端、芯的全棧全場景語音開放能力,廣泛應(yīng)用于文娛、金融、政務(wù)等多個行業(yè)和場景,開發(fā)者們只需要一個簡單的調(diào)用,即可為產(chǎn)品接入百度大腦的智能語音能力。

而從百度大腦語音能力引擎論壇傳遞的消息來看,百度大腦的語音引擎全新發(fā)布和升級了14大產(chǎn)品內(nèi)容,包括基于百度鴻鵠語音芯片的4款硬件模組、開發(fā)板,針對智能家居、智能車載、智能IoT設(shè)備等端到端的軟硬一體遠場語音交互場景解決方案,語音自訓練平臺、呼叫中心語音解決方案的升級,以及6個在線語音合成精品音庫和5個離線語音合成精品音的發(fā)布。

簡單來說,百度大腦已經(jīng)為語音能力引擎打造了一條應(yīng)用落地的生態(tài)鏈,而且生態(tài)鏈所覆蓋的場景和能力還在不斷拓展。

至于第二個問題的答案,不妨先來看三個具體的應(yīng)用案例。

創(chuàng)維AIoT研究院產(chǎn)品經(jīng)理李凱在演講中談及創(chuàng)維和百度大腦的合作,在百度鴻鵠語音芯片等軟硬件的賦能下,創(chuàng)維為產(chǎn)品增加了語音交互能力,涉及2500萬臺的電視裝機量,用戶只需要一個語音指令就能找到自己喜歡的電視節(jié)目,讓電視的交互從遙控器直接進化到智能語音時代。

北京子杰寶貝科技有限公司將百度大腦的語音能力引擎帶到了醫(yī)療領(lǐng)域,之前60%的醫(yī)護人員每天要花費45分鐘到90分鐘的時間填寫表單數(shù)據(jù)。依靠百度大腦的語音識別、自然語言處理等技術(shù),醫(yī)護人員如今用語音就能完成表單的錄入。

善行智能在百度大腦的智能語音技術(shù)、智能OCR識別、智能物體識別等技術(shù)的加持下,打造了可以智能識別障礙物、物品、錢幣等物體,并通過語音播報給用戶的小Q智能導(dǎo)盲眼鏡,幫助盲人群體獨立的認知世界。

誠然,“100億次日均調(diào)用量”的背后是人工智能落地應(yīng)用的生態(tài)圈,為合作伙伴帶來了轉(zhuǎn)型的契機,為醫(yī)護人員解決了工作的痛點,也讓盲人群體感受到了AI的溫暖。而這些僅僅是百度大腦技術(shù)賦能的冰山一角。

02 AI賽道中的“學霸”人設(shè)

除了智能語音的落地應(yīng)用,百度大腦還在不斷推動語音技術(shù)的發(fā)展,比如百度語音首席架構(gòu)師賈磊提出的基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強和語音識別一體化端到端建模技術(shù),相較于傳統(tǒng)基于數(shù)字信號處理的麥克陣列算法,新技術(shù)的錯誤率降低了30%以上,并且已經(jīng)被集成到最新發(fā)布的百度鴻鵠芯片中。

身為人工智能賽道里的“學霸”,百度大腦并非是擅長語音技術(shù)的偏科生,而是一個典型的“別人家的孩子”。

在烏鎮(zhèn)智庫出品的《全球人工智能發(fā)展報告》中,專門羅列了中國AI專利ToP 10的企業(yè),百度以935件的專利數(shù)量,毋庸置疑的成了榜單上的頭名選手,并與騰訊、阿里等同一陣營的玩家們拉開了較大的差距。

在國際權(quán)威研究機構(gòu)Forrester發(fā)布的計算機視覺公有云報告中,在百度大腦的AI視覺技術(shù)加持下,百度智能云處于中國市場“領(lǐng)導(dǎo)者”領(lǐng)域最上方 ,在數(shù)據(jù)、解決方案、應(yīng)用場景、管理能力等多維度領(lǐng)先于阿里云、騰訊云等廠商。另一份《IDC MarketScape:2019中國AI云服務(wù)市場廠商評估》中,憑借在能力和市場兩個維度的優(yōu)異表現(xiàn),百度智能云同樣位居領(lǐng)導(dǎo)者象限最上方。

在4月初結(jié)束的ICME人臉106關(guān)鍵點檢測比賽中,百度大腦力壓阿里、華為、美團、中科大等選手拿到冠軍;6月份的CVPR 2019上,百度大腦又在視頻理解與分析、目標檢測、圖像超分辨、智能城市車輛識別、人臉&人體檢測等領(lǐng)域斬獲了10項冠軍;11月份的ICCV 2019上,百度大腦視覺團隊以mAP值57.13%的成績奪得人臉檢測的冠軍,超過第二名0.47%……

如果從時間上看,2016年百度大腦對外開放至今不過三年時間,縱然離不開百度長期的技術(shù)積累,這么短時間里的全面開花無疑佐證了百度大腦的“學霸”人設(shè)。這樣的成長速度與百度的技術(shù)基因、工程師文化等不無關(guān)系,或許還有另外一重原因。

2017年的時候,就有人將中美在人工智能賽道中的角色比作星球大戰(zhàn)里的Luke和Darth Vader,甚至為雙方進行了“戰(zhàn)力”對比:美國AI公司的數(shù)量比中國高出1.82倍,流向美國的資金份額比中國高1.54倍,美國的AI人才庫亦是中國的2.01倍……美國在人工智能領(lǐng)域的強力基礎(chǔ),有賴于Google、亞馬遜、IBM、微軟等先行者,中國人工智能的擔子自然就落到了BAT身上。

某種程度上說,“學霸”百度大腦還肩負著抹平中美AI力量鴻溝的義務(wù),而從一系列國際賽事上的表現(xiàn)、國際權(quán)威機構(gòu)的認證來看,百度大腦也是中國AI領(lǐng)域當之無愧的頭雁,構(gòu)建起AI的全棧技術(shù)布局,平等的賦能每一位開發(fā)者,將是百度大腦現(xiàn)在和未來身體力行的使命所在。

03 百度大腦在持續(xù)刷新

百度首席技術(shù)官王海峰在百度大腦語音能力引擎論壇講到進化和賦能:“AI技術(shù)的進化和產(chǎn)業(yè)賦能正向循環(huán),相互促進,AI在應(yīng)用場景中不斷進化。”可以理解為這就是百度大腦對自身的使命,也促使百度大腦在持續(xù)“刷新”。

猶記得2016年的百度世界大會上,李彥宏用了相當長的篇幅來講述這個“新概念”,彼時還只是記住了“百度大腦”這個名字,至于會產(chǎn)生什么樣的影響,恐怕很多人并沒有答案。然而短短三年的時間里,百度大腦早已成了生活中的一部分,百度輸入法的語音輸入,入住酒店時的刷臉認證,農(nóng)田里的遙感無人機,工廠里的智能零件分揀……在那些看得到和看不見的生產(chǎn)生活場景中,都有著百度大腦的身影。

截止到目前,百度大腦已經(jīng)開放了228項AI能力,擁有超過150萬的開發(fā)者用戶,當年李彥宏對百度大腦的寄托已經(jīng)逐步實現(xiàn)。但百度大腦并沒有止步于此,在完成AI能力與應(yīng)用場景融合創(chuàng)新的第一步后,百度大腦在5.0升級時被定義為“軟硬一體的AI大生產(chǎn)平臺”,讓AI邁入產(chǎn)業(yè)世界與工業(yè)大生產(chǎn)進行融合。

與之對應(yīng)的是,語音技術(shù)推出了風格遷移的語音合成技術(shù),僅需20句話就可以制作一個人的專屬聲音;視覺方面形成了適用于不同應(yīng)用場景的技術(shù)矩陣,諸如車輛識別、物體識別、風格轉(zhuǎn)化、人流量統(tǒng)計等等;語言與知識方面,構(gòu)建了世界上最大的多元異構(gòu)知識圖譜……除了技術(shù)能力的刷新,百度還將算力、算法和數(shù)據(jù)打通,以百度智能云為依托,以百度大腦為核心,以飛槳為基礎(chǔ)底座,為各行各業(yè)的智能化轉(zhuǎn)型升級提供強有力的支撐。

市場的反映也印證了百度的正確性,僅以百度大腦人臉公有云服務(wù)為例,公有云日均調(diào)用量超過1億,開發(fā)者超過13萬,用戶使用規(guī)模穩(wěn)居業(yè)界第一。并且百度大腦在人臉識別領(lǐng)域積累了1000多家合作伙伴,落地了超過10萬個項目,形成了豐富、完整的人臉產(chǎn)品矩陣。

同樣“刷新”的還有百度大腦的人才體系。就在不久前,著名的計算機和大數(shù)據(jù)理論領(lǐng)域?qū)<襃effrey Vitter加入到百度研究院顧問委員會,美國俄勒岡大學教授竇德景也加盟百度研究院擔任大數(shù)據(jù)實驗室主任。從世界級科學家組成的頂級智囊,到百度龐大的一線工程師,百度大腦在為行業(yè)賦能,驅(qū)動AI走進工業(yè)大生產(chǎn)時代的同時,也在不斷將AI技術(shù)做透、做精、做深。

“刷新”是百度大腦的底色,也是持續(xù)修煉內(nèi)功讓AI走進真實世界的態(tài)度。

04 寫在最后

從2016到2019,人們對AI的理解已經(jīng)不再局限于圍棋大戰(zhàn),可在談?wù)揂I的時候,核心算法上的瓶頸仍然是不少開發(fā)者的錐心之痛。百度大腦就像一個扛著挑戰(zhàn)一路向前的勇士,在每一個關(guān)鍵節(jié)點上為業(yè)界開辟出一條條新路。

讀懂了這一點,語音能力引擎的100億次日均調(diào)用,注定只是百度大腦的一個小目標,因為“讓開發(fā)者平等地獲取AI能力”這條路本就沒有終點。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號