訂閱
糾錯(cuò)
加入自媒體

小度音箱背后的下一代操作系統(tǒng)

2019-07-05 10:51
深幾度
關(guān)注

小度音箱背后的下一代操作系統(tǒng)

文|吳俊宇

美國(guó)科技媒體CHROMEUNBOXED在今年5月Google I/O大會(huì)結(jié)束之后曾發(fā)表一篇名為《Next Generation Google Assistant Set To Revolutionize How We Talk To Devices》(下一代谷歌助手將徹底改變我們與設(shè)備的對(duì)話方式)的文章。

這篇文章提到,“我們的聲音與我們的設(shè)備將在交互方面進(jìn)行一場(chǎng)革命”。

小度音箱背后的下一代操作系統(tǒng)

也就是說(shuō),語(yǔ)音交互可能會(huì)帶來(lái)新一代操作系統(tǒng)——它可能和“桌面+鍵鼠”、“屏幕+觸控”一樣,成為我們?cè)谥悄軙r(shí)代的新選擇。

CHROMEUNBOXED這個(gè)判斷并非虛言。隨著自然語(yǔ)言處理NLP技術(shù)的日趨進(jìn)步,智能語(yǔ)音能夠理解的事物越來(lái)越多,我們和語(yǔ)音之間的交互也將越來(lái)越深。

這一次百度AI開(kāi)發(fā)者大會(huì)上,新發(fā)布的小度助手5.0,恰恰展現(xiàn)了成為“第三代操作系統(tǒng)”的潛力。

一、語(yǔ)音何以成為系統(tǒng)

在我看來(lái),互聯(lián)網(wǎng)的發(fā)展歷經(jīng)了兩個(gè)階段,現(xiàn)在正在進(jìn)入第三個(gè)階段。

第一代操作系統(tǒng)是“桌面+鍵鼠”,桌面時(shí)代的思路,是“搶入口”,比如搜索引擎、社交工具、殺毒軟件。

第一個(gè)階段的代表諸如桌面瀏覽器、桌面QQ、360衛(wèi)士這些產(chǎn)品。人們對(duì)這些工具型產(chǎn)品有著超乎尋常的依賴(lài),往往可以形成“三級(jí)火箭”的商業(yè)邏輯。比如“殺毒軟件—瀏覽器-搜索”就是典型的三級(jí)火箭模式。

不過(guò),這個(gè)模式到了移動(dòng)時(shí)代就失效了,隨著APP入口日趨分散,“平臺(tái)+生態(tài)”成了通用邏輯。

第二代操作系統(tǒng)是“屏幕+觸控”,移動(dòng)時(shí)代的思路,是“造平臺(tái)”。

第二階段的代表就是微信,微信無(wú)論是最開(kāi)始做微信公眾號(hào),還是后來(lái)的九宮格,以及當(dāng)下的小程序,微信都在希望逐步加深自己操作系統(tǒng)的屬性。

但限于微信移動(dòng)產(chǎn)品形態(tài)的限制,它只能是騰訊尋找下一個(gè)操作系統(tǒng)產(chǎn)品的過(guò)渡期產(chǎn)品,將第二階段的紅利盡量延長(zhǎng),為自己爭(zhēng)取更多時(shí)間。

第三代操作系統(tǒng)是“智能+語(yǔ)音”,智能時(shí)代的思路是入口無(wú)形化,服務(wù)語(yǔ)音調(diào)動(dòng)、無(wú)所不在,服務(wù)生態(tài)在系統(tǒng)內(nèi)實(shí)現(xiàn)自然閉環(huán)。

也就是說(shuō),語(yǔ)音成為了交互的工具。過(guò)去人們是通過(guò)“桌面+鍵鼠”、“屏幕+觸控”調(diào)取各式各樣的服務(wù)。但是在第三代操作系統(tǒng)這里,隨著自然語(yǔ)音處理技術(shù)的逐漸成熟,人們可以直接通過(guò)語(yǔ)音去調(diào)取服務(wù)。

在微軟Build2016開(kāi)發(fā)者大會(huì)上,微軟CEO納德拉首先提出了Conversations as a Platform,也就是對(duì)話即平臺(tái)的人工智能發(fā)展方向。

這個(gè)概念在后來(lái)也被稱(chēng)為是對(duì)話式人工智能。

所謂對(duì)話式人工智能指的是,對(duì)話本身就是一個(gè)平臺(tái),各種知識(shí)、信息與服務(wù)都運(yùn)行在對(duì)話器上,可以形成生態(tài)環(huán)境的基礎(chǔ)平臺(tái)。人和人工智能之間的對(duì)話,即是解決各種問(wèn)題的一種路徑和方式。

美國(guó)科技媒體Towards Data Science在今年4月刊載的一篇名為《A Voice Based Operating System》(《基于聲音的操作系統(tǒng)》)一文中提到了這樣一句話:

Voice interfaces are the future of human computer interaction.
語(yǔ)音接口是人機(jī)交互的未來(lái)。

小度音箱背后的下一代操作系統(tǒng)

這篇文章認(rèn)為,語(yǔ)音想要成為操作系統(tǒng),必須滿足這幾個(gè)條件。

1、巨大的研究實(shí)驗(yàn)室作為人工智能的技術(shù)先驅(qū)。

2、巨大的計(jì)算資源,幾乎不受限制地訪問(wèn)數(shù)據(jù)。

3、一個(gè)可以從基于語(yǔ)音的界面中獲益匪淺的應(yīng)用程序生態(tài)系統(tǒng)。

在我看來(lái),一個(gè)真正可能“上位”的語(yǔ)音操作系統(tǒng),還需要有著硬件生態(tài)規(guī)模作為支撐——讓它真正無(wú)處不在。

二、小度助手悄然崛起

7月3日,在“Baidu Create 2019”百度AI開(kāi)發(fā)者大會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏演示了小度行業(yè)領(lǐng)先的全雙工免喚醒能力,小度現(xiàn)場(chǎng)展示的“連續(xù)對(duì)話”和“拒絕反應(yīng)”能力讓人看到了“操作系統(tǒng)級(jí)別”的體驗(yàn)。

小度音箱背后的下一代操作系統(tǒng)

某種意義上看,今天的小度助手,其實(shí)就符合這三個(gè)條件。

百度本身就是國(guó)內(nèi)AI技術(shù)最領(lǐng)先的企業(yè),在計(jì)算資源、算力規(guī)模方面,也無(wú)需多言。基于這些基礎(chǔ)條件,百度開(kāi)發(fā)者大會(huì),作為國(guó)內(nèi)乃至全球開(kāi)發(fā)者們的頂級(jí)盛會(huì),勾勒了一個(gè)未來(lái)操作系統(tǒng)的影子——小度助手5.0。

1、技術(shù)基礎(chǔ)

語(yǔ)音操作系統(tǒng)最重要的技術(shù)基礎(chǔ)在于自然語(yǔ)言處理能力。這個(gè)素來(lái)都是百度的優(yōu)勢(shì)。

在自然語(yǔ)言處理之外,百度還具備小度開(kāi)放平臺(tái),專(zhuān)門(mén)為個(gè)人及企業(yè)開(kāi)發(fā)者提供專(zhuān)業(yè)的對(duì)話式AI技能開(kāi)發(fā)工具。其中包括智能設(shè)備開(kāi)放平臺(tái)和技能開(kāi)放平臺(tái)。

這使得小度助手可以不斷演化出新的技能,技術(shù)更新速度也更快。要知道,一款操作系統(tǒng)最重要的基礎(chǔ)就是應(yīng)用和硬件,百度在這方面已經(jīng)打通了軟硬件上下游的生態(tài)。

另一個(gè)重要的技術(shù)突破在于,小度助手5.0的全雙工免喚醒能力讓語(yǔ)音交互體驗(yàn)邁出了一大步,用戶不僅能在無(wú)需多次喚醒的情況下和機(jī)器順暢交流,還能在與他人對(duì)話的同時(shí)互不干擾地實(shí)現(xiàn)人機(jī)交互。

2、用戶規(guī)模

任何操作系統(tǒng),必不可少的就是用戶規(guī)模。語(yǔ)音操作系統(tǒng),其用戶規(guī)模的支撐又離不開(kāi)硬件規(guī)模。因?yàn)橹挥杏布?guī)模(如智能音箱、智能手機(jī)、智能電視等)足夠龐大,能夠覆蓋足夠多的場(chǎng)景,才能覆蓋足夠多的用戶。

百度副總裁、百度智能生活事業(yè)群組(SLG)總經(jīng)理景鯤在大會(huì)上提到的一組數(shù)據(jù)頗為驚人:

截至2019年6月,搭載小度助手的智能設(shè)備激活數(shù)量已經(jīng)達(dá)到4億(不包含百度系A(chǔ)PP內(nèi)置小度助手?jǐn)?shù)量),小度的月交互次數(shù)超過(guò)36億(不包含百度系A(chǔ)PP內(nèi)置小度助手?jǐn)?shù)量)。

支撐如此龐大數(shù)據(jù)規(guī)模的,其實(shí)是龐大的合作伙伴生態(tài)。小度助手的合作伙伴數(shù)量已經(jīng)超過(guò)300家,內(nèi)置小度助手的主控設(shè)備超過(guò)160多款;小度助手的對(duì)話能力應(yīng)用到智能家居、智能穿戴、車(chē)載、移動(dòng)等多個(gè)場(chǎng)景,為用戶提供語(yǔ)音服務(wù)。

有趣的是,根據(jù)Canalys 發(fā)布的2019年Q1 全球智能音箱市場(chǎng)報(bào)告,百度2019年Q1 小度智能音箱出貨量達(dá)330萬(wàn)臺(tái),僅次于谷歌的350萬(wàn)臺(tái)及亞馬遜的460萬(wàn)臺(tái),成為中國(guó)市場(chǎng)第一,全球市場(chǎng)第三。

小度音箱背后的下一代操作系統(tǒng)

不管是合作伙伴還是自有硬件,小度助手都形成了龐大的用戶規(guī)模。

3、生態(tài)規(guī)模

一個(gè)好的操作系統(tǒng),背后是一套完整的生態(tài),其中包括開(kāi)發(fā)者、應(yīng)用層和硬件層。今天的小度助手其實(shí)就滿足這個(gè)條件。

小度技能開(kāi)放平臺(tái)目前可提供包括游戲、效率工具、網(wǎng)絡(luò)電臺(tái)、直播、兒童教育、智能家居等2400多種技能支持;在小度技能開(kāi)放平臺(tái)上的技能開(kāi)發(fā)者數(shù)量已經(jīng)超過(guò)3.2萬(wàn)人;小度助手可以控制的IOT智能家居設(shè)備已經(jīng)超過(guò)了七千萬(wàn)。小度助手可以提供20余種跨場(chǎng)景、跨設(shè)備的解決方案。

小度助手5.0的發(fā)布,無(wú)論是所展現(xiàn)的技術(shù)能力還是智能語(yǔ)音技術(shù)所具備的天然優(yōu)勢(shì),都讓小度助手更有可能成為未來(lái)的操作系統(tǒng)。

更多的開(kāi)發(fā)者接入,更多的技能得以實(shí)現(xiàn),更多硬件廠商的擁抱態(tài)度,都為小度助手提供了成為操作系統(tǒng)道路的動(dòng)力。

有技術(shù)、有用戶、有生態(tài),小度助手需要做的,僅僅只是等待東風(fēng)的到來(lái)。

三、下一個(gè)劇變的開(kāi)始

國(guó)內(nèi)企業(yè)戰(zhàn)略及管理學(xué)研究者朱恒源有一個(gè)“變革動(dòng)態(tài)管理模型”。

小度音箱背后的下一代操作系統(tǒng)

在朱恒源看來(lái),一個(gè)創(chuàng)新產(chǎn)品是不會(huì)馬上就被所有用戶接受的,在不同的階段,主流的新增用戶是不同的。隨著這些用戶的不斷累積,就會(huì)看到市場(chǎng)的成長(zhǎng)軌跡不是一條直線,而是一條“S”形曲線。

在這個(gè)“S”形的市場(chǎng)發(fā)展曲線上,我們可以看到四個(gè)清晰可識(shí)別的階段:小眾市場(chǎng)、大眾市場(chǎng)、分眾市場(chǎng)和雜合市場(chǎng)。

小度音箱背后的下一代操作系統(tǒng)

在小眾市場(chǎng)的時(shí)候,它是一個(gè)漸變的過(guò)程,規(guī)模小、增長(zhǎng)慢而且不穩(wěn)定,需求多樣性很高。由小眾市場(chǎng)向大眾市場(chǎng)過(guò)渡就是突變,接受某個(gè)產(chǎn)品的人數(shù)突然呈指數(shù)式增長(zhǎng),市場(chǎng)在極短的時(shí)間內(nèi)極速擴(kuò)大,并且達(dá)到了一個(gè)非常大的規(guī)模。

某種意義上看,當(dāng)下發(fā)展階段就是圖中所示的智能手機(jī)和智能語(yǔ)音這兩條動(dòng)態(tài)曲線的重疊區(qū)間。

今天的智能語(yǔ)音,正處于下一個(gè)劇變的前夜。目前使用智能語(yǔ)音的用戶主要還處在小眾市場(chǎng),但是隨著技術(shù)不斷成熟、用戶不斷擴(kuò)大,真正的劇變即將開(kāi)始。

紐約時(shí)報(bào)在2017年曾經(jīng)針對(duì)智能語(yǔ)音發(fā)表過(guò)這樣一個(gè)觀點(diǎn):

人工智能時(shí)代利害攸關(guān)的不在于這些零零碎碎的創(chuàng)新,而是可能控制的一種全新的計(jì)算平臺(tái)。

如果說(shuō)曾經(jīng)的微軟掌握了Windows從而獲取了PC時(shí)代的霸權(quán)地位,后來(lái)的谷歌和蘋(píng)果掌握了Android和iOS因此在移動(dòng)時(shí)代叱咤風(fēng)云。

那么今天的百度,可能會(huì)因?yàn)樾《戎诌@樣的第三代操作系統(tǒng),在智能時(shí)代搶占新的機(jī)會(huì)。

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)