訂閱
糾錯
加入自媒體

更“主動”和“乖巧”的 Siri,能成為語音交互的最新發(fā)動機么?

2018-07-04 08:47
來源: 極客公園

被詬病“不好用”的Siri,曾一度因為HomePod的發(fā)布迎來更加糟糕的風(fēng)評。

作為“智能音箱”,HomePod的音質(zhì)收獲了幾乎所有人的一致贊美,但代表其“智能”這部分的Siri卻表現(xiàn)欠佳。在亞馬遜和Google兩家巨頭將智能語音助手之爭演變成軍備競賽的這兩年里,Siri始終沒有什么存在感。相比Alexa和GoogleAssistant,Siri常常被用戶吐槽“聽不懂,做不到”,整體的指令識別成功率偏低。同時,Siri的第三方開發(fā)的生態(tài)也不如Alexa和Google那么豐富,用戶也很難通過向Siri下達指令來獲取第三方服務(wù)。

但這一次,蘋果不想再讓用戶久等。就在各種批評聲音還未散去之時,蘋果在WWDC18上針對Siri交出了一份答卷。蘋果為Siri體系帶來了一個全新的自動化工具:Shortcuts,這相當(dāng)于給Siri配上了一臺全新的發(fā)動機。Shortcuts讓用戶可以將指令和動作依照自己的需求綁定起來,也讓Siri可以更細致地獲知用戶的需求,并且主動給出推薦。通過Shortcuts,蘋果希望讓Siri能聽懂用戶的指令,接入到盡可能多的服務(wù),最終融入豐富廣闊的iOS開發(fā)生態(tài)。

在Siri和第三方App間搭起一座橋

這并不是蘋果第一次為Siri的開放費盡心思。

在2016年的WWDC上,蘋果就發(fā)布了SiriKit。這是蘋果第一次將Siri開放給第三方開發(fā)者,希望用戶可以借助Siri訪問更多第三方服務(wù)。開發(fā)者可以基于自己的App功能定義指令,然后蘋果會將這些指令集成到Siri里,當(dāng)用戶發(fā)出的語音指令中包含正確的觸發(fā)詞時,App內(nèi)的功能就會被觸發(fā)。

但這個功能一直存在著一個隱患。自然語言里的關(guān)鍵詞極為有限,如果少數(shù)的重要關(guān)鍵詞比如“叫車”、“訂餐”被少數(shù)的開發(fā)者所把控,這是會比“域名爭奪”更可怕的一件事。因此,蘋果在此事上一直保持著謹慎的態(tài)度。針對SiriKit,蘋果最初僅僅開放了包括短信和通話在內(nèi)的6類服務(wù),允許開發(fā)者接入。雖然蘋果后續(xù)又陸續(xù)開放了一些服務(wù),但真正得以接入SiriKit的App數(shù)量少得可憐。另一方面,即便是接入了SiriKit的App,也因為開發(fā)者定義的指令不能廣泛契合大多數(shù)用戶發(fā)出語音指令的方式,很難讓用戶流暢使用。

不過,蘋果并沒有放棄這方面的努力,并且在仔細思考,如何在Siri開放的過程中利用好自身優(yōu)勢。去年3月,蘋果宣布收購Workflow;诜夯木W(wǎng)址系統(tǒng)(包括一切url和urlscheme)。這個iOS上的著名自動化App可以讓用戶可以將不同的指令、動作串聯(lián)起來,編寫自動化操作。

在被蘋果收購之后,iOS商店里Workflow的價格從之前的18-45元人民幣變?yōu)槊赓M,整個開發(fā)團隊也得以加入蘋果。當(dāng)時外界普遍認為,蘋果是希望基于Workflow來為iOS打造一款類似macOS上Automator的生產(chǎn)力工具。但蘋果顯然著更深層次思考,在收購Workflow之后,蘋果將整個團隊整合進了Siri團隊,在過去的一年多時間里,基于Workflow,這個新融合的團隊開發(fā)出了Shortcuts。

在智能鑰匙扣的App里,讓鑰匙扣響鈴就變成了一個Intention。

脫胎于Workflow的Shortcuts在“第三方服務(wù)接入”這件事上獲得了一個質(zhì)的飛躍。任何開發(fā)者都可以在自己的App內(nèi)定義一些名為“Intention”的動作:比如用戶用星巴克App點咖啡,星巴克的開發(fā)團隊就可以將“點咖啡”這個動作定義為一個Intention。而這些Intention最終都可以被用戶手動加入到Siri。App開發(fā)者也不再需要去思考“用戶會說什么關(guān)鍵詞來觸發(fā)我的服務(wù)”,而是只需要將用戶在自家App上進行的動作總結(jié)、精煉出來,接入到Shortcuts就行了。

Shortcuts使任何iOS開發(fā)者都可以輕松地將自己的App接入Siri,滿足用戶的需求。它相當(dāng)于一座橋梁,將豐富而廣闊的iOS應(yīng)用生態(tài),和不夠完善的Siri進行了一種連接。

當(dāng)Alexa和GoogleAssistant正各自試圖將自家的語音助手打造成一個獨立的平臺、并拉攏新開發(fā)者時,蘋果正試圖利用iOS本身的優(yōu)勢來完成一次超越。

Siri的主動推薦有了更豐富的細節(jié)

2016年,隨著iOS9的問世,蘋果推出了“ProactiveSiri”(Siri主動推薦)功能。蘋果希望Siri不僅僅是一個被動接受并執(zhí)行指令的“語音助手”,而是想讓它成為一個能主動預(yù)測用戶需求的智能私人助手。藉由Siri主動推薦功能,用戶在特定的地點和時間,會在多任務(wù)界面看到推薦打開的App;連上車載藍牙之后iPhone會自動給出回家的路線規(guī)劃和行程預(yù)測;Siri會自動識別規(guī)律性日歷項發(fā)生的地點,提前預(yù)測路況,提醒你該出發(fā)了;插上耳機之后iPhone會自動推薦打開你常用的音樂或視頻App……

但就過去兩年,就在GoogleAssistant和Alexa高歌猛進時,Siri的主動推薦功能并沒有成為iOS下的“殺手級功能”,甚至都不怎么為人所知。背后的一個重要原因是,其針對第三方App的支持僅僅只能停留在“推薦用戶打開App”這樣一個很淺的層面上,它既無法從App中獲取到更深層次的信息,也無法一步深入到App內(nèi)的某個行為上。其中真正有意義的深度推薦都是基于蘋果自家App的,這就大大限制了Siri主動推薦的發(fā)揮空間。

現(xiàn)在,蘋果希望Shortcuts的出現(xiàn)徹底改變這個困境。

Siri會自動分析你的需求給出動作推薦

在Shortcuts中,由開發(fā)者定義的“Intention”將會被整體接入到Siri主動推薦中。開發(fā)者可以定義這個動作的關(guān)鍵參考要素,比如時間、地點……這樣iOS就會在后臺對用戶進行這些動作時的關(guān)鍵參考要素進行觀察,比如用戶每天早上都會用某個App點咖啡,那么Siri就會以通知的形式在早上主動推薦用戶執(zhí)行這個動作,用戶只需要在鎖屏界面點擊一下,App就會接到指令,自動幫忙點好咖啡。同時,這些Shortcuts也會在AppleWatch的Siri表盤上顯示,并可以在智能手表上執(zhí)行。

這套機制讓Siri可以更精細地洞察用戶的需求,提供更多方便的快捷方式。更“貼心”的一點是,蘋果在進行這一系列創(chuàng)新時,已經(jīng)自覺站在了用戶那邊,它周全的考慮了用戶隱私的問題:這些和用戶需求相關(guān)的數(shù)據(jù)收集和處理全部都由iOS在本地執(zhí)行,開發(fā)者并不能獲取到詳細的用戶行為數(shù)據(jù)。

讓用戶自己來訓(xùn)練和教導(dǎo)Siri

除了自動推薦,蘋果當(dāng)然也沒忘了Siri最初的起點——語音控制。

在iOS12之前,人們對Siri最大的不滿,并非在于Siri聽不懂他們在說什么——事實上,Siri大部分時候都能夠?qū)⒙曇舯容^準(zhǔn)確地轉(zhuǎn)換為文字。但將不同用戶心中各不相同的自然語言習(xí)慣轉(zhuǎn)換成正確的命令,才是Siri一直沒有跨越的門檻。

在Twitter上,著名科技評論人莫博士曾經(jīng)毫不留情的吐槽過Siri理解指令的能力:在控制播放音樂時,用戶必須按照標(biāo)準(zhǔn)的句式,準(zhǔn)確地說出歌名、專輯名、歌手名,Siri才能正確地理解你想聽的是什么,否則就很容易表現(xiàn)成“人工智障”。

自然語言處理是計算機領(lǐng)域幾十年來的難題,也是智能語音助手想要真正進入更復(fù)雜場景時必須跨越的巨大障礙。現(xiàn)在,蘋果在這件事上做出了一個關(guān)鍵選擇。它不再完全讓iOS團隊或第三方app開發(fā)者來決定Siri對自然語言的理解,而是把訓(xùn)練和教導(dǎo)Siri“聽話”的權(quán)利交給用戶。

也就是說,用戶現(xiàn)在可以將各種app的動作編寫成Shortcuts,然后自己設(shè)置一個觸發(fā)詞來執(zhí)行Shortcuts。一個典型的場景是,用戶可以將“打開家里的空調(diào)”、“向家人發(fā)一條短信告知自己晚上回來吃飯”、“叫一輛回家的Uber”三件事連在一起編寫成一個Shortcut,將Siri關(guān)鍵詞設(shè)置成“下班回家”,在晚上離開辦公室前,對Siri說一句“下班回家”,Siri就會自動完成開空調(diào),發(fā)短信以及叫Uber三個動作。

我們使用手機的方式是很復(fù)雜的,即使業(yè)界高喊著voice-first,語音交互真正能接管的,還是很少的一部分場景。而Shortcuts要做的,就是把那些具有一定復(fù)雜性但有規(guī)律可循的任務(wù),讓用戶去自定義設(shè)置程序并教給Siri。進而把一個非常復(fù)雜的流程變成一句語音指令就可以搞定的事。用戶不再需要去“不斷嘗試”什么樣的指令是Siri能聽懂的,而是可以像做一個Workflow一樣把很多不同的動作變成一種“一觸即發(fā)”的體驗。

這種機制讓Shortcuts可以在AppleWatch和HomePod上被輕松觸發(fā),AppleWatch和HomePod會將執(zhí)行Shortcuts的指令發(fā)送到iPhone。同時也讓多語言的Siri變得有可能。對于中國用戶來說,需要用到多語言的情況還是挺常見的,而通過Shortcuts,類似“用中文Siri無法控制播放英文歌曲”的問題都可以通過自己設(shè)定Shortcuts來解決,你可以用中文指令去控制播放英文的歌單、播客,也可以用英文指令去觸發(fā)中文App里的訂餐、打車以及發(fā)短信。

在我們都以為作為“語音助手”的Siri正被亞馬遜和谷歌遠遠地甩在身后時,蘋果卻已經(jīng)對Siri有了更深遠的思考。很顯然,蘋果正希望Siri超越語音助手的定位,成為一個能夠聽懂指令,且能夠主動理解用戶需求的“綜合性AI助手”。只不過,想要達成這個目標(biāo)很困難,在過去的幾年里,蘋果的嘗試沒有取得太多成功。

而Shortcuts的問世,讓開發(fā)者和用戶被放到了各自合適的位置上,將一個遠大卻有點虛無縹緲的目標(biāo),轉(zhuǎn)化成了一種更實際的應(yīng)用機制。它讓更多的第三方服務(wù)有機會輕松接入Siri,也讓Siri能夠調(diào)用App內(nèi)更深層次的動作,并且讓用戶能夠主動控制這件事。

擁有這樣一個全新的發(fā)動機后,Siri需要達成的目標(biāo)不再“神奇”,已經(jīng)開始變得更加“實際”。這或許是我們在iOS12中看到的最令人興奮的更新之一。(作者:Jesse)

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號