訂閱
糾錯
加入自媒體

詳解AI領(lǐng)域“金發(fā)女郎效應(yīng)”:如何讓應(yīng)用型AI做到剛剛好?

雖然埃隆·馬斯克(Elon Musk)和馬克·扎克伯格一直在爭論AGI(通用人工智能,又稱強人工智能)的危險,但初創(chuàng)公司只是將人工智能應(yīng)用于解決特定領(lǐng)域問題,例如提升銷售團隊的績效以及提高生產(chǎn)線的運營效率,這些創(chuàng)企逐漸成長為估值數(shù)十億美元的企業(yè)。然而,嚴格的定義問題只是找到有價值的人工智能商業(yè)應(yīng)用的第一步。

為找到構(gòu)建人工智能業(yè)務(wù)的合適機會,初創(chuàng)公司必須在不同的維度上運用“金發(fā)姑娘原則”,以找到“合適”開始的甜蜜點(sweet spot)——在不同維度之間注意平衡,切記不可過分專注一個維度。根據(jù)我們從與數(shù)千家AI創(chuàng)企合作中學(xué)到的知識,以下是一些有抱負的創(chuàng)始人結(jié)合自己的人工智能策略尋找甜蜜點的一些方法。

“恰到好處”的預(yù)測時間范圍

與市面上其他智能軟件不同,人工智能會響應(yīng)其運行的環(huán)境;算法接收數(shù)據(jù)并返回一個結(jié)果或預(yù)測。根據(jù)應(yīng)用程序的不同,可以對近期的情況進行預(yù)測,例如明天的天氣,也可預(yù)測出未來許多年的結(jié)果,比如患者是否會在20年內(nèi)患上癌癥。算法預(yù)測的范圍對其有效性以及是否提供構(gòu)建防御性的機會而言至關(guān)重要。

針對一個較長的時間段進行預(yù)測的算法很難做出評估和改進。例如,算法可以使用承包商之前項目的時間表預(yù)測某個建筑項目將比計劃落后6個月并超預(yù)算20%。在新項目完成之前,算法設(shè)計者和最終用戶很難對此預(yù)測做出評論,只能判斷預(yù)測內(nèi)容在方向上是否正確——即項目是否延遲完成或成本是否更高。

即使最終的項目編號最終非常接近預(yù)測的數(shù)字,也很難完成反饋循環(huán)并積極地加強算法。許多因素會影響到復(fù)雜的程序,如建筑項目,因此很難利用A/B測試預(yù)測來梳理未知混雜因素的輸入變量。系統(tǒng)越復(fù)雜,算法完成加固循環(huán)所需的時間越長,精確訓(xùn)練算法也就越困難。

雖然很多企業(yè)客戶對使用AI解決方案持開放態(tài)度,但為了完成銷售,初創(chuàng)公司必須能夠驗證算法的性能。驗證算法最有說服力的方法就是借助客戶的實時數(shù)據(jù),但這種方法在試點期間可能很難實現(xiàn)。如果創(chuàng)企可獲權(quán)訪問客戶的數(shù)據(jù),預(yù)測時限應(yīng)該盡量短一點,以便在試驗期間驗證算法。

對于大多數(shù)AI創(chuàng)企而言,較慢的計算速度嚴重限制了應(yīng)用型人工智能的范圍。

歷史數(shù)據(jù)(若可用)可以作為訓(xùn)練算法的權(quán)宜之計,并通過回溯測試暫時驗證它。訓(xùn)練對歷史數(shù)據(jù)進行長時間范圍預(yù)測的算法是有風(fēng)險的,因為過程和環(huán)境更有可能改變你對歷史記錄的了解,從而使得歷史數(shù)據(jù)集對當(dāng)前條件的描述性減弱。

其他情況下,雖然描述結(jié)果的歷史數(shù)據(jù)可用于訓(xùn)練算法,但可能無法捕獲在考慮范圍之內(nèi)的輸入變量。舉個建筑行業(yè)實例,你發(fā)現(xiàn)使用藍色安全帽的建筑工地更有可能按時完成項目,但由于帽子的顏色在之前并沒有對管理項目帶來任何幫助,該信息未記錄到存檔文件中。所以必須從頭開始捕獲這些數(shù)據(jù),這將再度推遲企業(yè)的上市時間。

AI創(chuàng)企應(yīng)該建立多種算法,以較短的范圍進行更小、更簡單的預(yù)測,而不是在長時間范圍內(nèi)進行單一的“hero”預(yù)測。將運行環(huán)境分解為更簡單的子系統(tǒng)或在過程中限制數(shù)據(jù)的數(shù)量,使其更容易控制混雜因素。Autodesk的BIM 360項目IQ團隊將這種小型預(yù)測方法應(yīng)用于建筑行業(yè),消除了施工過程中的眾多低效問題,并有助于消除潛在的設(shè)計與施工風(fēng)險。其算法模型可預(yù)測安全性,并對供應(yīng)商和分包商的質(zhì)量/可靠性進行評估,所有數(shù)據(jù)都可以項目進行周期中進行測量。

較短的時間范圍便于算法工程師監(jiān)控其性能變化并采取措施快速改進,而僅限于對歷史數(shù)據(jù)進行回溯測試。時間范圍越短,算法的反饋回路越短。每個周期做出的反饋逐漸累加,可增強算法的性能,較短的反饋周期更有利于構(gòu)建防御性。

“恰到好處”的可操作窗口

大多數(shù)算法對動態(tài)系統(tǒng)進行建模并返回一個預(yù)測結(jié)果供人類采納。由于系統(tǒng)更改頻繁,算法的輸出很難在長時間內(nèi)保持有效性:很可能在用戶采取行動之前,預(yù)測結(jié)果的有效性就大幅度“下降了”。為保證預(yù)測結(jié)果對最終用戶的有效性,必須設(shè)計算法以適機器與人類速度的限制。

在典型的人工智能工作流程中,人類將數(shù)據(jù)輸入算法中,算法運行、計算輸入數(shù)據(jù),并輸出預(yù)測結(jié)果或建議行動步驟;人類解釋該信息以決定行動方案,然后采取行動。算法計算結(jié)果所花費的時間以及人類對輸出內(nèi)容進行操作所花費的時間是此工作流程中最大的兩個瓶頸。

對于大多數(shù)AI創(chuàng)企而言,較慢的計算速度嚴重限制了應(yīng)用型人工智能的應(yīng)用范圍。算法的預(yù)測取決于輸入數(shù)據(jù),輸入數(shù)據(jù)代表記錄過程的瞬時數(shù)據(jù)。如果數(shù)據(jù)描述的環(huán)境變化快于算法計算輸入數(shù)據(jù)的時間,則在算法完成其計算并返回預(yù)測時,預(yù)測結(jié)果僅適用于過去的某個時刻,并且將不可操作。例如,音樂程序Shazam后臺的算法在首次“聽到”歌曲到識別這首歌,期間可能需要花費好幾個小時,且需借助Windows 95系統(tǒng)的計算能力。

云計算的興起以及專為人工智能計算而優(yōu)化的硬件開發(fā)極大地拓寬了應(yīng)用型人工智能可行且可負擔(dān)的領(lǐng)域。雖然宏觀技術(shù)的進步極大地推進了應(yīng)用型人工智能,但算法并不完全受制于當(dāng)前的計算限制;通過訓(xùn)練加強也可以改善算法的響應(yīng)時間。算法遇到的相同示例越多,就能越快地跳過計算過程得出預(yù)測結(jié)果。由于計算的加強與改善,如今Shazam僅用不到15秒的時間便可識別一首歌。

自動化決策和操作還可以幫助用戶利用因過快失效而等不及人類做出回應(yīng)的預(yù)測。Opsani就是這樣一家企業(yè),它運用人工智能來做出數(shù)量龐大、快速變化的決策,以便人類有效采用。與人類DevOps(DevOps,即Development和Operations,是一組過程、方法與系統(tǒng)的統(tǒng)稱,用于促進開發(fā)應(yīng)用程序/軟件工程、技術(shù)運營和質(zhì)量保障部門之間的溝通、協(xié)作與整合)不同,人類DevOps只是根據(jù)算法的建議快速地優(yōu)化性能,Opsani則是應(yīng)用人工智能來識別和自動改進應(yīng)用程序和云設(shè)施的操作,以便用戶享受到更好的性能。

然而,并非所有人工智能應(yīng)用都可以完全自動化,如果感知風(fēng)險對于最終用戶來說太高而無法接受,或者法規(guī)要求必須有人類來批準該決策等情況下,人工智能應(yīng)用便無法完全自動化。

“恰到好處”的性能最低限度

就像軟件創(chuàng)企會選擇在開發(fā)了最小可行產(chǎn)品(MVP)以便從初始客戶中收集可采取措施的反饋時進入市場,AI初創(chuàng)公司應(yīng)該在達到早期用戶所需的最低算法性能(MAP)時正式進入時市場,在市場的大環(huán)境下,算法可以接受更多樣化和新鮮數(shù)據(jù)集的培訓(xùn),也可避免過度訓(xùn)練變成數(shù)據(jù)集。

大多數(shù)應(yīng)用程序并不需要達到100%準確,也會有一定價值。例如,欺詐檢測算法可能只會在發(fā)生故障后的24小時內(nèi)立即捕獲5%的欺詐案例,但詐騙調(diào)查人員經(jīng)過一個月的分析也僅能捕獲15%的案例。在這種情況下,MAP為0,因為欺詐檢測算法可以用作第一過濾器,以減少調(diào)查人員必須經(jīng)手的案例數(shù)量。該創(chuàng)企可立即進入市場,以確保訪問用于培訓(xùn)其算法的大量欺詐數(shù)據(jù)。長此以往,算法的準確性必將能提高并減輕調(diào)查人員的負擔(dān),使其能專注于更復(fù)雜的案例。

為0或較低的MAP應(yīng)用程序構(gòu)建算法的初創(chuàng)公司將能快速進入市場,但若是算法達到高水平性能之前出現(xiàn)這些副本,則可能需要不斷調(diào)查跟風(fēng)抄襲的企業(yè)。

將算法從研究實驗室轉(zhuǎn)向市場并沒有通用的方法。

專攻較低MAP問題的初創(chuàng)公司也應(yīng)注意那些可通過非常小的訓(xùn)練集以近100%準確度解決的問題,其中建模的問題相對簡單,跟蹤的維度少,結(jié)果可能出現(xiàn)的變動也比較少。

基于AI的合同處理是算法性能迅速提升的應(yīng)用一個很好的例子。合同類型數(shù)以千計,但大多數(shù)的關(guān)鍵板塊都是類似的:涉及的各方、交換價值的項目、時間框架等。抵押貸款申請或租賃協(xié)議等特定文件類型是高度標準化的,以符合監(jiān)管。在多個初創(chuàng)公司中,我們發(fā)現(xiàn)自動處理這些文檔的算法在其他示例未幫助改進之前,只需要幾百個示例就可訓(xùn)練到可接受的準確度,從而使后來者更容易將現(xiàn)有企業(yè)和早期算法性能進行匹配。

針對勞動力低廉且能夠輕松達到高精度的應(yīng)用領(lǐng)域而設(shè)計的人工智能需要在找到早期用戶之前達到更高的MAP。例如,需要精細運動技能的任務(wù)尚未被機器人接替,人類的表現(xiàn)需要了非常高的MAP來克服。拾取物體時,為機器人手提供動力的人工智能必須以高精度測量物體的硬度和重量,否則機器人手會損壞被處理的物體。而對人類而言,無需任何訓(xùn)練,也能非常準確地測量這些尺寸。攻擊高MAP問題的創(chuàng)企必須投入更多時間和資金來獲取足夠的數(shù)據(jù),才能達到MAP并正式進入市場。

克服困難

在研究實驗室中,限制領(lǐng)域人工智能(Narrow AI)可以在廣泛的應(yīng)用中取得了重大進展。此外,圍繞Narrow AI的應(yīng)用程序建立業(yè)務(wù)需要新的算法集。此過程很大程度上取決于所有維度的特定用例,算法的性能只是一個起點。將算法從研究實驗室轉(zhuǎn)移到市場并沒有通用的方案,還得具體問題具體分析,但希望這些想法能夠為你提供一個擁有的藍圖。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號