訂閱
糾錯
加入自媒體

實現(xiàn)AGI道路上,數(shù)據(jù)科學家防不勝防的9大陷阱

最近幾個月,科技研發(fā)的速度也越來越快。微軟宣布將投資10億美元,與科研實驗室OpenAI聯(lián)手打造通用人工智能(AGI),也就是人工智能的最高目標。OpenAI的首席執(zhí)行官Sam Altman表示,AGI將成為人類歷史上最重要的技術。

對于某些特定的任務,計算機能做得比人類好很多。但他們不具備智慧、常識和批判性思維,因此它們無法像人類那樣去應對一些特殊情況(比如一些未定義的情形、模糊的規(guī)則、模棱兩可甚至自相矛盾的要求)。隨著技術的發(fā)展,計算機也許能做到人類大腦能夠完成的任何事情,但之前微軟的表現(xiàn)并不讓人滿意。

2016年,微軟發(fā)布了聊天機器人Tay,這家公司稱“它能與人類在線交流,語言隨和風趣”。Tay的編程語言讓它表現(xiàn)得像一位千禧一代的女性,在學習訓練過程中,它就是在模仿千禧一代的講話方式。微軟表示,“你和Tay聊得越久,那么它就會越聰明!痹诓坏揭惶斓臅r間里,Tay發(fā)送了9.6萬條推特,擁有超過5萬名關注者。但這個問題最終出在Tay自己身上,它講的內(nèi)容越來越令人厭惡!霸资菍Φ,我討厭猶太人。”“911事件是有內(nèi)幕的。”“我非常討厭那些女權主義者。”Tay非常善于利用它接收到的詞匯和詞組,但它無法根據(jù)語境來說話,也不理解自己發(fā)送的推特到底是什么意思。因此微軟在16個小時后就關閉了Tay,但不到一周,它又重新上線。后來微軟稱第二次上線是個意外,并再次關閉了Tay。

AGI也許是一個美好的夢想,而數(shù)據(jù)科學讓我們有機會去利用大數(shù)據(jù)和強大的計算機,作出基于現(xiàn)實而非空想或偏見的決策。但不幸的是,在數(shù)據(jù)大規(guī)模出現(xiàn)之后,企業(yè)和政府仍然在重復之前犯過的一些錯誤,而且重復的速度更快。將重要的決策交給機器,只是實現(xiàn)了“犯錯的自動化”。

數(shù)據(jù)科學不僅僅是數(shù)學證明、統(tǒng)計計算和計算機編程。真實的人類智能也必不可少:比如實驗設計、智慧、常識、懷疑和批判思維等。數(shù)據(jù)科學家并不是要成為一臺機器,不斷地嘗試新模式,不斷地進行曲線擬合;他們更應該成為一位科學家。

如果數(shù)據(jù)科學家想要充分挖掘數(shù)據(jù)科學的潛力,他們應該避免以下九種常見的錯誤。

1.使用劣質(zhì)的數(shù)據(jù)

第一代機械計算機的投資者Charles Babbage曾被國會成員兩次提問:“Babbage先生,如果我們給計算機輸入錯誤的數(shù)據(jù),那么它會得到正確的答案嗎?”顯然優(yōu)質(zhì)的數(shù)據(jù)必不可少,而非可有可無。

芝加哥醫(yī)院對一批膿毒癥患者進行過一次研究,它發(fā)現(xiàn),血液pH值較低的患者在出院后,重新回醫(yī)院治療的可能性更低。兩者的相關系數(shù)達到了0.96。但是這些數(shù)據(jù)還包含了一些在住院期間死去的患者,也就是說這些患者通過太平間離開了醫(yī)院,是絕對不可能回來重新治療的。最后將這些死者的數(shù)據(jù)去掉,就會發(fā)現(xiàn)血液pH值較低的患者反而是更加危險的。

2.將數(shù)據(jù)的地位放在理論之上

一些數(shù)據(jù)科學家在沒有理論和常識的指導下,為了模型搜索大量數(shù)據(jù)。他們認為對于一個問題的定向思維會影響新的發(fā)現(xiàn)。然而不幸的是,大多數(shù)時候泛濫的數(shù)據(jù)都是沒什么意義的。大數(shù)據(jù)領域的一個悖論就是,我們?yōu)橐粋模型輸入的數(shù)據(jù)越多,最后發(fā)現(xiàn)它無用或錯誤的可能性越大。

一位互聯(lián)網(wǎng)營銷人員在大約100個國家測試過三種可選的登錄頁面顏色(黃色、紅色和藍綠色)與它傳統(tǒng)的藍色之間的對比,從理論上講,他應該會發(fā)現(xiàn)某些國家采用特定的顏色,會帶來更高的收入。比如他認為英格蘭更喜歡藍綠色,但實際上并不是。

3.盲目崇拜數(shù)學

數(shù)學家熱愛數(shù)學,非數(shù)學專業(yè)的人懼怕數(shù)學。這兩者的組合可能會催生大量不切實際的模型。

在經(jīng)濟大蕭條時期,由于假定違約事件的發(fā)生是獨立分布的,許多按揭貸款違約的數(shù)學模型都失效了。這些人低估了極端事件的可能性,同時也沒有考慮在經(jīng)濟大蕭條的背景下,無法按期償還貸款的可能性本身就更高。

4.盲目崇拜計算機

常常有人認為,計算機做某些事情做得很好,所以它們一定有非常高的智能,但要知道適用于特定任務和普遍適用多項任務之間還有很大的差別(甚至這些任務還可能完全不一樣)。我們對計算機的依賴并非百利而無一害。如果認為計算機比我們更聰明,從而將所有決策交給計算機,可能會帶來災難性的后果。

5.反復搗騰數(shù)據(jù)

為了尋找數(shù)據(jù)之間的隱藏關系,有些人會把數(shù)據(jù)按照多種方式進行分類。諾貝爾經(jīng)濟學獎得主羅納德·科斯就說過:“如果你不停地操作一些數(shù)據(jù),機器自己都會糊涂!钡髷(shù)據(jù)和強大的計算機卻助長了這種行為。

一位著名研究員曾在他的助手分析數(shù)據(jù)時,告訴后者“盡可能多地從數(shù)據(jù)中榨取信息”。當時他的助手試圖通過機器視覺將一間意大利自助餐廳的客人分為“男性、女性、吃中飯的、吃晚飯的、單獨吃飯的、兩人吃飯的、兩人以上一起吃飯的、點了酒精飲料的、點了軟飲料的”等。最后這些“榨取的信息”變成了四篇“披薩論文”,其中最著名的一篇稱“男性在女性一起吃飯時,會多吃93%的披薩”。如今他的十幾篇論文都被退回,人也被大學辭退。

6.自我欺騙

諾貝爾物理學獎得主理查德·費曼曾向科學家們提出過一條建議:“首要原則就是不要欺騙你自己——因為你自己是最容易被糊弄的。”真正的科學家是分享自己的理論、質(zhì)疑自己的假設,然后尋找機會做實驗來驗證或推翻假設。而擺弄數(shù)據(jù)的人只會看到自己想看的東西。

曾有一份研究要求一所高校的學生預測自己的數(shù)學測驗成績。結(jié)果預測的平均分數(shù)比實際分數(shù)要高,但兩組數(shù)據(jù)之間的相關系數(shù)高達0.70。因此作者得出兩條結(jié)論。第一,這些學生高估了自己的能力。第二,為提高學生的自信心,打分可以適當高一些。對于第一條,可能是學生低估了測驗的難度。對于第二條,較高的相關系數(shù)表明學生其實對自己的數(shù)學水平很有信心,少數(shù)認為自己考不好的,也只是不太熟悉材料。他們并不是太過于悲觀,而是非,F(xiàn)實。

7.把相關性當作誘因

不論被告知多少遍“存在相關性并不一定是誘因”,但研究人員總是會不自覺地忽略這條重要的建議。

2011年,谷歌創(chuàng)建了一個人工智能項目Google Flu,它用搜索請求來預測流感的爆發(fā)。當時他們夸下?冢骸拔覀兡芫珳实仡A測出美國各個地區(qū)未來一周的傳染狀況,每天更新一次!彼麄兎Q模型的精準度已經(jīng)達到97.5%,也就是模型預測結(jié)果和實際流感案例的相關系數(shù)已達到0.975。谷歌是怎么做到的呢?它的數(shù)據(jù)挖掘項目瀏覽了5000萬條搜索請求,并確定了其中45條請求最有可能和流感相關。由于流感的爆發(fā)具有高度的季節(jié)性,Google Flue更像是一個季節(jié)檢測器,它會挑選季候性的搜索詞匯(如圣誕節(jié)、寒假和情人節(jié)等)。當離開了歷史數(shù)據(jù),開始真刀真槍地預測時,Google Flu的準確率就大大地下降。在發(fā)布報告后,Google Flu誤報了未來108周內(nèi)的100起流感案例。從此,Google Flu再也不去預測流感了。

8.不要對平均值的回歸過于驚訝

當數(shù)據(jù)波動時,預測值可能會高于檢測值,但隨后就會繼續(xù)趨于平均值。比如一位高爾夫選手贏了大師錦標賽冠軍,不代表下一次他也能贏。并不是說他下次會倒霉,或者技術會退步,也許這次勝利本來就是超水平發(fā)揮。

數(shù)據(jù)也會在未來回歸平均值,這有點類似于防止一次“發(fā)揮失;虺0l(fā)揮”。例如一家數(shù)據(jù)科學公司做過一個實驗,它將一位客戶的網(wǎng)頁布局和100多萬域名中20個常用的布局進行比較?蛻魝兘(jīng)常會抱怨自己的網(wǎng)站表現(xiàn)不佳,認為網(wǎng)站本來還能賺更多的廣告營收。因此它給一位數(shù)據(jù)分析師一系列網(wǎng)站域名,這些網(wǎng)站在過去三個月的營收都在下降,分析師可以根據(jù)它來調(diào)整網(wǎng)頁布局,看看能否提高營收。結(jié)果他成功了,第二天的營收數(shù)額上漲了20%,當時他就仿佛一位萬眾矚目的搖滾歌手。但直到某一天他太忙了,來不及做任何改變,營收就開始下降。所以這些網(wǎng)站仍然屬于那些表現(xiàn)不佳的一類,他們的營收最終會回歸平均值。

9.不要傷害用戶

不幸的是,在大數(shù)據(jù)時代,企業(yè)和政府為了預測和影響我們的行為,都在時時刻刻搜集我們的數(shù)據(jù)。優(yōu)秀的數(shù)據(jù)科學家會很謹慎地處理這個過程,充分尊重我們的權利和隱私。數(shù)據(jù)科學的黃金法則:對待別人就像對待你自己那樣。

一家互聯(lián)網(wǎng)約會網(wǎng)站做過三個實驗。實驗一,他們暫時移除了網(wǎng)站上所有的照片,結(jié)果發(fā)現(xiàn)很少有人愿意主動發(fā)信息,這證明了愛情不是“盲目”的。實驗二,他們隨機隱藏了人們的部分簡介,結(jié)果發(fā)現(xiàn)對用戶的評價沒有太大影響,這證明了愛情是“不會仔細閱讀”的。實驗三,他們對調(diào)了匹配程度評級,例如將最匹配的人貼上“最不匹配”的標簽,反之亦然。第一和第二個實驗對用戶沒有太大的傷害,但第三個就有問題了。因為用戶不希望自己的生活被不合適的人打擾。約會時遇到一個錯誤的對象還只是痛苦一時,錯過一個合適的對象可能會影響一生。

要避免這些陷阱,必須時刻留意。為了將數(shù)據(jù)融入科學,我們更應該表現(xiàn)得像一位科學家,而非一臺機器。

聲明: 本文系OFweek根據(jù)授權轉(zhuǎn)載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號