訂閱
糾錯(cuò)
加入自媒體

一線|數(shù)據(jù)隱私保護(hù)下,AI大數(shù)據(jù)的發(fā)展該何去何從?

2020-06-05 16:40
來源: 粵訊

2020年5月25日,全國人大常委會工作報(bào)告在“下一步主要工作安排”中指出,圍繞國家安全和社會治理,制定生物安全法、個(gè)人信息保護(hù)法、數(shù)據(jù)安全法。消息一出,迅速“登頂”兩會熱搜榜——人們期盼已久的《個(gè)人信息保護(hù)法》,終于在經(jīng)歷了從醞釀到問世的8年歷程后“千呼萬喚始出來”。

同時(shí)這也引申出了一個(gè)問題,我們的個(gè)人隱私是從什么時(shí)候開始了“裸奔”?

如若從時(shí)間軸上去追溯這個(gè)問題的答案,那么似乎當(dāng)人類從農(nóng)業(yè)社會逐漸邁入城市商業(yè)社會,從熟人社區(qū)轉(zhuǎn)向陌生人社區(qū)的時(shí)候,人類被隱私問題所困擾的歷史便開始了。特別是在以大數(shù)據(jù)應(yīng)用為重要特征的后互聯(lián)網(wǎng)時(shí)代,日漸興起的大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)、人工智能、5G等新一代信息技術(shù),更使得個(gè)人數(shù)據(jù)信息、乃至生物識別信息無所遁形,哪怕細(xì)微到我們在網(wǎng)絡(luò)上的每一次搜索、聽的每一首歌、叫的每一次外賣、去的每個(gè)地方、乘坐的每一次交通工具,都可以被企業(yè)獲取,成為其數(shù)據(jù)汪洋中的點(diǎn)滴,在深度數(shù)據(jù)分析后轉(zhuǎn)而商用。

這一切正如英國雜志《經(jīng)濟(jì)學(xué)人》十年前預(yù)言的那樣,“數(shù)據(jù)是新時(shí)代的石油”。大數(shù)據(jù)時(shí)代,每一個(gè)人的隱私都在陽光下“裸奔”,信息一拋頭露面,就先被互聯(lián)網(wǎng)巨頭收割。并且伴隨著人工智能的不斷發(fā)展,個(gè)人隱私和數(shù)據(jù)可以被更加便利地公開、搜集、聚合、分析和使用,規(guī)模之大超出了想象,以至于至今我們?nèi)詿o法判斷這個(gè)過程對人類社會的進(jìn)程究竟產(chǎn)生了多大的影響。

大數(shù)據(jù)時(shí)代,隱私還能保護(hù)嗎

“不積小流,無以成江!贝蠖鄶(shù)時(shí)候,當(dāng)數(shù)據(jù)具備了相當(dāng)規(guī)模的量,足夠廣闊的覆蓋面和足夠精準(zhǔn)的數(shù)據(jù)源,數(shù)據(jù)就會有足夠的價(jià)值。如若從商業(yè)角度出發(fā),企業(yè)為用戶提供便捷、廉價(jià)的服務(wù),用戶則在享受服務(wù)的同時(shí),“順便”貢獻(xiàn)出自己的數(shù)據(jù),雙方其實(shí)是各取所需、兩得其所。

這樣看似乎是一個(gè)完美的邏輯。但問題是,大數(shù)據(jù)時(shí)代,公民隱私的數(shù)字化加劇了隱私的無形化!翱床灰、摸不著”,信息的存儲方式、速度、表現(xiàn)形式都發(fā)生了翻天覆地的變化,隱私在不經(jīng)意之間即被侵犯,并且互聯(lián)網(wǎng)強(qiáng)大的記憶和存儲功能讓一切在線行為被永久記錄。網(wǎng)絡(luò)空間的可搜索性和永久存儲性,有可能加重精神損害和名譽(yù)損害的后果。

與此同時(shí),我們不得不思考依托AI等科技手段收集來的數(shù)據(jù),能像傳統(tǒng)的商業(yè)問卷調(diào)查一樣,最大程度淡化、保護(hù)用戶個(gè)人信息嗎?大數(shù)據(jù)時(shí)代,人們該如何為自己的隱私上一把“安全鎖”?如何確定企業(yè)搜集信息樣本的過程中不會精準(zhǔn)定位到個(gè)人?

《道德經(jīng)》有云“反者,道之動”。盡管大數(shù)據(jù)時(shí)代的數(shù)據(jù)安全和隱私泄露問題無處不在,盡管法學(xué)與技術(shù)仍面臨著諸多挑戰(zhàn),我們也不能因噎廢食,因?yàn)椴豢煞裾J(rèn)的是大數(shù)據(jù)技術(shù)其實(shí)是人類科學(xué)發(fā)展的必然成果。于是圍繞著這類“魚和熊掌不可兼得”的問題,很多人展開了各自的探索。根據(jù)探索的方向,這些努力大致上可以分為兩類:法學(xué)的探索與科學(xué)的探索。

在法學(xué)家們看來,當(dāng)前數(shù)據(jù)的搜集和使用過程中之所以會出現(xiàn)種種問題,其關(guān)鍵就在于各種相關(guān)的法律和規(guī)范滯后了,不能適應(yīng)時(shí)代發(fā)展的需要。針對這一問題,法學(xué)領(lǐng)域幾年來一直都在積極推進(jìn)立法,努力彌補(bǔ)法律和制度上的各項(xiàng)不足和漏洞。2020年5月25日,我國全國人大常委會工作報(bào)告在“下一步主要工作安排”中明確指出了即將出臺《個(gè)人隱私保護(hù)法》。

與法學(xué)探索同步的是技術(shù)的探索。從技術(shù)角度上來看,數(shù)據(jù)應(yīng)用中存在的各種問題本質(zhì)上都是技術(shù)的局限問題,一旦技術(shù)進(jìn)步問題就會迎刃而解。到目前為止,技術(shù)人員已經(jīng)沿著這一方向進(jìn)行了包括安全多方計(jì)算、區(qū)塊鏈在內(nèi)的眾多新技術(shù)的探索嘗試。而最近興起的“聯(lián)邦學(xué)習(xí)”技術(shù),就是這些新技術(shù)中最令人眼前一亮的一種。

聯(lián)邦學(xué)習(xí)的崛起,破解數(shù)據(jù)信任難題

毫無疑問,AI技術(shù)是人類最偉大的科學(xué)成就之一。人工智能改變了人類社會,但如今AI技術(shù)在實(shí)際應(yīng)用落地的過程中也面臨著兩大瓶頸:一方面,多數(shù)企業(yè)擁有的“小數(shù)據(jù)”難以聚沙成塔、取長補(bǔ)短;另一方面,對數(shù)據(jù)隱私與安全的日益重視早已成為世界性趨勢。而“聯(lián)邦學(xué)習(xí)”作為加密的分布式機(jī)器學(xué)習(xí)范式,可以使得各方在不披露原始數(shù)據(jù)的情況下達(dá)到共建模型的目的,為應(yīng)對AI落地困境提供了更多可能性。

2018年伊始,微眾銀行首席人工智能官楊強(qiáng)教授就帶領(lǐng)人工智能團(tuán)隊(duì)推動構(gòu)建聯(lián)邦學(xué)習(xí)生態(tài),并且在2018年底向IEEE提交聯(lián)邦學(xué)習(xí)國際標(biāo)準(zhǔn)獲批,目前已經(jīng)有30多家企業(yè)參與其中。隨著聯(lián)邦學(xué)習(xí)理論研究的深入,微眾銀行在國內(nèi)、國際大會上聯(lián)合多家合作伙伴舉辦聯(lián)邦學(xué)習(xí)研討會,比如國際頂會IJCAI和NeurIPS,國內(nèi)計(jì)算機(jī)學(xué)會CCFTF等,吸引了更多研究者加入;基于聯(lián)邦學(xué)習(xí)開源軟件FATE(Federated AI Technology Enabler)的開源社區(qū)也漸漸吸納上百家機(jī)構(gòu)應(yīng)用和共建。在行業(yè)落地方面,微眾銀行積極推進(jìn)聯(lián)邦學(xué)習(xí)在金融領(lǐng)域更加深入的應(yīng)用,在風(fēng)控、反洗錢、智能營銷、智慧城市等領(lǐng)域的應(yīng)用均取得了很好的效果。

聯(lián)邦學(xué)習(xí)能夠充分的利用參與方的數(shù)據(jù)和計(jì)算能力,使多方可以協(xié)作構(gòu)建通用,更健壯的機(jī)器學(xué)習(xí)模型而不需要共享數(shù)據(jù),在數(shù)據(jù)監(jiān)管越來越嚴(yán)格的大環(huán)境下,聯(lián)邦學(xué)習(xí)能夠解決數(shù)據(jù)所有權(quán),數(shù)據(jù)隱私,數(shù)據(jù)訪問權(quán)以及異構(gòu)數(shù)據(jù)的訪問等關(guān)鍵問題,所以自從聯(lián)邦學(xué)習(xí)的概念已提出就獲得了人工智能行業(yè)的追捧,目前已經(jīng)在很多行業(yè)受到一定的應(yīng)用,比如國防、電信、移動服務(wù)、醫(yī)療和物聯(lián)網(wǎng)等。

從整個(gè)數(shù)據(jù)產(chǎn)業(yè)看,聯(lián)邦學(xué)習(xí)可以增加可用數(shù)據(jù)的總量,能很好的解決現(xiàn)存數(shù)據(jù)孤島的問題;對企業(yè)自身而言,使用聯(lián)邦學(xué)習(xí)能簡單、合法且低成本的獲取外部有效的數(shù)據(jù)信息,快速解決某些因數(shù)據(jù)量或數(shù)據(jù)維度不足而導(dǎo)致的困擾,而且也不會造成合作企業(yè)間數(shù)據(jù)或商業(yè)機(jī)密的泄露。

聯(lián)邦學(xué)習(xí)成了解決數(shù)據(jù)難題的“金鑰匙”。它是解決數(shù)據(jù)孤島問題的重要技術(shù),尤其是在當(dāng)下數(shù)字化轉(zhuǎn)型趨勢日益明顯時(shí),聯(lián)邦學(xué)習(xí)可為各行業(yè)的智能化升級提供更高效的模型應(yīng)用,同時(shí)也是建設(shè)聯(lián)邦智能生態(tài)的重要組成部分。

微眾銀行AI團(tuán)隊(duì)發(fā)布人工智能教科書《聯(lián)邦學(xué)習(xí)》 打破數(shù)據(jù)孤島

聯(lián)邦學(xué)習(xí)作為新興的技術(shù)范式,能夠在數(shù)據(jù)不出本地的前提下,實(shí)現(xiàn)安全數(shù)據(jù)模型共建與AI協(xié)作!皵(shù)據(jù)不出本地”這一特性可以保證數(shù)據(jù)隱私保護(hù),而AI聯(lián)合建模則可以最大程度挖掘數(shù)據(jù)價(jià)值,也因此,聯(lián)邦學(xué)習(xí)技術(shù)近兩年來市場呼聲極高。但隨著技術(shù)研究不斷深入與行業(yè)應(yīng)用范圍日益擴(kuò)大,市場亟需一本專業(yè)性及實(shí)用性兼?zhèn)涞摹爸亓考墝V,來幫助機(jī)構(gòu)及從業(yè)者快速與系統(tǒng)化地了解聯(lián)邦學(xué)習(xí)技術(shù)及其相關(guān)應(yīng)用。

因此,《聯(lián)邦學(xué)習(xí)》中文版應(yīng)運(yùn)而生,該書由電子工業(yè)出版社出版,微眾銀行首席人工智能官楊強(qiáng)教授及人工智能部劉洋、程勇、康焱、陳天健、于涵等多位人工智能領(lǐng)域頂級專家歷時(shí)兩年,共同撰寫而成。該書凝聚了楊強(qiáng)教授團(tuán)隊(duì)的多年學(xué)術(shù)成果和工程經(jīng)驗(yàn),是國際首部全面、系統(tǒng)論述聯(lián)邦學(xué)習(xí)的中文著作,剖析了了面向數(shù)據(jù)安全和隱私保護(hù)機(jī)器學(xué)習(xí)學(xué)術(shù)成果和應(yīng)用案例,數(shù)據(jù)孤島和數(shù)據(jù)保護(hù)難題破解之法。一方面對聯(lián)邦學(xué)習(xí)的整體構(gòu)架、技術(shù)原理、重要價(jià)值進(jìn)行了系統(tǒng)化介紹,另一方面也全面分享了微眾銀行在聯(lián)邦學(xué)習(xí)領(lǐng)域的深厚積累。

我們相信這本書的順利問世,既標(biāo)志著由微眾銀行AI團(tuán)隊(duì)帶領(lǐng)構(gòu)建的聯(lián)邦學(xué)習(xí)生態(tài)影響力正進(jìn)一步擴(kuò)大,也預(yù)示著聯(lián)邦學(xué)習(xí)這一技術(shù)在走向成熟,未來勢必將出現(xiàn)一個(gè)全領(lǐng)域合作的聯(lián)邦生態(tài),建立起安全有效的“數(shù)據(jù)聯(lián)盟”,釋放數(shù)據(jù)無限價(jià)值,在保護(hù)用戶個(gè)人隱私的同時(shí),實(shí)現(xiàn)全社會的智慧變革。正如《聯(lián)邦學(xué)習(xí)》中文版的作者之一,聯(lián)邦學(xué)習(xí)技術(shù)最早的布道者,國際人工智能界領(lǐng)軍人物楊強(qiáng)教授說的那樣:“聯(lián)邦學(xué)習(xí)作為下一代人工智能大規(guī)模協(xié)作的基礎(chǔ),迎合了技術(shù)和社會的需求,將承擔(dān)起人工智能在發(fā)展和應(yīng)用中的重任!

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號