国产清纯在线一区二区www,国产精品无码av看片

對話翼方健數(shù)羅震：天下無難用的數(shù)據(jù)，如何讓“機器人醫(yī)生”更智能？

2020-09-01 09:27

算力說

醫(yī)療領(lǐng)域被認(rèn)為是對于隱私數(shù)據(jù)要求最高的場景，而在這個方向的數(shù)據(jù)若是共享，其效應(yīng)將會巨大。醫(yī)療平臺集聚個人最私密的數(shù)據(jù)，共享是否意味著即失守？開放應(yīng)用生態(tài)更成無本之木？改弦更張，嘗試用新一代智能數(shù)據(jù)技術(shù)替代傳統(tǒng)的共享方式以釋放數(shù)據(jù)價值，逐步成為發(fā)展共識。那么，新技術(shù)有哪些落地方式，又如何提升診療準(zhǔn)確度？

8月25日，翼方健數(shù) CEO 羅震在SIGKDD·SDBD2020 第二屆智能數(shù)據(jù)和區(qū)塊鏈應(yīng)用國際研討會上帶來《隱私安全計算下的數(shù)據(jù)和算法的互聯(lián)互通》的專題分享，談?wù)勗鯓訛獒t(yī)療信息系統(tǒng)裝上智能的“最強大腦”。

你所認(rèn)知的醫(yī)療行業(yè)的數(shù)據(jù)問題，其實在行業(yè)具有普適性

羅震介紹說，翼方健數(shù)主要在醫(yī)療行業(yè)做隱私安全計算的生根和應(yīng)用。而在行業(yè)深耕多年后，最大的體會是醫(yī)療行業(yè)中間遇到的數(shù)據(jù)安全、數(shù)據(jù)共享以及數(shù)據(jù)應(yīng)用方面問題，并且具有普遍性，促使我們?nèi)プ龈鼮樯钊氲乃伎肌?/p>

我們身處由信息時代轉(zhuǎn)化到智能時代的變革中，兩個時代顯著的區(qū)別在于對數(shù)據(jù)的重視程度與認(rèn)知方式。

信息時代我們更關(guān)注解決具體問題，當(dāng)我們發(fā)現(xiàn)解決過程中產(chǎn)生的數(shù)據(jù)有很大的價值與應(yīng)用空間，才逐漸開始使用。在當(dāng)下的時代，更多的是我們擁有這樣的數(shù)據(jù)，可以解決什么問題，這是主次先后重要性的區(qū)別。我們認(rèn)為智能時代會產(chǎn)生海量的數(shù)據(jù)，處理數(shù)據(jù)主角是智能模型機器，而必須有大量數(shù)據(jù)才能產(chǎn)生比較好的智能，對數(shù)據(jù)的處理方式產(chǎn)生根本性的轉(zhuǎn)變。

基于此，國家會提出數(shù)據(jù)是新的生產(chǎn)要素，并把數(shù)據(jù)和土地、資本、勞動力等同起來。但是數(shù)據(jù)作為生產(chǎn)要素，其實與很多傳統(tǒng)的生產(chǎn)要素有許多區(qū)別。

首先數(shù)據(jù)是信息時代的遺留，由于分布在不同信息系統(tǒng)里邊，自誕生便相互隔離，是非標(biāo)準(zhǔn)化、非結(jié)構(gòu)化的，質(zhì)量有高有低。

數(shù)據(jù)作為生產(chǎn)要素有非常獨特的經(jīng)濟特征。其一是虛擬可再用的；其二是非競爭性的，如果我有一份數(shù)據(jù)共享給你，你就有一份一模一樣的數(shù)據(jù)；其三是產(chǎn)生數(shù)據(jù)需要高昂成本，但分享數(shù)據(jù)幾乎可以忽略成本。

數(shù)據(jù)的價值有外在性，當(dāng)我們產(chǎn)生數(shù)據(jù)，很難確定數(shù)據(jù)價值幾何。此外還有數(shù)據(jù)的非經(jīng)濟特征，在每個行業(yè)里邊都有隱私保護，合規(guī)數(shù)據(jù)安全等行業(yè)方面的規(guī)范，在醫(yī)療行業(yè)更加如此，因為我們接觸到的數(shù)據(jù)都是個人最隱私最保密的數(shù)據(jù)。

正是因為所有數(shù)據(jù)特點，恰恰是阻礙數(shù)據(jù)共享最核心的原因。從經(jīng)濟的角度我花了很多的價錢，產(chǎn)生數(shù)據(jù)，而后分享給你，數(shù)據(jù)將失去我的保護，而你有一份同樣的財產(chǎn)。對你將來如何使用數(shù)據(jù)，我將完全失控，無法得知你可能會產(chǎn)生新的價值。

從另一角度，一旦原始數(shù)據(jù)流失并產(chǎn)生傷害，這些傷害也很難被安頓。所以我們認(rèn)為數(shù)據(jù)在本質(zhì)上不能被共享。共享的方式不是將原始數(shù)據(jù)拷貝給他人，而是應(yīng)是試圖去共享數(shù)據(jù)的價值。

Alice與Bob誰更多金？不僅僅是“百萬富翁”

數(shù)據(jù)的時代特性引出我們所講的隱私安全技術(shù)，或者說隱私計算基本的理念。

舉例而言，有一家醫(yī)學(xué)統(tǒng)計公司，想做篩查效果及評估。如做完癌癥篩查后，想了解做過篩查的人后續(xù)是否有問題。涉及到醫(yī)學(xué)統(tǒng)計中經(jīng)常會提及的兩個詞，一個叫靈敏度，一個叫特異性。

一般比較直觀的做法是在數(shù)據(jù)平臺找到所有做過篩查的人群，觀察后續(xù)發(fā)生的事情。通過原始數(shù)據(jù)和分析，最后得到評估結(jié)果。最大的問題在于如果醫(yī)療行業(yè)原始數(shù)據(jù)一旦離開數(shù)據(jù)平臺保護，將來會產(chǎn)生問題。而統(tǒng)計公司只想知道篩查手段的結(jié)果，即靈敏度與特異性。所以可以將計算放在安全的環(huán)境，計算完畢之后，只需拿走統(tǒng)計結(jié)果。不用看到原始數(shù)據(jù)，不用將數(shù)據(jù)導(dǎo)出，通過這種計算的方式，實現(xiàn)不分享原始數(shù)據(jù)，而是分享數(shù)據(jù)的價值。

實際上，隱私安全計算面臨較大的挑戰(zhàn)。首先隱私安全計算，囊括的范圍很廣泛。三個主流的安全計算方式。一個方式稱為多方安全計算或者同態(tài)加密，實際方法完全不同，但是信任假設(shè)是相同的。

假如沒有任何可以信任的第三方，如何做計算？第二個方式使用比較多的方式是聯(lián)邦學(xué)習(xí)。聯(lián)邦學(xué)習(xí)是解決模型訓(xùn)練、模型推斷的問題，在機器學(xué)習(xí)方面來解決沒有信任的前提下，如何做聯(lián)合計算。

那么聯(lián)邦學(xué)習(xí)唯一的缺陷是指計算的方式僅僅是在機器學(xué)習(xí)的方式。如果我們有可以信任第三方，比如Alice、Bob信任第三人Charlie，他們?nèi)绻麑⒆约河卸嗌馘X告訴Charlie，Charlie就會立刻的告訴Alice、Bob你們倆誰錢更多，就可以通過安全多方計算的方式計算過程。

安全多方計算主要防備的是應(yīng)用本身對平臺產(chǎn)生的威脅。如果說安全沙箱做得好，對系統(tǒng)本身產(chǎn)生的風(fēng)險小，就可以非常安全將它算出來。

另一方面，第三方中間有特殊的硬件叫稱之為TEE，Trusted Execution Environment，可信任執(zhí)行環(huán)境。我們將安全沙箱計算放到TEE中算。此時可以解除對查理的信任，因為硬件可以保證哪怕Charlie是惡意的人，也沒有辦法看到算了Alice和Bob到底有多少錢。

1 2 下一頁>