訂閱
糾錯(cuò)
加入自媒體

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

算力探園記

合肥,這座位于江淮之間的文化老城“廬州”,從上世紀(jì)90年代“呼應(yīng)浦東開發(fā),建設(shè)新合肥”,到“長三角副中心”,再到如今的城市地位上升至國家戰(zhàn)略,合肥“發(fā)展坐標(biāo)”的每一次調(diào)整,都伴隨這座城市“能級(jí)”的不斷增強(qiáng)。

依托中科大等知名高校的人才資源,在科大訊飛領(lǐng)銜的中國聲谷,扎堆高新區(qū) “量子企業(yè)一條街”,實(shí)現(xiàn)一億度運(yùn)行的人造太陽“東方超環(huán)”等一批企業(yè)帶動(dòng)下,合肥在為下一波產(chǎn)業(yè)革命中的競爭與合作積攢能量。以“技術(shù)驅(qū)動(dòng)+應(yīng)用引領(lǐng)”為方向,推動(dòng)合肥在中國人工智能城市排名第五。現(xiàn)在的合肥,基本上每天誕生1戶國家高新技術(shù)企業(yè);每天申請發(fā)明專利近90個(gè)、獲得授權(quán)13個(gè)以上;每天技術(shù)合同交易額近4000萬元。

繼武漢東湖高新之后的第二站,算力智庫前往安徽合肥的中國聲谷調(diào)研,首先探訪了其中人工智能的代表企業(yè)科大訊飛,以及人工智能數(shù)據(jù)服務(wù)公司數(shù)據(jù)堂(安徽)。了解到Ai語音的應(yīng)用程度早已超出我們的想象,最新的小數(shù)據(jù)快速定制技術(shù)只需采集用戶短短幾句話就能用機(jī)器學(xué)習(xí)復(fù)刻你的聲音。另一方面,行業(yè)內(nèi)也活躍著大量數(shù)據(jù)服務(wù)公司,通過最基礎(chǔ)的數(shù)據(jù)標(biāo)注及整合服務(wù),為人工智能產(chǎn)業(yè)所需的數(shù)據(jù)質(zhì)量保駕護(hù)航。

你能想象讓特朗普說流利的中文嗎?Ai可以,甚至讓特朗普說一口地道川普也不是問題。Ai模擬人聲的技術(shù)現(xiàn)階段已經(jīng)可以通過短短十句話,就能以假亂真地模擬你的聲音說出各種話,包括中英文乃至方言。

在算力智庫探訪科大訊飛(展廳)時(shí),上來就被來自美國總統(tǒng)特朗普一口標(biāo)準(zhǔn)普通話來歡迎大家參觀科大訊飛給吸引住了。

其實(shí),語音合成技術(shù)的應(yīng)用可能早于你的認(rèn)知,應(yīng)用范圍也比你想象的更廣!

早被大規(guī)模商用的Ai語音合成已侵入你的日常生活

語音合成技術(shù)應(yīng)用其實(shí)比語音識(shí)別更早,思必馳CMO龍夢竹告訴算力智庫(ID:suanlicaijing),這項(xiàng)技術(shù)早已在我們身邊大規(guī)模應(yīng)用。

如Iphone的智能語音助手Siri,就是在真人語音的基礎(chǔ)上進(jìn)行語音合成。如今語音合成的聲音愈發(fā)接近真人,才讓我們突然發(fā)現(xiàn)原來語音合成技術(shù)已經(jīng)可以以假亂真。

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

Siri美式語音的聲音提供者Susan Bennett

“其實(shí)所有涉及到機(jī)器語音反饋的背后都需要以真人語音為基礎(chǔ),只是以前的合成效果比較明顯,我們可以明顯判斷出是電腦合成而已!饼垑糁裾f。

很多人以為地圖軟件中的林志玲、岳云鵬導(dǎo)航是把明星請來一句一句錄下來的,其實(shí)背后是語音合成技術(shù)。2018年很火的紀(jì)錄片《創(chuàng)新中國》的配音也是合成已去世的配音家李易的聲音,其背后,就是語音合成技術(shù)實(shí)現(xiàn)的聲音復(fù)刻。

龍夢竹表示,目前語音合成在娛樂方面的應(yīng)用比較多,比如歌曲合成、明星語音復(fù)刻等。即便是去世的明星,也可以通過語音合成和Ai換臉的方式再現(xiàn)熒幕。2017年電影《星球大戰(zhàn)前傳·俠盜一號(hào)》中,已去世的女星凱麗·費(fèi)雪再次以萊婭公主的形象出現(xiàn)在大銀幕上,感動(dòng)了一眾影迷,這種模式以后還將更加常見,哪怕是再聽單田芳出新的評書,也不再是夢想。

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

《俠盜一號(hào)》中還原的萊婭公主

除了商用娛樂方面,云知聲高級(jí)研發(fā)經(jīng)理王鳴對算力智庫表示,語音合成未來在大眾日常生活中的應(yīng)用也可以很多可暢想的地方。

比如視覺障礙人士的閱讀幫助以及需求陪伴,不在父母身邊的孩子可以聽著父母聲音的故事入睡、工作忙碌的子女可以讓父母聽到自己的聲音、戀人可以隨時(shí)聽到彼此的聲音用來閱讀新聞、小說等讀物。

再比如語音的個(gè)性化定制,讓我們的智能音箱、手機(jī)助手、甚至游戲內(nèi)的語音都可以自行定制!熬秃孟裎覀兺娴挠螒蛑械钠つw一樣,可以任意更換,甚至變成我們身邊朋友的聲音!蓖貘Q說。

人工智能語音可以模擬你自己的聲音,也可以替你犯罪

Ai語音合成的技術(shù)發(fā)展早已達(dá)到無需大量的數(shù)據(jù)進(jìn)行學(xué)習(xí)。思必馳CMO龍夢竹向算力智庫介紹,目前業(yè)內(nèi)主流的技術(shù)方向是小數(shù)據(jù)快速定制。

以前構(gòu)建合成系統(tǒng)需要至少上千句的音庫數(shù)據(jù)作為支撐,制作音庫費(fèi)時(shí)費(fèi)力,F(xiàn)在我們僅僅使用很少的數(shù)據(jù)就可以構(gòu)建出具有對應(yīng)音色的合成系統(tǒng)。

在探訪中,算力智庫也體驗(yàn)了科大訊飛此前推出的聲音復(fù)刻相關(guān)應(yīng)用,用戶只需要輸入10句話,就可以復(fù)刻出自己的聲音,播報(bào)新聞、說段子、送祝福惟妙惟肖。

不過這項(xiàng)體驗(yàn)僅限于讓機(jī)器朗讀既定的文本,每個(gè)用戶的音庫都要經(jīng)過實(shí)名認(rèn)證,對此,科大訊飛有自己的考量。工作人員向算力智庫表示,目前推出的語音復(fù)刻應(yīng)用只是一種宣傳娛樂手段,但是一旦開放用戶權(quán)限,可能會(huì)被不法分子利用。

“當(dāng)你接到一個(gè)電話,傳來你親人的聲音,向你借錢或者讓你轉(zhuǎn)賬,你信不信?”

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

記者拍攝的科大訊飛展廳

人工智能語音可以模擬你的聲音,也可以替你犯罪。尤其在大數(shù)據(jù)時(shí)代下,個(gè)人信息非常容易泄露,近兩年如Facebook、華住酒店集團(tuán)等多起個(gè)人信息泄露事件讓我們愈發(fā)重視個(gè)人信息的保護(hù),但是聲音信息的保密意識(shí)可能是我們此前從未想到過的。

前段時(shí)間剛結(jié)束的2019中國互聯(lián)網(wǎng)大會(huì)的防范治理電信網(wǎng)絡(luò)詐騙論壇上,中國傳媒大學(xué)政法學(xué)院法律系副主任鄭寧表示,技術(shù)一直以來都是雙刃劍,我們在享受技術(shù)帶來便利、新奇的同時(shí),也會(huì)面臨技術(shù)被濫用帶來的風(fēng)險(xiǎn)。

鄭寧在論壇上總結(jié)了四種新技術(shù)結(jié)合詐騙手段的形式,其中就提到了語音合成詐騙。騙子通過騷擾電話等錄音來提取某人聲音,獲取素材后進(jìn)行聲音合成,從而可以用偽造的聲音騙過對方。

另外三種詐騙方式分別為:微信語音轉(zhuǎn)發(fā)詐騙、AI換臉詐騙以及AI篩選詐騙人員系統(tǒng)。

通過少量數(shù)據(jù),將合成痕跡明顯的機(jī)器語音,轉(zhuǎn)換成更加流暢自然的語音,也正是目前Ai語音合成的主攻方向,據(jù)龍夢竹介紹,現(xiàn)有技術(shù)不僅可以讓語音流暢自然,甚至可以通過定制加入情緒,真正達(dá)到自然模擬的狀態(tài)。

就像前段時(shí)間Ai換臉技術(shù)在網(wǎng)上火了之后引發(fā)的大規(guī)模討論一樣,一旦語音合成技術(shù)被大規(guī)模應(yīng)用,是否會(huì)產(chǎn)生恐慌呢?

人工智能技術(shù)來詐騙,誰來解決?

從技術(shù)應(yīng)用方角度來說,云知聲高級(jí)研發(fā)經(jīng)理王鳴認(rèn)為,我們在積極推進(jìn)這項(xiàng)技術(shù)發(fā)展的同時(shí),也需要考慮結(jié)合更多的技術(shù)手段來降低在應(yīng)用層面帶來的一些技術(shù)倫理問題。

“云知聲對用戶上傳的錄音數(shù)據(jù)及用這些數(shù)據(jù)訓(xùn)練的模型都加入了嚴(yán)格的使用權(quán)限管理。從技術(shù)角度來說,雖然當(dāng)前語音合成算法在主觀聽感上已經(jīng)可以以假亂真,但是從聲學(xué)特征上依然是有一些差異的。另外,也可以通過加入一些人耳不可感知的聲學(xué)特征‘防偽’標(biāo)志,保證不影響正常用戶體驗(yàn)的情況下,使合成語音可以被特定工具檢測出來,防止被惡意使用!蓖貘Q對算力智庫說道。

科大訊飛也表示,其企業(yè)級(jí)合作則需要經(jīng)過授權(quán),特定在媒體行業(yè)、客服行業(yè)等使用,確保這項(xiàng)技術(shù)不會(huì)被誤用、濫用。除了這些問題,社會(huì)上主要擔(dān)心的問題在于用戶的信息泄露。

本周末蘋果公司被爆出Siri監(jiān)聽用戶語音的事件,雖然蘋果公司稱每天發(fā)送的錄音請求不到1%,而且通常只有幾秒鐘,這是為了更好的提高siri的精準(zhǔn)性,同時(shí)為了給用戶提供更好的服務(wù),仍然引起了大量的恐慌。

對此,安徽省大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長、數(shù)據(jù)堂副總經(jīng)理張子斌從產(chǎn)業(yè)上下游的角度,解釋了目前人工智能和大數(shù)據(jù)產(chǎn)業(yè)所面臨的隱私保護(hù)問題。

張子斌表示,人工智能產(chǎn)業(yè)鏈的上游并非AI技術(shù)公司,而是人工智能數(shù)據(jù)服務(wù)公司。人工智能企業(yè)在訓(xùn)練自己的AI模型時(shí)所需要的數(shù)據(jù)可以不需要他們?nèi)プ孕惺占蜆?biāo)注,而是通過人工智能數(shù)據(jù)服務(wù)公司定制相關(guān)數(shù)據(jù),這樣大大降低了人工智能企業(yè)成本及數(shù)據(jù)安全風(fēng)險(xiǎn),這也是數(shù)據(jù)堂的主營業(yè)務(wù)。

“從產(chǎn)業(yè)鏈上下游的角度來說,我們提供的所有訓(xùn)練數(shù)據(jù)都是和個(gè)人信息分離的,以語音數(shù)據(jù)為例,我們提供的都是獨(dú)立語音段落的集合,背后具體的提供者信息是完全不會(huì)出現(xiàn)的,因此,即便在上下游環(huán)節(jié)中出現(xiàn)了訓(xùn)練數(shù)據(jù)的泄露情況,對于語音提供者來說,不會(huì)出現(xiàn)任何影響。”

特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?

算力智庫記者探訪數(shù)據(jù)堂(左一左二為數(shù)據(jù)堂副總經(jīng)理張子斌、數(shù)據(jù)堂董事吳鑫坤)

近年來,政府也一直在聯(lián)合相關(guān)企業(yè)一起尋找新技術(shù)的管理之道。2019年6月17日,國家新一代人工智能治理專業(yè)委員會(huì)發(fā)布《新一代人工智能治理原則——發(fā)展負(fù)責(zé)任的人工智能》,提出了人工智能治理的框架和行動(dòng)指南!吨卫碓瓌t》突出了發(fā)展負(fù)責(zé)任的人工智能這一主題,強(qiáng)調(diào)了和諧友好、公平公正、包容共享、尊重隱私、安全可控、共擔(dān)責(zé)任、開放協(xié)作、敏捷治理等八條原則。

在中國傳媒大學(xué)鄭寧看來,正如AI技術(shù)可以被用于詐騙,也可以被用于反詐騙。利用技術(shù)的方式不同,帶來的影響也不同。因此,在面對一項(xiàng)技術(shù)時(shí),不僅要關(guān)注技術(shù)本身,更要關(guān)注技術(shù)的用途,將技術(shù)用于提高生活質(zhì)量。

鄭寧表示,科技發(fā)展與人民生活是相輔相成的,科技發(fā)展使得人民生活質(zhì)量有了極大的提高,因此應(yīng)當(dāng)大力促進(jìn)科技發(fā)展。但也要認(rèn)識(shí)到科技的兩面性,科技發(fā)展的同時(shí)也會(huì)產(chǎn)生一些負(fù)面影響,應(yīng)當(dāng)清楚認(rèn)識(shí)并接受這一點(diǎn),從而更加理性地看待科技發(fā)展,也有助于采取積極措施應(yīng)對科技發(fā)展的負(fù)面影響。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)