訂閱
糾錯(cuò)
加入自媒體

AI行業(yè)研報(bào):生成式文字后即將爆發(fā)生成式音頻?

作 者 | BT財(cái)經(jīng)

來(lái) 源 | 德意志銀行了解更多金融信息 | BT財(cái)經(jīng)數(shù)據(jù)通

在爆發(fā)全球熱潮前,人工智能是經(jīng)過(guò)了多年醞釀的。為了正確預(yù)測(cè)未來(lái)的人工智能創(chuàng)新,我們回到源頭,研究了人工智能應(yīng)用的專(zhuān)利和風(fēng)險(xiǎn)投資交易活動(dòng)。

我們收集了193個(gè)世界知識(shí)產(chǎn)權(quán)組織(WIPO)成員在2012年至2022年期間公布的175072項(xiàng)人工智能專(zhuān)利,分為五大類(lèi)。對(duì)于風(fēng)險(xiǎn)資本投資,我們使用了經(jīng)合組織(OECD)人工智能數(shù)據(jù)庫(kù)2012年至2022年92個(gè)經(jīng)濟(jì)體的24310筆交易數(shù)據(jù)。

按絕對(duì)值計(jì)算,自2012年以來(lái),人工智能領(lǐng)域的風(fēng)險(xiǎn)投資活動(dòng)和專(zhuān)利數(shù)量激增。期間,風(fēng)險(xiǎn)投資交易數(shù)量增加了10倍,達(dá)到3884筆,2022年的交易價(jià)值幾乎是2012年的50倍,達(dá)到830億美元。與此同時(shí),人工智能專(zhuān)利數(shù)量在2022年增長(zhǎng)了7倍,達(dá)到近3.7萬(wàn)個(gè)。

從風(fēng)險(xiǎn)投資交易和專(zhuān)利來(lái)看,過(guò)去10年,超過(guò)三分之二的人工智能創(chuàng)新集中在交通、工業(yè)和消費(fèi)等行業(yè)應(yīng)用上。

接下來(lái),我們預(yù)計(jì)生成式音頻(generative audio)將在2024年大規(guī)模出現(xiàn),并顛覆游戲和電影制作等行業(yè)。

1

人工智能走出冬眠

隨著OpenAI的ChatGPT于2022年11月發(fā)布,人們對(duì)人工智能的興趣激增,不僅是普通人,企業(yè)也是如此。2022年,公司文件中提到“人工智能”的次數(shù)超過(guò)71.5萬(wàn)次,而2020年僅為13.5萬(wàn)次。根據(jù)我們的調(diào)查,到2023年4月,41%的美國(guó)人已經(jīng)聽(tīng)說(shuō)過(guò)ChatGPT,而近60%的人表示他們的工作已經(jīng)在某種程度上開(kāi)始使用ChatGPT。

 

此外,在5月18日的新聞中,ChatGPT在美國(guó)發(fā)布了第一個(gè)應(yīng)用程序版本后,現(xiàn)在可以在iPhone上使用。谷歌還于5月5日宣布,將開(kāi)始推出集成到搜索產(chǎn)品中的生成式人工智能工具。在進(jìn)一步研究之前,我們先對(duì)人工智能進(jìn)行簡(jiǎn)單的定義——人工智能是一種基于機(jī)器的系統(tǒng),人類(lèi)給出一組給定的目標(biāo),它可以作出預(yù)測(cè)、建議甚至決定,從而可能影響現(xiàn)實(shí)或虛擬環(huán)境。

人工智能其實(shí)已經(jīng)醞釀了好幾年。自2012年以來(lái),與人工智能相關(guān)的風(fēng)險(xiǎn)投資交易活動(dòng)和已公布的專(zhuān)利一直在悄然飆升。例如,風(fēng)投數(shù)量從2012年的332筆增長(zhǎng)到2022年的3884筆。2022年,風(fēng)投交易價(jià)值達(dá)到830億美元,高于2012年的18億美元。與此同時(shí),自2012年以來(lái),人工智能方面的專(zhuān)利數(shù)量增加了7倍。

人工智能行業(yè)的進(jìn)入門(mén)檻一直在降低,這刺激了該領(lǐng)域的商業(yè)創(chuàng)新。例如,自2018年以來(lái),圖像分類(lèi)系統(tǒng)的訓(xùn)練成本降低了64%,而訓(xùn)練時(shí)間減少了94%。包括OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney和Cohere在內(nèi)的眾多初創(chuàng)公司和風(fēng)投公司也紛紛涌現(xiàn)。據(jù)報(bào)道,Anthropic最近在C輪融資中籌集了4.5億美元,參與融資的有Alphabet、賽富時(shí)(Salesforce)和Zoom。此外,一家倫敦的人工智能公司Builder. Ai在最新一輪融資中籌集了2.5億美元。

為了正確預(yù)測(cè)人工智能即將到來(lái)的情況,我們還研究了該領(lǐng)域的專(zhuān)利。我們預(yù)計(jì),獲得風(fēng)投的公司大約需要兩到三年時(shí)間才能將產(chǎn)品推向市場(chǎng),甚至需要更長(zhǎng)的時(shí)間等待專(zhuān)利批準(zhǔn),如七至十年。就專(zhuān)利而言,在公司專(zhuān)利獲得保護(hù)后,他們則需要營(yíng)銷(xiāo),選擇商業(yè)伙伴等,這大概需要一到三年時(shí)間。

通過(guò)世界知識(shí)產(chǎn)權(quán)組織Patentscope,我們收集了193個(gè)該組織成員在2012年至2022年期間公布的175072項(xiàng)人工智能專(zhuān)利條目,這些專(zhuān)利分為五大類(lèi),其中包括部門(mén)應(yīng)用(sectoral applications)、服務(wù)平臺(tái)(horizontal platforms)、自動(dòng)化機(jī)器(autonomous machines)和半導(dǎo)體(semiconductors)。在風(fēng)投方面,我們使用的是經(jīng)合組織人工智能數(shù)據(jù)庫(kù)涵蓋的92個(gè)經(jīng)濟(jì)體的24310筆交易。 

1. 人工智能景觀——將創(chuàng)意帶入生活 

股票市場(chǎng)反應(yīng)如何

迅速采用ChatGPT和其他新的人工智能的公司股價(jià)飆升。例如,2023年1月31日,人工智能軟件企業(yè)C3. ai推出了集OpenAI、谷歌、學(xué)術(shù)研究等人工智能技術(shù)于一體的“生成式人工智能產(chǎn)品套件”。當(dāng)日,該公司股價(jià)上漲近22%,自今年年初以來(lái)已累計(jì)上漲143%。

人工智能音頻和語(yǔ)音識(shí)別軟件公司SoundHound的股價(jià)今年迄今已上漲66%。

不僅僅是人工智能軟件公司,人工智能幾乎影響了價(jià)值鏈上的所有公司。英偉達(dá)是一家半導(dǎo)體公司,其生產(chǎn)的計(jì)算機(jī)芯片可以運(yùn)行人工智能模型,該公司股價(jià)上漲了110%。在大型科技公司之間的人工智能競(jìng)賽中,Meta也表現(xiàn)出色。 

資金流向人工智能

2022年,全球?qū)θ斯ぶ悄艿娘L(fēng)險(xiǎn)投資達(dá)到830億美元的峰值,高于2012年的18億美元。Databricks和麻省理工學(xué)院發(fā)現(xiàn),大多數(shù)公司已經(jīng)開(kāi)始廣泛部署人工智能。在樣本中,到2022年未使用人工智能的公司比例不到6%。 

企業(yè)將從人工智能增長(zhǎng)中受益

多年來(lái),人工智能研究一直局限于學(xué)術(shù)界,如今正被應(yīng)用于商業(yè)領(lǐng)域。學(xué)術(shù)界是先行者,從學(xué)術(shù)發(fā)表到獲得專(zhuān)利通常需要15年的時(shí)間。

然而,越來(lái)越明顯的是,人工智能創(chuàng)新爆發(fā)的時(shí)機(jī)已經(jīng)成熟。從2012年到2022年,49%的風(fēng)投交易是在過(guò)去三年達(dá)成的。同樣,我們的數(shù)據(jù)庫(kù)中有52%的人工智能相關(guān)專(zhuān)利在三年內(nèi)發(fā)布。 

2. 應(yīng)用領(lǐng)域:人工智能將在2023年成為主流 

亞馬遜創(chuàng)始人兼執(zhí)行主席Jeff Bezos表示:“我們現(xiàn)在正在用機(jī)器學(xué)習(xí)和人工智能來(lái)解決問(wèn)題,現(xiàn)在發(fā)生的這一切猶如科幻小說(shuō)里描述的內(nèi)容。”

過(guò)去10年,與人工智能相關(guān)的風(fēng)投交易中,近五分之四是在行業(yè)應(yīng)用領(lǐng)域。另有8%發(fā)生在自動(dòng)化機(jī)器和汽車(chē)領(lǐng)域,還有13%發(fā)生在半導(dǎo)體領(lǐng)域。人工智能相關(guān)專(zhuān)利的比例也類(lèi)似。 

行業(yè)應(yīng)用:人工智能不局限于一個(gè)行業(yè)

目前,79%的風(fēng)投交易和61%的專(zhuān)利發(fā)生在我們認(rèn)為的“行業(yè)應(yīng)用”中。根據(jù)我們的定義,這包括消費(fèi)、工業(yè)、資訊科技、運(yùn)輸、醫(yī)療保健、金融服務(wù)業(yè)。

從2012年到2022年,風(fēng)投交易數(shù)量從270筆增加到3006筆,增長(zhǎng)了10倍多。2022年,交易總額達(dá)到620億美元,遠(yuǎn)高于2012年的13億美元。在這些領(lǐng)域發(fā)布的專(zhuān)利也在蓬勃發(fā)展。自2012年以來(lái),相關(guān)專(zhuān)利數(shù)量增加了6倍。擁有最多專(zhuān)利的公司都是公認(rèn)的科技巨頭,如IBM、三星(Samsung)、英特爾(Intel)、LG電子(LG Electronics)和高通(Qualcomm)。

 

服務(wù)平臺(tái):AI工具

自2012年以來(lái),我們看到服務(wù)平臺(tái)(horizontal platforms)的專(zhuān)利數(shù)量增長(zhǎng)了近6倍,包括人工智能主核(AI core)、自然語(yǔ)言技術(shù)(natural language technology)、人工智能自動(dòng)化平臺(tái)(AI automation platforms)、計(jì)算機(jī)視覺(jué)軟件(computer vision software)。服務(wù)型應(yīng)用(Horizontal applications)是人工智能開(kāi)發(fā)和部署的重點(diǎn)模塊,擁有這類(lèi)專(zhuān)利的公司包括AT&T、IBM、LG電子、百度以及老牌科技企業(yè)。

 

自然語(yǔ)言處理(Natural language processing)是一種用于大型語(yǔ)言模型(LLMs)的人工智能工具,隨著ChatGPT的出現(xiàn)而變得流行。自然語(yǔ)言處理的一些例子包括翻譯、自動(dòng)糾錯(cuò)、自動(dòng)文本摘要、聊天機(jī)器人,以及金融領(lǐng)域的信息需求等處理方式。

計(jì)算機(jī)視覺(jué)涉及使用人工智能來(lái)分析視覺(jué)數(shù)據(jù),并做出有意義的預(yù)測(cè),包括面部識(shí)別、地理空間分析等。

微軟的Inner Eye技術(shù)已經(jīng)可以幫助檢測(cè)腫瘤和異常細(xì)胞。在他們的最新研究中,微軟展示了其技術(shù)如何幫助臨床醫(yī)生。在計(jì)算機(jī)視覺(jué)專(zhuān)利數(shù)量最多的五家公司中,有兩家是中國(guó)公司,分別是百度和華為。 

誰(shuí)還需要駕照?自動(dòng)駕駛已經(jīng)到來(lái)

在過(guò)去十年中,8%的風(fēng)投交易和16%的專(zhuān)利都發(fā)生在“自動(dòng)化機(jī)器”領(lǐng)域。這類(lèi)技術(shù)涵蓋兩個(gè)關(guān)鍵領(lǐng)域,分別是自動(dòng)駕駛汽車(chē)和智能機(jī)器人。在過(guò)去的十年里,這個(gè)領(lǐng)域受到了很多關(guān)注。這在很大程度上與特斯拉取得的成功相吻合,特斯拉一直在試驗(yàn)自動(dòng)駕駛汽車(chē)系統(tǒng)。

從2012年到2022年,自動(dòng)化機(jī)器領(lǐng)域的風(fēng)投交易數(shù)量從22筆增加到363筆。智能機(jī)器人就屬于這一類(lèi)。這些機(jī)器人能夠在不需要人類(lèi)干預(yù)和輸入的情況下進(jìn)行一定程度的操作。人工智能通常用于協(xié)助機(jī)器人機(jī)型訓(xùn)練和適應(yīng)。三星、LG電子、英特爾以及中國(guó)的大疆公司和滴滴等公司在機(jī)器人專(zhuān)利方面地位穩(wěn)固。

幾年來(lái),自動(dòng)駕駛汽車(chē)也一直是人們討論的焦點(diǎn)。除了特斯拉之外,其他公司也在擴(kuò)大對(duì)自動(dòng)駕駛汽車(chē)所需技術(shù)的研究和投資,因此,風(fēng)險(xiǎn)投資和專(zhuān)利申請(qǐng)的大幅增加很可能是在這個(gè)背景下發(fā)生的。 

半導(dǎo)體芯片

英偉達(dá)首席執(zhí)行官黃仁勛表示:“很明顯,人工智能將影響每一個(gè)行業(yè)。我認(rèn)為每個(gè)國(guó)家都需要確保人工智能是其國(guó)家戰(zhàn)略的一部分,每個(gè)國(guó)家都會(huì)受到影響。”

半導(dǎo)體占人工智能相關(guān)風(fēng)投交易的13%,占已公布專(zhuān)利的4%,包括處理器設(shè)計(jì)(processor design)、邊緣人工智能軟件(edge AI software)、智能傳感器和設(shè)備(intelligent sensors & devices)。

從2012年到2022年,半導(dǎo)體領(lǐng)域的風(fēng)投交易從40筆增加到515筆。2022年,該領(lǐng)域交易總額達(dá)到94億美元,高于2012年的2億美元。同樣,從2012年到2022年,該領(lǐng)域?qū)@麛?shù)量增長(zhǎng)了7倍。

自20世紀(jì)70年代以來(lái),芯片經(jīng)歷了快速的創(chuàng)新,芯片性能每隔幾年就會(huì)翻一番。生產(chǎn)商必須跟上發(fā)展的步伐,否則就有被甩在后面的風(fēng)險(xiǎn)。隨著技術(shù)變得越來(lái)越復(fù)雜,新工具是必要的,這正是人工智能可以發(fā)揮作用的地方。 

3. 2024年及以后的新機(jī)遇

生成式音頻可能是下一個(gè)大熱門(mén) 

人工智能現(xiàn)在能夠根據(jù)不同語(yǔ)言、口音和方言的文本輸入創(chuàng)造人類(lèi)的聲音和合成音頻。它使用了在ChatGPT中流行的生成式人工智能。

從2020年第一季度到2022年第四季度,提到“生成式音頻(generative audio)”的公司文件數(shù)量增加了13倍以上。

隨著音樂(lè)和聲音研發(fā)的深入,我們可能會(huì)看到新競(jìng)爭(zhēng)者的爆炸式增長(zhǎng)。很快,人們可以輸入文本或圖像來(lái)生成音頻內(nèi)容,而不需要音頻專(zhuān)家或計(jì)算機(jī)專(zhuān)家。

這可能會(huì)影響游戲、通信、音樂(lè)、新聞和醫(yī)療保健等一系列領(lǐng)域。擁有生成式音頻相關(guān)專(zhuān)利最多的公司包括索尼(Sony)、亞馬遜、華為、字節(jié)跳動(dòng)、Adobe、蘋(píng)果和騰訊。 

可以生成什么音頻?

生成式音頻分為四個(gè)主要類(lèi)別,包括合成聲音(synthetic voice)、語(yǔ)音互動(dòng)(speech interaction)、音樂(lè)生成(music generation)和音頻編輯(audio editing)。首先,通過(guò)深度學(xué)習(xí),人工智能可以高質(zhì)量地合成真實(shí)的人聲,包括音高、音調(diào)和節(jié)奏。語(yǔ)音互動(dòng)包括虛擬助手等技術(shù),例如蘋(píng)果的Siri和亞馬遜的Alexa。隨著技術(shù)的發(fā)展,人類(lèi)與人工智能之間的“自然”互動(dòng)可能會(huì)越來(lái)越多。

音樂(lè)生成技術(shù)可以輕松地創(chuàng)造出種類(lèi)繁多的新音樂(lè)。例如Spotify的DJ和Aimi Studio。人工智能音樂(lè)已經(jīng)對(duì)音樂(lè)產(chǎn)業(yè)構(gòu)成了挑戰(zhàn)。

最后,音頻編輯可以使用人工智能來(lái)提高音頻錄制質(zhì)量。 

2

結(jié)論

人工智能來(lái)了,新的創(chuàng)新就在眼前。以專(zhuān)利和風(fēng)險(xiǎn)投資等指標(biāo)進(jìn)行衡量,人工智能領(lǐng)域的創(chuàng)新在過(guò)去10年呈爆炸式增長(zhǎng)。從風(fēng)險(xiǎn)投資活動(dòng)和專(zhuān)利來(lái)看,過(guò)去十年中,超過(guò)三分之二的人工智能創(chuàng)新集中在交通、工業(yè)和消費(fèi)者應(yīng)用等領(lǐng)域,其次是自動(dòng)化機(jī)器和服務(wù)型應(yīng)用、半導(dǎo)體產(chǎn)業(yè)。

在2023年之后,我們預(yù)計(jì)生成音頻創(chuàng)新將會(huì)激增。隨著ChatGPT和DALL-E的到來(lái),我們已經(jīng)看到生成式人工智能引起了世界的關(guān)注。這些技術(shù)將共同改變游戲和電影制作等行業(yè)。

文章系作者個(gè)人觀點(diǎn)如有疑問(wèn)及任何意見(jiàn)反饋可直接在評(píng)論區(qū)留言或發(fā)送郵件

       原文標(biāo)題 : AI行業(yè)研報(bào):生成式文字后即將爆發(fā)生成式音頻?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)