訂閱
糾錯(cuò)
加入自媒體

2022,谷歌、抖音和百度涌向AIGC

2023-01-16 09:26
雷科技
關(guān)注

就在本月,WSJ 引述知情人士稱,作為 2022 年爆紅的聊天機(jī)器人 ChatGPT 背后的公司,OpenAI 正在談判以收購(gòu)要約的形式出售現(xiàn)有股份,這起交易對(duì) OpenAI 的估值達(dá)到 290 億美元左右。在 2021 年的一場(chǎng)交易中,OpenAI 的估值還只是在 140 億美元左右。

估值高漲的背后不只是因?yàn)?ChatGPT,OpenAI 旗下另一個(gè) AI 生成圖像模型——DALL-E 2 同樣展現(xiàn)了生成式 AI 的能力可以有多高。2022 年,從 Stable Diffusion 以開源形式引爆 AI 創(chuàng)作,到 GPTChat 一周內(nèi)就突破了百萬(wàn)級(jí)用戶注冊(cè),全球出現(xiàn)了無(wú)數(shù)生成式 AI 的產(chǎn)品和創(chuàng)業(yè)公司,文本、圖像乃至視頻,掀起了巨大的 AIGC(人工智能生成內(nèi)容)浪潮。

5425b3374e11190dda61102518910b614f8e8d.gif

AI 繪畫,圖/抖音

基于 Stable Diffusion 開源模型,字節(jié)也推出 2022 抖音年度爆款「AI 繪畫」,統(tǒng)計(jì)顯示有 2758.3 萬(wàn)人使用過(guò)這款特效。抖音和快手都看到了 AIGC 技術(shù)在圖像應(yīng)用上的巨大價(jià)值,快手對(duì) AIGC 的布局也證實(shí)了這一點(diǎn)?焓衷 11 月聯(lián)合百度 AI 數(shù)字人希加加、度曉曉等發(fā)布短視頻,進(jìn)行 24 小時(shí) AI 直播,還通過(guò) AIGC 技術(shù)進(jìn)行作畫、寫詩(shī)、寫歌詞等。

6 月,一位谷歌高級(jí)軟件工程師甚至聲稱,谷歌開發(fā)的對(duì)話式 AI LaMDA「有意識(shí)、有靈魂」,但隨后很快被谷歌否認(rèn)。而在一個(gè)月前,谷歌剛剛在 2022 年 I/O 大會(huì)上公布了 LaMDA2,稱其為谷歌有史以來(lái)最先進(jìn)的對(duì)話式 AI,與年底紅遍全球的 ChatGPT 有著相同的語(yǔ)言模型技術(shù)和原生應(yīng)用場(chǎng)景。

12 月 16 日,知名學(xué)術(shù)期刊《科學(xué)》雜志公布了 2022 年十大科學(xué)突破,記錄一年里最重大的科學(xué)發(fā)現(xiàn)、進(jìn)展和趨勢(shì),其中一項(xiàng)就是「AI 具備創(chuàng)造力」。用我們更熟悉的詞就是:AIGC,即基于 AI 能力的內(nèi)容創(chuàng)作。

當(dāng) AI 開始擁有大規(guī)模創(chuàng)造內(nèi)容的能力,很多事情都可能被顛覆。

AI作畫開始大眾化

0.jpg

圖/OpenAI

2022 年 4 月,人工智能研究公司 OpenAI 發(fā)布了新版本的文本生成圖像程序——DALL-E 2,隨后一張由 DALL-E 2 生成的「宇航員在太空騎馬」圖片開始躥紅社交網(wǎng)絡(luò)。

相比前代,DALL-E 2 生成圖像有了更高的分辨率和更低的延遲,同樣基于用戶描述文本進(jìn)行生成。不過(guò)和之前 OpenAI 推出的產(chǎn)品一樣,DALL-E 2 開始并不對(duì)外開放,僅限部分研究人員注冊(cè)使用該程序,一直到 9 月才宣布向公眾開放使用,每月僅限 15 個(gè)免費(fèi)圖像。

這也為下半年 Stable Diffusion 的爆火和流行提供了機(jī)會(huì)。如果說(shuō)上半年最火的「AI 畫師」當(dāng)屬 DALL-E 2 和 Midjourney,8 月 22 日 Stable Diffusion 發(fā)布之后基本就成了「AI 畫師」的代名詞。

在目前的三大 AI 圖像模型中,Stable Diffusion 誕生得最晚,但由于發(fā)展良好的開源社區(qū),它的用戶關(guān)注度和使用范圍都超越了 Midjourney 和 DALL-E。任何人都可以免費(fèi)使用,任何公司也可以基于開源項(xiàng)目定制自己的 AI 生成圖像程序。

「我們已經(jīng)看到 3 歲到 90 歲的人第一次開始創(chuàng)作!筍tabilityAI CEO Emad Mostaque 在一次采訪中說(shuō),該公司資助了 Stable Diffusion 的開發(fā)。在海外知名論壇 Reddit 的「StableDiffusion」板塊下,每天都有用戶分享通過(guò) Stable Diffusion 生成新的圖像作品。

到現(xiàn)在「AI 畫師」已經(jīng)可以走入千家萬(wàn)戶。用戶可以在本地部署,普通消費(fèi)級(jí)顯卡就能滿足硬件要求,也可以直接輸入一串網(wǎng)址,直接輸入描述文本開始創(chuàng)作,這是 2021 年 DALL-E 初代發(fā)布的時(shí)候不敢想的。

不僅如此,「AI 畫師」出現(xiàn)和流行也在 2022 年挑戰(zhàn)人類的美術(shù)和圖片產(chǎn)業(yè)。

9 月,全球最大圖庫(kù)蓋蒂圖片社(Getty Images)宣布禁止上傳和銷售使用 DALL-E、Midjourney 和 Stable Diffusion 等 AI 藝術(shù)工具生成的插圖。蓋蒂認(rèn)為 AI 產(chǎn)生的圖片并非是一種人類創(chuàng)造性的藝術(shù)品。

同月,游戲公司 CEO 兼游戲設(shè)計(jì)師 Jason Allen 通過(guò) Midjourney 生成的《太空歌劇院》,在美國(guó)科羅拉多州博覽會(huì)舉辦的藝術(shù)展中一舉奪得數(shù)字藝術(shù)組大獎(jiǎng)。

但這次獲獎(jiǎng)也引起了廣泛的爭(zhēng)論,有人認(rèn)為這對(duì)其他自己創(chuàng)作的人不公平,「這就跟為什么我們不讓機(jī)器人參加奧運(yùn)會(huì)的原因完全一樣!箙⒓釉u(píng)審的藝術(shù)家杜蘭(Cal Duran)甚至表示,他在評(píng)分的時(shí)候根本沒(méi)意識(shí)到這幅畫由 AI 生成。

相比之下,百度更加務(wù)實(shí),一開始就確定了自己「輔助」定位。8 月,百度基于自身的文心大模型也推出了AI 繪畫平臺(tái)「文心一格」,更明確定位為面向有設(shè)計(jì)需求和創(chuàng)意的人群,基于文心大模型智能生成多樣化AI創(chuàng)意圖片,輔助創(chuàng)作者的創(chuàng)意設(shè)計(jì)。

在技術(shù)之外,AI 生成圖像還在探索如何解決版權(quán)等一系列問(wèn)題。

用嘴做視頻?還要再等等

作為 AI 大廠,Meta 和谷歌實(shí)際上沒(méi)有缺席任何一個(gè)重要的 AI 技術(shù),在 AI 視頻生成上更是獨(dú)領(lǐng)風(fēng)騷。

Meta 在 9 月率先推出了 Make-A-Video,言簡(jiǎn)意賅地表達(dá)了它的作用:做視頻。更具體地說(shuō),Make-A-Video 可以通過(guò)文本、圖片或者視頻來(lái)生成一個(gè)全新的視頻內(nèi)容,尤其是文本直接生成視頻,直接讓視頻創(chuàng)作的門檻大大降低,比如輸入「機(jī)器人在時(shí)代廣場(chǎng)跳舞」:

ezgif-2-3cd8535b46.gif

圖/Meta

僅僅一周后,Google 也發(fā)布了自己的 AI 視頻擴(kuò)散模型 Imagen Video。與 Make-A-Video 相比,Imagen Video 最直接的感受就是清晰度更高——畫面分辨率可以達(dá)到 1280×768,幀率也能到 24 fps 了。

不過(guò),兩者實(shí)際上都還存在畫面不正常抖動(dòng)、主體畸形、動(dòng)作不夠流暢等問(wèn)題,而且與之前推出文本生成圖像程序一樣,谷歌和 Meta 都沒(méi)有選擇對(duì)外開放,這也是為什么相比 AI 畫畫的流行,AI 生成視頻領(lǐng)域更多還是處在看熱鬧的階段——就像 2021 年的 AI 生成圖像。

字節(jié)也看好 AI 視頻模型的未來(lái),在抖音內(nèi)就支持了「圖文成片」功能,輸入一段文字,軟件智能匹配圖片素材、添加字幕、旁白和音樂(lè),自動(dòng)生成視頻。從一些創(chuàng)作者的反饋來(lái)看,目前「圖文成片」的實(shí)現(xiàn)還很初級(jí),智能匹配和生成視頻兩個(gè)環(huán)節(jié)都很難真正在視頻生產(chǎn)環(huán)節(jié)中使用。

當(dāng)下 AI 生成視頻在技術(shù)上顯然還不夠成熟,但最近幾年 AI 進(jìn)化速度在肉眼可見(jiàn)地加快,很難想象今年 AI 視頻模型又會(huì)發(fā)生什么樣的質(zhì)變。

不管 AI 視頻模型是否能在今年再度質(zhì)變,就如百度移動(dòng)生態(tài)負(fù)責(zé)人何俊杰在 9 月的 2022 百度萬(wàn)象大會(huì)上所說(shuō),「未來(lái)十年,AIGC 將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式,可以實(shí)現(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,創(chuàng)造出有獨(dú)特價(jià)值和獨(dú)立視角的內(nèi)容!

5237483182193976795.png

何俊杰,圖/百度

可以預(yù)期,AIGC 將是 UGC 用戶生成內(nèi)容出現(xiàn)之后,又一個(gè)內(nèi)容生產(chǎn)的大變革,最直接的應(yīng)用就是大大降低視頻制作的成本和門檻,這也意味著為視頻內(nèi)容在供給側(cè)的大爆發(fā)提供了技術(shù)基礎(chǔ)。

那場(chǎng)萬(wàn)象大會(huì)上,百度就推出了基于文心 AI 大模型的「創(chuàng)作者 AI 助理團(tuán)」,由 AI 文案、AI 畫師和 AI 視頻制作人組成。理想狀態(tài)下,借助「創(chuàng)作者 AI 助理團(tuán)」,一個(gè)人就可以是一支視頻團(tuán)隊(duì)。

但顯然,現(xiàn)實(shí)是 AI 視頻生成還需要一些時(shí)間。

ChatGPT,屬于AI的「初代iPhone」

12 月初,OpenAI 發(fā)布了 ChatGPT——一個(gè)對(duì)話式 AI,發(fā)布后很快就在小范圍內(nèi)流行起來(lái),隨后持續(xù)發(fā)酵并風(fēng)靡全網(wǎng)。從敲代碼、寫稿、寫詩(shī)、推薦到教你學(xué)英語(yǔ)、寫小說(shuō),甚至是一場(chǎng)類似人類之間的對(duì)談,ChatGPT 都表現(xiàn)出了驚人的語(yǔ)言對(duì)話能力。

ChatGPT 甚至一度拉響了谷歌搜索的紅色警報(bào)。

zhaobug.jpg

用 ChatGPT 修 bug,圖/@amasad

與 OpenAI 之前發(fā)布的產(chǎn)品不同,ChatGPT 選擇面向公眾大范圍公測(cè),短短 5 天,其用戶注冊(cè)量就突破了百萬(wàn)級(jí),這在互聯(lián)網(wǎng)增長(zhǎng)集體放緩的 2022 年多少有些不可思議。即便到了歲末年初,很多用戶依然在使用 ChatGPT 做報(bào)告、寫年終總結(jié)等事務(wù),可見(jiàn)其表現(xiàn)帶來(lái)的用戶粘性。

ChatGPT 之所以脫穎而出,普遍認(rèn)為很大程度上是因?yàn)樗捎昧撕茏匀坏拇朕o進(jìn)行對(duì)話,有網(wǎng)友評(píng)價(jià)其使用體驗(yàn)「就像平常聊天」。而 ChatGPT 背后的核心之一是使用 GPT-3 的新版本 GPT-3.5 來(lái)進(jìn)行對(duì)話,該版本擁有 1750 億個(gè)模型參數(shù)。

事實(shí)上,從 GPT-3 引發(fā)全球范圍 AI 大模型的軍備競(jìng)賽開始,這件事一定程度上就是巨頭之間的比拼。谷歌在 2021 年推出了萬(wàn)億級(jí)參數(shù)的 AI 大模型——Switch Transformer,微軟和英偉達(dá)燒壞了 4480 塊 GPU 后,才開發(fā)出 5300 億參數(shù)的自然語(yǔ)言生成模型 MT-NLG(威震天-圖靈)。

204_BgPC.jpg

「錢」,圖/英偉達(dá)

根據(jù)媒體報(bào)道,GPT-3 訓(xùn)練的僅是硬件和電力成本就高達(dá) 1200 萬(wàn)美元(約 7500 萬(wàn)人民幣),GPT-3.5 應(yīng)該只高不少。目前 ChatGPT 仍然是免費(fèi)使用,但顯然 OpenAI 不可能一直免費(fèi)開放下去。

另一個(gè)對(duì)話式 AI 的問(wèn)題在于——自以為是。大量的用戶對(duì)話已經(jīng)證明,ChatGPT 的回答并不可靠,但它又經(jīng)常以令人信服的方式「胡說(shuō)八道」。OpenAI 也承認(rèn),盡管 ChatGPT 生成的回答從語(yǔ)氣上已經(jīng)非常逼近真人,但有時(shí)仍會(huì)給出完全錯(cuò)誤的答案。

這不是在否認(rèn) ChatGPT 帶來(lái)的驚艷。Box CEO 亞倫·萊維認(rèn)為,「當(dāng)一種新技術(shù)已經(jīng)到了改變你對(duì)計(jì)算機(jī)的看法時(shí),你會(huì)有一種特定的感覺(jué)。谷歌做到了,火狐做到了,AWS(亞馬遜)做到了,iPhone 做到了,OpenAI 正在通過(guò) ChatGPT 做到這一點(diǎn)!

寫在最后

過(guò)去十年,可以說(shuō)互聯(lián)網(wǎng)和智能手機(jī)徹底改變了內(nèi)容的分發(fā)和消費(fèi)環(huán)節(jié),但在內(nèi)容生產(chǎn)領(lǐng)域本質(zhì)上沒(méi)有過(guò)多的變化。而在過(guò)去一年,AIGC 已經(jīng)帶來(lái)了太多的變化,Stable Diffusion、Imagen Video 和 ChatGPT 分別對(duì)應(yīng)了最主要的內(nèi)容形式——圖像、視頻和文本。

當(dāng)然,AIGC 還在面對(duì)很多挑戰(zhàn),包括版權(quán)、生成質(zhì)量不穩(wěn)定、創(chuàng)作主體爭(zhēng)論等,甚至 AI 生成視頻還沒(méi)有經(jīng)過(guò)大眾使用驗(yàn)證。但現(xiàn)如今 AIGC 開始「飛入尋常百姓家」,已經(jīng)具備了成為一項(xiàng)大眾化技術(shù)的基礎(chǔ),未來(lái)很可能極大地提高內(nèi)容的生產(chǎn)效率和豐富度。

從《太空歌劇院》獲得藝術(shù)大獎(jiǎng)到今天,AI 的爭(zhēng)論依然沒(méi)有停止,但就如 Jason Allen 為自己的事件所做的總結(jié):AI 作畫程序已經(jīng)誕生,人們能做的只有承認(rèn)并接受這件事。

題圖來(lái)自 StabilityAI

來(lái)源:雷科技

本文圖片來(lái)自:123RF 正版圖庫(kù) 

       原文標(biāo)題 : 2022,谷歌、抖音和百度涌向AIGC

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)