訂閱
糾錯(cuò)
加入自媒體

Stable Video Diffusion來(lái)了!普通人拍大片指日可待

2023-11-26 09:37
新火種
關(guān)注

作者:小巖

隨著技術(shù)的不斷進(jìn)步,AI領(lǐng)域取得了巨大的突破。特別是在圖片生成這個(gè)賽道,AI目前能做到的成績(jī)超乎想象。或許就在1年以前,很多人,特別是一些專(zhuān)業(yè)從業(yè)者對(duì)AI繪畫(huà)的印象還停留在“元素要靠東拼西湊”“廢圖率太高”“成品無(wú)法直接使用”等方面,但如今,高質(zhì)量AI繪圖軟件的表現(xiàn)完全可以顛覆你的固有認(rèn)知。

而Stable Diffusion便是其中的典型代表。用Stable Diffusion完成的AI繪圖,不僅能夠精準(zhǔn)地呈現(xiàn)人體姿態(tài)和畫(huà)面層次感,還擁有復(fù)雜的三維結(jié)構(gòu),更支持用戶(hù)對(duì)圖片細(xì)節(jié)進(jìn)行調(diào)整。

如今,Stable Diffusion的官方Stability AI走得更遠(yuǎn)了。不僅在AI繪畫(huà)領(lǐng)域表現(xiàn)優(yōu)秀,還推出了Stable Video Diffusion,這款技術(shù)不僅具有強(qiáng)大的3D合成功能,更可以為視頻制作帶來(lái)巨大的變革。也就是說(shuō),它的出現(xiàn)大大降低了視頻拍攝的門(mén)檻,讓普通人也可以輕松拍大片。

什么是Stable Video Diffusion?

Stable Video Diffusion是一種先進(jìn)的視頻合成技術(shù),它能夠?qū)⒄鎸?shí)場(chǎng)景與虛擬物體完美地融合在一起,呈現(xiàn)出非常逼真的效果。這種技術(shù)可以應(yīng)用于電影制作,游戲開(kāi)發(fā),廣告創(chuàng)意等多個(gè)領(lǐng)域,從而為視頻制作帶來(lái)更多的可能性和創(chuàng)造性。

與傳統(tǒng)的視頻合成技術(shù)相比,Stable Video Diffusion最大的優(yōu)勢(shì)顯然是物美價(jià)廉。先說(shuō)“物美”,因?yàn)锳I軟件本身采用了深度學(xué)習(xí)的方法,對(duì)大量數(shù)據(jù)進(jìn)行訓(xùn)練,使得合成的視頻更加真實(shí),自然。同時(shí),這一AI技術(shù)還可以實(shí)現(xiàn)對(duì)細(xì)節(jié)的完美還原,例如物體的紋理、光線和陰影等等,可以說(shuō)是十分逼真。再來(lái)說(shuō)“價(jià)廉”,以前需要耗費(fèi)大量人力物力來(lái)完成的視頻制作工作,如今可能只需要通過(guò)Stable Video Diffusion就可以了,這就大大降低了成本。

Stable Video Diffusion的另一個(gè)重要特點(diǎn)是能夠?qū)崿F(xiàn)3D合成。通過(guò)這項(xiàng)技術(shù),制作人員可以創(chuàng)建出各種神奇的場(chǎng)景和效果,例如將現(xiàn)實(shí)中的物體搬到虛擬場(chǎng)景中,或者將多個(gè)虛擬物體組合在一起。這為電影制作帶來(lái)了更多的創(chuàng)意空間和可能性。

除了電影制作和游戲開(kāi)發(fā)外,Stable Video Diffusion還很有可能在廣告創(chuàng)意領(lǐng)域發(fā)揮重要的作用。廣告商可以利用這項(xiàng)技術(shù)創(chuàng)造出各種獨(dú)特的場(chǎng)景和效果,吸引消費(fèi)者的注意力。

3D合成引發(fā)關(guān)注,網(wǎng)友紛紛表示:進(jìn)步太快!

根據(jù)Stable Video Diffusion官方網(wǎng)站Stability AI顯示的信息,全新SVD(簡(jiǎn)稱(chēng))支持文本到視頻,圖像到視頻的生成;支持物體從單一視角到多視角的轉(zhuǎn)化,也就是大家所期待的3D合成。

盡管Stable Video Diffusion目前只是發(fā)布了基礎(chǔ)模型,但已經(jīng)受到了外界的廣泛關(guān)注和好評(píng),網(wǎng)友們普遍表示“進(jìn)步太快”。官方透露,“正計(jì)劃繼續(xù)擴(kuò)展,建立類(lèi)似于Stable Diffusion的生態(tài)系統(tǒng)”。不過(guò),對(duì)于官方發(fā)布的Demo,很多網(wǎng)友并不覺(jué)得有多驚艷,甚至認(rèn)為其中存在缺陷,諸如光影不對(duì);幀與幀之間有閃爍等等。

以下就是官方所發(fā)布的Demo,大家自行感受一下。

目前,Stable Video Diffusion的論文代碼權(quán)重已經(jīng)上線。根據(jù)介紹,SVD基于Stable Diffusion 2.1,使用了約6億個(gè)樣本的視頻數(shù)據(jù)集預(yù)訓(xùn)練了基礎(chǔ)模型。它可以輕松適應(yīng)各種下游任務(wù),包括通過(guò)對(duì)多視圖數(shù)據(jù)集進(jìn)行微調(diào)從單個(gè)圖像進(jìn)行多視圖合成。

需要說(shuō)明的是,Stability AI官方明確表示,Stable Video Diffusion僅限于研究,不適用于實(shí)際或商業(yè)應(yīng)用。所以,它還不具備被大規(guī)模應(yīng)用的條件。不過(guò),官方已經(jīng)開(kāi)放了用戶(hù)候補(bǔ)名單注冊(cè),這意味著我們普通小白也可以使用上這項(xiàng)技術(shù),過(guò)一過(guò)“一鍵拍大片”的癮。?

視頻生成迎來(lái)大爆發(fā),誰(shuí)會(huì)成為最后的贏家?

最近一段時(shí)間,視頻生成領(lǐng)域呈現(xiàn)出一種“混戰(zhàn)”的局面,各種優(yōu)秀產(chǎn)品冒頭,大有百家爭(zhēng)鳴的勢(shì)頭。

前有PikaLabs開(kāi)發(fā)的文生視頻AI。

之后Moonvalley推出了自己的作品,它素有“史上最強(qiáng)大的視頻生成AI”。

最近Gen-2的推出了“運(yùn)動(dòng)筆刷”功能,輕松實(shí)現(xiàn)“指哪畫(huà)哪”。

再加上如今驚艷亮相的Stable Video Diffusion,我們可以預(yù)見(jiàn),AI視頻生成領(lǐng)域競(jìng)爭(zhēng)十分領(lǐng)域,大家卷的如火如荼,很難說(shuō)誰(shuí)會(huì)成為最后的贏家。

視頻生成領(lǐng)域隸屬于生成式AI技術(shù)的范疇。隨著AI技術(shù)的不斷發(fā)展,生成式AI行業(yè)正在逐漸崛起。目前,該行業(yè)處于高速發(fā)展的階段,市場(chǎng)規(guī)模不斷擴(kuò)大,預(yù)計(jì)未來(lái)依舊會(huì)繼續(xù)保持快速增長(zhǎng)的速度。根據(jù)市場(chǎng)研究機(jī)構(gòu)的數(shù)據(jù)顯示,預(yù)計(jì)到2029年,行業(yè)的市場(chǎng)規(guī)模將達(dá)到100億美元。

這會(huì)是一塊肉眼可見(jiàn)的,極其美味的大蛋糕。

       原文標(biāo)題 : 新火種AI | Stable Video Diffusion來(lái)了!普通人拍大片指日可待

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)