訂閱
糾錯
加入自媒體

從ChatGPT到Sora,奧特曼要做創(chuàng)世者?

2024-02-18 09:00
何璽
關(guān)注

出品 | 何璽 排版 | 葉媛

ChatGPT之后,OpenAI再次讓人驚嘆!2月16日,奧特曼發(fā)布OpenAI首個視頻生成大模型Sora。

01

Sora能做什么?它又為什么讓業(yè)界如此震驚?

首先,Sora能夠圖文成片。文本成片方面,Sora能夠根據(jù)用戶提供的文本描述完整、準(zhǔn)確生成長達(dá)60S的的高品質(zhì)視頻。圖片成片方面,Sora不僅能夠從文本生成視頻,還能夠從現(xiàn)有的靜態(tài)圖像開始,準(zhǔn)確地動畫化圖像內(nèi)容,或者擴(kuò)展現(xiàn)有視頻,填補(bǔ)視頻中的缺失幀。此外,Sora還能夠生成包含多個角色、特定運動類型以及主題精確、背景細(xì)節(jié)復(fù)雜的場景。要知道,再此之前,Pika,RunwayMl,Stable Video等AI視頻大模型一次性生成的視頻時長也就幾秒。

其次,Sora還有強(qiáng)大的語音理解能力和多鏡頭生成能力。語言理解方面,Sora能夠準(zhǔn)確解釋提示并生成能表達(dá)豐富情感的角色。這使得模型能夠更好地理解用戶的文本指令,并在生成的視頻內(nèi)容中忠實地反映這些指令。多鏡頭方面,Sora可以在單個生成的視頻中創(chuàng)建多個鏡頭,同時保持角色和視覺風(fēng)格的一致性。這種能力對于制作電影預(yù)告片、動畫或其他需要多視角展示的內(nèi)容非常有用。

第三,Sora有強(qiáng)大的物理世界模擬能力。Sora能夠模擬現(xiàn)實世界的一些人、動物和環(huán)境方面行為的能力。值得一提的是,這些屬性的出現(xiàn)并沒有依賴于任何明確的3D建模、物體識別等歸納偏差,而是純粹通過模型的尺度擴(kuò)展而自然涌現(xiàn)的。

第三點有一點不好理解,璽哥簡單解釋一下,就是Sora已經(jīng)初步具有了洞察物理世界運行規(guī)律的能力。比如人物人類“咬”食物后,食物會留下咬痕,畫家在畫布上涂抹會留下新的筆觸等。

除了以上能力,Sora還具有視頻到視頻編輯,圖片生成等能力。

02

薩姆奧特曼要做創(chuàng)世者?

看到這里,或許有人會說,Sora雖然強(qiáng)大,但也就是一個視頻生成模型而已,如果你也這樣認(rèn)為,那就大錯特錯了。下面璽哥聊聊個人對Sora的一點看法。

目前我們看到的Sora生成的視頻還只是OpenAI放出來的demo,但從放出來的這些視頻可知,在洞察物理世界運行規(guī)律這件事情上,OpenAI已經(jīng)找到了一條模擬真實世界的路徑。而從OpenAI官方文檔透露的信息來看,Sora并不只是做一個簡單的視頻生成工具,其根本目的是做一個物理世界模擬器,為真實世界建模;蛟S在不遠(yuǎn)的未來,OpenAI將構(gòu)建一個和真實世界一模一樣的”AI擬真世界“。這個”AI擬真世界“不僅有和真實世界一模一樣的山川河流等自然環(huán)境,也有一模一樣的物理運行規(guī)則。那時,人類或可以在這個擬真世界以百倍,千倍,萬倍的效率完成學(xué)習(xí)、成長。

當(dāng)然,想要在這個”AI擬真世界“生活,你必須要有一個AI世界的身份,那就是人類的“數(shù)字人”分身。談到數(shù)字人分身,我們不得不提ChatGPT,因為他太像“人”了。ChatGPT不僅能夠通過學(xué)習(xí)和理解人類的語言來進(jìn)行對話,還能根據(jù)聊天的上下文進(jìn)行互動。ChatGPT不僅能理解人的意圖,還有自己的思辨能力,能夠推理,能夠勝任許多人類工作,F(xiàn)在,隨著應(yīng)用商店的發(fā)布,ChatGPT更實現(xiàn)了對人類能力的分類。

現(xiàn)在,我們把Sora和ChatGPT結(jié)合起來看看,一個是要復(fù)制一個真實的物理環(huán)境,一個是要復(fù)制一個真實的人,真實的物理環(huán)境+人,不就等于一個新的世界嗎?

或許在不久的將來,我們的人生就將分成兩部分,一個是AI世界中的我們,一個是現(xiàn)實世界的我們。至于是AI世界中的我們更重要,還是現(xiàn)實世界中的我們更重要,就要看個人更適合在哪種環(huán)境中生活了。

到那個時候,或許奧特曼真的就成了“AI擬真世界”的創(chuàng)世者。

       原文標(biāo)題 : 從ChatGPT到Sora,奧特曼要做創(chuàng)世者?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號