图片亚洲图揄拍自拍视频,日本被黑人强伦姧人妻完整版,中文字幕无码视频专区

GPT-5前瞻！GPT-5將具備哪些新能力？

2024-01-16 08:59

作者：小巖

編輯：彩云

Sam Altman在整個(gè)AI領(lǐng)域，乃至整個(gè)科技領(lǐng)域都被看作是極具影響力的存在，而2023年OpenAI無(wú)限反轉(zhuǎn)的宮斗事件更是讓Sam Altman刷足了存在感，他甚至被《時(shí)代》雜志評(píng)為“2023年度CEO”。

也正因此， Sam Altman的一條推文，瞬間就可以成為轟動(dòng)整個(gè)AI行業(yè)的信號(hào)，特別是當(dāng)這條推文還與萬(wàn)眾期待的“GPT-5”有關(guān)的時(shí)候。

圖片4.png

2023年平安夜，Sam Altman在社交平臺(tái)大膽公布了2024年的雄心壯志。他所發(fā)表的關(guān)鍵詞不僅涵蓋了2024年OpenAI的整體規(guī)劃，更契合了用戶(hù)的迫切需求。這其中包括：

AGI（請(qǐng)耐心等待）

GPT-5　

更好的語(yǔ)音模式

更高的費(fèi)率限制

更好的GPT

更好的推理

對(duì)工作/行為程度的控制

視頻

個(gè)性化

更好的瀏覽

“使用OpenAi登錄”

開(kāi)放源代碼

Sam Altman透露，OpenAI計(jì)劃在接下來(lái)的一年內(nèi)實(shí)現(xiàn)多個(gè)令人矚目的里程碑。其中所涉及到的內(nèi)容，不僅僅一次簡(jiǎn)單的技術(shù)更新，更是一場(chǎng)至關(guān)重要的AI變革。當(dāng)然，最受關(guān)注的，還是GPT-5。

圖片5.png

AI領(lǐng)域的開(kāi)源與閉源之爭(zhēng)：類(lèi)似于Android與IOS之爭(zhēng)。

對(duì)于AI界來(lái)說(shuō)，大家除了關(guān)心 GPT-5能否在技術(shù)壁壘上有所突破，更關(guān)心一個(gè)重點(diǎn)：GPT-5能否實(shí)現(xiàn)開(kāi)源？

大模型的開(kāi)源和閉源之爭(zhēng)一直是行業(yè)內(nèi)爭(zhēng)論的焦點(diǎn)，這種爭(zhēng)論，與移動(dòng)互聯(lián)網(wǎng)時(shí)代的Android與IOS之爭(zhēng)有異曲同工之妙。有意思的是，各個(gè)AI大廠(chǎng)對(duì)于開(kāi)源還是閉源的選擇也不盡相同。

目前拔得頭籌的OpenAI的GPT-4和百度的文心一言都堅(jiān)持閉源，Meta選擇了開(kāi)源的道路，相繼面向“學(xué)術(shù)研究用途”開(kāi)源了LLaMA和LLaMA-2模型。百川智能則兼具開(kāi)源和閉源，在學(xué)術(shù)領(lǐng)域選擇了開(kāi)源，使用7B和13B兩種尺寸的大模型；商業(yè)探索上將53B閉源，以保護(hù)商業(yè)利益和技術(shù)的競(jìng)爭(zhēng)優(yōu)勢(shì)。

圖片6.png

GPT的閉源，為OpenAI帶來(lái)了可觀的收入。據(jù)The Information報(bào)道，OpenAI CEO Sam Altman對(duì)員工表示，公司正以每年13億美元（約合人民幣94.93億元）的速度產(chǎn)生收入，平均每月收入超過(guò)1億美元，相較于去年全年2800萬(wàn)美元增長(zhǎng)超過(guò)450倍，達(dá)4542%。這個(gè)數(shù)據(jù)也比3個(gè)月前預(yù)期的年收入高30 %。這也讓2023年成為OpenAI公司成立8年來(lái)，收入增長(zhǎng)最快的一年。而這些，恰恰是GPT-4閉源所帶來(lái)的。

關(guān)鍵詞：GPT-5能實(shí)現(xiàn)開(kāi)源嗎？

那么，GPT-5能實(shí)現(xiàn)開(kāi)源嗎？未必。

對(duì)于商業(yè)模式，OpenAI曾在官網(wǎng)中明確指出“打算繼續(xù)免費(fèi)提供ChatGPT”，但也會(huì)選擇從付費(fèi)的高級(jí)服務(wù)的用戶(hù)和企業(yè)中獲得收入。而且，雖然OpenAI嘴上說(shuō)著“不指望在近期內(nèi)盈利”，但考慮到開(kāi)發(fā)和提供大模型的高成本，生存問(wèn)題仍然是其不得不面對(duì)的挑戰(zhàn)。

此外，盡管OpenAI實(shí)現(xiàn)了快速增長(zhǎng)，但背后的行業(yè)成本卻不容忽略。根據(jù)公開(kāi)信息顯示，2022 年，OpenAI開(kāi)發(fā)GPT-4，僅訓(xùn)練成本支出約5.4億美元。2023年4月，OpenAI每天為ChatGPT支付的運(yùn)營(yíng)成本約694.4萬(wàn)美元（其中主要是電費(fèi)），年化運(yùn)營(yíng)成本約為2.5億美元，綜合年化成本可能超過(guò)13億美元。毫無(wú)疑問(wèn)，OpenAI依舊處于虧損階段。

所以，倘若沒(méi)有商業(yè)化的維持，OpenAI恐怕很快會(huì)迎來(lái)破產(chǎn)。更重要的是，已經(jīng)通過(guò)GPT-4閉源嘗到甜頭，獲得大量收入的OpenAI，顯然沒(méi)有充足的理由將GPT-5完全開(kāi)源，這無(wú)異于自毀壁壘，在大模型賽道的競(jìng)逐中喪失領(lǐng)先優(yōu)勢(shì)。從這個(gè)層面來(lái)說(shuō)。GPT-5實(shí)現(xiàn)開(kāi)源的概率不大。

即便Sam Altman在推文中將“開(kāi)源”標(biāo)注成了關(guān)鍵詞，但更多的也只是在迎合行業(yè)的呼聲，我們還不能將其解讀為“企業(yè)2024年的發(fā)展目標(biāo)”。

不過(guò)，“部分開(kāi)源”的可能性并非沒(méi)有。GPT-5完全開(kāi)源的可能性雖然比較小，但是為了GPT相關(guān)生態(tài)建設(shè)，對(duì)與GPT相關(guān)的工具集提供開(kāi)源的可能性卻很高。或許，OpenAI會(huì)通過(guò)為較少部分提供開(kāi)源的方式，為開(kāi)發(fā)者的開(kāi)發(fā)，調(diào)試，分享提供便利。

未來(lái)的GPT-5，究竟會(huì)具備哪些新能力？

近日，艾倫人工智能研究所發(fā)布了Unified-IO 2，它的發(fā)布極具意義，因?yàn)樗梢詭椭覀兏玫念A(yù)判GPT-5的能力。

為什么這么說(shuō)呢？Unified與ChatGPT之間存在著怎樣的關(guān)系？

事實(shí)上，早在2022年6月，艾倫人工智能研究所就推出了第一代Unified-IO，它是首批能夠處理圖像和語(yǔ)言的多模態(tài)模型之一。大約在同一時(shí)間，OpenAI正在內(nèi)部測(cè)試GPT-4，并在2023年3月正式發(fā)布。所以，Unified-IO可以看作是對(duì)于未來(lái)大規(guī)模AI模型的前瞻。換句話(huà)說(shuō)，因?yàn)閁nified-IO 2的出現(xiàn)，我們可以大致預(yù)判一點(diǎn)：OpenAI可能正在內(nèi)部測(cè)試GPT-5，并很有可能在幾個(gè)月后發(fā)布。

圖片7.png

艾倫人工智能研究所推出的Unified-IO 2是第一個(gè)可以處理和生成文本，圖像，音頻，視頻和動(dòng)作序列的模型。這個(gè)新的高級(jí)人工智能模型使用幾十億個(gè)數(shù)據(jù)點(diǎn)進(jìn)行訓(xùn)練，雖然模型大小只有7B，卻展現(xiàn)出迄今為止最廣泛的多模態(tài)能力。它的訓(xùn)練數(shù)據(jù)包括：10億個(gè)圖像-文本對(duì)，1 萬(wàn)億個(gè)文本標(biāo)記，1.8億個(gè)視頻剪輯，1.3億張帶文本的圖像，300萬(wàn)個(gè)3D資產(chǎn)和100萬(wàn)個(gè)機(jī)器人代理運(yùn)動(dòng)序列。研究團(tuán)隊(duì)將總共120多個(gè)數(shù)據(jù)集組合成一個(gè)600 TB的包，涵蓋220個(gè)視覺(jué)，語(yǔ)言，聽(tīng)覺(jué)和動(dòng)作任務(wù)。Unified-IO 2采用編碼器-解碼器架構(gòu)，并進(jìn)行了一些更改，以穩(wěn)定訓(xùn)練并有效利用多模態(tài)信號(hào)。

模型可以回答問(wèn)題，根據(jù)指令撰寫(xiě)文本、以及分析文本內(nèi)容；可以識(shí)別圖像內(nèi)容，提供圖像描述，執(zhí)行圖像處理任務(wù)，并根據(jù)文本描述創(chuàng)建新圖像；可以根據(jù)描述或說(shuō)明生成音樂(lè)或聲音，以及分析視頻并回答有關(guān)視頻的問(wèn)題。此外，通過(guò)使用機(jī)器人數(shù)據(jù)進(jìn)行訓(xùn)練，Unified-IO 2還可以為機(jī)器人系統(tǒng)生成動(dòng)作，例如將指令轉(zhuǎn)換為機(jī)器人的動(dòng)作序列。由于多模態(tài)訓(xùn)練，它還可以處理不同的模態(tài)，例如，在圖像上標(biāo)記某個(gè)音軌使用的樂(lè)器等。

總體而言，Unified-IO 2在超過(guò)35個(gè)基準(zhǔn)測(cè)試中表現(xiàn)良好，包括圖像生成和理解，自然語(yǔ)言理解，視頻和音頻理解以及機(jī)器人操作。在大多數(shù)任務(wù)中，它能夠比肩專(zhuān)用模型，甚至更勝一籌。在圖像任務(wù)的GRIT基準(zhǔn)測(cè)試中，Unified-IO 2獲得了目前的最高分。通過(guò)這些，我們也可以更好的窺見(jiàn)未來(lái)GPT-5的模樣。

對(duì)于AI發(fā)展而言，科技生態(tài)與商業(yè)化是缺一不可的核心要素。技術(shù)和應(yīng)用的發(fā)展需要商業(yè)化提供必要的支持和保障；而商業(yè)化的成功也離不開(kāi)生態(tài)環(huán)境的建設(shè)。兩者之間必須相輔相成，有機(jī)結(jié)合。希望在未來(lái)發(fā)布的GPT-5中，OpenAI可以起到先導(dǎo)作用，率先實(shí)現(xiàn)生態(tài)與商業(yè)化之間的平衡。

原文標(biāo)題 : 新火種AI|GPT-5前瞻！GPT-5將具備哪些新能力？