訂閱
糾錯(cuò)
加入自媒體

OpenAI「草莓」成熟倒計(jì)時(shí),人類(lèi)距離AGI時(shí)代只剩兩周了?

2024-09-12 09:23
雷科技
關(guān)注

桌子底下的炸彈。

外界對(duì) OpenAI「草莓(Strawberry )」項(xiàng)目的關(guān)注由來(lái)已久,但很長(zhǎng)時(shí)間以來(lái)都是:只聞其聲,不見(jiàn)其人。這種局面可能很快就會(huì)被打破。

The Information 在最新的報(bào)道中披露,兩位測(cè)試過(guò)「草莓」模型的人士表示,OpenAI 可能將在接下來(lái)的兩周內(nèi)發(fā)布「草莓」模型,并上線 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在優(yōu)化使用體驗(yàn)和成本,「草莓」的目標(biāo)是再一次讓大模型向 AGI 前進(jìn)。

Snipaste_2024-09-11_18-48-53.png

圖/ The Information

那些取消 ChatGPT Plus 的用戶(hù),可能又要重新訂閱了,但據(jù)稱(chēng)新模型將擁有一個(gè)讓人「amazing」的定價(jià)。

「草莓」成熟時(shí),大模型也要「成熟」

OpenAI 將在未來(lái)兩周內(nèi)推出「草莓」的消息,無(wú)疑引起了業(yè)內(nèi)的廣泛關(guān)注,因?yàn)檫@不僅是 OpenAI 在大語(yǔ)言模型領(lǐng)域的新嘗試,也可能是對(duì)人工智能推理能力一次新的革命性提升。

根據(jù)目前流出的信息來(lái)看,相比以往的 GPT 模型,「草莓」在處理復(fù)雜問(wèn)題、執(zhí)行多步驟任務(wù)方面展現(xiàn)出前所未有的潛力,使其成為通用人工智能(AGI)邁出的重要一步。

首先,「草莓」項(xiàng)目的核心亮點(diǎn)是大幅增強(qiáng)了推理能力。據(jù)報(bào)道,「草莓」能夠自主完成深度研究任務(wù),這意味著它不再僅限于生成答案,而是能夠提前規(guī)劃、自動(dòng)導(dǎo)航互聯(lián)網(wǎng),甚至自主解決高度復(fù)雜的科學(xué)問(wèn)題。

相比現(xiàn)有的 GPT-4 系列模型,「草莓」被寄予了厚望,可以幫助 AI 更好地模仿人類(lèi)的思維過(guò)程,尤其是在數(shù)學(xué)和科學(xué)領(lǐng)域表現(xiàn)突出,成功解決了此前困擾大模型的多步驟推理問(wèn)題。

除了推理能力的突破,「草莓」還引入了名為「后訓(xùn)練(Post-training)」的新技術(shù),即在完成大數(shù)據(jù)集的預(yù)訓(xùn)練后,進(jìn)一步對(duì)模型進(jìn)行調(diào)整,使其在特定任務(wù)上表現(xiàn)更加出色。

Snipaste_2024-09-11_18-52-40.png

關(guān)于 STaR 的一篇論文,圖/ arXiv

這個(gè)方法類(lèi)似于斯坦福大學(xué)開(kāi)發(fā)的「自學(xué)推理者(STaR)」模型,通過(guò)自我生成訓(xùn)練數(shù)據(jù),AI 能夠不斷迭代優(yōu)化自身智能水平。這使得「草莓」在應(yīng)對(duì)復(fù)雜任務(wù)時(shí)能夠表現(xiàn)得更為靈活和高效,尤其是執(zhí)行長(zhǎng)時(shí)間任務(wù)(LHT)時(shí),其規(guī)劃能力和執(zhí)行能力均得到顯著提升。

然而,盡管「草莓」項(xiàng)目充滿(mǎn)了潛力,此前也有爆料指出了早期測(cè)試中暴露出的一些問(wèn)題。例如,在處理簡(jiǎn)單任務(wù)時(shí),響應(yīng)速度偶爾過(guò)慢,且其記憶對(duì)話的功能尚不穩(wěn)定。這些問(wèn)題顯然會(huì)影響使用體驗(yàn),但也是新技術(shù)在探索中的必然過(guò)程。

關(guān)鍵是推出之時(shí),OpenAI 能否解決或者改善這些問(wèn)題。

但無(wú)論如何,「草莓」或是當(dāng)下最可能引領(lǐng) AI 推理能力質(zhì)變的大模型,這也讓行業(yè)內(nèi)外對(duì)于「草莓」的期待愈發(fā)高漲。因?yàn)樗粌H意味著大語(yǔ)言模型的發(fā)展進(jìn)入了新的階段,也讓我們看到了實(shí)現(xiàn) AGI 的曙光。

OpenAI 宮變「導(dǎo)火索」:從 Q* 到草莓

「草莓」項(xiàng)目的誕生并非一蹴而就,它的根源可以追溯到 OpenAI 早期一個(gè)代號(hào)為「Q*」的秘密項(xiàng)目。對(duì)于很多人來(lái)說(shuō),「Q*」這個(gè)代號(hào)可能并不熟悉,但一定知道去年底的 OpenAI 宮斗事件。

2023 年末,OpenAI 突然爆發(fā)了宮斗級(jí)別的管理層震蕩,CEO 山姆·奧特曼(Sam Altman)被董事會(huì)短暫罷免,而直接導(dǎo)火索正是「Q*」項(xiàng)目的安全風(fēng)險(xiǎn)與爭(zhēng)議。

 

18OPENAI-1-pfbt-mediumSquareAt3X.jpg

「OpenAI 的靈魂」:左二為奧特曼、左四位伊利亞,圖/ OpenAI

事情的起因可以追溯到「Q*」的初步測(cè)試階段,當(dāng)時(shí)項(xiàng)目展示了在解決數(shù)學(xué)和科學(xué)推理問(wèn)題上的驚人成果,特別是在一些復(fù)雜的多步驟問(wèn)題上,模型的表現(xiàn)超越了現(xiàn)有的大模型。這讓部分研究人員感到興奮的同時(shí),也產(chǎn)生了深深的憂慮 。

這些突破預(yù)示著,OpenAI 可能正在快速逼近通用人工智能(AGI),這一發(fā)展超出了某些董事會(huì)成員的預(yù)期。他們擔(dān)心 AI 的快速進(jìn)化帶來(lái)不可控的風(fēng)險(xiǎn),甚至可能對(duì)社會(huì)產(chǎn)生深遠(yuǎn)的影響。OpenAI 內(nèi)部,圍繞「Q*」是否應(yīng)該繼續(xù)推進(jìn)的爭(zhēng)論愈演愈烈。

部分董事會(huì)成員認(rèn)為項(xiàng)目的推進(jìn)過(guò)于激進(jìn),尤其是涉及 AGI 的潛在危險(xiǎn),應(yīng)該更加謹(jǐn)慎對(duì)待 。最終,分歧達(dá)到了頂點(diǎn),奧特曼在未與董事會(huì)充分溝通的情況下加速推進(jìn)了「Q*」,引發(fā)了他短暫離職的戲劇性事件。

但事實(shí)上矛盾是以另一方的離場(chǎng)作為結(jié)果。奧特曼回歸之后,作為 OpenAI 靈魂人物、首席科學(xué)家的伊利亞(Ilya Sutskever)再也沒(méi)有現(xiàn)身官方發(fā)布活動(dòng),并在 GPT-4o 發(fā)布后官宣離職。

Screenshot_11-9-2024_19134_x.com.jpeg

圖/ X

3 天后,另一位 OpenAI「超級(jí)對(duì)齊」團(tuán)隊(duì)負(fù)責(zé)人 Jan Leike 也宣布了離職。而與此同時(shí),「Q*」項(xiàng)目還在加速推進(jìn),并演變成了后來(lái)更廣為人知的「草莓」項(xiàng)目。

今年夏天,奧特曼還在 X 上發(fā)布了一張草莓的實(shí)拍圖,一度引起了「草莓」即將落地的猜測(cè)。

Screenshot_11-9-2024_19350_x.com.jpeg

圖/ X

重新向 AGI 進(jìn)發(fā):「草莓」重新定義 AI?

過(guò)去近兩年,大模型廠商的方向顯然已經(jīng)發(fā)生了一些改變。最早,整個(gè)行業(yè)都把 OpenAI 的 Scaling Law 奉為金科玉律,每一代生成式 AI 模型的進(jìn)化都伴隨著龐大參數(shù)量的提升,背后的依據(jù)是參數(shù)越大,智能涌現(xiàn)的潛力就越高。

但到了 2024 年,各家大模型其實(shí)在放緩對(duì)「參數(shù)規(guī)!沟淖分,開(kāi)始轉(zhuǎn)向中小型參數(shù)規(guī)模、更具成本效益的模型。7 月,就連 OpenAI 也推出了 GPT-4o mini,更不用說(shuō)此前,國(guó)內(nèi)和國(guó)外的知名大模型基本都已經(jīng)推出了中等規(guī);蛘咻^小規(guī)模的模型。

在這個(gè)大背景下,OpenAI 的「草莓」項(xiàng)目仍然顯得與眾不同。在「草莓」項(xiàng)目上,OpenAI 不再通過(guò)堆疊參數(shù)規(guī)模來(lái)獲得智能涌現(xiàn),而是試圖通過(guò)優(yōu)化模型的推理邏輯,通過(guò)增強(qiáng)推理能力和自我訓(xùn)練算法,突破了傳統(tǒng) AI 的性能瓶頸。

從目前透露出的情況來(lái)看,「草莓」似乎不僅具備了類(lèi)似人類(lèi)的推理能力,能為解決復(fù)雜的多步驟問(wèn)題提供了新的可能性。比如在科學(xué)研究、復(fù)雜決策、數(shù)據(jù)分析等領(lǐng)域,傳統(tǒng)的語(yǔ)言模型往往只能通過(guò)簡(jiǎn)單的文本生成來(lái)應(yīng)對(duì),而「草莓」則能夠根據(jù)問(wèn)題的復(fù)雜性自主生成解決方案,并進(jìn)行推理驗(yàn)證。

 

DALL·E 2024-09-11 19.07.55 - A futuristic image representing OpenAI's 'Strawberry' project. The image features a large digital brain with a strawberry motif prominently at the cen.png

圖/ DALL·E 生成

這種轉(zhuǎn)變對(duì)推動(dòng) AI 真正從「工具」到「智能助手」的角色轉(zhuǎn)變至關(guān)重要,也將使更多企業(yè)受益于 AI 推理能力的進(jìn)步。

另一方面,「草莓」還在一定程度上具備了自我迭代、自我提升的能力,接近 AI 領(lǐng)域夢(mèng)寐以求的「遞歸自我改進(jìn)(Recursive Self-Improvement)」。通過(guò)自我生成訓(xùn)練數(shù)據(jù)并進(jìn)行迭代優(yōu)化,「草莓」能夠在過(guò)程中「學(xué)習(xí)」如何更有效地解決復(fù)雜問(wèn)題,并且在應(yīng)對(duì)新任務(wù)時(shí),能夠利用已有的經(jīng)驗(yàn)快速適應(yīng)。

然而,「草莓」項(xiàng)目當(dāng)然也有一些不可忽視的挑戰(zhàn)。比如大規(guī)模使用中的穩(wěn)定性表現(xiàn),又比如引發(fā) OpenAI 宮變的「安全」問(wèn)題。此外還有一個(gè)更加實(shí)際問(wèn)題是,與現(xiàn)有的 GPT-4 等多模態(tài)模型相比,據(jù)稱(chēng)「草莓」仍然缺乏多模態(tài)處理能力,這也意味著它在處理圖像、視頻等復(fù)雜數(shù)據(jù)時(shí)可能面臨局限性。

還有價(jià)格。

首先要說(shuō)明的是,在官方還未發(fā)布甚至官宣定價(jià)之前,實(shí)際「草莓」模型的價(jià)格是個(gè)未知數(shù)。但幾乎可以肯定,「草莓」模型的訓(xùn)練和推理成本都會(huì)更貴。而按照 The Information 的消息源表示,OpenAI 高管一度討論過(guò)將「草莓」模型和「Orion」模型(可能是 GPT-5)的訂閱價(jià)格定在:

2000 美元/月。

你沒(méi)看錯(cuò),不是 20 美元(目前 ChatGPT Plus 的定價(jià)),也不是 200 美元,而是 2000 美元。盡管只是「一度討論過(guò)」,甚至可能只是面對(duì)企業(yè)用戶(hù),但從中也能體現(xiàn)出「草莓」的高成本,以及 OpenAI 在一定程度上的自信。

Snipaste_2024-09-11_19-09-50.png

目前 Plus 的價(jià)格,圖/ ChatGPT

或許,如何平衡高推理能力、成本、用戶(hù)體驗(yàn)等方面之間的關(guān)系,是「草莓」項(xiàng)目必須面對(duì)的一個(gè)問(wèn)題。也就說(shuō),OpenAI 推出不同等級(jí)、不同價(jià)格的「草莓」也沒(méi)未必沒(méi)有可能。

但無(wú)論如何,前提條件還是「草莓」要有足夠優(yōu)秀、亮眼的表現(xiàn),就如 2022 年末橫空出世的 ChatGPT(GPT-3.5)一般。

而在未來(lái)兩周內(nèi),OpenAI 是否能憑借「草莓」項(xiàng)目再次定義 AI 的邊界,值得所有人拭目以待。

來(lái)源:雷科技

       原文標(biāo)題 : OpenAI「草莓」成熟倒計(jì)時(shí),人類(lèi)距離AGI時(shí)代只剩兩周了?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)