一夜之間,ChatGPT「開眼了」。 一夜之間,ChatGPT「開眼了」。 4 個(gè)月前發(fā)布 ChatGPT 最初就只支持文本輸入和文本輸出,也就是進(jìn)行文字聊天。然而在 GPT-4 發(fā)布之后,ChatGPT 甚至可以看懂一些梗圖,并解釋「!乖谀" />
訂閱
糾錯(cuò)
加入自媒體

ChatGPT升級(jí)后亂殺老師傅,百度文心一言能抗住壓力嗎?

2023-03-16 15:17
雷科技
關(guān)注

一夜之間,ChatGPT「開眼了」。

一夜之間,ChatGPT「開眼了」。

4 個(gè)月前發(fā)布 ChatGPT 最初就只支持文本輸入和文本輸出,也就是進(jìn)行文字聊天。然而在 GPT-4 發(fā)布之后,ChatGPT 甚至可以看懂一些梗圖,并解釋「梗」在哪。但 GPT-4 升級(jí)遠(yuǎn)不止如此。

美國(guó)當(dāng)?shù)貢r(shí)間 3 月 14 日,OpenAI 正式發(fā)布了多模態(tài)大型語(yǔ)言模型 GPT-4。OpenAI 在介紹中表示,雖然 GPT-4 在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平的表現(xiàn)。

與 ChatGPT 發(fā)布之初基于的 GPT-3.5 大模型相比,OpenAI 宣稱 GPT-4 擁有更強(qiáng)的語(yǔ)言理解能力,在準(zhǔn)確度上有了顯著提升,雖然還無(wú)法解決「胡說(shuō)八道」的問(wèn)題,但出現(xiàn)概率已經(jīng)降低了 60%。

此外,GPT-4 的訓(xùn)練語(yǔ)料庫(kù)還停留在 2021 年 9 月之前,但對(duì)科學(xué)、醫(yī)學(xué)、法律等特定領(lǐng)域進(jìn)行了知識(shí)面的擴(kuò)充,不僅能在美國(guó)統(tǒng)一律師資格考試中取得前列成績(jī),在奧賽、GRE 等考試均取得了很高的分?jǐn)?shù),甚至 SAT 成績(jī)——可以理解為美國(guó)高考成績(jī)——已經(jīng)超過(guò)了 90%的考生,跨過(guò)哈佛、斯坦福等名校的門檻。

FrMr4dMaAAEFVDX.jpg

部分考試成績(jī),圖/OpenAI

同時(shí) GPT-4 的其中一個(gè)重點(diǎn)升級(jí)是增加了對(duì)圖片輸入的支持,有了對(duì)圖片進(jìn)行總結(jié)和評(píng)論的能力。在官方示例中,GPT-4 就針對(duì)去年熱傳的一組圖片進(jìn)行了解讀,并指出其中的「笑點(diǎn)」。

Snipaste_2023-03-15_15-34-24.png

機(jī)翻,圖/OpenAI

Twitter 上還有用戶獲得圖片輸入測(cè)試資格展示了,GPT-4 如何根據(jù)冰箱里剩下的食材推薦今日菜譜。不僅是人類的黑話被 ChatGPT「破譯」了,ChatGPT 也第一次「觸碰」到了現(xiàn)實(shí)世界,讓 ChatGPT 未來(lái)在更多場(chǎng)景的使用成為了可能。

但需要一提的是,目前圖像識(shí)別功能還處于測(cè)試階段,暫時(shí)不公開使用,僅限部分客戶公司和研究人員使用。但除此之外,GPT-4 的所有升級(jí)都已經(jīng)面向 ChatGPT Plus 用戶和部分 ChatGPT API(應(yīng)用程序接口)全面開放。

不過(guò),GPT-4 相比 GPT-3.5 到底帶來(lái)了多大的進(jìn)步,又可能會(huì)掀起什么樣的風(fēng)暴,以及中國(guó)的 ChatGPT——特別是即將在 3 月 16 日發(fā)布的百度文心一言,還有趕超的機(jī)會(huì)嗎?

GPT-4 大大大升級(jí)

在 OpenAI 發(fā)布 GPT-4 的直播中,第一個(gè)介紹的就是對(duì)更長(zhǎng)內(nèi)容的支持——可以直接讀取的 token 數(shù)從 4096 個(gè)(GPT-3.5)升級(jí)到了 32000 個(gè),約等于可以一次性輸入 25000 個(gè)英文單詞。

很多普通用戶可能用不上也不理解這項(xiàng)升級(jí)的重大意義,但大幅增長(zhǎng)的上下文長(zhǎng)度將極大擴(kuò)展 ChatGPT 的推理能力和用例數(shù)量,比如可以將患者的全部病史一并輸入,或是將冗長(zhǎng)的法律合同輸入,都能減少 ChatGPT 對(duì)前后分開內(nèi)容的「誤讀」,提高輸出內(nèi)容的準(zhǔn)確性和實(shí)用性。

OpenAI 也提到,簡(jiǎn)單聊天中 GPT-4 升級(jí)并不明顯(不包括圖片輸入支持),但當(dāng)任務(wù)的復(fù)雜度達(dá)到足夠的閾值,GPT-4 將體現(xiàn)出遠(yuǎn)比 GPT-3.5 更可靠、更有創(chuàng)造力的表現(xiàn)。

此外,ChatGPT 在 GPT-4 大模型的加持下,不僅能夠生成更具說(shuō)服力和吸引力的內(nèi)容,還支持更個(gè)性化的需求和聊天風(fēng)格。官方示例就展示了「蘇格拉底」風(fēng)格設(shè)定下的 GPT-4 老師是如何調(diào)教人類學(xué)生,一步一步思考并解出方程組「3x + 2y = 7, 9x -4y = 1」的正確答案。

稿定設(shè)計(jì)導(dǎo)出-20230315-183846.jpg

GPT-4,圖/OpenAI

如果對(duì)比下基于 GPT-3.5 的 ChatGPT 就能明白它們之間的差距。

我們將同樣的設(shè)定和問(wèn)題輸入 ChatGPT(GPT-3.5),它不僅沒(méi)有表現(xiàn)出「蘇格拉底」循循善誘的教導(dǎo),反而直接給出了推導(dǎo)過(guò)程——答案還是錯(cuò)誤的「x=23/27,y=22/9」。

Snipaste_2023-03-15_10-06-09.png

ChatGPT(GPT-3.5),圖/OpenAI

從過(guò)程到結(jié)果,GPT-4 至少在教導(dǎo)人類解方程式這件事上吊打了 GPT-3.5,甚至可以說(shuō)已經(jīng)很接近人類老師的教導(dǎo)過(guò)程。甚至我們可以想象,GPT-4 如果充分學(xué)習(xí)了魯迅的資料,或許賽博「魯迅」老師也可以成為所有人的語(yǔ)文老師,甚至是終身導(dǎo)師。

這也引出了另一個(gè)升級(jí)重點(diǎn)——不同語(yǔ)言的能力。OpenAI 官方承認(rèn),GPT 不管從語(yǔ)料庫(kù)、基準(zhǔn)測(cè)試、開發(fā)人員都是以英文為主,故而對(duì)英文的理解和輸出能力都勝過(guò)其他語(yǔ)言。

但即便如此,在 GPT-4 下,包括中文在內(nèi)的大部分語(yǔ)言處理能力基本都超過(guò)了 GPT-3.5 的英文處理能力。中國(guó)版 ChatGPT 的壓力更大了。

不過(guò),盡管 GPT-4 的能力再一次實(shí)現(xiàn)了驚人的進(jìn)步,包括在對(duì)抗性事實(shí)性評(píng)估中的得分比 GPT-3.5 高出 40%,但還是存在一些「一本正經(jīng)地胡說(shuō)八道」,即 AI 對(duì)事實(shí)產(chǎn)生「幻覺」,并出現(xiàn)推理錯(cuò)誤。

比如之前 ChatGPT(GPT-3.5)回答并流傳出的「林黛玉三打白骨精」,我們?cè)诨?GPT-4 的 Bing Chat 中也進(jìn)行了測(cè)試,雖然提醒了我們這不是原著中的情節(jié),但同樣「虛造」了改編視頻的存在,這一點(diǎn)可以從引用資料中輕易得出結(jié)論。

Snipaste_2023-03-15_15-55-28.png

圖/必應(yīng)

就如 OpenAI CEO 山姆·阿特曼所說(shuō),GPT-4 仍然存在缺陷,但它有明顯的改進(jìn),相比以前的模型不僅幻覺減少、偏見減少,還更有創(chuàng)意。

另外據(jù) OpenAI 官網(wǎng)介紹,摩根士丹利、多鄰國(guó)、By My Eyes 等 6 個(gè)企業(yè)客戶已經(jīng)率先使用了 GPT-4,其中大概也包括微軟。

微軟和 OpenAI 又前進(jìn)了一大步

早在今年 2 月,就有傳聞稱微軟將在當(dāng)時(shí)尚未發(fā)布的 Bing 上集成 GPT-4。事實(shí)證明的確如此,Bing 團(tuán)隊(duì)在 GPT-4 正式發(fā)布后就表示:

我們很高興確認(rèn) New Bing 基于 GPT-4 運(yùn)行,這是我們?yōu)樗阉鞫ㄖ频。如果您在過(guò)去五周內(nèi)的任何時(shí)間使用過(guò)新版 Bing,那么您已經(jīng)體驗(yàn)過(guò)這個(gè)強(qiáng)大模型的早期版本。隨著 OpenAI 對(duì) GPT-4 及更高版本的更新,Bing Chat 也將從中受益。

事實(shí)上,微軟德國(guó)技術(shù)總監(jiān)也在上周提前透露了 OpenAI 將在本周發(fā)布 GPT-4。而 OpenAI 過(guò)去兩年還與微軟一起從頭設(shè)計(jì)了一臺(tái)專用于語(yǔ)言訓(xùn)練的超級(jí)計(jì)算機(jī),GPT-4 就是跑在這臺(tái)超級(jí)計(jì)算機(jī)上訓(xùn)練出來(lái)的。

再考慮到 2019 年的十億美元投資和今年年初的數(shù)十億美元投資,微軟和 OpenAI 很大程度上已經(jīng)綁為一體。而 GPT-4 的正式推出再次確立了微軟和 OpenAI 在生成式 AI 上的領(lǐng)先,開發(fā)者 Pietro Schirano 就表示:「我不在乎它是不是通用人工智能,GPT-4 是一項(xiàng)令人難以置信的變革性技術(shù)!

Snipaste_2023-03-15_16-49-23.png

圖/Twitter

與此同時(shí),ChatGPT 的巨大成功一方面已經(jīng)吸引了大量的商業(yè)應(yīng)用,包括微軟的 Bing Chat,同時(shí)也為微軟 Azure 云計(jì)算平臺(tái)拉來(lái)了大量客戶,為微軟繼續(xù)力挺 OpenAI 進(jìn)行大量的研發(fā)和資金投入提供了充足的條件。

這樣的強(qiáng)強(qiáng)聯(lián)合,國(guó)產(chǎn) ChatGPT 們還有希望嗎?

國(guó)產(chǎn)大模型的差距又被拉大了?

時(shí)至今日,沒(méi)有人會(huì)懷疑 ChatGPT 以及大語(yǔ)言模型的重要性了,包括科技部部長(zhǎng)王志剛也在幾周前重點(diǎn)談到了 ChatGPT,指出就像踢足球都是盤帶和射門,但要做到梅西那么好很難:

ChatGPT 在技術(shù)進(jìn)步上,特別是保證算法的實(shí)時(shí)性與算法質(zhì)量的有效性上,非常難。

換句話說(shuō),開發(fā)一個(gè)類似 ChatGPT 的對(duì)話機(jī)器人不難,但要實(shí)現(xiàn) ChatGPT 同等水平的自然語(yǔ)言理解能力以及實(shí)時(shí)性,難度極高。

在國(guó)內(nèi)一眾宣稱正在開發(fā)類 ChatGPT 中,只有阿里、騰訊、百度對(duì)大語(yǔ)言模型進(jìn)行了大規(guī)模且長(zhǎng)期的投入,而且百度也是三家之中對(duì)于 AI 傾注心血和時(shí)間最多的一家?梢哉f(shuō),從技術(shù)實(shí)力上,百度是目前最有希望在大語(yǔ)言模型上追趕 OpenAI 的中國(guó)公司。

日前,百度也已經(jīng)宣布將于 3 月 16 日下午召開文心一言發(fā)布會(huì),如果順利,文心一言將成為國(guó)內(nèi)大公司推出的第一個(gè)類 ChatGPT 產(chǎn)品。不過(guò)據(jù) WSJ 報(bào)道,百度從年前就在緊鑼密鼓地進(jìn)行類 ChatGPT 的開發(fā),包括春節(jié)假期期間,甚至將原計(jì)劃的支持中英雙語(yǔ)縮減為專注中文。

在算力、資金、技術(shù)等方面都不占優(yōu)勢(shì)的情況下,指望百度一舉追上甚至超越 OpenAI 不現(xiàn)實(shí)。而且隨著谷歌開放 PaLM API(5400 億參數(shù)量的業(yè)界頂尖模型),以及 GPT-4 的進(jìn)一步升級(jí),大幅提高了通用版 GPT 的門檻,留給后來(lái)者的機(jī)會(huì)也越來(lái)越小。

但一方面,不管是 OpenAI 還是谷歌對(duì)中文的重視程度明顯不足,再加上網(wǎng)絡(luò)和法規(guī)等諸多因素,注定很難在國(guó)內(nèi)直接大規(guī)模落地,百度等國(guó)內(nèi)公司如果能在中文上追平甚至超越 OpenAI,也不失為一種可行路徑。

另一方面,圍繞大語(yǔ)言模型和生成式 AI 的商業(yè)模式還有大量的未知,OpenAI 和百度一樣需要不斷地進(jìn)行商業(yè)化嘗試。百度此前宣布包括魅族、攜程、興業(yè)銀行、美通社等 400 多家企業(yè)將首批接入文心一言生態(tài),意圖明顯希望極大地?cái)U(kuò)展生成式 AI 的用戶群體,除了考慮生態(tài)的建立,可能也是提前搶占中國(guó)更廣泛用戶的心智。

當(dāng)然,在文心一言真正推出落地之前,很難評(píng)判它的真正實(shí)力和潛力。而且可以預(yù)見,文心一言將不可避免地被用來(lái)與 ChatGPT 進(jìn)行對(duì)比,屆時(shí)才是檢驗(yàn)百度在大語(yǔ)言模型和生成式 AI 實(shí)力的時(shí)刻。

題圖來(lái)自 OpenAI

    來(lái)源:雷科技

           原文標(biāo)題 : ChatGPT升級(jí)后亂殺老師傅,百度文心一言能抗住壓力嗎?

    聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

    發(fā)表評(píng)論

    0條評(píng)論,0人參與

    請(qǐng)輸入評(píng)論內(nèi)容...

    請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

    您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

    • 看不清,點(diǎn)擊換一張  刷新

    暫無(wú)評(píng)論

    暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)