国产一区二区三区在线水蜜桃,国产乱码精品一区二区水蜜桃,国产精品自拍视频

GPT-4，從北喬峰變南慕容？

2023-07-06 16:40

數(shù)字力場

關(guān)注

之前看GPT-4像喬峰，武功蓋世。現(xiàn)在看GPT-4像慕容復(fù)，浪得虛名？

文 | 佘宗明

發(fā)現(xiàn)沒，好像沒什么人再吹GPT-4了（包括我）。

料到了它的熱度會(huì)降下來，不降對(duì)不起Gartner曲線，但沒想到是斷崖式下降。

要知道，110多天前，作為ChatGPT進(jìn)化版的GPT-4剛問世時(shí)，很多人還被它能1秒生成網(wǎng)站、解答邏輯題、調(diào)侃腦筋急轉(zhuǎn)彎的能力驚到了。

那時(shí)候，國人的反應(yīng)通常包括幾點(diǎn)：

先是震驚，「真是牛逼Plus」。

后是擔(dān)心，「差距又拉大了」。

接著是覺得自己想象力已經(jīng)不夠用了：按照GPT這一日千里的進(jìn)化速度，GPT-5出來后，是不是得宣告大結(jié)局了？

盡管今天輿論談到GPT時(shí)習(xí)慣提ChatGPT，但GPT-4其實(shí)是更強(qiáng)大的存在。

「皮衣刀客」黃仁勛就說：GPT-4的厲害之處，OpenAI也沒說清楚。

360創(chuàng)始人周鴻祎則是將GPT-4視作「通用人工智能的奇點(diǎn)和強(qiáng)人工智能到來的拐點(diǎn)」。

「硅基取代碳基」的話題，也被GPT-4的史詩級(jí)進(jìn)化帶入輿論場。

包括馬斯克跟AI教父Bengio在內(nèi)的上千名科技行業(yè)人士，沒多久后還聯(lián)名發(fā)公開信，呼吁暫停強(qiáng)AI的研發(fā)。

▲馬斯克等上千名科技人士此前曾發(fā)聯(lián)名公開信，呼吁為強(qiáng)AI研發(fā)摁暫停鍵。

一股擔(dān)心科技大爆炸引發(fā)社會(huì)大震蕩的流行情緒，在全球蔓延開來。

可現(xiàn)在呢，你跟許多人說GPT-4，他沒準(zhǔn)會(huì)回你：GPT什么？G什么4？什么PT4？

你說：行，你先涼快著吧。他說「好嘞」，爾后繼續(xù)刷普里戈任或蔡徐坤。

天空響了一道驚雷，但風(fēng)暴雨并沒有來。

何止是GPT-4，就連ChatGPT和背后的OpenAI公司，都在「增長放緩」的判斷和「這輪AI見頂了嗎」的分析中，顯得有些黯淡失色。

以前上熱搜，指向的都是ChatGPT厲害炸了。

而今成熱門，畫風(fēng)早已大變——

圖靈獎(jiǎng)得主楊立昆炮轟ChatGPT：五年內(nèi)就沒人用了

馬斯克為了不再被ChatGPT白嫖，決定給 Twitter「上鎖」

ChatGPT涼了？6月訪問量環(huán)比下滑近10%

OpenAI遭集體訴訟，明星大模型變「數(shù)據(jù)小偷」?

已經(jīng)有媒體開始很嚴(yán)肅地討論：GPT，是吹起來的泡沫嗎？?

之前看GPT-4像喬峰，武功蓋世。

現(xiàn)在看GPT-4像慕容復(fù)，浪得虛名。

這似乎又是個(gè)「初看是王者，再看是青銅」的故事腳本。

問題來了：現(xiàn)有的大模型天花板GPT-4，已經(jīng)不香了嗎？

看上去，確實(shí)是這樣。

就在上個(gè)月，「GPT-4變笨」的話題，一度在國外技術(shù)社區(qū)內(nèi)引發(fā)熱議。

有用戶反饋，把GPT-4的3小時(shí)25條對(duì)話額度一口氣用完了，都沒能解決自己的代碼問題，無奈切換到ChatGPT基于的GPT-3.5版本，反倒把事情解決了。

他反饋的主要問題包括：以前GPT-4能寫對(duì)的代碼，現(xiàn)在滿是Bug；回答問題的深度分析變少了，內(nèi)容質(zhì)量變差了。

這引起網(wǎng)友們的共鳴，「GPT-4開倒車」的說法由此興起。

不少網(wǎng)友都懷疑，GPT-4會(huì)像微軟必應(yīng)那樣，出道即巔峰，但后來慘遭「前額葉切除」。

深度學(xué)習(xí)框架Keras創(chuàng)始人、網(wǎng)紅科學(xué)家François Chollet，為GPT-4「自干五」地洗道：

不是GPT的表現(xiàn)變差，而是大家渡過了最初的驚喜期，對(duì)它的期待變高了。

言下之意，是高期待值拉高了人們對(duì)GPT失誤的敏感度。

但OpenAI開發(fā)者推廣大使Logan Kilpatrick，倒是挺會(huì)自我拆臺(tái)——

▲很顯然，OpenAI開發(fā)者推廣大使是個(gè)耿直Boy。

網(wǎng)友問他，GPT-4大模型本體自從3月14日發(fā)布以來都是靜態(tài)的，對(duì)吧？

他說，沒錯(cuò)。

網(wǎng)友又問他，相同提示詞回答不一致，是因?yàn)榇竽Ｐ捅旧聿环€(wěn)定嗎？

他又回答，Yes。

回答得這么坦誠，一看就是沒好好學(xué)習(xí)胡錫進(jìn)的講話藝術(shù)：近期網(wǎng)上出現(xiàn)了××，老羅也看到××，知道大家很××，老羅忍不住啰嗦幾句，雖然××確實(shí)存在××，但是××……

GPT-4變「弱」了，國內(nèi)科技大佬的「大模型自信」也就變強(qiáng)了。

幾個(gè)月前，國內(nèi)外AI大模型存在代差，幾乎是共識(shí)，歧異只在于差距到底有多大。

今年3月25日，周鴻祎曾表示，中國大語言模型和GPT-4差距在兩三年。

5月上旬，周鴻祎跟俞敏洪對(duì)談，談到ChatGPT問題時(shí)說，「如果不經(jīng)過兩年的模仿和抄襲，上來就說自己能超越，那才叫吹牛呢�！�

幾天后，做客央視節(jié)目時(shí)又說：GPT-4有強(qiáng)大的思維鏈模型，能夠把一個(gè)事情做連續(xù)多步推理，能夠把一個(gè)目標(biāo)做多任務(wù)的分解和規(guī)劃。如果要跟這種能力去比，國內(nèi)大模型引擎跟它比都是六七十分的水平，差距可能是兩年，「如果有人說差兩個(gè)月、差兩周我可能不太相信」。

華為原副總裁張俊對(duì)此大概頗為認(rèn)同，他5月下旬受訪時(shí)也說，國內(nèi)外AI大模型存在約兩年的代差。

而李彥宏被王小川懟，也是因?yàn)樗?月下旬接受專訪時(shí)提了一嘴「文心一言和 ChatGPT 的水平差了2個(gè)月，但可以追趕」。

在王小川看來，這屬于自我吹噓，「怎么可能只差2個(gè)月？」「之前如果說追上GPT-3.5用一年還是有可能的，但是目前OpenAI已經(jīng)訓(xùn)練到GPT-4的級(jí)別，GPT-5也在訓(xùn)練過程當(dāng)中，我們追上還需要三年�！�

就連李彥宏事后都給自己找補(bǔ)，說自己是被斷章取義了。

▲李彥宏稱「文心一言和ChatGPT的水平差了2個(gè)月」后，被王小川懟了。

彼時(shí)的共識(shí)就是：AI大模型的進(jìn)化是非線性的，其正向增強(qiáng)回路的特點(diǎn)會(huì)強(qiáng)化「強(qiáng)者愈強(qiáng)」的頭部效應(yīng)，外加語料庫質(zhì)量差異，國內(nèi)外AI大模型很可能會(huì)越拉越大。

但近段時(shí)間，某些大佬的口徑在變。

科大訊飛董事長劉慶峰就很自信。在5月6日的訊飛星火認(rèn)知大模型發(fā)布會(huì)上，劉慶峰表示，當(dāng)前訊飛星火認(rèn)知大模型已經(jīng)在文本生成、知識(shí)問答、數(shù)學(xué)能力三大能力上已超ChatGPT。

他還揚(yáng)言：10月24日，將實(shí)現(xiàn)通用模型對(duì)標(biāo)ChatGPT，中文超越ChatGPT的當(dāng)前版本，英文能做到相當(dāng)水平。

周鴻祎也不遑多讓：6月8日，跟品玩創(chuàng)始人駱軼航對(duì)話時(shí)，他說，最近幾個(gè)月國內(nèi)同行陸陸續(xù)續(xù)發(fā)布了自己的大模型，雖然客觀來講跟GPT4.0還有點(diǎn)差距，相比GPT3.5也有點(diǎn)差距，但差距沒有那么大。

在5天后的360智腦大模型發(fā)布會(huì)上，他更是表示，國內(nèi)大模型已基本趕上或接近國際先進(jìn)水平，之前曾說和全球先進(jìn)的差距有一兩年，今天收回這句話。

中國工程院院士鄔賀銓在6月下旬接受采訪時(shí)也說，評(píng)價(jià)大模型水平應(yīng)該是多維度的，全面性、合理性、使用便捷性、響應(yīng)速度、成本、能效等，籠統(tǒng)地說目前我國大模型開發(fā)與國外的差距為1—2年的依據(jù)還不清楚，現(xiàn)在下這一結(jié)論意義也不大。

他還指出，按2022年年底的數(shù)據(jù)，美國占全球算力36%，中國占31%，現(xiàn)有算力總規(guī)模與美國相比有差距但不大，而以GPU和NPU為主的智能算力規(guī)模中，中國明顯高于美國（按2021年年底數(shù)據(jù)，美國智算規(guī)模占全球智算總規(guī)模15%，中國則是占到26%）。

所以，GPT-4是被吹得太狠了嗎？

這兩天的兩則新聞，或許挺適合對(duì)此作答：

阿里達(dá)摩院多語言NLP團(tuán)隊(duì)日前發(fā)布了首個(gè)多語言多模態(tài)測試基準(zhǔn) M3Exam，共涵蓋 12317 道題目，結(jié)果顯示，多語言能力上，GPT-4是唯一一個(gè)可以超過60%準(zhǔn)確率的模型，其他的均不及格。

麻省理工學(xué)院和微軟的學(xué)者近來的研究也發(fā)現(xiàn)，GPT-4在自修復(fù)方面表現(xiàn)出了有效能力，GPT-3.5則沒有。在此之外，GPT-4還能夠?qū)PT-3.5生成的代碼提供反饋。

▲阿里達(dá)摩院的測試中，GPT-4在多語言能力上仍是最秀的那一個(gè)。

那為什么很多人感覺GPT-4能力退化了？

微軟研究院早前刷屏的那篇論文《AGI的火花：GPT-4早期試驗(yàn)》中的說法，興許可資參考：

微軟方面獲得的GPT-4版本性能，要遠(yuǎn)強(qiáng)于目前的公測版本。公測版本變?nèi)�，是因�(yàn)樗獙?duì)標(biāo)人類的指令和價(jià)值觀。

說大白話就是：OpenAI也怕出安全問題，所以「寧可變慢一點(diǎn)，也要安全一些」。

有人會(huì)說：不重要了，沒看到人家訪問量正在下滑嗎？

訪問量下滑，確實(shí)是不少人評(píng)價(jià)ChatGPT們「漲不動(dòng)了」「也不行了」的重要依據(jù)。

乍看起來，這不乏數(shù)據(jù)支撐：多家數(shù)據(jù)分析網(wǎng)站指出，ChatGPT的訪問量環(huán)比增長率已從1月份的131.6%、2月份的62.5%、3月份的55.8%、4月份的12.6%，跌到了5月份的2.8%，6月份或環(huán)比下降。

▲統(tǒng)計(jì)顯示，ChatGPT的訪問量增速出現(xiàn)回落態(tài)勢(shì)。

OpenAI麾下的ChatGPT和GPT-4告別流量高增長時(shí)代，大概率是事實(shí)。

但別忘了幾點(diǎn)潛在背景：

1，OpenAI未必在乎C端用戶直接訪問官網(wǎng)的流量，因?yàn)樗幌敫鶥端客戶搶用戶。

OpenAI的CEO阿爾特曼就曾表示，ChatGPT未來的核心戰(zhàn)略使命，是吸引更多的企業(yè)應(yīng)用程序接入API，而非在C端，與自己的企業(yè)客戶爭奪流量。

OpenAI從3月初開始，就在降價(jià)token的費(fèi)用，借此鼓勵(lì)更多第三方開發(fā)者（很多都是B端客戶）使用ChatGPT和Whisper工具，通過API接口整合接入他們的服務(wù)。

現(xiàn)實(shí)中，很多人訪問的都是那些應(yīng)用插件，而不是OpenAI官網(wǎng)。這難免對(duì)ChatGPT和GPT-4造成分流，但那些統(tǒng)計(jì)工具并未顧及這層因素。

2，4月初ChatGPT曾出現(xiàn)大面積封號(hào)，主要針對(duì)「特制工具」批量注冊(cè)的黑賬號(hào)。

來自東方的神秘力量們憑著VPN和黑科技貢獻(xiàn)的流量，就被切掉了。

所以，你說它的流量下滑沒毛病，但這未必是OpenAI最在意的。

不論是GPT-4貌似沒那么「靈」了，還是ChatGPT和GPT-4訪問量下滑了，都指向了一點(diǎn)：

大模型的正確打開方式，與其說是做流量入口，不如說是深入行業(yè)場景，做行業(yè)數(shù)字化的AI底座。

從網(wǎng)絡(luò)反饋看，反映GPT-4變笨了的，主要都是些細(xì)分行業(yè)從業(yè)者。他們想要的業(yè)務(wù)知識(shí)，確實(shí)是那些基礎(chǔ)性、普適型的公用大模型給不了的。

OpenAI要把自身從C端爆火的超級(jí)AI應(yīng)用，變成并不性感的API接口服務(wù)平臺(tái)，說白了，就是想將價(jià)值做深，而不是只賺流量錢。

為什么阿里云的通義千問今年4月發(fā)布后，想要通過「伙伴計(jì)劃」撬動(dòng)更多企業(yè)在再訓(xùn)練和精調(diào)基礎(chǔ)上打造企業(yè)的專屬大模型？

為什么周鴻祎說「公有大模型在落地政府、城市、行業(yè)和企業(yè)場景時(shí)并不能直接使用，存在著缺乏行業(yè)深度、易帶來數(shù)據(jù)安全隱患、無法保障內(nèi)容真正可信及無法實(shí)現(xiàn)成本可控四大痛點(diǎn)」，企業(yè)級(jí)垂直大模型才是未來？

為什么騰訊云6月19日不是直接發(fā)布基礎(chǔ)的通用大模型，而是發(fā)布面向 B 端客戶的 MaaS（模型即服務(wù)）服務(wù)解決方案，幫金融、政府、文旅、傳媒、教育等行業(yè)打造契合自身業(yè)務(wù)需要的「專屬模型」？

原因就在于：AI大模型是工業(yè)革命級(jí)的生產(chǎn)力工具，最終得服務(wù)于生產(chǎn)效率提升，是以還得將B端作為切入口。

唯有如此，才能在AI時(shí)代「把所有行業(yè)重做一遍」。

前些天，傅盛PK朱嘯虎，圍繞ChatGPT激辯，核心也在于類ChatGPT產(chǎn)品的價(jià)值點(diǎn)開掘上。

▲傅盛跟朱嘯虎前不久在朋友圈激辯大模型創(chuàng)業(yè)。

作為創(chuàng)投圈話題人物的朱嘯虎，認(rèn)為ChatGPT對(duì)創(chuàng)業(yè)者不友好，只有大廠商才玩得轉(zhuǎn)大模型，大模型都是在大模型上做應(yīng)用又沒什么價(jià)值，完全沒有BAT級(jí)機(jī)會(huì)。

曾跟周鴻祎、雷軍、馬化騰、馬云等一眾大佬相愛相殺的獵豹?jiǎng)?chuàng)始人傅盛，則認(rèn)為大模型催生了很多新的架構(gòu)在大模型之上的創(chuàng)業(yè)機(jī)會(huì)，包括直接在大模型上搭建的不同應(yīng)用和由于數(shù)據(jù)私有帶來的垂直領(lǐng)域大模型等。

可以這么理解：朱嘯虎認(rèn)為，創(chuàng)業(yè)公司們很難復(fù)制OpenAI，壓根就沒做通用AI時(shí)代的Windows或安卓系統(tǒng)的機(jī)會(huì)。

傅盛則不以為然，認(rèn)為做AI時(shí)代的美團(tuán)滴滴也挺好——美團(tuán)滴滴們不就是靠拿捏住落地場景做大的嗎？

說回GPT-4，再怎么說它變?nèi)趿�，它依舊是霸榜級(jí)別的存在。

打個(gè)不甚恰當(dāng)?shù)谋确�，GPT-4就是大模型版NBA里巔峰期還沒過去的詹姆斯，它身后的Bard、LLaMA、文心一言、通義千問等，就相當(dāng)于字母哥、杜蘭特、庫里、約基奇，仍在追趕。

詹姆斯未必是「永遠(yuǎn)的神」（華語樂壇這么多年了「永遠(yuǎn)的神」也只有華晨宇一個(gè)），但在其鼎盛期，他的實(shí)力是獨(dú)一檔。

至于OpenAI的GPT以后會(huì)不會(huì)走下坡路，就難以料定了。

就目前看，中國大模型的追趕之路仍然道阻且長。

特別是考慮到美國預(yù)計(jì)7月份針對(duì)對(duì)華芯片出口實(shí)施新管制，連英偉達(dá)為中國特供的A100平替版GPU芯片A800都要禁，加速追趕正迎來更多高難度挑戰(zhàn)。

▲英偉達(dá)為中國特供的A800GPU芯片，也在美國新一輪出口管制的射程內(nèi)。

但不能說中國大模型就沒機(jī)會(huì)。中國互聯(lián)網(wǎng)過去20年能彎道超車，成為全球Top2的玩家，超大市場提供的海量應(yīng)用場景就是個(gè)重要因素。

中國消費(fèi)互聯(lián)網(wǎng)規(guī)模能做成全球第一，就得益于互聯(lián)網(wǎng)平臺(tái)們抓住了應(yīng)用場景里蘊(yùn)藏的機(jī)會(huì)，進(jìn)而不斷做大。

到了大模型時(shí)代，國產(chǎn)大模型很難再做出ChatGPT那種一問世就舉世矚目的大模型產(chǎn)品了，畢竟喝頭啖湯有身位優(yōu)勢(shì)。

可它們能不能立足于應(yīng)用場景，在助益實(shí)體產(chǎn)業(yè)中發(fā)掘出更多「平臺(tái)級(jí)」機(jī)會(huì)來，還挺值得觀察。

能，就會(huì)得到市場的犒賞。

說到底，GPT-4有沒有從北喬峰變南慕容，固然挺有說頭。

但反求諸己，更重要的，還是練好「適合自身體質(zhì)」的武功秘笈。

不然的話，連進(jìn)AI江湖「五絕」的機(jī)會(huì)都沒。

?作者 | 佘宗明

?運(yùn)營 | 李玩

原文標(biāo)題 : GPT-4，從北喬峰變南慕容？

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

暫無評(píng)論

圖片新聞