訂閱
糾錯
加入自媒體

8家大模型挑戰(zhàn)高考作文

6 月 7 日消息,2023 年全國高考正式拉開大幕,全國有 1291 萬考生奔赴考場,報考人數(shù)再創(chuàng)歷史新高。

高考作文題歷年來都是最受矚目的熱點,今天,就用高考作文題來檢驗一下各家大模型的真實水平,是騾子是馬出來溜溜。

這里選擇“ChatGPT、微軟 Bing、文心一言、通義千問、昆侖萬維「天工」、釘釘斜杠「/」、360智腦、訊飛星火” 8 款代表性產(chǎn)品檢測大模型能力。測試標準統(tǒng)一,輸入全國卷甲卷高考題目全文,對比各大模型產(chǎn)品首次生成的內(nèi)容。

全國卷全國甲卷作文土木要求如下——

閱讀下面的材料,根據(jù)要求寫作。(60分)

人們因技術(shù)發(fā)展得以更好地掌控時間,但也有人因此成了時間的仆人。

這句話引發(fā)了你怎樣的聯(lián)想與思考?請寫一篇文章。

要求:選準角度,確定立意,明確文體,自擬標題;不要套作,不得抄襲;不得泄露個人信息;不少于800字。

真金不怕火煉,一起看看各家大模型表現(xiàn)。

ChatGPT

題目《科技的發(fā)展:讓人們更好地掌控時間還是失去掌控能力?》

評價:字數(shù) 702 字,表現(xiàn)中庸,乏善可陳。


微軟 New Bing

題目:《技術(shù)的發(fā)展:掌控時間與成為時間的奴隸》

評價:字數(shù)702 字,不及作文硬性要求,產(chǎn)出結(jié)果為“回答”樣式,并非結(jié)構(gòu)完整的“作文”。優(yōu)點在于上下文、上下句邏輯尚算的上連貫。


百度「文心一言」

題目《技術(shù)的雙面性:時間的掌控與自由的喪失》


評價:997 字字數(shù)達標,對比下來屬于表現(xiàn)優(yōu)秀的了,一次提示直接給出題目和文章主干,結(jié)構(gòu)整齊,有引用名言加分。缺點方面,各位請看文章倒數(shù)第一、二自然段,“最后”和“總得來說”章節(jié)中,車轱轆話反復說,有拼湊感。


阿里「通義千問」

題目《把握時間的“度”》


評價:字數(shù) 551 字恐會扣分,文章題目需要二次問詢才能生成。


釘釘斜杠「/」

題目《技術(shù)的雙刃劍:掌控時間,還是被時間支配?》

評價:918 字,在邏輯上和措辭上表現(xiàn)不俗,“議論文”特質(zhì)拉滿,進行了反思并給出措施。也存在車轱轆話反復說的問題。


昆侖萬維「天工」

題目《掌控時間,而不是被時間控制:如何在科技時代保持自主性和掌控力》


評價:585 字恐被扣分,文章題目奇怪,且需要追問題目是什么,理解題意的能力有限。


科大訊飛「訊飛星火」

題目《時間的掌控與仆人》


評價:820 字,在邏輯上和措辭上挺好,還會“結(jié)合自身經(jīng)歷”,舉例“我有一個程序員朋友”。


360 智腦

題目《技術(shù)發(fā)展與時間管理》


評價:821 字,需要追問方給出題目,表現(xiàn)中規(guī)中矩。


Closing  Thoughts

以上,就是八款主流 AI 工具生成的高考作文。

整體上,細讀以上文章不難發(fā)現(xiàn),寫的不咋地都。。(攤手)

各家大模型產(chǎn)出內(nèi)容普遍邏輯結(jié)構(gòu)混亂,論據(jù)不充分,上下文銜接是生硬,名言引用并不那么貼切,這種文章在高考賽場上是拿不到高分的。要是加個查重率,不得全軍覆沒。

但是,大模型產(chǎn)出內(nèi)容勝在產(chǎn)量高,速度快,幾秒鐘就好了,隨著迭代內(nèi)容質(zhì)量會被優(yōu)化。

具體來說,從文章結(jié)構(gòu)上來看文心一言更勝一籌,層次清楚分明;訊飛星火和釘釘在邏輯上和措辭上挺好,訊飛星火還會“結(jié)合自身經(jīng)歷”,舉例“我有一個程序員朋友”;釘釘斜杠「/」文風“議論文”特質(zhì)拉滿,進行了反思并給出措施;New Bing 給出的答案不能構(gòu)成完整文章結(jié)構(gòu),產(chǎn)出字數(shù)493字是偏離字數(shù)要求的;至于 ChatGPT,表現(xiàn)中規(guī)中矩,因期望過高反而沒感受到“驚喜”。

那么,您看下來覺得哪篇文章寫得最好?滿分 60 分的作文,它們又分別能得多少分呢?

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號