訂閱
糾錯
加入自媒體

國產(chǎn)大模型發(fā)布,我們都涉身其中了

2023-09-06 17:31
南冥一鯊
關注

百度文心一言、訊飛星火,國產(chǎn)的大模型陸續(xù)開放給普通用戶了,這也是人工智能AI的新階段產(chǎn)品、預訓練語言大模型(LLM)產(chǎn)品在國內(nèi)的首批產(chǎn)品。文心一言、訊飛星火上線后,很快都登上了國內(nèi)蘋果和安卓應用商店的免費應用排行版前列。

從去年11月30日OpenAI公司推出ChatGPT的9個月后,中國版產(chǎn)品也跟上了,國內(nèi)民眾終于可以合法、穩(wěn)定地體驗、使用新科技。 

01大模型之前AI什么?

在人工智能之前的歷史上,有過5大相對成熟的應用:機器翻譯、搜索引擎、圖像識別、語音識別和智能客服。

其中圖像識別和語音識別領域滋養(yǎng)了最多的有規(guī)模的創(chuàng)業(yè)公司,有非?捎^的投資和收入規(guī)模,著名的公司包括商湯、曠視,科大訊飛、云知聲等等。

智能客服在銀行、通信運營商和IT、互聯(lián)網(wǎng)等面向大規(guī)模用戶的企業(yè)中應用廣泛,以前采用專家系統(tǒng),一種半智能的問答系統(tǒng)。后來全面轉到自然語言等技術后,AI和自動化水平明顯提高,普通民眾對此感受深刻,同時也有了很多面對機器人的無奈。著名產(chǎn)品有騰訊企業(yè)、環(huán)信、網(wǎng)易七魚等。

機器翻譯最早的版本是2006年由谷歌公司推出,10年后的2016年推出了深度學習版的翻譯引擎,翻譯效果明顯提高,達到民用基本無誤的水平。谷歌、必應和國內(nèi)的有道、百度翻譯是這個過程里的主要角色。

搜索引擎就更加廣為人知了,谷歌的搜索引擎一下把互聯(lián)網(wǎng)的信息檢索從雅虎代表的目錄管理水平,(可以想見目錄管理源自傳統(tǒng)的圖書信息管理,是圖書時代向互聯(lián)網(wǎng)時代進化中的過渡方式。)提高到了面對海量數(shù)據(jù)使用關鍵詞搜索的水平。搜索引擎滋養(yǎng)了美中兩大互聯(lián)網(wǎng)巨型公司:谷歌和百度。

而語言大模型產(chǎn)品,不但囊括了上述應用,還誕生了自己新的功能:AIGC,就是人工智能自動生產(chǎn)內(nèi)容,無論是文字、繪畫、音樂還是計算機代碼,人工智能產(chǎn)出的內(nèi)容達到了讓人驚艷和震撼的地步。

這一切,是計算機面對人類誕生以來的所有知識和信息的這個層面上,處理和消化了其中20%多的內(nèi)容后,訓練出的能力,代表了人類至今對數(shù)據(jù)的處理能力、軟件工程能力,以及配套所需的巨量計算能力的最高水平,已經(jīng)接近達到顛覆人類自己智力的階層。 

02人們之前怎么使用AI?

按照上述梳理,此前我們在使用AI的時候,像圖像和語音識別、智能客服,大部分是場景相對固定的商業(yè)、專業(yè)應用,用戶基本上是被動的。咱們來說說服務大眾用戶的機器翻譯和搜索引擎。

自動翻譯是有人類以來對AI夢想的起點。機器翻譯從上線那一天開始,對普通用戶就是免費的,但是免費中有很多層意思。

免費首先意味著它是網(wǎng)站的純投入無收入的成本部門,沒有現(xiàn)金收入,對機器翻譯的考核加了一項重要指標就是流量,作為網(wǎng)站整體服務的重要一環(huán),留住用戶。谷歌瀏覽器Chrome有一個功能,就是用谷歌翻譯把整個頁面內(nèi)容自動翻譯成用戶所需的語種,對跨語種在網(wǎng)上沖浪的用戶非常友好。

機器翻譯之所以免費,還因為它無論號稱多么準確,總會出現(xiàn)對某個單詞的錯別解釋,整句整段的語義不連貫和錯誤地方就更多了,以及無法糾正的機器腔——它的遣詞造句對用戶閱讀來說很別扭,類似星球大戰(zhàn)里機器人C-3PO——說話走路都帶著機器的味道。這種層次的產(chǎn)品讓用戶付費的話,我估計無論是工程師和網(wǎng)站的銷售都沒有這個底氣,于是機器翻譯生而免費。

最初,產(chǎn)品經(jīng)理和工程師還有一項期待:希望通過獲取用戶對翻譯結果的反饋來提高機器翻譯質(zhì)量。這一項指標寫在每一任機器翻譯的產(chǎn)品經(jīng)理的項目報告里。但是快20年了,反饋還是不足以讓工程師來訓練更好的翻譯引擎。因為機器翻譯和用戶的交互非常弱,幾乎沒有人愿意花時間把自己對譯文的看法、尤其是對某個詞句的具體意見寫下來提交給運營方。

所以機器翻譯雖然在AI一度廣泛使用的自然語言處理技術NLP中,被稱作技術應用的皇冠,在計算機技術專業(yè)領域存在感是A級;在用戶端受到關注但是好評度并不高、存在感降到C級;在商業(yè)和投資價值方面,它是最末流的D-級。因此它就是大型互聯(lián)網(wǎng)企業(yè)養(yǎng)育的一頭銷金獸。

搜索引擎是另外一番天地,它滿足了人們上網(wǎng)的第一需求:獲取信息。是搜索引擎第一次真實實現(xiàn)了互聯(lián)網(wǎng)上的信息自由。同時產(chǎn)品經(jīng)理還創(chuàng)造了搜索引擎嵌入廣告和關鍵詞排名廣告方式,徹底改變傳統(tǒng)世界商業(yè)信息傳播介質(zhì),互聯(lián)網(wǎng)取代了傳統(tǒng)廣播電視報紙雜志和戶外等媒體,成為獨大的廣告平臺,谷歌也成為有史以來廣告收入最多的公司。

搜索引擎中的人工智能,主要體現(xiàn)在兩點:一是盡可能對用戶輸入的搜索關鍵詞的理解正確,以便展示出最合適的內(nèi)容;第二是對內(nèi)容庫里的內(nèi)容進行管理,以匹配用戶的需求。

谷歌之所以拿到了有史以來最大的廣告收入,是因為它匯集了有史以來最大的用戶群,擁有最多的用戶畫像和最全的資訊數(shù)據(jù)庫,在幫助建立所有人對所有信息的鏈接的同時,也建立了商業(yè)買賣的橋梁,搭建了廣告銷售的機會。

03我們怎么使用大模型?

啰啰嗦嗦說AI的歷史,是要來告訴讀者,現(xiàn)在使用大模型會是一個什么樣的場景?

大模型的基礎版是免費的。這個免費也同樣有很多層意思。

首先當然是因為所有AI的缺點,它不保證每次提供給你的信息是準確和正確的,它會告訴你“我的回答有90%的概率是對的”,但是哪里不對,什么時候會出錯,AI不知道,工程師們也不知道。

但是大模型之所以說橫空出世,是它在類似于無所不知的搜索引擎的基礎上,把它之前訓練模型時所包括進去的信息,用一個有條理的文檔來回答你。你可以理解為以前的搜索引擎升級到了智能搜索1.0版,區(qū)別是以前用戶需要在搜索結果中逐頁打開找到自己的目標信息。而大模型不但幫你找到,還幫你總結稱流利通順的文字了。

還有更進一步的功能,大模型會幫你按要求寫作、畫畫、編曲,甚至寫計算機代碼,幫助你寫作業(yè),做科學研究。目前我們但凡涉及到語言(聲音、文字、繪畫、音階、計算機代碼)的腦力工作,大模型都可以部分甚至完全替代。

以前人們普遍看不上藍領的技能&體力工作,沒想到大模型AI上來就要替代大部分的白領工作。 

理論上,人們除了睡覺吃飯出門運動,其他時間可以全身心撲在大模型上完成自己的學習、工作。目前,這些都是免費的。

運營公司因此建立龐大的用戶群,最好只來我家不去其他家。因此頁面上大概率會和其他互聯(lián)網(wǎng)公司一樣,會出現(xiàn)廣告。同時,即使這邊免費,大模型還備著很多收費的產(chǎn)品要賣給他們呢。對,大模型將是第一次對大數(shù)量級的普通用戶收取費用的平臺級產(chǎn)品,因為它要從人類整體積累的知識與能力的層次上,給你學習和職業(yè)的支持。

龐大用戶群的另一個價值,就是利用機器和人的交互對話,大模型能夠迅速提高自己的智力水平。而對個人用戶來說,也是你在訓練符合你的興趣和需求的個性化大模型的過程。所以,大模型類似于每個人的外腦一樣,越用越離不開。這種終生服務,就是大模型公司正在計劃和實施的事情。

如何讓提高大模型的確定性,提高它服務的正確與準確度,除了和用戶交互之外,大模型一定邀請了更多小型垂直的應用服務商來一起開發(fā),比如一個數(shù)學學習和研究的應用,比如一個腦外科手術的應用。類似于大模型提供通用的判斷和技能,而具體應用把具體服務落地。

以上是目前第一代大模型和用戶相處的場景。

從技術和產(chǎn)品來說,科學家們相信和人類智能相當、甚至超越人類的AI一定會出現(xiàn)。其中涉及的道德倫理不是本文要討論的,僅就使用而言,一切都剛剛開始,機器在瘋狂地進步,我們也要盡力跟上。

圖片來源于網(wǎng)絡,侵權請聯(lián)系刪除。

       原文標題 : 國產(chǎn)大模型發(fā)布,我們都涉身其中了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號