亚洲AV性色永久无码精品,久久综合气久久狠狠狠97色,成人伊人色一区二区三区

言犀大模型，云計(jì)算競爭中的“泥腿子”

2023-07-14 13:39

模型競爭持續(xù)了半年，京東雖然遲到卻未缺席。

7月13日上午，京東在2023京東全球科技探索者大會(huì)暨京東云峰會(huì)上，正式發(fā)布京東言犀大模型，同時(shí)發(fā)布言犀AI開發(fā)計(jì)算平臺(tái)。該平臺(tái)已經(jīng)啟動(dòng)預(yù)約注冊，預(yù)計(jì)8月正式上線。

京東集團(tuán)技術(shù)委員會(huì)主席曹鵬表示，京東靈犀大模型源于產(chǎn)業(yè)、服務(wù)產(chǎn)業(yè)，具有更高的產(chǎn)業(yè)屬性。

國內(nèi)頭部云廠商中，于大模型領(lǐng)域先行占位者如百度、阿里已經(jīng)在模型能力上卷過一輪，為避免產(chǎn)品服務(wù)同質(zhì)化，京東將定位放在“產(chǎn)業(yè)”與“專精”以求差異性。

作為模型競爭的另類參與者，京東不會(huì)做大包大攬的“大生態(tài)”，而是更強(qiáng)調(diào)落地應(yīng)用與產(chǎn)業(yè)場景，承接京東云以往的定位“更懂產(chǎn)業(yè)的云”。

產(chǎn)業(yè)大模型，是京東為自己“量身定做”的服務(wù)模式，避開通用能力的橫向比較，聚焦于專項(xiàng)領(lǐng)域的模型處理能力。

數(shù)據(jù)“專項(xiàng)專練”

大模型競爭走入深水區(qū)，數(shù)據(jù)的重要性越來越突出。

數(shù)據(jù)規(guī)模與質(zhì)量都會(huì)影響模型最終呈現(xiàn)效果，故而當(dāng)下企業(yè)和研究機(jī)構(gòu)都在積極投資于數(shù)據(jù)收集、數(shù)據(jù)清洗和數(shù)據(jù)標(biāo)注，以獲取更好的數(shù)據(jù)集來訓(xùn)練其大型模型，作為競爭優(yōu)勢。

數(shù)據(jù)集足夠優(yōu)質(zhì)且有代表性，就能訓(xùn)練出更專精的產(chǎn)業(yè)大模型。

許多公司在試用 ChatGPT 和其他大模型時(shí)，會(huì)發(fā)現(xiàn)它們用清晰語言表達(dá)復(fù)雜想法的能力非常出色，但無法響應(yīng)有關(guān)專有內(nèi)容或知識(shí)的提示或問題。因?yàn)橛?xùn)練大模型的數(shù)據(jù)普遍來自互聯(lián)網(wǎng)公開資料，缺乏對(duì)特定領(lǐng)域的深入挖掘。

相比之下，產(chǎn)業(yè)大模型的訓(xùn)練數(shù)據(jù)更加專注于特定領(lǐng)域。這些更準(zhǔn)確、一致和具有產(chǎn)業(yè)代表性的標(biāo)注信息，能讓大模型學(xué)習(xí)到適配相應(yīng)領(lǐng)域的語言規(guī)律，同時(shí)減少模型學(xué)習(xí)到錯(cuò)誤模式的風(fēng)險(xiǎn)，提高模型的精度和可靠性。

探索者大會(huì)上，京東強(qiáng)調(diào)，作為一家新型實(shí)體企業(yè)，自身發(fā)展就來自產(chǎn)業(yè)場景歷練，擁有包括零售、物流、科技、健康、工業(yè)、產(chǎn)發(fā)等豐富的產(chǎn)業(yè)布局。

這為京東積累下每年數(shù)百億條優(yōu)質(zhì)交互數(shù)據(jù)，訓(xùn)練言犀大模型的數(shù)據(jù)庫，就由70%通用數(shù)據(jù)和30%供應(yīng)鏈原生數(shù)據(jù)組成。

用自家數(shù)據(jù)訓(xùn)練自家模型，京東的優(yōu)勢就是京東言犀大模型的優(yōu)勢，這是京東想展現(xiàn)給外界的邏輯。

有知情人士提到，京東所有事業(yè)部都在配合模型訓(xùn)練，并提出自己的需求，其中京東零售幾乎交出了所有數(shù)據(jù)。

京東在電商領(lǐng)域經(jīng)營多年，且一直保持的頭部的體量與影響力，其完整的商品產(chǎn)銷與售后數(shù)據(jù)，都是訓(xùn)練大模型最好的“養(yǎng)料”。京東可以借用大模型研發(fā)搭售商品，輔助商家完成營銷物料準(zhǔn)備，或者制定組合策略。

京東介紹，在電商領(lǐng)域，京東大模型在AIGC與內(nèi)容營銷的配合上獨(dú)具優(yōu)勢。從一張商品圖出發(fā)，它能夠理解商品特征，快速生成電商運(yùn)營需要的商品主圖、營銷海報(bào)圖和商詳圖等，滿足商家快速開店和營銷的需求。人工智能可以讓每套圖的制作成本能降低90%，制作周期也從7天縮短到半天。

這些生成質(zhì)量、效率上的表現(xiàn)，都來源于數(shù)據(jù)“專項(xiàng)專練”。通俗來講，就是做電商的最懂電商，京東大模型能為在電商領(lǐng)域有生產(chǎn)力需求的客戶，提供最具針對(duì)性的服務(wù)。

但略顯尷尬的是，目前京東所描述的，AIGC在零售領(lǐng)域的應(yīng)用僅限于文生文、文生圖，跨模態(tài)和多模態(tài)能力相對(duì)來說并不成熟。

技術(shù)迭代到現(xiàn)在，多模態(tài)處理能力幾乎是頭部大模型產(chǎn)品的標(biāo)配，京東坐擁足量優(yōu)質(zhì)數(shù)據(jù)，在技術(shù)呈現(xiàn)上，卻還顯得相對(duì)原始。

產(chǎn)業(yè)大模型，一種“量體裁衣”

各家都在追求以模型通用能力為基礎(chǔ)，進(jìn)而服務(wù)千行百業(yè)之時(shí)，單獨(dú)強(qiáng)調(diào)產(chǎn)業(yè)場景的特殊針對(duì)性，難免會(huì)讓人覺得有“避重就輕”之嫌。

產(chǎn)業(yè)大模型需要兼顧通用能力，這是提供模型服務(wù)的前提。

以最近大熱的BloombergGPT（彭博GPT）為例，同樣是聚焦與特定領(lǐng)域、具體場景，在官方發(fā)布的論文中，對(duì)BloombergGPT的評(píng)估包含了兩部分，金融領(lǐng)域評(píng)估與通用領(lǐng)域評(píng)估。

BloombergGPT基于Bloomberg終端（Bloomberg Terminal）的海量金融數(shù)據(jù)進(jìn)行訓(xùn)練，數(shù)據(jù)涵蓋了各種金融文檔，如新聞、報(bào)告、評(píng)論、財(cái)務(wù)報(bào)表等。與京東數(shù)據(jù)“專項(xiàng)專練”的產(chǎn)業(yè)大模型訓(xùn)練思路頗為一致。

文章指出，在金融領(lǐng)域任務(wù)上，BloombergGPT綜合表現(xiàn)最好，同時(shí)在通用任務(wù)上，BloombergGPT的綜合得分同樣優(yōu)于相同參數(shù)量級(jí)的其他模型，甚至在某些任務(wù)上的得分要高于參數(shù)量更大的模型。即BloombergGPT在金融領(lǐng)域表現(xiàn)突出的同時(shí)，并沒有以犧牲模型通用能力為代價(jià)。

更直白的說，如果一個(gè)大模型缺乏通用能力，可能會(huì)限制模型應(yīng)用范圍的靈活性。通用大模型通常能夠處理各種類型的語言任務(wù)，并從廣泛的語料庫中學(xué)習(xí)到多樣性的語言模式。作為對(duì)比，專業(yè)大模型的泛化能力可能受到限制，無法適應(yīng)多樣的應(yīng)用場景和任務(wù)。

所以大多數(shù)廠商會(huì)選擇在通用大模型的基礎(chǔ)之上，進(jìn)行特定領(lǐng)域的訓(xùn)練和優(yōu)化開發(fā)產(chǎn)業(yè)大模型，使其具備更深入的行業(yè)知識(shí)和理解，提供更準(zhǔn)確的內(nèi)容生成。同時(shí)廠商也會(huì)重點(diǎn)指出訓(xùn)練模型時(shí)，會(huì)兼顧通用與專業(yè)。

而反觀京東對(duì)言犀大模型差異化定位的描述，并未強(qiáng)調(diào)其通用模型能力，著重強(qiáng)調(diào)對(duì)特定場景、特定行業(yè)問題的解決力。

京東表示，不會(huì)向千行百業(yè)提供通用大模型，通用性不是目的，原生數(shù)據(jù)集所帶來的能力，對(duì)零售、健康、物流、金融這幾個(gè)特定行業(yè)的深入理解，構(gòu)成了言犀大模型的差異。

大模型華山論劍，當(dāng)各家大廠都在以技術(shù)能力展示其功底如何深厚之時(shí)，京東卻話鋒一轉(zhuǎn)，說自己身經(jīng)百戰(zhàn)，對(duì)手眾多皆是一流、京東大模型實(shí)力必然也是個(gè)中翹楚。

這種“泥腿子”路數(shù)似乎對(duì)應(yīng)著京東一直以來的“江湖味”作風(fēng)，沒有絕對(duì)實(shí)力和話語權(quán)，又不得缺席競爭，就以江湖經(jīng)驗(yàn)標(biāo)榜自己不落人后。

如此看來，不做通用，反復(fù)重申自己“產(chǎn)業(yè)大模型”的定位，其實(shí)是一種更適合其當(dāng)下發(fā)展路線的“量體裁衣”：長處不在技術(shù)之時(shí)，宣傳場景更有優(yōu)勢。

只是這個(gè)定位也非京東獨(dú)家。

百度、阿里這類在通用大模型之路上狂奔多時(shí)的企業(yè)，正不斷推出行業(yè)應(yīng)用、產(chǎn)業(yè)結(jié)合方案。同樣入局稍晚的騰訊、華為也在近期發(fā)布了自己的行業(yè)大模型。具體場景、特殊領(lǐng)域的模型能力的確更符合應(yīng)用邏輯，也更容易跑通商業(yè)模式。

無論定位如何，宣傳側(cè)重怎樣，客戶的選用最終還是要看真實(shí)產(chǎn)品表現(xiàn)。雖然打出了產(chǎn)業(yè)的旗號(hào)，京東目前的宣傳賣點(diǎn)還在側(cè)重于智能客服和智能導(dǎo)購這些相對(duì)初級(jí)的應(yīng)用場景，恐怕離“產(chǎn)業(yè)”還有相當(dāng)一段距離。

先革自己的命

從整體戰(zhàn)略布局來看，京東大模型的推進(jìn)思路也略有不同。

據(jù)官方解釋，言犀大模型的落地分3步走：第一步，基于內(nèi)部實(shí)踐構(gòu)建通用大模型；第二步，在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場景大規(guī)模錘煉，融合行業(yè)解決方案對(duì)外輸出；第三步，針對(duì)嚴(yán)肅商業(yè)場景將大模型能力對(duì)外開放。

模型訓(xùn)練非常依賴實(shí)時(shí)數(shù)據(jù)反饋，故而多數(shù)廠商會(huì)選擇盡快公開投入測試，以求在實(shí)用中收集真實(shí)數(shù)據(jù)，對(duì)模型進(jìn)行調(diào)整。

按照京東的提法，開發(fā)大模型對(duì)外服務(wù)是下一個(gè)階段的目標(biāo)，當(dāng)下先得著力滿足自身業(yè)務(wù)需求才行。

對(duì)此，京東內(nèi)部技術(shù)人員的解釋是，因?yàn)榫〇|目前還沒有完全完成模型對(duì)內(nèi)部場景的接入。

雖然京東集團(tuán)各大事業(yè)部都在支持模型訓(xùn)練，希望盡快接入，但不同業(yè)務(wù)對(duì)模型的需求差異較大，滿足所有內(nèi)部場景需求在現(xiàn)階段對(duì)京東來說壓力不小。

“比如零售業(yè)務(wù)需要模型做推薦和風(fēng)控、研發(fā)團(tuán)隊(duì)希望模型幫助提升編碼效率，都得做針對(duì)性調(diào)整。我們會(huì)逐步開放一些在內(nèi)部場景磨煉成熟了的能力，今年下半年還是重點(diǎn)在內(nèi)部的打磨。”

可以把這種先拿自家業(yè)務(wù)體系做實(shí)驗(yàn)，再對(duì)外售賣成熟服務(wù)的思路視為一種推己及人。京東旗下業(yè)務(wù)涵蓋面廣，“先革自己的命”做出一個(gè)大模型應(yīng)用的范本，也是對(duì)自身產(chǎn)品能力的最好證明。

只不過就目前釋放出的消息來看，由內(nèi)及外更像是產(chǎn)品還未打磨完整，出于控制風(fēng)險(xiǎn)和成本的考慮，把測試范圍先限制在內(nèi)部，以保證家丑不外揚(yáng)。

如前文提到，京東不對(duì)外開放其通用大模型，而當(dāng)下內(nèi)部多場景的協(xié)調(diào)不順，似乎已經(jīng)在暗示一些通用性的不足，拖慢了產(chǎn)品推進(jìn)的腳步。

原文標(biāo)題 : 言犀大模型，云計(jì)算競爭中的“泥腿子”

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請輸入評(píng)論內(nèi)容...

請輸入評(píng)論/評(píng)論長度6~500個(gè)字

暫無評(píng)論

圖片新聞