在AI與信息交互之間:QQ 瀏覽器的邊界探索之旅
互聯(lián)網(wǎng)1.0時(shí)代,網(wǎng)絡(luò)是人們查閱資料、了解世界的重要窗口,這個(gè)時(shí)期人與信息的關(guān)系是單向的,信息如一本本靜態(tài)的電子化書本需要用戶觸及后再閱覽獲。
互聯(lián)網(wǎng)2.0時(shí)代,互聯(lián)網(wǎng)開始成為人們獲取價(jià)值信息和社交不可或缺的重要工具,人與信息的關(guān)系開始有了雙向的交互,信息與人共同編織、豐富著這張時(shí)代大網(wǎng)。
隨著推薦技術(shù)成熟以及信息流業(yè)務(wù)急速擴(kuò)張,用戶與內(nèi)容的交互模式逐漸從“人找內(nèi)容-搜索”向“內(nèi)容找人-推薦”遷移,并且這種趨勢(shì)仍在擴(kuò)大它的外延。搜索作為人與內(nèi)容信息交互的一種重要方式,它的作用并沒有削弱,用戶在推薦場(chǎng)景的沉浸消費(fèi)反而會(huì)激發(fā)出新的搜索需求。
從本質(zhì)上看,搜索與推薦關(guān)注的交匯點(diǎn)都是交互的核心——用戶興趣,因此如何在當(dāng)前信息分發(fā)場(chǎng)景中更好滿足用戶興趣是一個(gè)重要命題。而瀏覽器是用戶在互聯(lián)網(wǎng)2.0時(shí)代與世界交互信息的重要入口,也是展示搜索與推薦技術(shù)精進(jìn)的絕佳觀察點(diǎn)。
瀏覽器作為一款綜合性APP,承載了搜索、信息流推薦、小說(shuō)等多種用戶消費(fèi)信息的場(chǎng)景。這些場(chǎng)景都有大量的內(nèi)容理解、內(nèi)容生成方面的AI需求。不同的場(chǎng)景都有各自的特點(diǎn),比如搜索的Query意圖分類、信息流的內(nèi)容推薦、小說(shuō)的內(nèi)容分類等。
這些特點(diǎn)也讓瀏覽器成為全面觀察AI技術(shù)在自然語(yǔ)言語(yǔ)義理解方向發(fā)展很好的窗口,跟隨推薦技術(shù)的發(fā)展脈絡(luò),我們發(fā)現(xiàn)騰訊旗下的QQ瀏覽器應(yīng)用月活用戶已經(jīng)超過(guò)4億,儼然成長(zhǎng)為瀏覽器中的超級(jí)APP。
在國(guó)內(nèi),騰訊是較早大規(guī)模實(shí)踐AI推薦技術(shù)的廠商之一,旗下的QQ瀏覽器過(guò)去幾年來(lái)在AI和推薦技術(shù)方面經(jīng)歷了幾次大規(guī)模重構(gòu)和迭代,現(xiàn)在已經(jīng)蔚然成森。這幾年QQ 瀏覽器在技術(shù)層經(jīng)歷了怎樣的厚積?在信息繭房和視頻化難題的泥沼中,QQ 瀏覽器做出了哪些選擇?其實(shí)戰(zhàn)經(jīng)歷對(duì)于瀏覽器行業(yè)來(lái)說(shuō),還是具有一定的學(xué)習(xí)和參考價(jià)值的,值得我們探討一下。
信息流“沼澤”中QQ瀏覽器面對(duì)的選擇
在瀏覽器中,信息流主feed是圖文、短視頻、小視頻混合形態(tài),這也是推薦算法應(yīng)用的主場(chǎng)景。在這些場(chǎng)景中,瀏覽器在不斷發(fā)展的進(jìn)階過(guò)程中容易遇到這些痛點(diǎn)難題:
1.信息繭房現(xiàn)象。內(nèi)容和資訊類平臺(tái)不光要推薦熱門的信息內(nèi)容,也面臨解決一些初始信息的冷啟動(dòng)問題,推薦系統(tǒng)如何公正有效的推薦優(yōu)質(zhì)內(nèi)容,使得好內(nèi)容獲得更多的曝光機(jī)會(huì),觸達(dá)更多的人群。
2.面對(duì)具有豐富場(chǎng)景的瀏覽器,其背后的AI研發(fā)需求多樣復(fù)雜,傳統(tǒng)的研發(fā)模式研發(fā)周期長(zhǎng),效率低。比如內(nèi)容視頻化方向,怎么打更好的標(biāo)簽以及做更好的多模態(tài),對(duì)視頻的理解和多模態(tài)的理解如何做到準(zhǔn)確把控等。
3.細(xì)分場(chǎng)景的多樣化與精細(xì)化運(yùn)營(yíng)的需求,信息流目前發(fā)展到了精細(xì)化運(yùn)營(yíng)的階段,需要針對(duì)多種多樣的細(xì)分場(chǎng)景進(jìn)行敏捷優(yōu)化。
無(wú)論是對(duì)于用戶來(lái)說(shuō),信息內(nèi)容的繭房現(xiàn)象帶來(lái)的一畝三分地的局限“視野”,還是企業(yè)面臨的形態(tài)復(fù)雜、內(nèi)容多樣化進(jìn)階的AI技術(shù)需求等,這些對(duì)信息流內(nèi)容產(chǎn)生影響的挑戰(zhàn)都亟需解決,為內(nèi)容信息的獲取和交互還一片輕快的價(jià)值體驗(yàn)。
QQ瀏覽器在面對(duì)上述挑戰(zhàn)中,選擇運(yùn)用預(yù)訓(xùn)練+finetune+AutoML的新范式和多目標(biāo)多場(chǎng)景聯(lián)合優(yōu)化的新深度模型等創(chuàng)新來(lái)應(yīng)對(duì)信息流這方面的技術(shù)挑戰(zhàn)。在騰訊QQ 瀏覽器舉辦的AI算法大賽中也可以窺視到多模態(tài)技術(shù)與超參數(shù)對(duì)這些瀏覽器難題的優(yōu)化,這兩個(gè)技術(shù)也是此次比賽的兩條賽道。
比如在視頻流的場(chǎng)景中,多模態(tài)的技術(shù)可以根據(jù)視頻觀看的時(shí)間及關(guān)注的興趣及行為讓下一個(gè)視頻更符合、相似目前觀看的視頻,在語(yǔ)義上的相似可以讓用戶的體驗(yàn)更好。QQ 瀏覽器在多模態(tài)技術(shù)中也做了評(píng)價(jià)視頻語(yǔ)義相似度的問題,可以更精確地評(píng)價(jià)兩個(gè)視頻的文本區(qū)別,為用戶不再推薦重復(fù)的內(nèi)容,增強(qiáng)在推薦方面的泛化和興趣探索的能力,很好地緩解信息繭房的問題。
而超參數(shù)技術(shù)可以實(shí)現(xiàn)多目標(biāo)融合,也就是在推薦系統(tǒng)中,從刷視頻的點(diǎn)擊率演進(jìn)到點(diǎn)擊、關(guān)注、點(diǎn)贊等同時(shí)完成,超參數(shù)搜索把以前人工尋參的方式通過(guò)網(wǎng)格搜索、非個(gè)性化尋參到個(gè)性化尋參的方式提升效率。在騰訊QQ瀏覽器實(shí)踐過(guò)程中可以減少 80% 以上的尋參時(shí)間,大大提升了推薦系統(tǒng)的研發(fā)效率。
我們知道瀏覽器在實(shí)際的推薦和搜索業(yè)務(wù)場(chǎng)景中,有異常豐富且持續(xù)演化的內(nèi)容需求,這些龐大的內(nèi)容數(shù)據(jù)并沒有客觀清晰的定義,數(shù)據(jù)標(biāo)注也就成為內(nèi)容算法研發(fā)的核心瓶頸,而預(yù)訓(xùn)練大模型是解決這一問題的“良藥”。
聚焦推薦與搜索:當(dāng)瀏覽器擁抱大模型
預(yù)訓(xùn)練大模型也是近兩年AI產(chǎn)業(yè)中最火的關(guān)鍵詞之一。目前比較有名的模型參數(shù)量都已經(jīng)達(dá)到萬(wàn)億級(jí)別了,應(yīng)用場(chǎng)景差異也比較明顯。以 OpenAI斥巨資打造的GPT-3為例,它依然是偏 NLP 的模型。在AI大模型的探索上,無(wú)論是著眼于提升超大規(guī)模AI算力,還是突破學(xué)術(shù)前沿的角度,本質(zhì)上都是通過(guò)將海量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練、預(yù)集成,形成高魯棒性、低樣本量需求的大模型。企業(yè)可以根據(jù)自身的應(yīng)用場(chǎng)景,在大模型的基礎(chǔ)上進(jìn)行少量的調(diào)參即可完成落地。
而瀏覽器與大模型的結(jié)合,可以將瀏覽器背后場(chǎng)景的大量?jī)?nèi)容理解、內(nèi)容生成中的AI研發(fā)所需樣本量大大降低,解決標(biāo)注量與成本這個(gè)在瀏覽器整體業(yè)務(wù)場(chǎng)景中的核心瓶頸。
QQ瀏覽器實(shí)驗(yàn)室自研了預(yù)訓(xùn)練模型“神舟”,這個(gè)模型具有百億參數(shù)的訓(xùn)練能力,可以為搜索、推薦、內(nèi)容理解等多種業(yè)務(wù)場(chǎng)景起到直接幫助,提升各種自然語(yǔ)言理解算法效果。神舟預(yù)訓(xùn)練大模型專注中文自然語(yǔ)言理解,基于預(yù)訓(xùn)練的研發(fā)模式,可以提前把語(yǔ)言語(yǔ)義中通用的知識(shí)學(xué)習(xí)到預(yù)訓(xùn)練模型中,針對(duì)下游具體的任務(wù)只需要學(xué)習(xí)任務(wù)相關(guān)的知識(shí)。
通過(guò)該模型QQ 瀏覽器可以微調(diào)和滿足業(yè)務(wù)中出現(xiàn)的如評(píng)論理解、搜索 Query 推薦等NLP 需求,可以減少 40% 以上所需的標(biāo)注數(shù)據(jù)量和相應(yīng)的研發(fā)時(shí)間,節(jié)省了標(biāo)注的成本,大大提升了研發(fā)的效率。在學(xué)術(shù)上,也刷新了業(yè)界紀(jì)錄,登頂了中文語(yǔ)言理解測(cè)評(píng)基準(zhǔn) CLUE 榜單上,成為首個(gè)在中文自然語(yǔ)言理解綜合評(píng)測(cè)數(shù)據(jù)上超過(guò)人類水平的預(yù)訓(xùn)練模型。
當(dāng)前神舟大模型已經(jīng)逐步應(yīng)用于 QQ 瀏覽器的搜索、看點(diǎn)資訊、小說(shuō)等多個(gè)場(chǎng)景。隨著大模型進(jìn)一步的迭代和實(shí)踐,也會(huì)深度改造 QQ 瀏覽器的搜索推薦能力,更好地理解并滿足用戶表達(dá)背后的意圖與需求。
大算力時(shí)代,機(jī)器變得更加理解信息與人,比如在醫(yī)療領(lǐng)域的問診問答、交互對(duì)話等實(shí)際場(chǎng)景中,大模型可以為語(yǔ)義的理解帶來(lái)更強(qiáng)的綜合效果,而瀏覽器擁抱大模型,可以更好地沉淀大量的知識(shí),幫助我們更準(zhǔn)確地探索AI與機(jī)器學(xué)習(xí)的邊界。
在全面數(shù)字化遷徙之旅中,我們獲得信息的渠道和服務(wù)方式也變得越來(lái)越便捷智能,對(duì)于瀏覽器行業(yè)來(lái)說(shuō),讓人們以優(yōu)質(zhì)的體驗(yàn)零門檻獲取價(jià)值信息是核心訴求,基于這個(gè)變化與訴求,QQ 瀏覽器也將自己的技術(shù)品牌升級(jí)為QQ 瀏覽器實(shí)驗(yàn)室以更好地聚焦服務(wù)用戶。
QQ瀏覽器實(shí)驗(yàn)室:走向下一代信息交互
對(duì)于下一代信息的交互平臺(tái),每個(gè)人心目中的瀏覽器都不一樣,我們可能會(huì)借助元宇宙的技術(shù),通過(guò)手勢(shì)、眼神甚至是意識(shí)來(lái)操控搜索與推薦,當(dāng)我們進(jìn)入沉浸式的新搜索界面時(shí),可能很多的邊界都會(huì)模糊甚至消失,比如消費(fèi)和應(yīng)用的邊界,體驗(yàn)與內(nèi)容的邊界,體驗(yàn)與創(chuàng)作的邊界等,可能搜索就是一個(gè)創(chuàng)作的引子,發(fā)現(xiàn)就是探索開始的價(jià)值,用戶與內(nèi)容與應(yīng)用開始層層遞進(jìn)深入,體驗(yàn)和交互的方式全面融合。
無(wú)論是哪種未來(lái)瀏覽器,本質(zhì)上都是搜索網(wǎng)羅信息,精準(zhǔn)推薦價(jià)值內(nèi)容,這也是信息技術(shù)發(fā)展過(guò)程中的不變內(nèi)核。無(wú)論未來(lái)信息交互的前景怎么變化,前提是技術(shù)的不斷更迭、突破才能帶來(lái)體驗(yàn)的重構(gòu)。
(左起:騰訊副總裁郄小虎、信息平臺(tái)與服務(wù)線CTO徐羽、騰訊副總裁殷宇)
QQ瀏覽器瞄準(zhǔn)長(zhǎng)線的數(shù)字化趨勢(shì)價(jià)值,成立“QQ瀏覽器實(shí)驗(yàn)室”技術(shù)品牌,依靠AI、搜索、大數(shù)據(jù)、推薦算法的技術(shù)研究,提升信息與服務(wù)的獲取效率,幫助用戶零門檻地獲取價(jià)值信息和服務(wù),革新用戶與世界的交互方式。
近些年來(lái),我們發(fā)現(xiàn)騰訊越來(lái)越重視AI技術(shù)能力的構(gòu)建,也成立了一些技術(shù)品牌,比如TEG(技術(shù)工程事業(yè)群)和CSIG(云與智慧產(chǎn)業(yè)事業(yè)群),這也是大家心目中離技術(shù)最近的品牌。以內(nèi)容為主的PCG并沒有得到足夠的關(guān)注。隨著PCG技術(shù)中臺(tái)的成立,推薦AI中臺(tái)也成為騰訊技術(shù)平臺(tái)中的核心中臺(tái),而QQ瀏覽器實(shí)驗(yàn)室是PCG技術(shù)中臺(tái)的核心支撐中臺(tái)模塊之一,不斷為騰訊的推薦業(yè)務(wù)賦能。
實(shí)驗(yàn)室是創(chuàng)新不斷誕生并生根發(fā)芽的地方,搜狗搜索團(tuán)隊(duì)并入后,全網(wǎng)搜索的技術(shù)能力與騰訊垂直搜索的能力形成互補(bǔ),強(qiáng)強(qiáng)聯(lián)手,這個(gè)實(shí)驗(yàn)室就聚合了信息交互中最核心的兩個(gè)技術(shù),可能是我們邁入未來(lái)沉浸式搜索交互的第一步。
我們知道,信息技術(shù)交互平臺(tái)的發(fā)展不斷進(jìn)階的目標(biāo)就是消除鴻溝與隔閡,縮短人與人、人與信息的距離。騰訊信息平臺(tái)與服務(wù)線CTO徐羽也公開表示QQ 瀏覽器的進(jìn)階目標(biāo),與之相似都是緊密連接信息與價(jià)值,拓寬用戶了解世界的眼界。打造互聯(lián)網(wǎng)未來(lái)30年的信息服務(wù)工具,做技術(shù)的擺渡人,讓價(jià)值信息更好地網(wǎng)羅服務(wù)生活,成為探索未知的下一代超級(jí)窗口。
人類歷史的長(zhǎng)河中,隨著信息技術(shù)的不斷更迭,會(huì)越來(lái)越注重信息與價(jià)值的準(zhǔn)確與高效,這也就意味著推薦系統(tǒng)是個(gè)無(wú)限增長(zhǎng)且沒有最優(yōu)解的技術(shù)體系,不斷進(jìn)化是它的特點(diǎn),因此理解用戶的能力也會(huì)不斷地深入,這樣持續(xù)洞察探索推薦的新趨勢(shì)和方向,會(huì)為用戶帶來(lái)新一代的交互體驗(yàn)與價(jià)值賦能。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市