最近韩国电影高清免费观看hd,西西大胆人胆全棵艺术照

谷歌這一“大招”，要逼死多少AI標(biāo)注公司？

2023-09-18 17:56

阿爾法工場

關(guān)注

手工小作坊，終究敵不過工廠流水線。

如果說，當(dāng)下的生成式AI，是一個正在茁壯成長的孩子，那么源源不斷的數(shù)據(jù)，就是其喂養(yǎng)其生長的食物。

而數(shù)據(jù)標(biāo)注，就是制作這一“食物”的過程。

然而，這一過程真的很卷，很累人。

進(jìn)行標(biāo)注的“標(biāo)注師”不僅需要反復(fù)地識別出圖像中的各種物體、顏色、形狀等，有時(shí)候甚至需要對數(shù)據(jù)進(jìn)行清洗和預(yù)處理。

隨著AI技術(shù)的不斷進(jìn)步，人工數(shù)據(jù)標(biāo)注的局限性也日益顯現(xiàn)。人工數(shù)據(jù)標(biāo)注不僅耗時(shí)耗力，而且質(zhì)量有時(shí)難以保障。

為了解決這些問題，谷歌最近提出了一種用大模型替代人類進(jìn)行偏好標(biāo)注的方法，稱為AI反饋強(qiáng)化學(xué)習(xí)（RLAIF）。

研究結(jié)果表明，RLAIF可以在不依賴人類標(biāo)注的情況下，產(chǎn)生與人類反饋強(qiáng)化學(xué)習(xí)（RLHF）相當(dāng)?shù)母倪M(jìn)效果，兩者的勝率都是50%。同時(shí)，RLAIF和RLHF都優(yōu)于監(jiān)督微調(diào)（SFT）的基線策略。

這些結(jié)果表明，RLAIF不需要依賴于人工標(biāo)注，是RLHF的可行替代方案。

那么，倘若這一技術(shù)將來真的推廣、普及，眾多還在靠人工“拉框”的數(shù)據(jù)標(biāo)注企業(yè)，從此是否就真的要被逼上絕路了？

01 數(shù)據(jù)標(biāo)注現(xiàn)狀

如果要簡單地總結(jié)目前國內(nèi)標(biāo)注行業(yè)的現(xiàn)狀，那就是：勞動量大，但效率卻不太高，屬于費(fèi)力不討好的狀態(tài)。

標(biāo)注企業(yè)被稱為AI領(lǐng)域的數(shù)據(jù)工廠，通常集中在東南亞、非洲或是中國的河南、山西、山東等人力資源豐富的地區(qū)。

為了控制成本，標(biāo)注公司的老板們會在縣城里租一塊場地，擺上電腦，有訂單了就在附近招人兼職來做，沒單子就解散休息。

簡單來說，這個工種有點(diǎn)類似馬路邊上的臨時(shí)裝修工。

在工位上，系統(tǒng)會隨機(jī)給“標(biāo)注師”一組數(shù)據(jù)，一般包含幾個問題和幾個回答。

之后，“標(biāo)注師”需要先標(biāo)注出這個問題屬于什么類型，隨后給這些回答分別打分并排序。

此前，人們在談?wù)搰a(chǎn)大模型與GPT-4等先進(jìn)大模型的差距時(shí)，總結(jié)出了國內(nèi)數(shù)據(jù)質(zhì)量不高的原因。

但數(shù)據(jù)質(zhì)量為何不高？一部分原因，就出在數(shù)據(jù)標(biāo)注的“流水線”上。

目前，中文大模型的數(shù)據(jù)來源是兩類，一類是開源的數(shù)據(jù)集；一類是通過爬蟲爬來的中文互聯(lián)網(wǎng)數(shù)據(jù)。

中文大模型表現(xiàn)不夠好的主要原因之一就是互聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量，比如，專業(yè)人士在查找資料的時(shí)候一般不會用百度。

因此，在面對一些較為專業(yè)、垂直的數(shù)據(jù)問題，例如醫(yī)療、金融等，就要與專業(yè)團(tuán)隊(duì)合作。

可這時(shí)，問題又來了：對于專業(yè)團(tuán)隊(duì)來說，在數(shù)據(jù)方面不僅回報(bào)周期長，而且先行者很有可能會吃虧。

例如，某家標(biāo)注團(tuán)隊(duì)花了很多錢和時(shí)間，做了很多數(shù)據(jù)，別人可能花很少的錢就可以直接打包買走。

面對這樣的“搭便車?yán)Ь?rdquo;，國內(nèi)大模型紛紛陷入了數(shù)據(jù)雖多，但質(zhì)量卻不高的詭異困境。

既然如此，那目前國外一些較為領(lǐng)先的AI企業(yè)，如OpenAI，他們是怎么解決這一問題的？

其實(shí)，在數(shù)據(jù)標(biāo)注方面，OpenAI也沒有放棄使用廉價(jià)的密集勞動來降低成本，

例如，此前就曝出其曾以2美元/小時(shí)的價(jià)格，雇傭了大量肯尼亞勞工進(jìn)行有毒信息的標(biāo)注工作。

但關(guān)鍵的區(qū)別，就在于如何解決數(shù)據(jù)質(zhì)量和標(biāo)注效率的問題。

具體來說，OpenAI在這方面，與國內(nèi)企業(yè)最大的不同，就在于如何降低人工標(biāo)注的“主觀性”、“不穩(wěn)定性”的影響。

02 OpenAI的方式

為了降低這樣人類標(biāo)注員的“主觀性”和“不穩(wěn)定性”，OpenAI大致采用了兩個主要的策略：

1、人工反饋與強(qiáng)化學(xué)習(xí)相結(jié)合；

這里先說說第一點(diǎn)，在標(biāo)注方式上，OpenAI的人工反饋，與國內(nèi)最大的區(qū)別，就在于其主要是對智能系統(tǒng)的行為進(jìn)行排序或評分，而不是對其輸出進(jìn)行修改或標(biāo)注。

智能系統(tǒng)的行為，是指智能系統(tǒng)在一個復(fù)雜的環(huán)境中，根據(jù)自己的目標(biāo)和策略，做出一系列的動作或決策。

例如玩一個游戲、控制一個機(jī)器人、與一個人對話等。

智能系統(tǒng)的輸出，則是指在一個簡單的任務(wù)中，根據(jù)輸入的數(shù)據(jù)，生成一個結(jié)果或回答，例如寫一篇文章、畫一幅畫。

通常來說，智能系統(tǒng)的行為比輸出更難以用“正確”或“錯誤”來判斷，更需要用偏好或滿意度來評價(jià)。

而這種以“偏好”或“滿意度”為標(biāo)準(zhǔn)的評價(jià)體系，由于不需要修改或標(biāo)注具體的內(nèi)容，從而減少了人類主觀性、知識水平等因素對數(shù)據(jù)標(biāo)注質(zhì)量以及準(zhǔn)確性的影響。

誠然，國內(nèi)企業(yè)在進(jìn)行標(biāo)注時(shí)，也會使用類似“排序”、“打分”的體系，但由于缺乏OpenAI那樣的“獎勵模型”作為獎勵函數(shù)來優(yōu)化智能系統(tǒng)的策略，這樣的“排序”和“打分”，本質(zhì)上仍然是一種對輸出進(jìn)行修改或標(biāo)注的方法。

2、多樣化、大規(guī)模的數(shù)據(jù)來源渠道；

國內(nèi)的數(shù)據(jù)標(biāo)注來源主要是第三方標(biāo)注公司或科技公司自建團(tuán)隊(duì)，這些團(tuán)隊(duì)多為本科生組成，缺乏足夠的專業(yè)性和經(jīng)驗(yàn)，難以提供高質(zhì)量和高效率的反饋。

而相較之下，OpenAI的人工反饋則來自多個渠道和團(tuán)隊(duì)。

OpenAI不僅使用開源數(shù)據(jù)集和互聯(lián)網(wǎng)爬蟲來獲取數(shù)據(jù)，還與多家數(shù)據(jù)公司和機(jī)構(gòu)合作，例如Scale AI、Appen、Lionbridge AI等，來獲取更多樣化和高質(zhì)量的數(shù)據(jù)。

與國內(nèi)的同行相比，這些數(shù)據(jù)公司和機(jī)構(gòu)標(biāo)注的手段要“自動”和“智能”得多。

例如，Scale AI使用了一種稱為 Snorkel的技術(shù)，它是一種基于弱監(jiān)督學(xué)習(xí)的數(shù)據(jù)標(biāo)注方法，可以從多個不精確的數(shù)據(jù)源中生成高質(zhì)量的標(biāo)簽。

同時(shí)，Snorkel還可以利用規(guī)則、模型、知識庫等多種信號來為數(shù)據(jù)添加標(biāo)簽，而不需要人工直接標(biāo)注每個數(shù)據(jù)點(diǎn)。這樣可以大大減少人工標(biāo)注的成本和時(shí)間。

在數(shù)據(jù)標(biāo)注的成本、周期縮短的情況下，這些具備了競爭優(yōu)勢的數(shù)據(jù)公司，再通過選擇高價(jià)值、高難度、高門檻的細(xì)分領(lǐng)域，如自動駕駛、大語言模型、合成數(shù)據(jù)等，就可不斷提升自己的核心競爭力和差異化優(yōu)勢。

如此一來，“先行者會吃虧”的搭便車?yán)Ь�，也被�?qiáng)大的技術(shù)和行業(yè)壁壘給消弭了。

03 標(biāo)準(zhǔn)化VS小作坊

由此可見，AI自動標(biāo)注技術(shù)，真正淘汰的只是那些還在使用純?nèi)斯さ臉?biāo)注公司。

盡管數(shù)據(jù)標(biāo)注聽上去是一個“勞動密集型”產(chǎn)業(yè)，但是一旦深入細(xì)節(jié)，便會發(fā)現(xiàn)，追求高質(zhì)量的數(shù)據(jù)并不是一件容易的事。

以海外數(shù)據(jù)標(biāo)注的獨(dú)角獸Scale AI為代表，Scale AI不僅僅在使用非洲等地的廉價(jià)人力資源，同樣還招聘了數(shù)十名博士，來應(yīng)對各行業(yè)的專業(yè)數(shù)據(jù)。

數(shù)據(jù)標(biāo)注質(zhì)量，是Scale AI為OpenAI等大模型企業(yè)提供的最大價(jià)值。

而要想最大程度地保障數(shù)據(jù)質(zhì)量，除了前面提到的使用AI輔助標(biāo)注外，Scale AI的另一大創(chuàng)新，就是了一個統(tǒng)一的數(shù)據(jù)平臺。

這些平臺，包括了Scale Audit、Scale Analytics、ScaleData Quality 等。通過這些平臺，客戶可以監(jiān)控和分析標(biāo)注過程中的各種指標(biāo)，并對標(biāo)注數(shù)據(jù)進(jìn)行校驗(yàn)和優(yōu)化，評估標(biāo)注的準(zhǔn)確性、一致性和完整性。

可以說，這樣標(biāo)準(zhǔn)化、統(tǒng)一化的工具與流程，成為了區(qū)分標(biāo)注企業(yè)中“流水線工廠”和“手工小作坊”的關(guān)鍵因素。

在這方面，目前國內(nèi)大部分的標(biāo)注企業(yè)，都仍在使用“人工審核”的方式來審核數(shù)據(jù)標(biāo)注的質(zhì)量，只有百度等少數(shù)巨頭引入了較為先進(jìn)的管理和評估工具，如EasyData智能數(shù)據(jù)服務(wù)平臺。

如果在關(guān)鍵的數(shù)據(jù)審核方面，沒有專門的工具來監(jiān)控和分析標(biāo)注結(jié)果和指標(biāo)，那對數(shù)據(jù)質(zhì)量的把關(guān)，就仍舊只能淪為靠“老師傅”眼力見的作坊式水準(zhǔn)。

因此，越來越多的國內(nèi)企業(yè)，如百度、龍貓數(shù)據(jù)等，都開始利用機(jī)器學(xué)習(xí)和人工智能技術(shù)，提高數(shù)據(jù)標(biāo)注的效率和質(zhì)量，實(shí)現(xiàn)人機(jī)協(xié)作的模式。

由此可見，AI標(biāo)注的出現(xiàn)，并不是國內(nèi)標(biāo)注企業(yè)的末日，而只是一種低效、廉價(jià)、缺乏技術(shù)含量的勞動密集型標(biāo)注方式的末日。

原文標(biāo)題 : 谷歌這一“大招”，要逼死多少AI標(biāo)注公司？

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報(bào)。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號登錄： QQ | 微信 | 新浪微博

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞