中國品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁 > 云計(jì)算頻道 > 大模型

    谷歌這一“大招”,要逼死多少AI標(biāo)注公司?

    2023年09月18日 13:46:29   來源:微信公眾號(hào):AI新智能

      手工小作坊,終究敵不過工廠流水線。

      如果說,當(dāng)下的生成式AI,是一個(gè)正在茁壯成長的孩子,那么源源不斷的數(shù)據(jù),就是其喂養(yǎng)其生長的食物。

      而數(shù)據(jù)標(biāo)注,就是制作這一“食物”的過程。

      然而,這一過程真的很卷,很累人。

      進(jìn)行標(biāo)注的“標(biāo)注師”不僅需要反復(fù)地識(shí)別出圖像中的各種物體、顏色、形狀等,有時(shí)候甚至需要對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理。

      隨著AI技術(shù)的不斷進(jìn)步,人工數(shù)據(jù)標(biāo)注的局限性也日益顯現(xiàn)。人工數(shù)據(jù)標(biāo)注不僅耗時(shí)耗力,而且質(zhì)量有時(shí)難以保障。

      為了解決這些問題,谷歌最近提出了一種用大模型替代人類進(jìn)行偏好標(biāo)注的方法,稱為AI反饋強(qiáng)化學(xué)習(xí)(RLAIF)。

      研究結(jié)果表明,RLAIF可以在不依賴人類標(biāo)注的情況下,產(chǎn)生與人類反饋強(qiáng)化學(xué)習(xí)(RLHF)相當(dāng)?shù)母倪M(jìn)效果,兩者的勝率都是50%。同時(shí),RLAIF和RLHF都優(yōu)于監(jiān)督微調(diào)(SFT)的基線策略。

      這些結(jié)果表明,RLAIF不需要依賴于人工標(biāo)注,是RLHF的可行替代方案。

      那么,倘若這一技術(shù)將來真的推廣、普及,眾多還在靠人工“拉框”的數(shù)據(jù)標(biāo)注企業(yè),從此是否就真的要被逼上絕路了?

      01 數(shù)據(jù)標(biāo)注現(xiàn)狀

      如果要簡(jiǎn)單地總結(jié)目前國內(nèi)標(biāo)注行業(yè)的現(xiàn)狀,那就是:勞動(dòng)量大,但效率卻不太高,屬于費(fèi)力不討好的狀態(tài)。

      標(biāo)注企業(yè)被稱為AI領(lǐng)域的數(shù)據(jù)工廠,通常集中在東南亞、非洲或是中國的河南、山西、山東等人力資源豐富的地區(qū)。

      為了控制成本,標(biāo)注公司的老板們會(huì)在縣城里租一塊場(chǎng)地,擺上電腦,有訂單了就在附近招人兼職來做,沒單子就解散休息。

      簡(jiǎn)單來說,這個(gè)工種有點(diǎn)類似馬路邊上的臨時(shí)裝修工。

      在工位上,系統(tǒng)會(huì)隨機(jī)給“標(biāo)注師”一組數(shù)據(jù),一般包含幾個(gè)問題和幾個(gè)回答。

      之后,“標(biāo)注師”需要先標(biāo)注出這個(gè)問題屬于什么類型,隨后給這些回答分別打分并排序。

      此前,人們?cè)谡務(wù)搰a(chǎn)大模型與GPT-4等先進(jìn)大模型的差距時(shí),總結(jié)出了國內(nèi)數(shù)據(jù)質(zhì)量不高的原因。

      但數(shù)據(jù)質(zhì)量為何不高?一部分原因,就出在數(shù)據(jù)標(biāo)注的“流水線”上。

      目前,中文大模型的數(shù)據(jù)來源是兩類,一類是開源的數(shù)據(jù)集;一類是通過爬蟲爬來的中文互聯(lián)網(wǎng)數(shù)據(jù)。

      中文大模型表現(xiàn)不夠好的主要原因之一就是互聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量,比如,專業(yè)人士在查找資料的時(shí)候一般不會(huì)用百度。

      因此,在面對(duì)一些較為專業(yè)、垂直的數(shù)據(jù)問題,例如醫(yī)療、金融等,就要與專業(yè)團(tuán)隊(duì)合作。

      可這時(shí),問題又來了:對(duì)于專業(yè)團(tuán)隊(duì)來說,在數(shù)據(jù)方面不僅回報(bào)周期長,而且先行者很有可能會(huì)吃虧。

      例如,某家標(biāo)注團(tuán)隊(duì)花了很多錢和時(shí)間,做了很多數(shù)據(jù),別人可能花很少的錢就可以直接打包買走。

      面對(duì)這樣的“搭便車?yán)Ь?rdquo;,國內(nèi)大模型紛紛陷入了數(shù)據(jù)雖多,但質(zhì)量卻不高的詭異困境。

      既然如此,那目前國外一些較為*的AI企業(yè),如OpenAI,他們是怎么解決這一問題的?

      其實(shí),在數(shù)據(jù)標(biāo)注方面,OpenAI也沒有放棄使用廉價(jià)的密集勞動(dòng)來降低成本,

      例如,此前就曝出其曾以2美元/小時(shí)的價(jià)格,雇傭了大量肯尼亞勞工進(jìn)行有毒信息的標(biāo)注工作。

      但關(guān)鍵的區(qū)別,就在于如何解決數(shù)據(jù)質(zhì)量和標(biāo)注效率的問題。

      具體來說,OpenAI在這方面,與國內(nèi)企業(yè)*的不同,就在于如何降低人工標(biāo)注的“主觀性”、“不穩(wěn)定性”的影響。

      02 OpenAI的方式

      為了降低這樣人類標(biāo)注員的“主觀性”和“不穩(wěn)定性”,OpenAI大致采用了兩個(gè)主要的策略:

      1、人工反饋與強(qiáng)化學(xué)習(xí)相結(jié)合;

      這里先說說*點(diǎn),在標(biāo)注方式上,OpenAI的人工反饋,與國內(nèi)*的區(qū)別,就在于其主要是對(duì)智能系統(tǒng)的行為進(jìn)行排序或評(píng)分,而不是對(duì)其輸出進(jìn)行修改或標(biāo)注。

      智能系統(tǒng)的行為,是指智能系統(tǒng)在一個(gè)復(fù)雜的環(huán)境中,根據(jù)自己的目標(biāo)和策略,做出一系列的動(dòng)作或決策。

      例如玩一個(gè)游戲、控制一個(gè)機(jī)器人、與一個(gè)人對(duì)話等。

      智能系統(tǒng)的輸出,則是指在一個(gè)簡(jiǎn)單的任務(wù)中,根據(jù)輸入的數(shù)據(jù),生成一個(gè)結(jié)果或回答,例如寫一篇文章、畫一幅畫。

      通常來說,智能系統(tǒng)的行為比輸出更難以用“正確”或“錯(cuò)誤”來判斷,更需要用偏好或滿意度來評(píng)價(jià)。

      而這種以“偏好”或“滿意度”為標(biāo)準(zhǔn)的評(píng)價(jià)體系,由于不需要修改或標(biāo)注具體的內(nèi)容,從而減少了人類主觀性、知識(shí)水平等因素對(duì)數(shù)據(jù)標(biāo)注質(zhì)量以及準(zhǔn)確性的影響。

      誠然,國內(nèi)企業(yè)在進(jìn)行標(biāo)注時(shí),也會(huì)使用類似“排序”、“打分”的體系,但由于缺乏OpenAI那樣的“獎(jiǎng)勵(lì)模型”作為獎(jiǎng)勵(lì)函數(shù)來優(yōu)化智能系統(tǒng)的策略,這樣的“排序”和“打分”,本質(zhì)上仍然是一種對(duì)輸出進(jìn)行修改或標(biāo)注的方法。

      2、多樣化、大規(guī)模的數(shù)據(jù)來源渠道;

      國內(nèi)的數(shù)據(jù)標(biāo)注來源主要是第三方標(biāo)注公司或科技公司自建團(tuán)隊(duì),這些團(tuán)隊(duì)多為本科生組成,缺乏足夠的專業(yè)性和經(jīng)驗(yàn),難以提供高質(zhì)量和高效率的反饋。

      而相較之下,OpenAI的人工反饋則來自多個(gè)渠道和團(tuán)隊(duì)。

      OpenAI不僅使用開源數(shù)據(jù)集和互聯(lián)網(wǎng)爬蟲來獲取數(shù)據(jù),還與多家數(shù)據(jù)公司和機(jī)構(gòu)合作,例如Scale AI、Appen、Lionbridge AI等,來獲取更多樣化和高質(zhì)量的數(shù)據(jù)。

      與國內(nèi)的同行相比,這些數(shù)據(jù)公司和機(jī)構(gòu)標(biāo)注的手段要“自動(dòng)”和“智能”得多。

      例如,Scale AI使用了一種稱為 Snorkel的技術(shù),它是一種基于弱監(jiān)督學(xué)習(xí)的數(shù)據(jù)標(biāo)注方法,可以從多個(gè)不精確的數(shù)據(jù)源中生成高質(zhì)量的標(biāo)簽。

      同時(shí),Snorkel還可以利用規(guī)則、模型、知識(shí)庫等多種信號(hào)來為數(shù)據(jù)添加標(biāo)簽,而不需要人工直接標(biāo)注每個(gè)數(shù)據(jù)點(diǎn)。這樣可以大大減少人工標(biāo)注的成本和時(shí)間。

      在數(shù)據(jù)標(biāo)注的成本、周期縮短的情況下,這些具備了競(jìng)爭(zhēng)優(yōu)勢(shì)的數(shù)據(jù)公司,再通過選擇高價(jià)值、高難度、高門檻的細(xì)分領(lǐng)域,如自動(dòng)駕駛、大語言模型、合成數(shù)據(jù)等,就可不斷提升自己的核心競(jìng)爭(zhēng)力和差異化優(yōu)勢(shì)。

      如此一來,“先行者會(huì)吃虧”的搭便車?yán)Ь,也被?qiáng)大的技術(shù)和行業(yè)壁壘給消弭了。

      03標(biāo)準(zhǔn)化VS小作坊

      由此可見,AI自動(dòng)標(biāo)注技術(shù),真正淘汰的只是那些還在使用純?nèi)斯さ臉?biāo)注公司。

      盡管數(shù)據(jù)標(biāo)注聽上去是一個(gè)“勞動(dòng)密集型”產(chǎn)業(yè),但是一旦深入細(xì)節(jié),便會(huì)發(fā)現(xiàn),追求高質(zhì)量的數(shù)據(jù)并不是一件容易的事。

      以海外數(shù)據(jù)標(biāo)注的獨(dú)角獸Scale AI為代表,Scale AI不僅僅在使用非洲等地的廉價(jià)人力資源,同樣還招聘了數(shù)十名博士,來應(yīng)對(duì)各行業(yè)的專業(yè)數(shù)據(jù)。

      數(shù)據(jù)標(biāo)注質(zhì)量,是Scale AI為OpenAI等大模型企業(yè)提供的*價(jià)值。

      而要想*程度地保障數(shù)據(jù)質(zhì)量,除了前面提到的使用AI輔助標(biāo)注外,Scale AI的另一大創(chuàng)新,就是了一個(gè)統(tǒng)一的數(shù)據(jù)平臺(tái)。

      這些平臺(tái),包括了Scale Audit、Scale Analytics、ScaleData Quality 等。通過這些平臺(tái),客戶可以監(jiān)控和分析標(biāo)注過程中的各種指標(biāo),并對(duì)標(biāo)注數(shù)據(jù)進(jìn)行校驗(yàn)和優(yōu)化,評(píng)估標(biāo)注的準(zhǔn)確性、一致性和完整性。

      可以說,這樣標(biāo)準(zhǔn)化、統(tǒng)一化的工具與流程,成為了區(qū)分標(biāo)注企業(yè)中“流水線工廠”和“手工小作坊”的關(guān)鍵因素。

      在這方面,目前國內(nèi)大部分的標(biāo)注企業(yè),都仍在使用“人工審核”的方式來審核數(shù)據(jù)標(biāo)注的質(zhì)量,只有百度等少數(shù)巨頭引入了較為先進(jìn)的管理和評(píng)估工具,如EasyData智能數(shù)據(jù)服務(wù)平臺(tái)。

      如果在關(guān)鍵的數(shù)據(jù)審核方面,沒有專門的工具來監(jiān)控和分析標(biāo)注結(jié)果和指標(biāo),那對(duì)數(shù)據(jù)質(zhì)量的把關(guān),就仍舊只能淪為靠“老師傅”眼力見的作坊式水準(zhǔn)。

      因此,越來越多的國內(nèi)企業(yè),如百度、龍貓數(shù)據(jù)等,都開始利用機(jī)器學(xué)習(xí)和人工智能技術(shù),提高數(shù)據(jù)標(biāo)注的效率和質(zhì)量,實(shí)現(xiàn)人機(jī)協(xié)作的模式。

      由此可見,AI標(biāo)注的出現(xiàn),并不是國內(nèi)標(biāo)注企業(yè)的末日,而只是一種低效、廉價(jià)、缺乏技術(shù)含量的勞動(dòng)密集型標(biāo)注方式的末日。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。