正式實(shí)習(xí)的第 一天,晨曦感覺(jué)自己可能“被騙”了。
剛剛結(jié)束完學(xué)校的畢業(yè)論文,準(zhǔn)研究生晨曦準(zhǔn)備給自己找點(diǎn)事做。投遞了幾份簡(jiǎn)歷之后,很快,國(guó)內(nèi)某互聯(lián)網(wǎng)大廠(chǎng)的人工智能編輯崗位(翻譯方向)向她發(fā)出了邀請(qǐng)。
職位描述上寫(xiě)著:
1. 為人工智能機(jī)器學(xué)習(xí)提供優(yōu)質(zhì)的語(yǔ)料,復(fù)制模型訓(xùn)練迭代;
2. 與技術(shù)組對(duì)接需求,按時(shí)交付優(yōu)質(zhì)合格的數(shù)據(jù),對(duì)編輯結(jié)果質(zhì)量負(fù)責(zé)。
對(duì)于不了解模型訓(xùn)練的晨曦來(lái)說(shuō),這看上去似乎是一份相當(dāng)不錯(cuò)的實(shí)習(xí)。
晨曦面試的是翻譯方向,這與她所就讀的英語(yǔ)專(zhuān)業(yè)十分契合;年初ChatGPT在國(guó)內(nèi)爆火,晨曦日常就有使用AI產(chǎn)品的習(xí)慣,符合自己的興趣愛(ài)好;另外,能有機(jī)會(huì)參與新興的科技產(chǎn)業(yè)發(fā)展對(duì)于文科生來(lái)說(shuō)可遇不可求;當(dāng)然,最 大的吸引力來(lái)自于這家互聯(lián)網(wǎng)大廠(chǎng)。在過(guò)去幾年內(nèi),這家公司已經(jīng)成功吸引了無(wú)數(shù)年輕學(xué)生前仆后繼。從某種角度來(lái)說(shuō),簡(jiǎn)歷上的大廠(chǎng)名字足以成為自身能力的象征。
只是,除了招聘頁(yè)面上簡(jiǎn)單的職位描述,晨曦沒(méi)有從面試官那里獲得關(guān)于這份實(shí)習(xí)更多的信息。
“我當(dāng)時(shí)為什么覺(jué)得被騙,就是因?yàn)槊嬖嚨臅r(shí)候HR基本都聚焦在翻譯相關(guān)的問(wèn)題。”在面試中做了幾道翻譯題之后,晨曦順利拿到了offer。一直到工作之前,她都以為這是一份翻譯的工作。
感到“被騙”的不止晨曦一人。
作為人工智能編輯最早的一批實(shí)習(xí)生,楊小云在2月底也來(lái)到了這家大廠(chǎng)。面試官表示,這是一份對(duì)信息抓取、語(yǔ)言概括和文字編輯等能力要求很高的工作。
實(shí)際上手之后她意識(shí)到:“HR描述的工作跟實(shí)操的工作,完全是兩件事情。說(shuō)得再天花亂墜,其實(shí)也是一個(gè)‘打標(biāo)’的工作。”
如今,人工智能熱潮帶火了這些以假亂真的聊天機(jī)器人,以及通過(guò)簡(jiǎn)單提示就能生成圖片的繪畫(huà)軟件。大模型的現(xiàn)象級(jí)出圈,使得數(shù)據(jù)、算法、算力作為訓(xùn)練大模型的基礎(chǔ)而備受關(guān)注,數(shù)據(jù)標(biāo)注就是數(shù)據(jù)環(huán)節(jié)必不可少的一部分。
2007年,時(shí)任普林斯頓大學(xué)計(jì)算機(jī)科學(xué)系的助理教授李飛飛開(kāi)啟了一個(gè)名為ImageNet的項(xiàng)目,希望擴(kuò)展可用于訓(xùn)練AI算法的數(shù)據(jù)。
為了給每個(gè)單詞提供盡可能多的視覺(jué)案例,亞馬遜眾包平臺(tái)Mechanical Turk上的近5萬(wàn)名工人,花了兩年半的時(shí)間標(biāo)記出圖片中的對(duì)象,例如氣球、草莓等共計(jì)320萬(wàn)張圖片。這些工人來(lái)自全球的167個(gè)國(guó)家,大多分布在人工成本低廉的地區(qū)。
《時(shí)代》雜志的一項(xiàng)調(diào)查發(fā)現(xiàn),為了減少ChatGPT數(shù)據(jù)集中關(guān)于暴力、性別歧視和種族主義等內(nèi)容,OpenAI使用了每小時(shí)收入不到2美元的肯尼亞勞工!杜聿┥纭穲(bào)道,谷歌的AI聊天機(jī)器人Bard由數(shù)千名合同工訓(xùn)練,他們只有3分鐘的時(shí)間來(lái)審閱、標(biāo)注完Bard的回答。
在過(guò)去很長(zhǎng)一段時(shí)間里,數(shù)據(jù)標(biāo)注對(duì)語(yǔ)言與圖像識(shí)別的認(rèn)知要求都并不高。大模型時(shí)代,數(shù)據(jù)標(biāo)注從圖像轉(zhuǎn)向語(yǔ)言,要求更高、更垂直,需要特定領(lǐng)域的專(zhuān)業(yè)知識(shí)和流暢的語(yǔ)言能力。
但對(duì)于普通的數(shù)據(jù)標(biāo)注員來(lái)說(shuō),它依然是一份不斷重復(fù)的低技術(shù)含量的工作。
正如同這些“被騙”的名校學(xué)生進(jìn)大廠(chǎng)實(shí)習(xí)一樣,他們沒(méi)辦法說(shuō)清,自己的工作是為了實(shí)現(xiàn)什么樣的目的,有什么價(jià)值。他們往往只有一個(gè)模糊的認(rèn)識(shí),為了“訓(xùn)練大模型”。
以晨曦和楊小云為代表的人工智能編輯實(shí)習(xí)生,便因?yàn)橛?xùn)練大模型的需要而誕生。這些受到熱捧的大模型,讓實(shí)習(xí)生們懷揣著好奇和憧憬進(jìn)入,同時(shí),也讓他們感受到背后真實(shí)的混亂和價(jià)值感匱乏。
1.當(dāng)大學(xué)生涌入大模型數(shù)據(jù)標(biāo)注
人們通常會(huì)認(rèn)為,數(shù)據(jù)標(biāo)注員是一群身處三四線(xiàn)城市、低學(xué)歷、高年齡的群體。事實(shí)上這也的確是此前國(guó)內(nèi)數(shù)據(jù)標(biāo)注員的現(xiàn)狀。
根據(jù)人社部2021年發(fā)布的《人工智能訓(xùn)練師國(guó)家職業(yè)技能標(biāo)準(zhǔn)》,人工智能訓(xùn)練師的普遍受教育程度是初中畢業(yè)(或相當(dāng)文化程度)。他們可能分散在河北、河南、山東、山西等傳統(tǒng)勞動(dòng)密集型企業(yè)選址的地區(qū),甚至更偏遠(yuǎn)的山區(qū)——在那里,數(shù)據(jù)標(biāo)注是扶貧的試點(diǎn)項(xiàng)目。
但改變已經(jīng)隨著大模型的出現(xiàn)而發(fā)生。
讓楊小云感到無(wú)聊的,其實(shí)就是為訓(xùn)練大模型而做的數(shù)據(jù)標(biāo)注工作。
經(jīng)過(guò)簡(jiǎn)單的培訓(xùn)和考核之后,楊小云被安排進(jìn)了文字編輯組。她每天的工作就是回答題庫(kù)中的問(wèn)題,目的是通過(guò)標(biāo)注者人工書(shū)寫(xiě)答案來(lái)優(yōu)化大模型的訓(xùn)練過(guò)程。
一個(gè)問(wèn)題的回答步驟經(jīng)過(guò)嚴(yán)格把控。以游戲《原神》為例,如果收到“夜蘭的圣遺物是什么?”的問(wèn)題,楊小云需要把回答拆分成幾個(gè)段落:首先夜蘭是什么?其次圣遺物是什么?最后夜蘭的圣遺物配對(duì)什么?
在指定的搜索引擎上搜集資料,完成回答的編輯之后,最終以Markdown的形式完成提交。
除了簡(jiǎn)單易答的問(wèn)題,楊小云的大多數(shù)時(shí)間都花在了自己完全不熟悉的專(zhuān)業(yè)領(lǐng)域,例如經(jīng)濟(jì)專(zhuān)區(qū)、法律專(zhuān)區(qū)等。
顯而易見(jiàn),這與以往的數(shù)據(jù)標(biāo)注工作完全不同。
在大模型出現(xiàn)之前,數(shù)據(jù)標(biāo)注的場(chǎng)景通常都是幾百人的工廠(chǎng),一人一臺(tái)電腦,只有鼠標(biāo)鍵盤(pán)噼里啪啦的聲音。而他們一天8小時(shí)的工作時(shí)間內(nèi),都只做一件簡(jiǎn)單重復(fù)的事情:在不同的圖片中框出機(jī)動(dòng)車(chē)、非機(jī)動(dòng)車(chē)、行人、紅綠燈(目標(biāo)檢測(cè));或者劃出一段話(huà)的主語(yǔ)、謂語(yǔ)、賓語(yǔ)(語(yǔ)義分割)。
這些針對(duì)圖片視頻的拉框和文本的語(yǔ)義分割,都是對(duì)已有數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)標(biāo)注員本身并不用給出“創(chuàng)造性結(jié)論”。但針對(duì)大模型的數(shù)據(jù)標(biāo)注并非如此。數(shù)據(jù)標(biāo)注員除了需要對(duì)已有數(shù)據(jù)進(jìn)行處理之外,還需要對(duì)問(wèn)題進(jìn)行解答,給出正確的結(jié)論。
根據(jù)觀(guān)研天下數(shù)據(jù)中心2023年發(fā)布的《中國(guó)數(shù)據(jù)標(biāo)注行業(yè)現(xiàn)狀深度分析與投資趨勢(shì)研究報(bào)告(2023-2030年)》,在ChatGPT發(fā)布之前,AI訓(xùn)練數(shù)據(jù)標(biāo)注以語(yǔ)音和計(jì)算機(jī)視覺(jué)為主,自然語(yǔ)言處理(NLP)的需求不足15%。
隨著ChatGPT聊天機(jī)器人成為AIGC的現(xiàn)象級(jí)應(yīng)用,對(duì)更偏情緒判斷、考驗(yàn)理解能力甚至推理能力等高質(zhì)量文字標(biāo)注任務(wù)的需求正在越來(lái)越多。
“(大模型)項(xiàng)目的復(fù)雜度變得比以前高了,對(duì)人員的要求也相對(duì)不一樣了。”星塵數(shù)據(jù)產(chǎn)品部負(fù)責(zé)人告訴「甲子光年」,“自動(dòng)駕駛偏視覺(jué)信息的識(shí)別標(biāo)注,更偏體力活的工作,對(duì)員工進(jìn)行一些培訓(xùn),他們經(jīng)過(guò)上手拉框,熟練快捷鍵,掌握一些技巧之后,能很快勝任。但是大模型所需要的是一個(gè)完整的、結(jié)構(gòu)化的、多元化的、包羅萬(wàn)象的數(shù)據(jù)體系,需要四層數(shù)據(jù)來(lái)支撐模型的搭建和提升。這些數(shù)據(jù)涉及預(yù)訓(xùn)練、SFT(有監(jiān)督微調(diào),Supervised Fine-Tuning)、RLHF(基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí),Reinforcement Learning from Human Feedback),私有化部署等等,針對(duì)不同行業(yè)的需求,我們發(fā)布了COSMO大模型數(shù)據(jù)金字塔解決方案;對(duì)于大模型數(shù)據(jù)標(biāo)注員來(lái)說(shuō),標(biāo)注COSMO的數(shù)據(jù)不是做選擇題,也不是簡(jiǎn)單的閱讀理解、文本編輯,而是讓你創(chuàng)造問(wèn)答,創(chuàng)造內(nèi)容了。”
云測(cè)數(shù)據(jù)總經(jīng)理賈宇航將大模型的訓(xùn)練數(shù)據(jù)劃分為基礎(chǔ)數(shù)據(jù)、場(chǎng)景數(shù)據(jù)和場(chǎng)景數(shù)據(jù)優(yōu)化三個(gè)階段。他將這三個(gè)階段類(lèi)比成學(xué)習(xí)的過(guò)程。
“對(duì)于拉框這種基礎(chǔ)的數(shù)據(jù)標(biāo)注會(huì)比較簡(jiǎn)單,會(huì)電腦操作、學(xué)一學(xué)即會(huì);場(chǎng)景數(shù)據(jù)是在特定環(huán)節(jié)做定向研發(fā)時(shí)所需要的特定領(lǐng)域的數(shù)據(jù),需要學(xué)習(xí)相關(guān)領(lǐng)域知識(shí)以達(dá)到標(biāo)注要求;到三個(gè)階段,基于投入使用中持續(xù)的迭代和優(yōu)化,技能和領(lǐng)域知識(shí)的要求會(huì)更加精進(jìn)。”賈宇航表示。
在這種工作需求之下,越來(lái)越多的大模型公司對(duì)數(shù)據(jù)標(biāo)注員的需求,也從過(guò)去的低學(xué)歷向高學(xué)歷轉(zhuǎn)變,并且這種需求正越來(lái)越多。
在國(guó)內(nèi)主流的求職平臺(tái)上,已有不少關(guān)于大模型的數(shù)據(jù)標(biāo)注崗正在招聘。這些崗位要求標(biāo)注員的學(xué)歷在本科以上。百度此前曾表示,其位于?诘拇竽P蛿(shù)據(jù)標(biāo)注基地有數(shù)百位數(shù)據(jù)標(biāo)注員,本科率已達(dá)100%。
圖片來(lái)源:BOSS直聘&脈脈
2.苛刻的大模型數(shù)據(jù)標(biāo)注
通常來(lái)說(shuō),訓(xùn)練一個(gè)大模型,需要以下3個(gè)步驟:
資料來(lái)源:OpenAI《Introducing ChatGPT》
這些重復(fù)性的工作背后,實(shí)際上是為了實(shí)現(xiàn)“根據(jù)人類(lèi)反饋進(jìn)行強(qiáng)化學(xué)習(xí)”(Reinforcement Learning from Human Feedback)的技術(shù),GPT-3.5的最 大提升便來(lái)自于此,其中的關(guān)鍵,是人(Labeler)的參與,也就是這些數(shù)據(jù)標(biāo)注員。
從上述RLHF三步驟來(lái)看,步驟一與步驟二相對(duì)更重要,因?yàn)樗鼪Q定了訓(xùn)練獎(jiǎng)勵(lì)模型所必須的數(shù)據(jù)質(zhì)量的高低。而這兩個(gè)步驟中的數(shù)據(jù)標(biāo)注實(shí)習(xí)生,也被分成了“編輯組”與“排序組”兩個(gè)核心小組。
編輯組的工作就是回答題庫(kù)中的問(wèn)題;而排序組的工作則是給生成的答案(包括模型和人工生成的答案)進(jìn)行優(yōu)劣排序。
丁小雨在7月份加入文字編輯。同為英語(yǔ)專(zhuān)業(yè)的丁小雨和晨曦一樣,期待著一份翻譯工作能提高專(zhuān)業(yè)水平,但她的工作其實(shí)也與英語(yǔ)并不相關(guān)。
對(duì)比2月份楊小云實(shí)習(xí)的時(shí)候,丁小雨面臨的文字編輯組變得更加細(xì)分,每個(gè)實(shí)習(xí)生要選擇一個(gè)垂直方向,例如娛樂(lè)、物理、政治等,答案的要求也變得更加詳細(xì)。
一道古詩(shī)文的選擇題,不能只解釋答案,而要先從題型開(kāi)始介紹,然后是詩(shī)文的翻譯以及背景,最后是每個(gè)選項(xiàng)正確與否的分析,最重要的是要對(duì)標(biāo)3月14日OpenAI發(fā)布的GPT-4。
“要參考它的答案,又不能跟它的答案雷同,還要比它的答案好。”丁小雨很無(wú)奈。
而晨曦被安排進(jìn)的是排序組,每天為問(wèn)題對(duì)應(yīng)的多個(gè)回答進(jìn)行排序,以確定不同答案的優(yōu)劣。
排序的結(jié)果是需要被明確量化的。她需要從有用性、真實(shí)性、相關(guān)性、安全性等不同角度對(duì)回答進(jìn)行評(píng)分,并且寫(xiě)下原因。這是為了讓機(jī)器無(wú)限接近人類(lèi)期待的答案。
晨曦發(fā)現(xiàn)自己有時(shí)候不得不在幾個(gè)糟糕的回答之間做出選擇。而當(dāng)所有的回答都不好時(shí),她被要求自己寫(xiě)出更好的回答。
編輯組的丁小雨面臨的要求更加苛刻。每個(gè)回答在合格交付之前將要面臨兩道審核。第 一道來(lái)自組長(zhǎng):“做完幾道題就要開(kāi)審核的會(huì),給我們挑毛病,直到改到組長(zhǎng)滿(mǎn)意為止。”第二道來(lái)自于總部,總部審核通過(guò)才算結(jié)束。
一次,因?yàn)楦袷降腻e(cuò)誤,丁小雨的大多數(shù)回答被判了全錯(cuò)。“可能調(diào)一下順序就可以了,但是他們不在意你是回答的內(nèi)容錯(cuò)了,還是格式出現(xiàn)問(wèn)題,直接就是全錯(cuò)。”
更令丁小雨崩潰的是,組長(zhǎng)直接表示,如果再錯(cuò)這么多就可能勸退她。
為大模型做數(shù)據(jù)標(biāo)注是一件*的結(jié)果導(dǎo)向的工作。不管在做的過(guò)程中付出了多少努力,只要效果不好,之前的一切努力就會(huì)被全盤(pán)否定。
但問(wèn)題在于,無(wú)論是編輯組的答案輸出,還是排序組的答案排序,都是一個(gè)非常主觀(guān)的工作。數(shù)據(jù)標(biāo)注實(shí)習(xí)生們很難把控一個(gè)答案到底是好是壞;針對(duì)同一個(gè)問(wèn)題,不同實(shí)習(xí)生往往也會(huì)給出不同的答案。
為了解決這一問(wèn)題,大模型數(shù)據(jù)標(biāo)注團(tuán)隊(duì)每天必須進(jìn)行的一項(xiàng)工作就是開(kāi)“審核會(huì)”——在公司內(nèi)部被稱(chēng)為“拉齊會(huì)”,目的就是拉齊答案的標(biāo)準(zhǔn),拉齊每個(gè)人的理解,拉齊所有的建議。
只是,要實(shí)現(xiàn)真正的拉齊,是一件頗為費(fèi)勁的事。這就像高考閱卷一樣,不同的人會(huì)分到同樣的題目,如果評(píng)分不一致,就要不斷調(diào)整直到得出一個(gè)統(tǒng)一的分?jǐn)?shù)。
在晨曦的印象里,每天都有兩三小時(shí)的時(shí)間花在會(huì)議上。會(huì)議開(kāi)到最后,往往敲定的是最簡(jiǎn)單粗暴的解決方法,少數(shù)服從多數(shù),她形容為“沒(méi)有價(jià)值在創(chuàng)造價(jià)值”。
不過(guò),比起大家坐在一起“人為”拉齊答案標(biāo)準(zhǔn),一個(gè)更令人頭大的問(wèn)題是:標(biāo)準(zhǔn)并非人為拉齊之后就可以一勞永逸,而是要不斷根據(jù)模型輸出的反饋進(jìn)行調(diào)整。
每天上班的第 一件事,楊小云需要確認(rèn)當(dāng)天是否下發(fā)了新的標(biāo)注標(biāo)準(zhǔn),大到回答的框架,段落的拆分,小到搜索引擎的選擇,空格、標(biāo)點(diǎn)符號(hào)等格式。但標(biāo)準(zhǔn)一直在變。一旦發(fā)現(xiàn)投喂的數(shù)據(jù)在機(jī)器上不奏效,標(biāo)準(zhǔn)就需要重新制定,全部問(wèn)題跟著推翻重寫(xiě)。
“這就好像織布一樣,是織橫紋還是豎紋?是織芝麻扣還是麥子扣?但是不管是什么扣,都只能放進(jìn)程序里跑,發(fā)現(xiàn)跑不出來(lái)就要換一種方法。”楊小云向「甲子光年」解釋。這個(gè)比喻的背后是,如果數(shù)據(jù)標(biāo)注給出的答案,在獎(jiǎng)勵(lì)模型的訓(xùn)練過(guò)程中可能沒(méi)有達(dá)到預(yù)期的效果,就要調(diào)整標(biāo)準(zhǔn)。
標(biāo)準(zhǔn)變更,意味著上一次拉齊會(huì)結(jié)論的失效,標(biāo)準(zhǔn)又要重新拉齊。
“又冗余又高效,每天都在非常高效地說(shuō)一些廢話(huà)。”楊小云吐槽。
3.被大廠(chǎng)薅羊毛的高材生
一邊是每天開(kāi)不完的拉齊會(huì),一邊是隨時(shí)可能變更的數(shù)據(jù)標(biāo)準(zhǔn)。很多像晨曦一樣被大廠(chǎng)光鮮亮麗的招牌吸引進(jìn)來(lái)的高材生們,卻在一次次內(nèi)耗中喪失了自己最初的心氣,最終選擇離開(kāi)。
這些實(shí)習(xí)生的共同特點(diǎn)是高學(xué)歷。招聘要求是本科以上,但許多實(shí)習(xí)生擁有碩士研究生的文憑。
他們中不少人受過(guò)中國(guó)乃至世界*大學(xué)的教育。楊小云的身邊有來(lái)自北大、帝國(guó)理工的學(xué)生,晨曦工位旁的實(shí)習(xí)生來(lái)自南開(kāi)、電子科大;丁小雨在培訓(xùn)的時(shí)候被明確告知,實(shí)習(xí)生的學(xué)歷是經(jīng)過(guò)篩選的。“他(面試官)說(shuō)像我們這樣高學(xué)歷的大學(xué)生,學(xué)習(xí)東西比較快,容易上手”。
管理一幫聰明人從來(lái)都不是一件容易的事。因?yàn)檫@些人很容易從不斷重復(fù)的動(dòng)作中發(fā)現(xiàn)工作的本質(zhì),進(jìn)而質(zhì)疑這份工作對(duì)自己的未來(lái)是否真的有價(jià)值。
丁小雨形容自己的工作“沒(méi)什么價(jià)值,很內(nèi)耗”。
每天早上來(lái)到工位,打開(kāi)顯示屏和筆記本,一邊用筆記本查看規(guī)則,一邊在顯示屏上編寫(xiě)回答,丁小雨能清晰地感受到詳細(xì)的規(guī)則和流程讓自己逐漸失去了思考的空間,把她規(guī)訓(xùn)成了一個(gè)機(jī)器。“沒(méi)有學(xué)到東西,而且也沒(méi)有精力去學(xué)習(xí)其他的東西,就慢慢喪失學(xué)習(xí)的動(dòng)力和做其他事情的熱情。”
丁小雨還在脫敏組待過(guò),但實(shí)際工作和“脫敏”這個(gè)詞沒(méi)有根本聯(lián)系,只是使用不同的聊天機(jī)器人與企業(yè)內(nèi)測(cè)的產(chǎn)品回答相同的問(wèn)題,并對(duì)答案進(jìn)行對(duì)比打分。只干了幾天,她又被調(diào)到過(guò)文字校對(duì)組,要做的是修改pdf格式轉(zhuǎn)換成Word格式時(shí)出現(xiàn)的錯(cuò)誤,主要是錯(cuò)別字和標(biāo)點(diǎn)符號(hào)。在這個(gè)她形容為“接近崩潰”的過(guò)程中,她每天要完成25頁(yè)與醫(yī)療相關(guān)的糾錯(cuò)任務(wù)。
在面試過(guò)程中,面試官曾問(wèn)丁小雨能不能接受一份比較枯燥和重復(fù)的工作。“我當(dāng)時(shí)回答是能接受。我想所有候選人的回答應(yīng)該都是能夠接受。”因?yàn)楸究浦挥幸欢螌?shí)習(xí)經(jīng)歷,帶著積累更多實(shí)習(xí)和體驗(yàn)大廠(chǎng)的期待,即使抱著懷疑的想法,丁小雨還是選擇了入職。
在短短兩個(gè)月中,丁小雨已經(jīng)算是同期實(shí)習(xí)生中堅(jiān)持到最后的人。她親眼見(jiàn)到許多實(shí)習(xí)生躊躇滿(mǎn)志地進(jìn)來(lái),又垂頭喪氣地離開(kāi)。
人類(lèi)學(xué)家大衛(wèi)·格雷伯將“狗屁工作”(bullshit jobs)定義為沒(méi)有意義或目的的工作,本該被機(jī)器自動(dòng)化淘汰掉的工作,卻因?yàn)檠b點(diǎn)門(mén)面、討好上級(jí)、填補(bǔ)系統(tǒng)漏洞而繼續(xù)存在。數(shù)據(jù)標(biāo)注就像是狗屁工作的變體,通常認(rèn)為已經(jīng)被機(jī)器替代,卻仍然需要人類(lèi)完成。
在人工智能熱潮到來(lái)之際,人們往往會(huì)聽(tīng)到這樣的期許:AI可以替代人類(lèi)完成重復(fù)性、乏味的工作,從而讓人類(lèi)有更多時(shí)間和精力去追求更有創(chuàng)造性、成就感的工作。
但也有可能的是,人工智能像過(guò)去節(jié)省勞動(dòng)力的技術(shù)一樣,如電話(huà)和打字機(jī),克服了信息傳遞和手寫(xiě)的苦惱,但也產(chǎn)生了大量的通訊、文書(shū)工作,以至于需要配備新的人工來(lái)進(jìn)行管理,例如前臺(tái)、文員。AI可能不會(huì)替代人類(lèi),但會(huì)創(chuàng)造出更加乏味、枯燥、孤立的工作。
除了無(wú)法獲得工作價(jià)值認(rèn)同之外,到手的薪資,恐怕也不能讓這幫高材生們實(shí)現(xiàn)“價(jià)格認(rèn)同”。
據(jù)「甲子光年」了解,這些數(shù)據(jù)標(biāo)注實(shí)習(xí)生的工資并不高。如果位于一線(xiàn)城市的工位,大多數(shù)人工智能實(shí)習(xí)生的工資是150元/天,兼有房補(bǔ),提供免費(fèi)食堂;位于二線(xiàn)城市,只剩下100元/天,房補(bǔ)也縮減三分之二,20元的餐補(bǔ)替代免費(fèi)餐食。
像丁小雨在二線(xiàn)城市的工位實(shí)習(xí),因?yàn)檗k公地點(diǎn)處在城市中心,地段繁華,一頓外賣(mài)輕輕松松超過(guò)20元的餐補(bǔ)標(biāo)準(zhǔn),基本上都需要用實(shí)習(xí)工資倒貼。
因?yàn)樗麄兇蠖鄶?shù)只是作為訓(xùn)練大模型的基礎(chǔ)標(biāo)注員,可能被統(tǒng)一安排到和專(zhuān)業(yè)毫無(wú)相關(guān)的崗位,又有可能隨時(shí)抽調(diào)到不同的部門(mén),經(jīng)過(guò)短暫的培訓(xùn)后要求快速上手。
丁小雨形容,他們是一批一批被大廠(chǎng)薅羊毛的實(shí)習(xí)生。
晨曦明顯感受到,她不是唯 一感受到期待與實(shí)際工作落差的人。“說(shuō)得直白一點(diǎn),我覺(jué)得這個(gè)工作配不上我。有時(shí)候聊天我會(huì)發(fā)現(xiàn)其他實(shí)習(xí)生可能是985本科,也有海歸的碩士,他們的落差也非常非常大。”
楊小云則表達(dá)得更為直接:“可能是一個(gè)不太恰當(dāng)?shù)谋扔,我媽媽上過(guò)高中,她來(lái)做這個(gè)工作也可以。”
4.“我們其實(shí)是流水線(xiàn)的工人”
事實(shí)上,招聘高材生做一些低技術(shù)含量的工作,給付極低的薪資成本,也是目前大模型數(shù)據(jù)標(biāo)注發(fā)展初期市場(chǎng)混亂的客觀(guān)體現(xiàn)。對(duì)于數(shù)據(jù)標(biāo)注公司來(lái)說(shuō),在大模型目前的發(fā)展階段,數(shù)據(jù)標(biāo)注還沒(méi)有形成統(tǒng)一的標(biāo)準(zhǔn),對(duì)標(biāo)注員也沒(méi)有成型的具體要求。
星塵數(shù)據(jù)產(chǎn)品部負(fù)責(zé)人表示:“隨著大模型基礎(chǔ)能力補(bǔ)齊之后,開(kāi)始向更垂直、更加復(fù)雜能力的發(fā)展過(guò)程中,任務(wù)會(huì)逐步產(chǎn)生變化,要求工具和人員隨之更新迭代。但是,大模型現(xiàn)在還在早期發(fā)展過(guò)程,市場(chǎng)需求對(duì)標(biāo)注員的要求也隨任務(wù)的差異有高有低。相比CV(計(jì)算機(jī)視覺(jué))項(xiàng)目而言,NLP(自然語(yǔ)言處理)的標(biāo)注員對(duì)理解能力、專(zhuān)業(yè)術(shù)語(yǔ)、領(lǐng)域知識(shí)的要求更高,必須能提供準(zhǔn)確、可靠的語(yǔ)料。”
該負(fù)責(zé)人介紹,大模型對(duì)數(shù)據(jù)標(biāo)注提出的難題更多體現(xiàn)在頂層設(shè)計(jì)。對(duì)于每個(gè)數(shù)據(jù)標(biāo)注任務(wù),如何理解客戶(hù)的應(yīng)用場(chǎng)景訴求,進(jìn)行數(shù)據(jù)選擇、數(shù)據(jù)分布設(shè)計(jì)、可高效低成本落地執(zhí)行的pipeline設(shè)計(jì)等一套解決方案的設(shè)計(jì),如何提高平臺(tái)工具的效率和能力,是更大的挑戰(zhàn)。
這其中依賴(lài)著垂直領(lǐng)域?qū)<易鳛楦呒?jí)標(biāo)注員的參與,將領(lǐng)域?qū)I(yè)知識(shí)和經(jīng)驗(yàn)注入解決方案的設(shè)計(jì),甚至參與到數(shù)據(jù)質(zhì)量檢查迭代的過(guò)程中。
數(shù)據(jù)解決方案提供商倍賽科技的運(yùn)營(yíng)負(fù)責(zé)人張子千直言,目前就訓(xùn)練大型模型而言,基礎(chǔ)標(biāo)注員和之前從事框選工作的標(biāo)注員在工作難度、時(shí)薪方面并沒(méi)有明顯的區(qū)別。在為客戶(hù)進(jìn)行大模型微調(diào)并創(chuàng)建垂直領(lǐng)域的解決方案時(shí),最 大的難題在于如何構(gòu)建高質(zhì)量的數(shù)據(jù)集,這需要IT、醫(yī)學(xué)和金融等專(zhuān)業(yè)領(lǐng)域的標(biāo)注專(zhuān)家才能解決,這類(lèi)人才依然稀缺。
OpenAI投入了幾十位博士生進(jìn)行數(shù)據(jù)標(biāo)注的指導(dǎo)和審核,而將基礎(chǔ)的數(shù)據(jù)標(biāo)注外包給了數(shù)據(jù)標(biāo)注公司,分散在非洲、印度等低收入地區(qū)。真正起作用的是那些高級(jí)標(biāo)注員,只占到很小的比例。
通過(guò)對(duì)比百度在北京總部和?跀(shù)據(jù)標(biāo)注基地招聘的標(biāo)注員崗位介紹可以看出,同樣是為了訓(xùn)練大模型,前者為高級(jí)標(biāo)注員,負(fù)責(zé)指導(dǎo)、培訓(xùn)和審核,而后者則是基礎(chǔ)的數(shù)據(jù)標(biāo)注員,兩者在薪資水平上千差萬(wàn)別。
圖片來(lái)源:BOSS直聘
也就是說(shuō),那些更高級(jí)別的高級(jí)標(biāo)注員其實(shí)才是大模型訓(xùn)練的關(guān)鍵人才,他們的工作更具技術(shù)含量、價(jià)值更高,同時(shí)人力成本也更高。
對(duì)比之下,這些來(lái)自名校的實(shí)習(xí)生們,即使是為了訓(xùn)練大模型而來(lái),從現(xiàn)階段來(lái)說(shuō),也與過(guò)去那些數(shù)據(jù)標(biāo)注員在本質(zhì)上并無(wú)差別。
實(shí)習(xí)生之間常常開(kāi)玩笑,他們并不是在大廠(chǎng),而是在互聯(lián)網(wǎng)富士康,自己是流水線(xiàn)上的工人。他們既看不到自己的工作成果最終通向何方,也無(wú)法與身邊的人產(chǎn)生橫向的意義鏈條。
這種“互聯(lián)網(wǎng)富士康”的玩笑,指的不僅僅是這些實(shí)習(xí)生的工作,就連工作量與管理模式,也幾乎與工廠(chǎng)流水線(xiàn)看齊。
實(shí)習(xí)生們每天要完成的工作量,都有規(guī)定的人效紅線(xiàn)。對(duì)于楊小云來(lái)說(shuō),她一天需要標(biāo)注滿(mǎn)32條問(wèn)題,如果沒(méi)有達(dá)到紅線(xiàn)要求,就要匯報(bào)原因或者加班把它干完。而完成工作的前提,是不斷變換的拉齊會(huì)標(biāo)準(zhǔn),以及不停的資料搜集。
為了最快速度完成模型訓(xùn)練,標(biāo)注團(tuán)隊(duì)面臨的是高壓式的管理。楊小云所在的小組工作時(shí)間禁止說(shuō)話(huà),閑聊幾句的代價(jià)可能會(huì)新增額外的任務(wù)量,完不成工作會(huì)在群里被瘋狂提醒,甚至生病請(qǐng)假也可能會(huì)被正職的加急電話(huà)打擾。
此外,為了保證數(shù)據(jù)不被泄密,數(shù)據(jù)標(biāo)注跨組別的交流是明令禁止的。即使不同小組的實(shí)習(xí)生安排在臨近的位置,也不能討論工作內(nèi)容。這些實(shí)習(xí)生們都不知道,在企業(yè)內(nèi)部,數(shù)據(jù)標(biāo)注到底有多少細(xì)分的組,有多少實(shí)習(xí)生。一個(gè)組可能有10人、40人、50人、60人,每層樓會(huì)有上百人。
在高壓的人效紅線(xiàn)之下,只有遇到違禁的題目能讓楊小云短暫“高興”一下。因?yàn)樯婕暗奖┝、色情、血腥的?nèi)容要直接去掉,但還可以算到個(gè)人的工作條數(shù)。“相當(dāng)于擰到了一個(gè)壞的螺絲,你只會(huì)很高興這個(gè)螺絲不用你擰了”。早上分工的時(shí)候,實(shí)習(xí)生之間甚至爭(zhēng)著領(lǐng)違禁問(wèn)題。
在楊小云提前離職之后,她經(jīng)常刷到同期實(shí)習(xí)生深夜10點(diǎn),甚至12點(diǎn)還在公司開(kāi)會(huì)的朋友圈。還有實(shí)習(xí)生給她發(fā)語(yǔ)音,帶著哭腔,但是因?yàn)樽饬朔孔記](méi)有辦法離開(kāi),堅(jiān)持不下去就意味著房租全部打水漂。
5.這里永遠(yuǎn)不會(huì)缺人
但不是沒(méi)有堅(jiān)持下來(lái)的人。
李竹溪是其中少見(jiàn)的擁有數(shù)據(jù)標(biāo)注經(jīng)驗(yàn)的實(shí)習(xí)生。她學(xué)的是認(rèn)知語(yǔ)言學(xué),她解釋道,語(yǔ)言學(xué)與神經(jīng)結(jié)合的方向,觀(guān)察腦成像,包括建立腦機(jī)接口,與人工智能有一定的聯(lián)系。
在來(lái)到這家大廠(chǎng)之前,她就曾在另一家大廠(chǎng)做過(guò)大語(yǔ)言模型的數(shù)據(jù)標(biāo)注,那還是在ChatGPT發(fā)布之前。在李竹溪的印象中,在ChatGPT出圈之后,類(lèi)似的數(shù)據(jù)標(biāo)注實(shí)習(xí)如雨后春筍一樣一下子就冒了出來(lái)。
她順利完成了三個(gè)月的實(shí)習(xí),即使在她的形容中,這是一份“比較機(jī)械、難度不大”的工作。李竹溪描述自己更注重體驗(yàn),“我不指望這份工作很有趣,去體驗(yàn)一下還是很不錯(cuò)的,既收獲了大廠(chǎng)的實(shí)習(xí)經(jīng)驗(yàn),也體驗(yàn)了這里獨(dú)特的企業(yè)文化”。
對(duì)來(lái)自雙非院校的文科生趙碩來(lái)說(shuō),大廠(chǎng)的人工智能編輯實(shí)習(xí)崗已經(jīng)是他上層的選擇。
在找暑假實(shí)習(xí)的時(shí)候,他其實(shí)更傾向于一個(gè)研究所的運(yùn)營(yíng)崗位,研究所屬于事業(yè)單位,更帶編制,對(duì)于趙碩有很強(qiáng)的吸引力,“當(dāng)時(shí)我特別期待它能給我反饋”。但最終研究所沒(méi)有選擇研一的趙碩,招走了一個(gè)年級(jí)更高的學(xué)生。
還有更“卷”的人。
在趙碩眼中,有些實(shí)習(xí)生會(huì)特別努力,領(lǐng)取更多的任務(wù)量,以謀求轉(zhuǎn)正的機(jī)會(huì)。認(rèn)真的態(tài)度、勤奮的狀態(tài)會(huì)博得正職的青睞,“Leader與他們之間經(jīng)常有一定的交流,也會(huì)給他們一些管理的授權(quán),管理實(shí)習(xí)生”。
甚至公司每周會(huì)評(píng)選表現(xiàn)突出的實(shí)習(xí)生,將他們的照片貼在墻上作為表彰,但是并不一定存在獎(jiǎng)金激勵(lì),趙碩所在的業(yè)務(wù)線(xiàn)就沒(méi)有。
云測(cè)數(shù)據(jù)總經(jīng)理賈宇航告訴「甲子光年」,數(shù)據(jù)標(biāo)注員的晉升主要有兩條:一條是專(zhuān)家路線(xiàn),在掌握特定垂直領(lǐng)域的相關(guān)技能之后,初級(jí)的標(biāo)注員可以逐漸成為高級(jí)的標(biāo)注專(zhuān)家;另一條是管理路線(xiàn),成為項(xiàng)目的管理者。
但趙碩不會(huì)選擇留下。在讀了一年研之后,趙碩很明顯地體會(huì)到,他對(duì)于未來(lái)工作的期待降低了。感受到身處大環(huán)境的日益變化,觀(guān)察到本科畢業(yè)選擇就業(yè)的同學(xué)的不如意,趙碩之前期待的“高精尖”“不可替代性強(qiáng)”的工作也逐漸被一份安穩(wěn)的工作替代。作為一名文科生,他焦慮于自己還沒(méi)有掌握不可替代性強(qiáng)的技能,更希望能找到一份在編制內(nèi)管理的工作。
閑聊的時(shí)候,實(shí)習(xí)生們會(huì)互相感嘆自己在做的工作或許很快就會(huì)被機(jī)器替代,不再需要人工投喂數(shù)據(jù)。
對(duì)于云測(cè)數(shù)據(jù)總經(jīng)理賈宇航來(lái)說(shuō),類(lèi)似的擔(dān)憂(yōu)并不存在。隨著算法的實(shí)際量產(chǎn),數(shù)據(jù)閉環(huán)能力增強(qiáng),整體標(biāo)注數(shù)據(jù)量和手工數(shù)據(jù)標(biāo)注量依然在逐年上升。以往是百分之百人工標(biāo)注,現(xiàn)在是人工標(biāo)注、自動(dòng)標(biāo)注、人工校驗(yàn)各有一定占比。未來(lái)可能自動(dòng)標(biāo)注占比會(huì)越來(lái)越大。不過(guò),雖然人工標(biāo)注的占比在減小,但伴隨人工智能行業(yè)的逐步發(fā)展數(shù)據(jù)量日漸增加,人工標(biāo)注的量仍會(huì)持續(xù)增加。
在提前離職之后,楊小云找到了一份自己喜歡的游戲策劃實(shí)習(xí),那里工作氛圍輕松,也更有獲得感,人工智能編輯對(duì)她來(lái)說(shuō)是一段“倒霉”的實(shí)習(xí)經(jīng)歷。而對(duì)于丁小雨來(lái)說(shuō)則是一次祛魅的過(guò)程,即使去了曾經(jīng)很期待的大廠(chǎng)實(shí)習(xí),也會(huì)面臨無(wú)數(shù)枯燥無(wú)味的工作,她覺(jué)得這可能是因?yàn)樽约旱哪芰不夠強(qiáng)或歷練機(jī)會(huì)太少。
但那里也永遠(yuǎn)不會(huì)缺人。
楊小云聽(tīng)說(shuō)在她走之后,團(tuán)隊(duì)從幾十個(gè)人在一個(gè)月內(nèi)擴(kuò)充到了幾百個(gè)。丁小雨發(fā)現(xiàn),每隔10天,就會(huì)來(lái)一批新的實(shí)習(xí)生,每批都有二三十人。
“你可能罵罵咧咧地走了,向全世界宣告這個(gè)工作多么不好,但還有源源不斷的新人進(jìn)來(lái)補(bǔ)充你的空位。”
*應(yīng)采訪(fǎng)對(duì)象要求,文中人物晨曦、楊小云、丁小雨、李竹溪、趙碩為化名。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線(xiàn)上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性?xún)r(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。