實(shí)習(xí)生涌入大模型

2023年09月13日 16:53:29 朱悅來(lái)源：微信公眾號(hào)：甲子光年

　　正式實(shí)習(xí)的第一天，晨曦感覺(jué)自己可能“被騙”了。

　　剛剛結(jié)束完學(xué)校的畢業(yè)論文，準(zhǔn)研究生晨曦準(zhǔn)備給自己找點(diǎn)事做。投遞了幾份簡(jiǎn)歷之后，很快，國(guó)內(nèi)某互聯(lián)網(wǎng)大廠(chǎng)的人工智能編輯崗位(翻譯方向)向她發(fā)出了邀請(qǐng)。

　　職位描述上寫(xiě)著：

　　1. 為人工智能機(jī)器學(xué)習(xí)提供優(yōu)質(zhì)的語(yǔ)料，復(fù)制模型訓(xùn)練迭代;

　　2. 與技術(shù)組對(duì)接需求，按時(shí)交付優(yōu)質(zhì)合格的數(shù)據(jù)，對(duì)編輯結(jié)果質(zhì)量負(fù)責(zé)。

　　對(duì)于不了解模型訓(xùn)練的晨曦來(lái)說(shuō)，這看上去似乎是一份相當(dāng)不錯(cuò)的實(shí)習(xí)。

　　晨曦面試的是翻譯方向，這與她所就讀的英語(yǔ)專(zhuān)業(yè)十分契合;年初ChatGPT在國(guó)內(nèi)爆火，晨曦日常就有使用AI產(chǎn)品的習(xí)慣，符合自己的興趣愛(ài)好;另外，能有機(jī)會(huì)參與新興的科技產(chǎn)業(yè)發(fā)展對(duì)于文科生來(lái)說(shuō)可遇不可求;當(dāng)然，最大的吸引力來(lái)自于這家互聯(lián)網(wǎng)大廠(chǎng)。在過(guò)去幾年內(nèi)，這家公司已經(jīng)成功吸引了無(wú)數(shù)年輕學(xué)生前仆后繼。從某種角度來(lái)說(shuō)，簡(jiǎn)歷上的大廠(chǎng)名字足以成為自身能力的象征。

　　只是，除了招聘頁(yè)面上簡(jiǎn)單的職位描述，晨曦沒(méi)有從面試官那里獲得關(guān)于這份實(shí)習(xí)更多的信息。

　　“我當(dāng)時(shí)為什么覺(jué)得被騙，就是因?yàn)槊嬖嚨臅r(shí)候HR基本都聚焦在翻譯相關(guān)的問(wèn)題。”在面試中做了幾道翻譯題之后，晨曦順利拿到了offer。一直到工作之前，她都以為這是一份翻譯的工作。

　　感到“被騙”的不止晨曦一人。

　　作為人工智能編輯最早的一批實(shí)習(xí)生，楊小云在2月底也來(lái)到了這家大廠(chǎng)。面試官表示，這是一份對(duì)信息抓取、語(yǔ)言概括和文字編輯等能力要求很高的工作。

　　實(shí)際上手之后她意識(shí)到：“HR描述的工作跟實(shí)操的工作，完全是兩件事情。說(shuō)得再天花亂墜，其實(shí)也是一個(gè)‘打標(biāo)’的工作。”

　　如今，人工智能熱潮帶火了這些以假亂真的聊天機(jī)器人，以及通過(guò)簡(jiǎn)單提示就能生成圖片的繪畫(huà)軟件。大模型的現(xiàn)象級(jí)出圈，使得數(shù)據(jù)、算法、算力作為訓(xùn)練大模型的基礎(chǔ)而備受關(guān)注，數(shù)據(jù)標(biāo)注就是數(shù)據(jù)環(huán)節(jié)必不可少的一部分。

　　2007年，時(shí)任普林斯頓大學(xué)計(jì)算機(jī)科學(xué)系的助理教授李飛飛開(kāi)啟了一個(gè)名為ImageNet的項(xiàng)目，希望擴(kuò)展可用于訓(xùn)練AI算法的數(shù)據(jù)。

　　為了給每個(gè)單詞提供盡可能多的視覺(jué)案例，亞馬遜眾包平臺(tái)Mechanical Turk上的近5萬(wàn)名工人，花了兩年半的時(shí)間標(biāo)記出圖片中的對(duì)象，例如氣球、草莓等共計(jì)320萬(wàn)張圖片。這些工人來(lái)自全球的167個(gè)國(guó)家，大多分布在人工成本低廉的地區(qū)。

　　《時(shí)代》雜志的一項(xiàng)調(diào)查發(fā)現(xiàn)，為了減少ChatGPT數(shù)據(jù)集中關(guān)于暴力、性別歧視和種族主義等內(nèi)容，OpenAI使用了每小時(shí)收入不到2美元的肯尼亞勞工�！杜聿┥纭穲�(bào)道，谷歌的AI聊天機(jī)器人Bard由數(shù)千名合同工訓(xùn)練，他們只有3分鐘的時(shí)間來(lái)審閱、標(biāo)注完Bard的回答。

　　在過(guò)去很長(zhǎng)一段時(shí)間里，數(shù)據(jù)標(biāo)注對(duì)語(yǔ)言與圖像識(shí)別的認(rèn)知要求都并不高。大模型時(shí)代，數(shù)據(jù)標(biāo)注從圖像轉(zhuǎn)向語(yǔ)言，要求更高、更垂直，需要特定領(lǐng)域的專(zhuān)業(yè)知識(shí)和流暢的語(yǔ)言能力。

　　但對(duì)于普通的數(shù)據(jù)標(biāo)注員來(lái)說(shuō)，它依然是一份不斷重復(fù)的低技術(shù)含量的工作。

　　正如同這些“被騙”的名校學(xué)生進(jìn)大廠(chǎng)實(shí)習(xí)一樣，他們沒(méi)辦法說(shuō)清，自己的工作是為了實(shí)現(xiàn)什么樣的目的，有什么價(jià)值。他們往往只有一個(gè)模糊的認(rèn)識(shí)，為了“訓(xùn)練大模型”。

　　以晨曦和楊小云為代表的人工智能編輯實(shí)習(xí)生，便因?yàn)橛?xùn)練大模型的需要而誕生。這些受到熱捧的大模型，讓實(shí)習(xí)生們懷揣著好奇和憧憬進(jìn)入，同時(shí)，也讓他們感受到背后真實(shí)的混亂和價(jià)值感匱乏。

　　1.當(dāng)大學(xué)生涌入大模型數(shù)據(jù)標(biāo)注

　　人們通常會(huì)認(rèn)為，數(shù)據(jù)標(biāo)注員是一群身處三四線(xiàn)城市、低學(xué)歷、高年齡的群體。事實(shí)上這也的確是此前國(guó)內(nèi)數(shù)據(jù)標(biāo)注員的現(xiàn)狀。

　　根據(jù)人社部2021年發(fā)布的《人工智能訓(xùn)練師國(guó)家職業(yè)技能標(biāo)準(zhǔn)》，人工智能訓(xùn)練師的普遍受教育程度是初中畢業(yè)(或相當(dāng)文化程度)。他們可能分散在河北、河南、山東、山西等傳統(tǒng)勞動(dòng)密集型企業(yè)選址的地區(qū)，甚至更偏遠(yuǎn)的山區(qū)——在那里，數(shù)據(jù)標(biāo)注是扶貧的試點(diǎn)項(xiàng)目。

　　但改變已經(jīng)隨著大模型的出現(xiàn)而發(fā)生。

　　讓楊小云感到無(wú)聊的，其實(shí)就是為訓(xùn)練大模型而做的數(shù)據(jù)標(biāo)注工作。

　　經(jīng)過(guò)簡(jiǎn)單的培訓(xùn)和考核之后，楊小云被安排進(jìn)了文字編輯組。她每天的工作就是回答題庫(kù)中的問(wèn)題，目的是通過(guò)標(biāo)注者人工書(shū)寫(xiě)答案來(lái)優(yōu)化大模型的訓(xùn)練過(guò)程。

　　一個(gè)問(wèn)題的回答步驟經(jīng)過(guò)嚴(yán)格把控。以游戲《原神》為例，如果收到“夜蘭的圣遺物是什么?”的問(wèn)題，楊小云需要把回答拆分成幾個(gè)段落：首先夜蘭是什么?其次圣遺物是什么?最后夜蘭的圣遺物配對(duì)什么?

　　在指定的搜索引擎上搜集資料，完成回答的編輯之后，最終以Markdown的形式完成提交。

　　除了簡(jiǎn)單易答的問(wèn)題，楊小云的大多數(shù)時(shí)間都花在了自己完全不熟悉的專(zhuān)業(yè)領(lǐng)域，例如經(jīng)濟(jì)專(zhuān)區(qū)、法律專(zhuān)區(qū)等。

　　顯而易見(jiàn)，這與以往的數(shù)據(jù)標(biāo)注工作完全不同。

　　在大模型出現(xiàn)之前，數(shù)據(jù)標(biāo)注的場(chǎng)景通常都是幾百人的工廠(chǎng)，一人一臺(tái)電腦，只有鼠標(biāo)鍵盤(pán)噼里啪啦的聲音。而他們一天8小時(shí)的工作時(shí)間內(nèi)，都只做一件簡(jiǎn)單重復(fù)的事情：在不同的圖片中框出機(jī)動(dòng)車(chē)、非機(jī)動(dòng)車(chē)、行人、紅綠燈(目標(biāo)檢測(cè));或者劃出一段話(huà)的主語(yǔ)、謂語(yǔ)、賓語(yǔ)(語(yǔ)義分割)。

　　這些針對(duì)圖片視頻的拉框和文本的語(yǔ)義分割，都是對(duì)已有數(shù)據(jù)進(jìn)行處理，數(shù)據(jù)標(biāo)注員本身并不用給出“創(chuàng)造性結(jié)論”。但針對(duì)大模型的數(shù)據(jù)標(biāo)注并非如此。數(shù)據(jù)標(biāo)注員除了需要對(duì)已有數(shù)據(jù)進(jìn)行處理之外，還需要對(duì)問(wèn)題進(jìn)行解答，給出正確的結(jié)論。

　　根據(jù)觀(guān)研天下數(shù)據(jù)中心2023年發(fā)布的《中國(guó)數(shù)據(jù)標(biāo)注行業(yè)現(xiàn)狀深度分析與投資趨勢(shì)研究報(bào)告(2023-2030年)》，在ChatGPT發(fā)布之前，AI訓(xùn)練數(shù)據(jù)標(biāo)注以語(yǔ)音和計(jì)算機(jī)視覺(jué)為主，自然語(yǔ)言處理(NLP)的需求不足15%。

　　隨著ChatGPT聊天機(jī)器人成為AIGC的現(xiàn)象級(jí)應(yīng)用，對(duì)更偏情緒判斷、考驗(yàn)理解能力甚至推理能力等高質(zhì)量文字標(biāo)注任務(wù)的需求正在越來(lái)越多。

　　“(大模型)項(xiàng)目的復(fù)雜度變得比以前高了，對(duì)人員的要求也相對(duì)不一樣了。”星塵數(shù)據(jù)產(chǎn)品部負(fù)責(zé)人告訴「甲子光年」，“自動(dòng)駕駛偏視覺(jué)信息的識(shí)別標(biāo)注，更偏體力活的工作，對(duì)員工進(jìn)行一些培訓(xùn)，他們經(jīng)過(guò)上手拉框，熟練快捷鍵，掌握一些技巧之后，能很快勝任。但是大模型所需要的是一個(gè)完整的、結(jié)構(gòu)化的、多元化的、包羅萬(wàn)象的數(shù)據(jù)體系，需要四層數(shù)據(jù)來(lái)支撐模型的搭建和提升。這些數(shù)據(jù)涉及預(yù)訓(xùn)練、SFT(有監(jiān)督微調(diào)，Supervised Fine-Tuning)、RLHF(基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)，Reinforcement Learning from Human Feedback)，私有化部署等等，針對(duì)不同行業(yè)的需求，我們發(fā)布了COSMO大模型數(shù)據(jù)金字塔解決方案;對(duì)于大模型數(shù)據(jù)標(biāo)注員來(lái)說(shuō)，標(biāo)注COSMO的數(shù)據(jù)不是做選擇題，也不是簡(jiǎn)單的閱讀理解、文本編輯，而是讓你創(chuàng)造問(wèn)答，創(chuàng)造內(nèi)容了。”

　　云測(cè)數(shù)據(jù)總經(jīng)理賈宇航將大模型的訓(xùn)練數(shù)據(jù)劃分為基礎(chǔ)數(shù)據(jù)、場(chǎng)景數(shù)據(jù)和場(chǎng)景數(shù)據(jù)優(yōu)化三個(gè)階段。他將這三個(gè)階段類(lèi)比成學(xué)習(xí)的過(guò)程。

　　“對(duì)于拉框這種基礎(chǔ)的數(shù)據(jù)標(biāo)注會(huì)比較簡(jiǎn)單，會(huì)電腦操作、學(xué)一學(xué)即會(huì);場(chǎng)景數(shù)據(jù)是在特定環(huán)節(jié)做定向研發(fā)時(shí)所需要的特定領(lǐng)域的數(shù)據(jù)，需要學(xué)習(xí)相關(guān)領(lǐng)域知識(shí)以達(dá)到標(biāo)注要求;到三個(gè)階段，基于投入使用中持續(xù)的迭代和優(yōu)化，技能和領(lǐng)域知識(shí)的要求會(huì)更加精進(jìn)。”賈宇航表示。

　　在這種工作需求之下，越來(lái)越多的大模型公司對(duì)數(shù)據(jù)標(biāo)注員的需求，也從過(guò)去的低學(xué)歷向高學(xué)歷轉(zhuǎn)變，并且這種需求正越來(lái)越多。

　　在國(guó)內(nèi)主流的求職平臺(tái)上，已有不少關(guān)于大模型的數(shù)據(jù)標(biāo)注崗正在招聘。這些崗位要求標(biāo)注員的學(xué)歷在本科以上。百度此前曾表示，其位于�？诘拇竽Ｐ蛿�(shù)據(jù)標(biāo)注基地有數(shù)百位數(shù)據(jù)標(biāo)注員，本科率已達(dá)100%。

　　圖片來(lái)源：BOSS直聘&脈脈

　　2.苛刻的大模型數(shù)據(jù)標(biāo)注

　　通常來(lái)說(shuō)，訓(xùn)練一個(gè)大模型，需要以下3個(gè)步驟：

　　資料來(lái)源：OpenAI《Introducing ChatGPT》

　　這些重復(fù)性的工作背后，實(shí)際上是為了實(shí)現(xiàn)“根據(jù)人類(lèi)反饋進(jìn)行強(qiáng)化學(xué)習(xí)”(Reinforcement Learning from Human Feedback)的技術(shù)，GPT-3.5的最大提升便來(lái)自于此，其中的關(guān)鍵，是人(Labeler)的參與，也就是這些數(shù)據(jù)標(biāo)注員。

　　從上述RLHF三步驟來(lái)看，步驟一與步驟二相對(duì)更重要，因?yàn)樗鼪Q定了訓(xùn)練獎(jiǎng)勵(lì)模型所必須的數(shù)據(jù)質(zhì)量的高低。而這兩個(gè)步驟中的數(shù)據(jù)標(biāo)注實(shí)習(xí)生，也被分成了“編輯組”與“排序組”兩個(gè)核心小組。

　　編輯組的工作就是回答題庫(kù)中的問(wèn)題;而排序組的工作則是給生成的答案(包括模型和人工生成的答案)進(jìn)行優(yōu)劣排序。

　　丁小雨在7月份加入文字編輯。同為英語(yǔ)專(zhuān)業(yè)的丁小雨和晨曦一樣，期待著一份翻譯工作能提高專(zhuān)業(yè)水平，但她的工作其實(shí)也與英語(yǔ)并不相關(guān)。

　　對(duì)比2月份楊小云實(shí)習(xí)的時(shí)候，丁小雨面臨的文字編輯組變得更加細(xì)分，每個(gè)實(shí)習(xí)生要選擇一個(gè)垂直方向，例如娛樂(lè)、物理、政治等，答案的要求也變得更加詳細(xì)。

　　一道古詩(shī)文的選擇題，不能只解釋答案，而要先從題型開(kāi)始介紹，然后是詩(shī)文的翻譯以及背景，最后是每個(gè)選項(xiàng)正確與否的分析，最重要的是要對(duì)標(biāo)3月14日OpenAI發(fā)布的GPT-4。

　　“要參考它的答案，又不能跟它的答案雷同，還要比它的答案好。”丁小雨很無(wú)奈。

　　而晨曦被安排進(jìn)的是排序組，每天為問(wèn)題對(duì)應(yīng)的多個(gè)回答進(jìn)行排序，以確定不同答案的優(yōu)劣。

　　排序的結(jié)果是需要被明確量化的。她需要從有用性、真實(shí)性、相關(guān)性、安全性等不同角度對(duì)回答進(jìn)行評(píng)分，并且寫(xiě)下原因。這是為了讓機(jī)器無(wú)限接近人類(lèi)期待的答案。

　　晨曦發(fā)現(xiàn)自己有時(shí)候不得不在幾個(gè)糟糕的回答之間做出選擇。而當(dāng)所有的回答都不好時(shí)，她被要求自己寫(xiě)出更好的回答。

　　編輯組的丁小雨面臨的要求更加苛刻。每個(gè)回答在合格交付之前將要面臨兩道審核。第一道來(lái)自組長(zhǎng)：“做完幾道題就要開(kāi)審核的會(huì)，給我們挑毛病，直到改到組長(zhǎng)滿(mǎn)意為止。”第二道來(lái)自于總部，總部審核通過(guò)才算結(jié)束。

　　一次，因?yàn)楦袷降腻e(cuò)誤，丁小雨的大多數(shù)回答被判了全錯(cuò)。“可能調(diào)一下順序就可以了，但是他們不在意你是回答的內(nèi)容錯(cuò)了，還是格式出現(xiàn)問(wèn)題，直接就是全錯(cuò)。”

　　更令丁小雨崩潰的是，組長(zhǎng)直接表示，如果再錯(cuò)這么多就可能勸退她。

　　為大模型做數(shù)據(jù)標(biāo)注是一件*的結(jié)果導(dǎo)向的工作。不管在做的過(guò)程中付出了多少努力，只要效果不好，之前的一切努力就會(huì)被全盤(pán)否定。

　　但問(wèn)題在于，無(wú)論是編輯組的答案輸出，還是排序組的答案排序，都是一個(gè)非常主觀(guān)的工作。數(shù)據(jù)標(biāo)注實(shí)習(xí)生們很難把控一個(gè)答案到底是好是壞;針對(duì)同一個(gè)問(wèn)題，不同實(shí)習(xí)生往往也會(huì)給出不同的答案。

　　為了解決這一問(wèn)題，大模型數(shù)據(jù)標(biāo)注團(tuán)隊(duì)每天必須進(jìn)行的一項(xiàng)工作就是開(kāi)“審核會(huì)”——在公司內(nèi)部被稱(chēng)為“拉齊會(huì)”，目的就是拉齊答案的標(biāo)準(zhǔn)，拉齊每個(gè)人的理解，拉齊所有的建議。

　　只是，要實(shí)現(xiàn)真正的拉齊，是一件頗為費(fèi)勁的事。這就像高考閱卷一樣，不同的人會(huì)分到同樣的題目，如果評(píng)分不一致，就要不斷調(diào)整直到得出一個(gè)統(tǒng)一的分?jǐn)?shù)。

　　在晨曦的印象里，每天都有兩三小時(shí)的時(shí)間花在會(huì)議上。會(huì)議開(kāi)到最后，往往敲定的是最簡(jiǎn)單粗暴的解決方法，少數(shù)服從多數(shù)，她形容為“沒(méi)有價(jià)值在創(chuàng)造價(jià)值”。

　　不過(guò)，比起大家坐在一起“人為”拉齊答案標(biāo)準(zhǔn)，一個(gè)更令人頭大的問(wèn)題是：標(biāo)準(zhǔn)并非人為拉齊之后就可以一勞永逸，而是要不斷根據(jù)模型輸出的反饋進(jìn)行調(diào)整。

　　每天上班的第一件事，楊小云需要確認(rèn)當(dāng)天是否下發(fā)了新的標(biāo)注標(biāo)準(zhǔn)，大到回答的框架，段落的拆分，小到搜索引擎的選擇，空格、標(biāo)點(diǎn)符號(hào)等格式。但標(biāo)準(zhǔn)一直在變。一旦發(fā)現(xiàn)投喂的數(shù)據(jù)在機(jī)器上不奏效，標(biāo)準(zhǔn)就需要重新制定，全部問(wèn)題跟著推翻重寫(xiě)。

　　“這就好像織布一樣，是織橫紋還是豎紋?是織芝麻扣還是麥子扣?但是不管是什么扣，都只能放進(jìn)程序里跑，發(fā)現(xiàn)跑不出來(lái)就要換一種方法。”楊小云向「甲子光年」解釋。這個(gè)比喻的背后是，如果數(shù)據(jù)標(biāo)注給出的答案，在獎(jiǎng)勵(lì)模型的訓(xùn)練過(guò)程中可能沒(méi)有達(dá)到預(yù)期的效果，就要調(diào)整標(biāo)準(zhǔn)。

　　標(biāo)準(zhǔn)變更，意味著上一次拉齊會(huì)結(jié)論的失效，標(biāo)準(zhǔn)又要重新拉齊。

　　“又冗余又高效，每天都在非常高效地說(shuō)一些廢話(huà)。”楊小云吐槽。

　　3.被大廠(chǎng)薅羊毛的高材生

　　一邊是每天開(kāi)不完的拉齊會(huì)，一邊是隨時(shí)可能變更的數(shù)據(jù)標(biāo)準(zhǔn)。很多像晨曦一樣被大廠(chǎng)光鮮亮麗的招牌吸引進(jìn)來(lái)的高材生們，卻在一次次內(nèi)耗中喪失了自己最初的心氣，最終選擇離開(kāi)。

　　這些實(shí)習(xí)生的共同特點(diǎn)是高學(xué)歷。招聘要求是本科以上，但許多實(shí)習(xí)生擁有碩士研究生的文憑。

　　他們中不少人受過(guò)中國(guó)乃至世界*大學(xué)的教育。楊小云的身邊有來(lái)自北大、帝國(guó)理工的學(xué)生，晨曦工位旁的實(shí)習(xí)生來(lái)自南開(kāi)、電子科大;丁小雨在培訓(xùn)的時(shí)候被明確告知，實(shí)習(xí)生的學(xué)歷是經(jīng)過(guò)篩選的。“他(面試官)說(shuō)像我們這樣高學(xué)歷的大學(xué)生，學(xué)習(xí)東西比較快，容易上手”。

　　管理一幫聰明人從來(lái)都不是一件容易的事。因?yàn)檫@些人很容易從不斷重復(fù)的動(dòng)作中發(fā)現(xiàn)工作的本質(zhì)，進(jìn)而質(zhì)疑這份工作對(duì)自己的未來(lái)是否真的有價(jià)值。

　　丁小雨形容自己的工作“沒(méi)什么價(jià)值，很內(nèi)耗”。

　　每天早上來(lái)到工位，打開(kāi)顯示屏和筆記本，一邊用筆記本查看規(guī)則，一邊在顯示屏上編寫(xiě)回答，丁小雨能清晰地感受到詳細(xì)的規(guī)則和流程讓自己逐漸失去了思考的空間，把她規(guī)訓(xùn)成了一個(gè)機(jī)器。“沒(méi)有學(xué)到東西，而且也沒(méi)有精力去學(xué)習(xí)其他的東西，就慢慢喪失學(xué)習(xí)的動(dòng)力和做其他事情的熱情。”

　　丁小雨還在脫敏組待過(guò)，但實(shí)際工作和“脫敏”這個(gè)詞沒(méi)有根本聯(lián)系，只是使用不同的聊天機(jī)器人與企業(yè)內(nèi)測(cè)的產(chǎn)品回答相同的問(wèn)題，并對(duì)答案進(jìn)行對(duì)比打分。只干了幾天，她又被調(diào)到過(guò)文字校對(duì)組，要做的是修改pdf格式轉(zhuǎn)換成Word格式時(shí)出現(xiàn)的錯(cuò)誤，主要是錯(cuò)別字和標(biāo)點(diǎn)符號(hào)。在這個(gè)她形容為“接近崩潰”的過(guò)程中，她每天要完成25頁(yè)與醫(yī)療相關(guān)的糾錯(cuò)任務(wù)。

　　在面試過(guò)程中，面試官曾問(wèn)丁小雨能不能接受一份比較枯燥和重復(fù)的工作。“我當(dāng)時(shí)回答是能接受。我想所有候選人的回答應(yīng)該都是能夠接受。”因?yàn)楸究浦挥幸欢螌?shí)習(xí)經(jīng)歷，帶著積累更多實(shí)習(xí)和體驗(yàn)大廠(chǎng)的期待，即使抱著懷疑的想法，丁小雨還是選擇了入職。

　　在短短兩個(gè)月中，丁小雨已經(jīng)算是同期實(shí)習(xí)生中堅(jiān)持到最后的人。她親眼見(jiàn)到許多實(shí)習(xí)生躊躇滿(mǎn)志地進(jìn)來(lái)，又垂頭喪氣地離開(kāi)。

　　人類(lèi)學(xué)家大衛(wèi)·格雷伯將“狗屁工作”(bullshit jobs)定義為沒(méi)有意義或目的的工作，本該被機(jī)器自動(dòng)化淘汰掉的工作，卻因?yàn)檠b點(diǎn)門(mén)面、討好上級(jí)、填補(bǔ)系統(tǒng)漏洞而繼續(xù)存在。數(shù)據(jù)標(biāo)注就像是狗屁工作的變體，通常認(rèn)為已經(jīng)被機(jī)器替代，卻仍然需要人類(lèi)完成。

　　在人工智能熱潮到來(lái)之際，人們往往會(huì)聽(tīng)到這樣的期許：AI可以替代人類(lèi)完成重復(fù)性、乏味的工作，從而讓人類(lèi)有更多時(shí)間和精力去追求更有創(chuàng)造性、成就感的工作。

　　但也有可能的是，人工智能像過(guò)去節(jié)省勞動(dòng)力的技術(shù)一樣，如電話(huà)和打字機(jī)，克服了信息傳遞和手寫(xiě)的苦惱，但也產(chǎn)生了大量的通訊、文書(shū)工作，以至于需要配備新的人工來(lái)進(jìn)行管理，例如前臺(tái)、文員。AI可能不會(huì)替代人類(lèi)，但會(huì)創(chuàng)造出更加乏味、枯燥、孤立的工作。

　　除了無(wú)法獲得工作價(jià)值認(rèn)同之外，到手的薪資，恐怕也不能讓這幫高材生們實(shí)現(xiàn)“價(jià)格認(rèn)同”。

　　據(jù)「甲子光年」了解，這些數(shù)據(jù)標(biāo)注實(shí)習(xí)生的工資并不高。如果位于一線(xiàn)城市的工位，大多數(shù)人工智能實(shí)習(xí)生的工資是150元/天，兼有房補(bǔ)，提供免費(fèi)食堂;位于二線(xiàn)城市，只剩下100元/天，房補(bǔ)也縮減三分之二，20元的餐補(bǔ)替代免費(fèi)餐食。

　　像丁小雨在二線(xiàn)城市的工位實(shí)習(xí)，因?yàn)檗k公地點(diǎn)處在城市中心，地段繁華，一頓外賣(mài)輕輕松松超過(guò)20元的餐補(bǔ)標(biāo)準(zhǔn)，基本上都需要用實(shí)習(xí)工資倒貼。

　　因?yàn)樗麄兇蠖鄶?shù)只是作為訓(xùn)練大模型的基礎(chǔ)標(biāo)注員，可能被統(tǒng)一安排到和專(zhuān)業(yè)毫無(wú)相關(guān)的崗位，又有可能隨時(shí)抽調(diào)到不同的部門(mén)，經(jīng)過(guò)短暫的培訓(xùn)后要求快速上手。

　　丁小雨形容，他們是一批一批被大廠(chǎng)薅羊毛的實(shí)習(xí)生。

　　晨曦明顯感受到，她不是唯一感受到期待與實(shí)際工作落差的人。“說(shuō)得直白一點(diǎn)，我覺(jué)得這個(gè)工作配不上我。有時(shí)候聊天我會(huì)發(fā)現(xiàn)其他實(shí)習(xí)生可能是985本科，也有海歸的碩士，他們的落差也非常非常大。”

　　楊小云則表達(dá)得更為直接：“可能是一個(gè)不太恰當(dāng)?shù)谋扔�，我媽媽上過(guò)高中，她來(lái)做這個(gè)工作也可以。”

　　4.“我們其實(shí)是流水線(xiàn)的工人”

　　事實(shí)上，招聘高材生做一些低技術(shù)含量的工作，給付極低的薪資成本，也是目前大模型數(shù)據(jù)標(biāo)注發(fā)展初期市場(chǎng)混亂的客觀(guān)體現(xiàn)。對(duì)于數(shù)據(jù)標(biāo)注公司來(lái)說(shuō)，在大模型目前的發(fā)展階段，數(shù)據(jù)標(biāo)注還沒(méi)有形成統(tǒng)一的標(biāo)準(zhǔn)，對(duì)標(biāo)注員也沒(méi)有成型的具體要求。

　　星塵數(shù)據(jù)產(chǎn)品部負(fù)責(zé)人表示：“隨著大模型基礎(chǔ)能力補(bǔ)齊之后，開(kāi)始向更垂直、更加復(fù)雜能力的發(fā)展過(guò)程中，任務(wù)會(huì)逐步產(chǎn)生變化，要求工具和人員隨之更新迭代。但是，大模型現(xiàn)在還在早期發(fā)展過(guò)程，市場(chǎng)需求對(duì)標(biāo)注員的要求也隨任務(wù)的差異有高有低。相比CV(計(jì)算機(jī)視覺(jué))項(xiàng)目而言，NLP(自然語(yǔ)言處理)的標(biāo)注員對(duì)理解能力、專(zhuān)業(yè)術(shù)語(yǔ)、領(lǐng)域知識(shí)的要求更高，必須能提供準(zhǔn)確、可靠的語(yǔ)料。”

　　該負(fù)責(zé)人介紹，大模型對(duì)數(shù)據(jù)標(biāo)注提出的難題更多體現(xiàn)在頂層設(shè)計(jì)。對(duì)于每個(gè)數(shù)據(jù)標(biāo)注任務(wù)，如何理解客戶(hù)的應(yīng)用場(chǎng)景訴求，進(jìn)行數(shù)據(jù)選擇、數(shù)據(jù)分布設(shè)計(jì)、可高效低成本落地執(zhí)行的pipeline設(shè)計(jì)等一套解決方案的設(shè)計(jì)，如何提高平臺(tái)工具的效率和能力，是更大的挑戰(zhàn)。

　　這其中依賴(lài)著垂直領(lǐng)域?qū)＜易鳛楦呒?jí)標(biāo)注員的參與，將領(lǐng)域?qū)I(yè)知識(shí)和經(jīng)驗(yàn)注入解決方案的設(shè)計(jì)，甚至參與到數(shù)據(jù)質(zhì)量檢查迭代的過(guò)程中。

　　數(shù)據(jù)解決方案提供商倍賽科技的運(yùn)營(yíng)負(fù)責(zé)人張子千直言，目前就訓(xùn)練大型模型而言，基礎(chǔ)標(biāo)注員和之前從事框選工作的標(biāo)注員在工作難度、時(shí)薪方面并沒(méi)有明顯的區(qū)別。在為客戶(hù)進(jìn)行大模型微調(diào)并創(chuàng)建垂直領(lǐng)域的解決方案時(shí)，最大的難題在于如何構(gòu)建高質(zhì)量的數(shù)據(jù)集，這需要IT、醫(yī)學(xué)和金融等專(zhuān)業(yè)領(lǐng)域的標(biāo)注專(zhuān)家才能解決，這類(lèi)人才依然稀缺。

　　OpenAI投入了幾十位博士生進(jìn)行數(shù)據(jù)標(biāo)注的指導(dǎo)和審核，而將基礎(chǔ)的數(shù)據(jù)標(biāo)注外包給了數(shù)據(jù)標(biāo)注公司，分散在非洲、印度等低收入地區(qū)。真正起作用的是那些高級(jí)標(biāo)注員，只占到很小的比例。

　　通過(guò)對(duì)比百度在北京總部和�？跀�(shù)據(jù)標(biāo)注基地招聘的標(biāo)注員崗位介紹可以看出，同樣是為了訓(xùn)練大模型，前者為高級(jí)標(biāo)注員，負(fù)責(zé)指導(dǎo)、培訓(xùn)和審核，而后者則是基礎(chǔ)的數(shù)據(jù)標(biāo)注員，兩者在薪資水平上千差萬(wàn)別。

　　圖片來(lái)源：BOSS直聘

　　也就是說(shuō)，那些更高級(jí)別的高級(jí)標(biāo)注員其實(shí)才是大模型訓(xùn)練的關(guān)鍵人才，他們的工作更具技術(shù)含量、價(jià)值更高，同時(shí)人力成本也更高。

　　對(duì)比之下，這些來(lái)自名校的實(shí)習(xí)生們，即使是為了訓(xùn)練大模型而來(lái)，從現(xiàn)階段來(lái)說(shuō)，也與過(guò)去那些數(shù)據(jù)標(biāo)注員在本質(zhì)上并無(wú)差別。

　　實(shí)習(xí)生之間常常開(kāi)玩笑，他們并不是在大廠(chǎng)，而是在互聯(lián)網(wǎng)富士康，自己是流水線(xiàn)上的工人。他們既看不到自己的工作成果最終通向何方，也無(wú)法與身邊的人產(chǎn)生橫向的意義鏈條。

　　這種“互聯(lián)網(wǎng)富士康”的玩笑，指的不僅僅是這些實(shí)習(xí)生的工作，就連工作量與管理模式，也幾乎與工廠(chǎng)流水線(xiàn)看齊。

　　實(shí)習(xí)生們每天要完成的工作量，都有規(guī)定的人效紅線(xiàn)。對(duì)于楊小云來(lái)說(shuō)，她一天需要標(biāo)注滿(mǎn)32條問(wèn)題，如果沒(méi)有達(dá)到紅線(xiàn)要求，就要匯報(bào)原因或者加班把它干完。而完成工作的前提，是不斷變換的拉齊會(huì)標(biāo)準(zhǔn)，以及不停的資料搜集。

　　為了最快速度完成模型訓(xùn)練，標(biāo)注團(tuán)隊(duì)面臨的是高壓式的管理。楊小云所在的小組工作時(shí)間禁止說(shuō)話(huà)，閑聊幾句的代價(jià)可能會(huì)新增額外的任務(wù)量，完不成工作會(huì)在群里被瘋狂提醒，甚至生病請(qǐng)假也可能會(huì)被正職的加急電話(huà)打擾。

　　此外，為了保證數(shù)據(jù)不被泄密，數(shù)據(jù)標(biāo)注跨組別的交流是明令禁止的。即使不同小組的實(shí)習(xí)生安排在臨近的位置，也不能討論工作內(nèi)容。這些實(shí)習(xí)生們都不知道，在企業(yè)內(nèi)部，數(shù)據(jù)標(biāo)注到底有多少細(xì)分的組，有多少實(shí)習(xí)生。一個(gè)組可能有10人、40人、50人、60人，每層樓會(huì)有上百人。

　　在高壓的人效紅線(xiàn)之下，只有遇到違禁的題目能讓楊小云短暫“高興”一下。因?yàn)樯婕暗奖┝�、色情、血腥的�?nèi)容要直接去掉，但還可以算到個(gè)人的工作條數(shù)。“相當(dāng)于擰到了一個(gè)壞的螺絲，你只會(huì)很高興這個(gè)螺絲不用你擰了”。早上分工的時(shí)候，實(shí)習(xí)生之間甚至爭(zhēng)著領(lǐng)違禁問(wèn)題。

　　在楊小云提前離職之后，她經(jīng)常刷到同期實(shí)習(xí)生深夜10點(diǎn)，甚至12點(diǎn)還在公司開(kāi)會(huì)的朋友圈。還有實(shí)習(xí)生給她發(fā)語(yǔ)音，帶著哭腔，但是因?yàn)樽饬朔孔記](méi)有辦法離開(kāi)，堅(jiān)持不下去就意味著房租全部打水漂。

　　5.這里永遠(yuǎn)不會(huì)缺人

　　但不是沒(méi)有堅(jiān)持下來(lái)的人。

　　李竹溪是其中少見(jiàn)的擁有數(shù)據(jù)標(biāo)注經(jīng)驗(yàn)的實(shí)習(xí)生。她學(xué)的是認(rèn)知語(yǔ)言學(xué)，她解釋道，語(yǔ)言學(xué)與神經(jīng)結(jié)合的方向，觀(guān)察腦成像，包括建立腦機(jī)接口，與人工智能有一定的聯(lián)系。

　　在來(lái)到這家大廠(chǎng)之前，她就曾在另一家大廠(chǎng)做過(guò)大語(yǔ)言模型的數(shù)據(jù)標(biāo)注，那還是在ChatGPT發(fā)布之前。在李竹溪的印象中，在ChatGPT出圈之后，類(lèi)似的數(shù)據(jù)標(biāo)注實(shí)習(xí)如雨后春筍一樣一下子就冒了出來(lái)。

　　她順利完成了三個(gè)月的實(shí)習(xí)，即使在她的形容中，這是一份“比較機(jī)械、難度不大”的工作。李竹溪描述自己更注重體驗(yàn)，“我不指望這份工作很有趣，去體驗(yàn)一下還是很不錯(cuò)的，既收獲了大廠(chǎng)的實(shí)習(xí)經(jīng)驗(yàn)，也體驗(yàn)了這里獨(dú)特的企業(yè)文化”。

　　對(duì)來(lái)自雙非院校的文科生趙碩來(lái)說(shuō)，大廠(chǎng)的人工智能編輯實(shí)習(xí)崗已經(jīng)是他上層的選擇。

　　在找暑假實(shí)習(xí)的時(shí)候，他其實(shí)更傾向于一個(gè)研究所的運(yùn)營(yíng)崗位，研究所屬于事業(yè)單位，更帶編制，對(duì)于趙碩有很強(qiáng)的吸引力，“當(dāng)時(shí)我特別期待它能給我反饋”。但最終研究所沒(méi)有選擇研一的趙碩，招走了一個(gè)年級(jí)更高的學(xué)生。

　　還有更“卷”的人。

　　在趙碩眼中，有些實(shí)習(xí)生會(huì)特別努力，領(lǐng)取更多的任務(wù)量，以謀求轉(zhuǎn)正的機(jī)會(huì)。認(rèn)真的態(tài)度、勤奮的狀態(tài)會(huì)博得正職的青睞，“Leader與他們之間經(jīng)常有一定的交流，也會(huì)給他們一些管理的授權(quán)，管理實(shí)習(xí)生”。

　　甚至公司每周會(huì)評(píng)選表現(xiàn)突出的實(shí)習(xí)生，將他們的照片貼在墻上作為表彰，但是并不一定存在獎(jiǎng)金激勵(lì)，趙碩所在的業(yè)務(wù)線(xiàn)就沒(méi)有。

　　云測(cè)數(shù)據(jù)總經(jīng)理賈宇航告訴「甲子光年」，數(shù)據(jù)標(biāo)注員的晉升主要有兩條：一條是專(zhuān)家路線(xiàn)，在掌握特定垂直領(lǐng)域的相關(guān)技能之后，初級(jí)的標(biāo)注員可以逐漸成為高級(jí)的標(biāo)注專(zhuān)家;另一條是管理路線(xiàn)，成為項(xiàng)目的管理者。

　　但趙碩不會(huì)選擇留下。在讀了一年研之后，趙碩很明顯地體會(huì)到，他對(duì)于未來(lái)工作的期待降低了。感受到身處大環(huán)境的日益變化，觀(guān)察到本科畢業(yè)選擇就業(yè)的同學(xué)的不如意，趙碩之前期待的“高精尖”“不可替代性強(qiáng)”的工作也逐漸被一份安穩(wěn)的工作替代。作為一名文科生，他焦慮于自己還沒(méi)有掌握不可替代性強(qiáng)的技能，更希望能找到一份在編制內(nèi)管理的工作。

　　閑聊的時(shí)候，實(shí)習(xí)生們會(huì)互相感嘆自己在做的工作或許很快就會(huì)被機(jī)器替代，不再需要人工投喂數(shù)據(jù)。

　　對(duì)于云測(cè)數(shù)據(jù)總經(jīng)理賈宇航來(lái)說(shuō)，類(lèi)似的擔(dān)憂(yōu)并不存在。隨著算法的實(shí)際量產(chǎn)，數(shù)據(jù)閉環(huán)能力增強(qiáng)，整體標(biāo)注數(shù)據(jù)量和手工數(shù)據(jù)標(biāo)注量依然在逐年上升。以往是百分之百人工標(biāo)注，現(xiàn)在是人工標(biāo)注、自動(dòng)標(biāo)注、人工校驗(yàn)各有一定占比。未來(lái)可能自動(dòng)標(biāo)注占比會(huì)越來(lái)越大。不過(guò)，雖然人工標(biāo)注的占比在減小，但伴隨人工智能行業(yè)的逐步發(fā)展數(shù)據(jù)量日漸增加，人工標(biāo)注的量仍會(huì)持續(xù)增加。

　　在提前離職之后，楊小云找到了一份自己喜歡的游戲策劃實(shí)習(xí)，那里工作氛圍輕松，也更有獲得感，人工智能編輯對(duì)她來(lái)說(shuō)是一段“倒霉”的實(shí)習(xí)經(jīng)歷。而對(duì)于丁小雨來(lái)說(shuō)則是一次祛魅的過(guò)程，即使去了曾經(jīng)很期待的大廠(chǎng)實(shí)習(xí)，也會(huì)面臨無(wú)數(shù)枯燥無(wú)味的工作，她覺(jué)得這可能是因?yàn)樽约旱哪芰︖€不夠強(qiáng)或歷練機(jī)會(huì)太少。

　　但那里也永遠(yuǎn)不會(huì)缺人。

　　楊小云聽(tīng)說(shuō)在她走之后，團(tuán)隊(duì)從幾十個(gè)人在一個(gè)月內(nèi)擴(kuò)充到了幾百個(gè)。丁小雨發(fā)現(xiàn)，每隔10天，就會(huì)來(lái)一批新的實(shí)習(xí)生，每批都有二三十人。

　　“你可能罵罵咧咧地走了，向全世界宣告這個(gè)工作多么不好，但還有源源不斷的新人進(jìn)來(lái)補(bǔ)充你的空位。”

　　*應(yīng)采訪(fǎng)對(duì)象要求，文中人物晨曦、楊小云、丁小雨、李竹溪、趙碩為化名。‍

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信