一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗(yàn)東芝全部業(yè)務(wù)實(shí)現(xiàn)盈利,退市裁員重組后終于賺錢(qián)真我14 Pro+開(kāi)始提上日程:1.5K等深四微曲屏+潛望長(zhǎng)焦穩(wěn)了消息稱(chēng)本田和日產(chǎn)計(jì)劃明年6月前敲定合并協(xié)議 2026年8月成立控股公司凱迪拉克最新版OTA開(kāi)啟推送,新增百度語(yǔ)音大模型和QQ音樂(lè)等應(yīng)用中國(guó)聯(lián)通11月5G套餐用戶(hù)凈增127.8萬(wàn)戶(hù)5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團(tuán)隊(duì)前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過(guò)這道檻!Livekit 開(kāi)源模型精準(zhǔn)識(shí)別“你是否說(shuō)完”!DeepSeek開(kāi)源大模型開(kāi)發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復(fù)合翼飛行汽車(chē) GOVY AirJet:最高飛行速度可達(dá) 250km/h清華大學(xué)聯(lián)合騰訊出品!ColorFlow:自動(dòng)給黑白漫畫(huà)上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲(chǔ)能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o(jì)3:AI 推理能力的重大突破,得分高達(dá)87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團(tuán)外賣(mài)出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動(dòng)6000億GTV后,抖音計(jì)劃偷襲美團(tuán)大本營(yíng)AGI Open Network(AON):賦能每個(gè)人創(chuàng)建、部署和貨幣化AI Agent
  • 首頁(yè) > 企業(yè)IT頻道 > 人工智能

    馬斯克要告微軟 拒絕AI訓(xùn)練“白嫖”數(shù)據(jù)

    2023年04月25日 14:40:45   來(lái)源:元宇宙日爆

      文|元宇宙日爆,作者|凱蒂,編輯|文刀

      “現(xiàn)在是訴訟時(shí)間。”4月20日,推特被微軟踢出其數(shù)字營(yíng)銷(xiāo)平臺(tái)后,新掌門(mén)人馬斯克立馬發(fā)推回?fù)舴Q(chēng),微軟用推特的數(shù)據(jù)做“非法訓(xùn)練”。這一懟,直接揭開(kāi)了AI大模型開(kāi)發(fā)商與數(shù)據(jù)源的利益之爭(zhēng)。

      此前,在線社區(qū)論壇Reddit與程序員社區(qū)Stack Overflow先后宣布,將向使用平臺(tái)API訓(xùn)練數(shù)據(jù)的公司收費(fèi);環(huán)球音樂(lè)集團(tuán)直接表示,將阻止AI從其版權(quán)歌曲中抓取歌手的聲音。

      在此之前,AI大模型開(kāi)發(fā)商都在低成本地使用互聯(lián)網(wǎng)公開(kāi)的內(nèi)容數(shù)據(jù)訓(xùn)練自家的大模型,如今,各種科技巨頭們加持的大模型紛紛開(kāi)始商業(yè)化,互聯(lián)網(wǎng)內(nèi)容平臺(tái)們突然反應(yīng)過(guò)來(lái),不能讓這些巨頭們薅羊毛“白嫖”數(shù)據(jù)了。‍‍‍‍‍‍‍‍

      當(dāng)推特將API收費(fèi)門(mén)檻擺在微軟面前時(shí),AI大模型訓(xùn)練要給付的成本就不止芯片算力和研發(fā)算法的人才了,現(xiàn)在還要加上“為數(shù)據(jù)付費(fèi)”。

      馬斯克直懟微軟“非法訓(xùn)練”

      “他們非法使用推特的數(shù)據(jù)進(jìn)行訓(xùn)練。現(xiàn)在是訴訟時(shí)間。” 4月20日,“宇宙頂流”馬斯克直接在推特上明示要告微軟。他以推特CEO的身份親自下場(chǎng),以此直懟微軟把推特踢出Microsoft Digital Marketing Center(微軟數(shù)字營(yíng)銷(xiāo)中心)的做法。

      這個(gè)“中心”是干嘛的呢?它其實(shí)是微軟利用大數(shù)據(jù)和AI技術(shù)開(kāi)發(fā)的一個(gè)廣告和營(yíng)銷(xiāo)的管理平臺(tái),聚合了包括推特、臉書(shū)、Ins等海外所有主流的社交平臺(tái),方便企業(yè)主們?cè)谝粋(gè)平臺(tái)上完成廣告和營(yíng)銷(xiāo)活動(dòng)的推送,還能管理各種賬號(hào)、分析推流數(shù)據(jù)。你刷微博、微信朋友圈時(shí)突然冒出的廣告,就有類(lèi)似微軟這種工具的貢獻(xiàn)。

      微軟這個(gè)數(shù)字營(yíng)銷(xiāo)中心能實(shí)現(xiàn)這些功能,很重要的一環(huán)是接入了這些社交平臺(tái)的API,這是企業(yè)主推送廣告、分析數(shù)據(jù)的基礎(chǔ)。

      結(jié)果,馬斯克收購(gòu)?fù)铺睾,直接把推特API的企業(yè)套餐初始訂閱費(fèi)用定為4.2萬(wàn)美元/月,折合人民幣28.9萬(wàn)元,以這個(gè)價(jià)格能獲得2500萬(wàn)條推文,一條差不多1塊多錢(qián)了。如果每月支付12.5萬(wàn)美元,能獲得 1 億條推文,后續(xù)還會(huì)按照使用量加錢(qián)。

      推特API的新收費(fèi)標(biāo)準(zhǔn)直接勸退了不少小公司,連財(cái)大氣粗的微軟數(shù)字營(yíng)銷(xiāo)中心都直言“要價(jià)太高”,于是,直接把推特踢出了管理庫(kù)。這意味著,借助微軟這個(gè)平臺(tái)執(zhí)行廣告和營(yíng)銷(xiāo)計(jì)劃的廣告主們,沒(méi)法在推特上搞投放了。

      原本這是企業(yè)主、分發(fā)平臺(tái)、渠道商之間的廣告業(yè)內(nèi)事,馬斯克跳出來(lái)了,直指微軟用推特的數(shù)據(jù)搞非法訓(xùn)練。

      馬斯克稱(chēng)微軟用推特?cái)?shù)據(jù)“非法訓(xùn)練”

      誰(shuí)都知道,爆火的ChatGPT背后有微軟的資本加持。而馬斯克和GPT大模型的開(kāi)發(fā)方OpenAI不僅淵源頗深,還積怨許久。

      2015年,馬斯克與Sam Altman等6人共同創(chuàng)立OpenAI人工智能實(shí)驗(yàn)室,致力于建設(shè)開(kāi)源的、研發(fā)人工智能的非營(yíng)利機(jī)構(gòu),來(lái)抗衡當(dāng)時(shí)在人工智能領(lǐng)域大有一家獨(dú)大之勢(shì)的谷歌。為此,馬斯克捐了1億美元,承諾未來(lái)繼續(xù)捐9億。結(jié)果不到2年,馬斯克就退出了OpenAI董事會(huì),這里既有燒錢(qián)開(kāi)發(fā)大模型短期沒(méi)燒出成果的問(wèn)題,也有馬斯克和Altman對(duì)OpenAI的管理權(quán)之爭(zhēng)。

      馬斯克退出1年后,即2019年3月,OpenAI成立子公司OpenLP,將其定位為“有限營(yíng)利機(jī)構(gòu)”,重組后的OpenAI很快拿到了來(lái)自微軟的10億美元投資。誰(shuí)也沒(méi)想到又一個(gè)3年過(guò)去后, OpenAI站上了全球科技舞臺(tái)的最前沿。

      ChatGPT爆火后,當(dāng)初為OpenAI掏過(guò)錢(qián)、站過(guò)臺(tái)的馬斯克頻頻表達(dá)怨念。

      2月17日,馬斯克發(fā)推指稱(chēng)OpenAI從開(kāi)源、非營(yíng)利變成了微軟控制的“閉源、追求利益最大化”的公司;后來(lái)還多次在公開(kāi)場(chǎng)合強(qiáng)調(diào)人工智能對(duì)人類(lèi)社會(huì)的潛在危害,甚至認(rèn)為“風(fēng)險(xiǎn)比飛機(jī)、汽車(chē)、毒品更大”;3月29日,那封科技大佬聯(lián)署簽名“暫停AI巨型實(shí)驗(yàn)”的公開(kāi)信上,他也第一時(shí)間簽名表態(tài)。

      馬斯克為人工智能的健康發(fā)展操碎了心,看上去,這位將巨型載人飛船送入太空的現(xiàn)實(shí)版“鋼鐵俠”似乎不打算跟風(fēng)人工智能了。

      然而,4月17日,馬斯克在媒體采訪中披露,將推出一款生成式AI大模型TruthGPT。很快就有媒體爆料,馬斯克買(mǎi)了1萬(wàn)個(gè)英偉達(dá)A100芯片。這是AI大模型訓(xùn)練的重要硬件。

      撕微軟非法訓(xùn)練數(shù)據(jù),懟OpenAI變成逐利公司,無(wú)論馬斯克如何批評(píng)這兩家公司,這下也難掩他對(duì)人工智能的興趣了。左手?jǐn)r下推特?cái)?shù)據(jù)低成本外流,右手高價(jià)囤芯片,在AI大模型賽道上,馬斯克開(kāi)始跑馬圈地。

      多平臺(tái)API擬收費(fèi),AI訓(xùn)練成本被推高

      不過(guò),最近要向AI大模型開(kāi)發(fā)商們收取API費(fèi)用的平臺(tái)不止推特。

      4月18日,海外最大的社區(qū)論壇Reddit宣布,將向使用其API做數(shù)據(jù)訓(xùn)練的公司收取數(shù)據(jù)使用費(fèi)。Reddit暫未公布具體收費(fèi)標(biāo)準(zhǔn),業(yè)內(nèi)推測(cè),Reddit很可能會(huì)按數(shù)據(jù)數(shù)量分等級(jí)收費(fèi),這也是業(yè)內(nèi)的常規(guī)做法。此外,程序員問(wèn)答網(wǎng)站Stack Overflow也計(jì)劃向AI巨頭收取訓(xùn)練數(shù)據(jù)費(fèi)用。

      要知道,研發(fā)AI大模型,算法、算力和算據(jù)這“三算”缺一不可。以O(shè)penAI訓(xùn)練GPT-3.5為例,這個(gè)模型容納了多達(dá)45TB的文本語(yǔ)料,這些語(yǔ)料既包括書(shū)籍期刊等出版物的內(nèi)容,也包括社交平臺(tái)、問(wèn)答網(wǎng)站、論壇小組等在線數(shù)據(jù)中的用戶(hù)生成內(nèi)容。而從OpenAI的公開(kāi)信息看,該公司并沒(méi)有提及獲取線上數(shù)據(jù)是否支付過(guò)費(fèi)用。用“爬蟲(chóng)”爬、和第三方合作、以及購(gòu)買(mǎi)都有可能是OpenAI 獲得數(shù)據(jù)的方式。

      此前,各個(gè)生成式大模型似乎都在沒(méi)啥限制地使用互聯(lián)網(wǎng)上的公開(kāi)內(nèi)容,影響大模型性能的要素就集中在算法和算力差異上。從推特、Reddit等平臺(tái)明確為API收費(fèi)后,大模型開(kāi)發(fā)商自在地使用數(shù)據(jù)的好日子到頭了。

      2019年之前,OpenAI是非營(yíng)利機(jī)構(gòu),如今,ChatGPT都有Plus收費(fèi)版了,更別提該公司還開(kāi)通了API的付費(fèi)渠道。當(dāng)前,OpenAI的估值接近300億美元,研究機(jī)構(gòu)PitchBook預(yù)測(cè),該公司今年的收入將達(dá)到2億美元,明年會(huì)翻五番。

      社交平臺(tái)們明確API收費(fèi),劍指大模型開(kāi)發(fā)商,雙方也正式變成了“商業(yè)對(duì)商業(yè)”的關(guān)系,收費(fèi)與付費(fèi)實(shí)屬正常。這也意味著,AI大模型成為科技巨頭們狂卷的賽道后,像Reddit這樣的海量?jī)?nèi)容平臺(tái)將增加商業(yè)來(lái)源,數(shù)據(jù)將成為重要要素。

      以成立于2008年的Reddit為例,它是全球互聯(lián)網(wǎng)中最有活力的社區(qū)之一,目前日活達(dá)到3.3億,大量的用戶(hù)創(chuàng)建了超過(guò)14萬(wàn)個(gè)活躍社區(qū),帖子總量超3.6億。尤其在很多小眾領(lǐng)域,Reddit論壇貢獻(xiàn)了很多有價(jià)值的討論內(nèi)容。換句話(huà)說(shuō),Reddit提供了英語(yǔ)互聯(lián)網(wǎng)中最重要的語(yǔ)料庫(kù)。

      OpenAI的CEO Sam Altman也表示,公司在積極與內(nèi)容公司進(jìn)行合作,并愿意“為高質(zhì)量數(shù)據(jù)支付高價(jià)”。

      盡管Altman宣稱(chēng)“目前沒(méi)在訓(xùn)練GPT-5”,但OpenAI應(yīng)該不會(huì)停下數(shù)據(jù)訓(xùn)練的腳步,因?yàn)镚PT-4仍有很多需要打磨的地方,比如通識(shí)知識(shí)的準(zhǔn)確性、對(duì)人類(lèi)語(yǔ)言的理解進(jìn)化等等,這些仍然需要語(yǔ)料數(shù)據(jù)的持續(xù)投入。

      放眼全球,研究AI大模型的公司還不止OpenAI一家,海外有谷歌,國(guó)內(nèi)有百度、華為、阿里?梢灶A(yù)見(jiàn),切入大模型賽道的公司,都將面對(duì)數(shù)據(jù)所有者的收費(fèi)關(guān)卡,訓(xùn)練成本將水漲船高。另一個(gè)值得深思的問(wèn)題是,Twitter也好,Reddit也罷,他們手握數(shù)據(jù)向大模型開(kāi)發(fā)公司收取價(jià)格不菲的費(fèi)用,那么,為這些平臺(tái)貢獻(xiàn)了海量?jī)?nèi)容和數(shù)據(jù)的用戶(hù)又得到了什么?

     

     

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類(lèi)目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性?xún)r(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。