版權(quán)問題引發(fā)大規(guī)模的生成式人工智能爭議,Meta 試圖以不公開訓(xùn)練數(shù)據(jù)的方式規(guī)避爭議。
周二,社交媒體巨頭 Meta 發(fā)布了一款名為 Llama 2 的龐大新模型,但在研究論文中幾乎沒有透露使用了哪些數(shù)據(jù)。「新的公開可用的在線數(shù)據(jù),」Meta 的研究人員在論文中寫道,幾乎沒有其他信息。
這是不同尋常的。迄今為止,人工智能行業(yè)一直對(duì)模型的訓(xùn)練數(shù)據(jù)持開放態(tài)度。原因在于:這種強(qiáng)大的技術(shù)必須被理解,其輸出必須盡可能地可解釋和可追溯,以便研究人員在出現(xiàn)問題時(shí)可以進(jìn)行修復(fù)。訓(xùn)練數(shù)據(jù)對(duì)這些模型的性能至關(guān)重要。
例如,原始的 Transformer 研究論文揭示了用于訓(xùn)練的詳細(xì)數(shù)據(jù)。其中包括來自WSJ 的約 40,000 個(gè)句子。
Meta 在今年二月發(fā)布第一版 LLaMA 時(shí),論文中列出了所有的訓(xùn)練數(shù)據(jù)。它包括一堆圖書和 Common Crawl 數(shù)據(jù)集,這是一個(gè)自 2008 年以來積累的龐大互聯(lián)網(wǎng)副本,存儲(chǔ)在亞馬遜的云端,隨時(shí)可以下載。該數(shù)據(jù)集占 Meta 用于訓(xùn)練 LLaMA 的信息的三分之二以上。
而在過去五個(gè)月里,出版商、作家和其他創(chuàng)作者突然意識(shí)到他們的作品被用于訓(xùn)練所有這些人工智能模型。他們并沒有被征求許可。
已經(jīng)有一系列訴訟挑戰(zhàn)了科技公司使用這些信息訓(xùn)練 AI 模型的權(quán)利。Sarah Silverman的投訴可能是迄今為止最有名的一個(gè)。
對(duì)于大型科技公司來說,他們知道這是一個(gè)風(fēng)險(xiǎn)。微軟作為產(chǎn)業(yè)領(lǐng)導(dǎo)者 OpenAI 的支持者,最近在其季度 SEC 文件中增加了這個(gè)風(fēng)險(xiǎn)因素。微軟在四月份增加的新部分中強(qiáng)調(diào)了版權(quán)作為知識(shí)產(chǎn)權(quán)法的重要組成部分。
谷歌,作為另一個(gè)人工智能領(lǐng)域的領(lǐng)導(dǎo)者,不愿為在線內(nèi)容付費(fèi),因?yàn)檫@會(huì)削弱其高盈利的商業(yè)模式。谷歌的高級(jí)法律顧問 Halimah DeLaine Prado 表示,美國法律「支持使用公共信息來創(chuàng)造新的有益用途」,這一觀點(diǎn)在法庭上可能占上風(fēng)。
而 Meta 似乎已經(jīng)認(rèn)定,在這個(gè)新法律問題得到解決之前,不告訴任何人使用了哪些數(shù)據(jù)是一個(gè)安全的做法。
此外,Meta 可能還有其他原因保持沉默。Lamini AI 創(chuàng)業(yè)公司的 CEO Sharon Zhou 提出了一些理論,包括最具爭議的一點(diǎn):Meta 在規(guī)避法律責(zé)任,公司想要保留將 Llama 2 復(fù)制的能力,也有可能是因?yàn)檎硭性獢?shù)據(jù)是很費(fèi)時(shí)的工作,所以 Meta 可能會(huì)在合適的時(shí)候發(fā)布訓(xùn)練數(shù)據(jù)的細(xì)節(jié)。
對(duì)此,Meta 表示,他們將發(fā)布模型權(quán)重和起始代碼,以供開發(fā)者使用,并強(qiáng)調(diào)他們致力于負(fù)責(zé)任和道德的開發(fā)生成式 AI 產(chǎn)品,確保他們的政策符合不同背景的要求和不斷變化的社會(huì)期望。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。