家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o3:AI 推理能力的重大突破,得分高達87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動6000億GTV后,抖音計劃偷襲美團大本營AGI Open Network(AON):賦能每個人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來電”有詐?抖音客服上線“驗證助手”助用戶識別詐騙OpenAI新模型GPT-5研發(fā)未達預(yù)期:成本高昂 效果不佳曝天馬打入果鏈:為蘋果HomePod供應(yīng)LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運營商e&,展示全球首個固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案零下25℃制熱26℃!海爾水暖通黑科技亮相冰雪大世界三星沒放棄曲面屏開發(fā)!最新專利曝光暗示有望回歸三大運營商11月成績單:用戶數(shù)據(jù)增幅放緩打造下一個英偉達,孫正義的2026芯片計劃曝光瞭望2025全球6G技術(shù)發(fā)展趨勢AI時代云安全新范式,暢捷通智能守護小微企業(yè)安全上云百川智能發(fā)布全鏈路領(lǐng)域增強金融大模型 Baichuan4-Finance
  • 首頁 > 云計算頻道 > 大模型

    李開復(fù)零一萬物公司回應(yīng)大模型爭議:承認模型結(jié)構(gòu)基于GPT結(jié)構(gòu)

    2023年11月15日 10:07:03   來源:站長之家

      李開復(fù)旗下公司「零一萬物」的大模型 Yi-34B 引發(fā)爭議,因研究者發(fā)現(xiàn)其基本采用 LLaMA 架構(gòu),但只是對兩個張量進行了重命名。

      2. 有關(guān)該模型的性能和成就,包括上下文窗口大小超過200k、一次處理40萬漢字、在 Hugging Face 全球開源模型排行榜中獲得雙料冠軍等。

      3. 在社區(qū)中有人指出,Yi-34B 實際上是對 LLaMA 代碼的一次重構(gòu),但未作實質(zhì)性改變,引起對虛假宣傳、許可證違規(guī)等問題的疑慮。公司回應(yīng)表示基于 GPT 結(jié)構(gòu),并在模型訓(xùn)練中遇到的一些需求導(dǎo)致了代碼重命名。

      最近,「零一萬物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架構(gòu)但改變張量名引發(fā)爭議。這一爭議中,研究者指出其代碼實際上是對 LLaMA 代碼的一次重構(gòu),只是未作實質(zhì)性改變。社區(qū)擔心這可能違反了許可證規(guī)定,且未經(jīng)過框架支持的外部代碼附加可能存在安全風(fēng)險。

      Yi-34B 的成就在開源大模型領(lǐng)域引起了廣泛關(guān)注,其上下文窗口大小超過200k,能處理40萬漢字,成為全球開源模型雙料冠軍。然而,爭議的核心在于其是否真正符合 LLaMA 的許可協(xié)議,以及對模型代碼的更改是否屬于虛假宣傳。

      在社區(qū)的討論中,有人提到模型的性能參數(shù)和配置存在疑慮,包括模型被標榜為32K 模型實際上配置為4K 模型的問題。此外,對于模型的微調(diào)數(shù)據(jù)和基準測試的信息也沒有充分提供,引起了社區(qū)的疑慮。

      「零一萬物」公司回應(yīng)稱,他們的模型結(jié)構(gòu)基于 GPT 成熟結(jié)構(gòu),但在訓(xùn)練實驗中由于需求對代碼進行了更名。他們強調(diào)模型的結(jié)構(gòu)只是其中一部分,投入了大量研發(fā)工作在數(shù)據(jù)工程、訓(xùn)練方法、評估方法等方面,這是他們在大模型預(yù)訓(xùn)練階段的核心技術(shù)護城河。最后,他們表示尊重社區(qū)的反饋,將代碼進行更新以更好地融入 Transformer 生態(tài)。

      綜合來看,爭議集中在「零一萬物」公司的 Yi-34B 模型是否違反了開源協(xié)議,以及其在性能參數(shù)和代碼修改上的透明度。這一事件提醒開源社區(qū)對于模型的合規(guī)性和透明度的重要性,同時也反映了在開源領(lǐng)域中公司的技術(shù)選擇可能引發(fā)廣泛關(guān)注和爭議的現(xiàn)實。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。