最新新聞：

中科聞歌發(fā)布“智川”企業(yè)智能體平臺1.0、“優(yōu)雅”音視頻大模型平臺1.5，領先技術加速AI普惠落地這個周末，在最懂開發(fā)者的城市邂逅最懂開發(fā)者的算力平臺 DDN推出 Infinia 2.0對象存儲加速AI數(shù)據(jù)處理速度全部免費！百度文心智能體平臺已全面接入DeepSeek模型燈塔云系統(tǒng)：開啟勞務派遣管理4.0時代超2671萬名消費者申請手機等數(shù)碼產品購新補貼用國補買手機上京東皇家馬德里對陣赫羅納：不乏進球與高水平競技的足球現(xiàn)場 OpenAI宣布面向多個國家推出AI代理 Operator 扣子Coze宣布獨家支持 DeepSeek Function Calling 工具調用能力小紅書將接入DeepSeek AI 搜索產品“點點” 內測深度思考功能騰訊元寶「混元+DeepSeek」雙模聚合推出「圖像理解」技能蘋果死磕廉價牌 Clone公司推出首款“類人機器人”Protoclone 擁有肌肉和骨骼結構微軟為OpenAI即將推出的 GPT-4.5和 GPT-5模型積極準備服務器容量國際星閃聯(lián)盟會議在京召開，為星閃2.0標準完成打下基礎 Telstra攜手愛立信進行亞太首個5G-A高性能可編程網(wǎng)絡部署阿里通義萬相宣布即將開源視頻生成模型WanX2.1 DeepSeek賦能Vixtel飛思達CloudFox可觀測性平臺，打破可觀測性工程的實施壁壘《和平精英》手游宣布正式接入DeepSeek REDMI K80至尊版曝光：電池超7000mAh 紅米史上最大

首頁 > 云計算頻道 > 大模型

李飛飛團隊50美元復現(xiàn)DeepSeek R1？真相來了

2025年02月07日 11:57:36 來源：財聯(lián)社

　　2月6日訊今日一則關于人工智能領域的新聞引發(fā)廣泛關注。

　　據(jù)報道，李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的云計算費用，成功訓練出了一個名為s1的人工智能推理模型。該模型在數(shù)學和編碼能力測試中的表現(xiàn)，據(jù)稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

　　這一消息無疑在AI界投下了一顆重磅炸彈，真相究竟如何?

　　《科創(chuàng)板日報》記者調查和采訪業(yè)內人士后發(fā)現(xiàn)，s1模型的訓練并非從零開始，而是基于阿里云通義千問(Qwen)模型進行監(jiān)督微調。這意味著，s1模型的神奇“低成本”，是建立在已具備強大能力的開源基礎模型之上。

　　▍通義模型的“基座”作用

　　根據(jù)李飛飛等人的研究論文，s1模型的訓練僅使用了1000個樣本數(shù)據(jù)。按照業(yè)內共識，這一數(shù)據(jù)量在AI訓練中可謂微乎其微，通常不足以訓練出一個具備推理能力的模型。

　　青年AI科學家、上海交通大學人工智能學院謝偉迪副教授告訴《科創(chuàng)板日報》記者，如果仔細研究斯坦福s1的論文會發(fā)現(xiàn)，s1模型的神奇是以通義千問模型為基座進行微調，這1000個樣本訓練的作用更像是“錦上添花”，而非“從零開始”。

　　國內某知名大模型公司CEO也向《科創(chuàng)板日報》記者表示：“從論文原文來看，所謂用50美元訓練出新的具有推理能力的模型，實際上只是用從谷歌模型中提煉出來的1000個樣本，然后對通義千問模型進行監(jiān)督微調。這種微調的成本確實很低，但明顯是站在既有領先模型的‘肩上’才能做到。”

　　斯坦福s1論文原文也注明模型是以阿里通義千問模型為基礎微調

　　謝偉迪指出，國內外還有其他團隊也聲稱用極低的成本，訓練出了具有推理能力的新模型。但一閱讀其論文原文，就會發(fā)現(xiàn)它們無一例外都是基于通義模型作為基座進行的。

　　國外多位人工智能研究者也指出，不少的“新”模型都是建立通義模型基礎上

　　“以通義千問模型作為基座，確實可以用很少的樣本數(shù)據(jù)就達到產生新的推理模型的效果，但如果換成其他基座模型，新模型能力卻沒有任何的提升。所以，能力真正神奇的是Qwen模型，而不是s1。 ” 謝偉迪說。

　　▍低成本訓練大模型有局限，但也是方向

　　盡管s1模型的低成本訓練在某種程度上展示了AI訓練的潛力，但其局限性也不容忽視。

　　首先，這種低成本訓練依賴于已有的強大基座模型，如阿里通義千問模型。如果沒有這樣的基座模型，低成本訓練的效果將大打折扣。

　　其次，1000個樣本數(shù)據(jù)的訓練量在大多數(shù)情況下是不夠的，尤其是在需要處理復雜任務的場景中。

　　此外，低成本訓練的成功也引發(fā)了對AI模型知識產權和倫理問題的討論。如果越來越多的研究依賴于已有的基座模型進行微調，那么這些基座模型的開發(fā)者是否應該獲得相應的回報?如何確保AI技術的公平使用和共享?這些問題都需要業(yè)界進一步探討和解決。

　　盡管s1模型的低成本訓練引發(fā)了爭議，但其背后的研究思路無疑為AI領域提供了新的思考方向。

　　武漢人工智能學院一位資深研究人員向《科創(chuàng)板日報》記者表示，如何在保證模型性能的前提下，降低訓練成本，是AI研究的一個重要課題。未來，隨著技術的進步和算法的優(yōu)化，或許我們真的能夠看到更多低成本、高性能的AI模型問世。

　　【來源：財聯(lián)社】

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信

即時

BenQ DesignVue攜新品重磅亮相「創(chuàng)意界奧斯卡」Adobe Max

2024年的Adobe MAX 2024發(fā)布會上，Adobe推出了最新版本的Adobe Creative Cloud。

銷量增速遠超預期一加手機達成春節(jié)假期全行業(yè)銷量增幅第

決戰(zhàn)性能之巔真我GT7 Pro競速版2月13日發(fā)布

新聞

明火炊具市場：三季度健康屬性貫穿全類目

奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示，2024年1-9月明火炊具線上零售額94.2億元，同比增加3.1%，其中抖音渠道表現(xiàn)優(yōu)異，同比有14%的漲幅，傳統(tǒng)電商略有下滑，同比降低2.3%。

企業(yè)IT

重慶創(chuàng)新公積金應用，“區(qū)塊鏈+政務服務”顯成效

“以前都要去窗口辦，一套流程下來都要半個月了，現(xiàn)在方便多了!”打開“重慶公積金”微信小程序，按照提示流程提交相關材料，僅幾秒鐘，重慶市民曾某的賬戶就打進了21600元。

3C消費

華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器，高能實力，創(chuàng)

華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器，憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力，為您的創(chuàng)作工作帶來實質性的幫助，雙十一期間低至2799元，性價比很高，簡直是創(chuàng)作者們的首選。

研究

中國信通院羅松：深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

9月14日，2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。

專題

返回主頁 ┊ 關于我們 ┊ 內容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責聲明 ┊ 原創(chuàng)新聞 ┊ 友情鏈接 ┊ 舊版首頁

Copyright © 2009-2024 3iu24w.cn 中文科技資訊|Citnews中文科技資訊,中文科技資訊網(wǎng)|科技資訊網(wǎng)|中國科技資訊|中國科技新聞網(wǎng)|中國科技資訊網(wǎng)|快科技|新科技|中文科技數(shù)碼頭條號|中文移動新媒體 all rights reserved

京ICP備18037198號-1 京公網(wǎng)安備 11010502041587號

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网