Stability AI發(fā)布30億參數(shù)語言模型StableLM Zephyr 3B 更小更快更節(jié)省資源

2023年12月08日 11:57:18 來源：站長之家

　　Stability AI以其stable diffusion文本到圖像的生成人工智能模型而聞名，但這已不再是該公司的全部業(yè)務(wù)。

　　最新發(fā)布的StableLM Zephyr3B是一款30億參數(shù)的大語言模型，專為聊天應(yīng)用場景進行了優(yōu)化，包括文本生成、摘要和內(nèi)容個性化。這款新模型是Stability AI早在今年四月首次提及的StableLM文本生成模型的較小、優(yōu)化版本。

　　StableLM Zephyr3B的承諾在于，它比7B的StableLM模型更小，帶來了一系列好處。由于體積更小，它可以在更廣泛的硬件上部署，占用更低的資源，同時仍然提供快速響應(yīng)。該模型經(jīng)過優(yōu)化，特別適用于問答和指令跟隨類型的任務(wù)。

　　Stability AI首席執(zhí)行官Emad Mostaque表示:“相對于以前的模型，StableLM經(jīng)過更長時間、更高質(zhì)量數(shù)據(jù)的訓(xùn)練，例如與LLaMA v27b相比，盡管體積只有其40%，但在基礎(chǔ)性能上卻能夠匹配。”

　　StableLM Zephyr3B并非全新模型，而是Stability AI定義的現(xiàn)有StableLM3B-4e1t模型的擴展。Zephyr的設(shè)計方法受到HuggingFace的Zephyr7B模型的啟發(fā)。HuggingFace的Zephyr模型是在開源MIT許可下開發(fā)的，旨在充當(dāng)助手。Zephyr采用一種稱為Direct Preference Optimization(DPO)的訓(xùn)練方法，StableLM現(xiàn)在也受益于這一方法。

　　Mostaque解釋說，Direct Preference Optimization(DPO)是一種替代以前模型中使用的強化學(xué)習(xí)的方法，用于調(diào)整模型以符合人類偏好。DPO通常用于更大的70億參數(shù)模型，而StableLM Zephyr是首批在更小的30億參數(shù)大小中使用該技術(shù)的模型之一。

　　Stability AI使用了來自O(shè)penBMB研究組的UltraFeedback數(shù)據(jù)集進行DPO。UltraFeedback數(shù)據(jù)集包含超過64，000個提示和256，000個響應(yīng)。DPO、較小的體積和優(yōu)化的數(shù)據(jù)訓(xùn)練集的組合為StableLM提供了在Stability AI提供的指標(biāo)中表現(xiàn)出色。例如，在MT Bench評估中，StableLM Zephyr3B能夠勝過包括Meta的Llama-2-70b-chat和Anthropric的Claude-V1在內(nèi)的更大模型。

　　StableLM Zephyr3B是Stability AI近幾個月推出的一系列新模型之一，該初創(chuàng)公司繼續(xù)推動其能力和工具的發(fā)展。雖然公司忙于進入不同領(lǐng)域，但新模型并沒有讓Stability AI忘記文本到圖像生成的基礎(chǔ)。上周，Stability AI發(fā)布了SDXL Turbo，作為其旗艦SDXL文本到圖像stable diffusion模型的更快版本。

　　Mostaque還明確表示，Stability AI還將推出更多創(chuàng)新。他表示:“我們相信，針對用戶自己的數(shù)據(jù)進行調(diào)整的小型、開放、性能良好的模型將勝過更大的通用模型。隨著我們新的StableLM模型的未來全面發(fā)布，我們期待進一步實現(xiàn)生成語言模型的民主化。”

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信

即時

TCL實業(yè)榮獲IFA2024多項大獎，展示全球科技創(chuàng)新力量

近日，德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革，全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎，有力證明了其在全球市場的強大影響力。

服貿(mào)會高通展示開放創(chuàng)新生態(tài)，以5G、AI等技術(shù)促進合作共贏

OPPO續(xù)約歐洲冠軍聯(lián)賽未來三季再續(xù)輝煌

新聞

敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

近日，中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相，以敢為精神勇闖技術(shù)無人區(qū)，斬獲四項AWE 2024艾普蘭大獎。

企業(yè)IT

重慶創(chuàng)新公積金應(yīng)用，“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

“以前都要去窗口辦，一套流程下來都要半個月了，現(xiàn)在方便多了!”打開“重慶公積金”微信小程序，按照提示流程提交相關(guān)材料，僅幾秒鐘，重慶市民曾某的賬戶就打進了21600元。

3C消費

“純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

2024年3月12日，由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

研究

2024全球開發(fā)者先鋒大會即將開幕

由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo)，由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”，將于2024年3月23日至24日舉辦。

專題

2021 CCF全國高性能計算學(xué)術(shù)年會

返回主頁 ┊ 關(guān)于我們 ┊ 內(nèi)容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責(zé)聲明 ┊ 原創(chuàng)新聞 ┊ 友情鏈接 ┊ 舊版首頁

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网
久久精品视频国产女人扒开腿让人桶视频男女做爰猛烈叫床视频免费 99精品久久久中文字幕欧美日韩一区精品视频

Stability AI發(fā)布30億參數(shù)語言模型StableLM Zephyr 3B 更小更快更節(jié)省資源

擴展閱讀