2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團隊煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實況圖重裝微信:以免丟失微信聊天記錄
  • 首頁 > 云計算頻道 > 大模型

    Stability AI發(fā)布30億參數(shù)語言模型StableLM Zephyr 3B 更小更快更節(jié)省資源

    2023年12月08日 11:57:18   來源:站長之家

      Stability AI以其stable diffusion文本到圖像的生成人工智能模型而聞名,但這已不再是該公司的全部業(yè)務(wù)。

      最新發(fā)布的StableLM Zephyr3B是一款30億參數(shù)的大語言模型,專為聊天應(yīng)用場景進行了優(yōu)化,包括文本生成、摘要和內(nèi)容個性化。這款新模型是Stability AI早在今年四月首次提及的StableLM文本生成模型的較小、優(yōu)化版本。

      StableLM Zephyr3B的承諾在于,它比7B的StableLM模型更小,帶來了一系列好處。由于體積更小,它可以在更廣泛的硬件上部署,占用更低的資源,同時仍然提供快速響應(yīng)。該模型經(jīng)過優(yōu)化,特別適用于問答和指令跟隨類型的任務(wù)。

      Stability AI首席執(zhí)行官Emad Mostaque表示:“相對于以前的模型,StableLM經(jīng)過更長時間、更高質(zhì)量數(shù)據(jù)的訓(xùn)練,例如與LLaMA v27b相比,盡管體積只有其40%,但在基礎(chǔ)性能上卻能夠匹配。”

      StableLM Zephyr3B并非全新模型,而是Stability AI定義的現(xiàn)有StableLM3B-4e1t模型的擴展。Zephyr的設(shè)計方法受到HuggingFace的Zephyr7B模型的啟發(fā)。HuggingFace的Zephyr模型是在開源MIT許可下開發(fā)的,旨在充當(dāng)助手。Zephyr采用一種稱為Direct Preference Optimization(DPO)的訓(xùn)練方法,StableLM現(xiàn)在也受益于這一方法。

      Mostaque解釋說,Direct Preference Optimization(DPO)是一種替代以前模型中使用的強化學(xué)習(xí)的方法,用于調(diào)整模型以符合人類偏好。DPO通常用于更大的70億參數(shù)模型,而StableLM Zephyr是首批在更小的30億參數(shù)大小中使用該技術(shù)的模型之一。

      Stability AI使用了來自O(shè)penBMB研究組的UltraFeedback數(shù)據(jù)集進行DPO。UltraFeedback數(shù)據(jù)集包含超過64,000個提示和256,000個響應(yīng)。DPO、較小的體積和優(yōu)化的數(shù)據(jù)訓(xùn)練集的組合為StableLM提供了在Stability AI提供的指標(biāo)中表現(xiàn)出色。例如,在MT Bench評估中,StableLM Zephyr3B能夠勝過包括Meta的Llama-2-70b-chat和Anthropric的Claude-V1在內(nèi)的更大模型。

      StableLM Zephyr3B是Stability AI近幾個月推出的一系列新模型之一,該初創(chuàng)公司繼續(xù)推動其能力和工具的發(fā)展。雖然公司忙于進入不同領(lǐng)域,但新模型并沒有讓Stability AI忘記文本到圖像生成的基礎(chǔ)。上周,Stability AI發(fā)布了SDXL Turbo,作為其旗艦SDXL文本到圖像stable diffusion模型的更快版本。

      Mostaque還明確表示,Stability AI還將推出更多創(chuàng)新。他表示:“我們相信,針對用戶自己的數(shù)據(jù)進行調(diào)整的小型、開放、性能良好的模型將勝過更大的通用模型。隨著我們新的StableLM模型的未來全面發(fā)布,我們期待進一步實現(xiàn)生成語言模型的民主化。”

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。