• 首頁 > 云計算頻道 > 大模型

    孟子3-13B大模型正式開源

    2024年04月01日 15:32:36   來源:中文科技資訊

      瀾舟科技近日宣布,其研發(fā)的孟子3-13B大模型正式開源,并向學術研究領域全面開放,同時支持免費商用。這一輕量化大模型在多項基準測試中展現(xiàn)了優(yōu)異的性能,特別是在參數(shù)量20B以內的模型中,其中英文語言能力尤為突出,數(shù)學和編程能力也位于行業(yè)前列。

      孟子3-13B大模型基于Llama架構,經過高達3T Tokens的數(shù)據(jù)集訓練,該數(shù)據(jù)集包括網頁、百科、社交、媒體、新聞以及高質量的開源數(shù)據(jù)集。模型在萬億tokens上進行了多語言語料的繼續(xù)訓練,使其中文能力得到顯著提升,同時也具備了強大的多語言處理能力。

    1.jpg

      為了便于用戶快速部署和使用,瀾舟科技提供了簡單的兩步操作。首先,用戶需要進行環(huán)境配置,通過pip命令安裝必要的依賴。隨后,用戶可以通過提供的代碼快速開始使用模型,進行基礎的交互推理。此外,瀾舟科技還提供了樣例代碼和模型微調的相關文件和代碼,以便用戶根據(jù)自己的需求進行定制和優(yōu)化。

      瀾舟科技的選擇背后有著明確的商業(yè)考量。公司專注于服務ToB場景,并在實踐中發(fā)現(xiàn),ToB場景中使用頻率最高的大模型參數(shù)量集中在10B-100B之間。從投資回報率角度出發(fā),這一參數(shù)規(guī)模范圍的模型既能滿足場景需求,又具有高性價比。因此,瀾舟科技致力于在這一參數(shù)規(guī)模范圍內打造優(yōu)質的行業(yè)大模型。

      孟子3-13B大模型的開源,是瀾舟科技在大模型領域的又一重要里程碑。去年3月,瀾舟科技發(fā)布了孟子GPT V1(MChat),今年1月,孟子大模型GPT V2對公眾開放,F(xiàn)在,感興趣的用戶可以通過GitHub、HuggingFace、ModelScope和Wisemodel等平臺體驗和使用孟子3-13B大模型。

      隨著孟子3-13B大模型的開源,瀾舟科技進一步鞏固了其在AI大模型行業(yè)的領先地位,并為學術研究和商業(yè)應用提供了強大的支持。這一舉措無疑將推動大模型技術的發(fā)展和應用,為AI產業(yè)的進步貢獻力量。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。