今年 6 月,上海 AI 實驗室發(fā)布了“書生・浦語”(InternLM)大模型,為104B 參數(shù),后續(xù)又推出了7B 和 13B 規(guī)格模型。
近日,上海 AI 實驗室、商湯科技、香港中文大學、復旦大學宣布推出書生・浦語 20B 版本,這是一款中量級大模型,號稱基于 2.3T Tokens 預訓練語料從頭訓練,相較于 InternLM-7B,其理解能力、推理能力、數(shù)學能力、編程能力等都有顯著提升。
據(jù)介紹,相比于此前國內(nèi)陸續(xù)開源的 7B 和 13B 規(guī)格模型,20B 量級模型具備更強大的綜合能力,復雜推理和反思能力尤為突出,能為實際應用場景提供更有力的性能支持;同時,20B 量級模型可在單卡上進行推理,經(jīng)過低比特量化后,可運行在單塊消費級 GPU 上,因而在實際應用中更為便捷。
相比于此前的開源模型,InternLM-20B 擁有幾大亮點,IT之家匯總?cè)缦拢?/p>
以不足 1/3 的參數(shù)量,測評成績達到了 Llama2-70B 的水平。
支持數(shù)十類插件,上萬個 API 功能,還具備代碼解釋和反思修正能力。
實現(xiàn)了對長文理解、長文生成和超長對話的有效支持,同時支持 16K 語境長度。
研究團隊進行了基于 SFT 和 RLHF 兩階段價值對齊,并通過專家紅隊的對抗訓練大幅提高其安全性。
此外,書生・浦語開源工具鏈也已全新升級,形成更完善的體系,包括預訓練框架 InternLM-Train、低成本微調(diào)框架 XTuner、部署推理框架 LMDeploy、評測框架 OpenCompass 以及面向場景應用的智能體框架 Lagent。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產(chǎn)品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。