書(shū)生・浦語(yǔ)20B 開(kāi)源AI大模型發(fā)布，消費(fèi)級(jí)GPU單卡即可運(yùn)行

2023年09月21日 21:44:42 來(lái)源：IT之家

　　今年 6 月，上海 AI 實(shí)驗(yàn)室發(fā)布了“書(shū)生・浦語(yǔ)”(InternLM)大模型，為104B 參數(shù)，后續(xù)又推出了7B 和 13B 規(guī)格模型。

　　近日，上海 AI 實(shí)驗(yàn)室、商湯科技、香港中文大學(xué)、復(fù)旦大學(xué)宣布推出書(shū)生・浦語(yǔ) 20B 版本，這是一款中量級(jí)大模型，號(hào)稱基于 2.3T Tokens 預(yù)訓(xùn)練語(yǔ)料從頭訓(xùn)練，相較于 InternLM-7B，其理解能力、推理能力、數(shù)學(xué)能力、編程能力等都有顯著提升。

　　據(jù)介紹，相比于此前國(guó)內(nèi)陸續(xù)開(kāi)源的 7B 和 13B 規(guī)格模型，20B 量級(jí)模型具備更強(qiáng)大的綜合能力，復(fù)雜推理和反思能力尤為突出，能為實(shí)際應(yīng)用場(chǎng)景提供更有力的性能支持;同時(shí)，20B 量級(jí)模型可在單卡上進(jìn)行推理，經(jīng)過(guò)低比特量化后，可運(yùn)行在單塊消費(fèi)級(jí) GPU 上，因而在實(shí)際應(yīng)用中更為便捷。

　　相比于此前的開(kāi)源模型，InternLM-20B 擁有幾大亮點(diǎn)，IT之家匯總?cè)缦拢?/p>

　　以不足 1/3 的參數(shù)量，測(cè)評(píng)成績(jī)達(dá)到了 Llama2-70B 的水平。

　　支持?jǐn)?shù)十類插件，上萬(wàn)個(gè) API 功能，還具備代碼解釋和反思修正能力。

　　實(shí)現(xiàn)了對(duì)長(zhǎng)文理解、長(zhǎng)文生成和超長(zhǎng)對(duì)話的有效支持，同時(shí)支持 16K 語(yǔ)境長(zhǎng)度。

　　研究團(tuán)隊(duì)進(jìn)行了基于 SFT 和 RLHF 兩階段價(jià)值對(duì)齊，并通過(guò)專家紅隊(duì)的對(duì)抗訓(xùn)練大幅提高其安全性。

　　此外，書(shū)生・浦語(yǔ)開(kāi)源工具鏈也已全新升級(jí)，形成更完善的體系，包括預(yù)訓(xùn)練框架 InternLM-Train、低成本微調(diào)框架 XTuner、部署推理框架 LMDeploy、評(píng)測(cè)框架 OpenCompass 以及面向場(chǎng)景應(yīng)用的智能體框架 Lagent。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信