行業(yè)唯一!海爾熱聲熱泵技術獲全國顛覆性技術創(chuàng)新大賽最高獎OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應,強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應螢火蟲外觀設計:看過實車的人都喜歡這個設計林杰:未來 A 級、A0 級、A00 級車型都將是領克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設與智慧出行萬象分區(qū)、絢彩XDR、量子點Pro 2025齊出手,TCL引領觀影體驗新變革!QQ音樂年度聽歌報告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術報告出爐2024年結(jié)束,哪里是原創(chuàng)動畫的應許之地?
  • 首頁 > 云計算頻道 > 大模型

    智譜AI推出國產(chǎn)大模型GLM-4 中文能力比肩GPT-4

    2024年01月16日 18:20:35   來源:TechWeb

      1月16日消息,智譜AI今天發(fā)布全自研第四代基座大模型GLM-4,性能相比前一代GLM-3提升60%、中文能力比肩GPT-4。

      智譜AI CEO張鵬介紹,GLM-4的整體性能相比上一代大幅提升,逼近GPT-4。它可以支持更長的上下文,具備更強的多模態(tài)能力。同時,它的推理速度更快,支持更高的并發(fā),大大降低推理成本。

      除此之外,GLM-4大幅提升了智能體能力,GLM-4 All Tools 實現(xiàn)自主根據(jù)用戶意圖,自動理解、規(guī)劃復雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復雜任務。GLMs 個性化智能體定制功能亦同時上線,用戶用簡單的提示詞指令就能創(chuàng)建屬于自己的 GLM 智能體。

      中文能力比肩GPT-4

      在基礎能力方面,GLM-4在各項評測集上的最終得分如下:

      MMLU:81.5,達到GPT-4的94%水平;

      GSM8K:87.6 ,達到GPT-4的95%水平;

      MATH :47.9,達到GPT-4的91%水平;

      BBH :82.3,達到GPT-4的99%水平;

      HellaSwag :85.4,達到GPT-4 的90%水平;

      HumanEval:72,達到GPT-4的100%水平。

      指令跟隨能力方面, GLM-4在IFEval Prompt提示詞跟隨中文方面達到和GPT-4的88%水平,指令跟隨(中文)方面達到 90%水平。

      對齊能力上,基于AlignBench數(shù)據(jù)集,GLM-4超過了GPT-4的6月13日版本,逼近GPT-4最新11月6日版本的效果。GLM-4在中文推理、邏輯推理方面的能力,還有待進一步提升。

      GLM-4可以支持128k的上下文窗口長度,單次提示詞可以處理的文本可以達到300頁。同時,在needle test(大海撈針)測試中,128K文本長度內(nèi)GLM-4 模型均可做到幾乎100%的精度召回,并未出現(xiàn)長上下文全局信息因為失焦而導致的精度下降問題。

      同時,多模態(tài)能力方面,GLM-4在文生圖(CogView3)和多模態(tài)理解都得到了增強。CogView3效果超過開源最佳的Stable Diffusion XL,逼近DALLE•3。

      此外,GLM-4的All Tools能力全新發(fā)布。

      GLM-4實現(xiàn)了自主根據(jù)用戶意圖,自動理解、規(guī)劃復雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和文生圖CogView3模型。

      同時,GLM-4 通過代碼解釋器,會自動調(diào)用代碼解釋器進行復雜的方程或者微積分求解。對比GSM8K、Math以及Math23K三個數(shù)據(jù)集上的結(jié)果,GLM-4 All Tools取得和GPT-4 All Tools相當?shù)男Ч?/p>

      GLM-4的All Tools能力完全自動,而且可以處理各種任務,比如包括文件處理、數(shù)據(jù)分析、圖表繪制等復雜任務,支持處理 Excel、PDF、PPT 等格式的文件。

      GLMs上線 大模型開源基金共建生態(tài)

      GLMs個性化智能體定制能力也同步上線。

      基于GLM-4模型的強大能力,張鵬介紹介紹,用戶只要登錄智譜清言官方網(wǎng)站,用簡單的提示詞指令就能創(chuàng)建屬于自己的GLM智能體。

      用戶可以通過全新上線的智能體中心分享自己創(chuàng)建的各種智能體。GLM模型智能體的推出標志著任何人都能夠自由運用GLM-4模型并挖掘它的潛力,沒有任何編程基礎也能夠?qū)崿F(xiàn)大模型的便捷開發(fā)。這是智譜AI為降低大模型使用門檻所做的最新努力。

      此前,智譜AI分別聯(lián)合CCF中國計算機學會、中國中文信息學會社會媒體處理專委會發(fā)起了CCF-智譜大模型基金、SMP-智譜大模型交叉學科基金,用于支持大模型理論、算法、模型、應用等相關研究和跨領域交叉創(chuàng)新。去年兩支基金為來自全國三十余所高校參與的41個研究項目累計提供了超1000萬元現(xiàn)金和算力資源的科研支持。

      2024年智譜AI也將發(fā)起開源開放的大模型開源基金。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。