MOVA洗地機CES 2025首秀 X40 Pro推動家居美學融合大放異彩!追覓CES 2025完美收官載譽而歸MOVA在CES 2025盡顯創(chuàng)新實力 為全球智能家居市場注入新活力1月13日京東3C數(shù)碼“瘋狂星期一”低價來襲 爆款低至5折Perplexity與旅游網(wǎng)站合作 帶來全新酒店信息搜索體驗微軟聯(lián)合清北推rStar-Math技術(shù):小型模型逆襲數(shù)學問題,超越 OpenAI!xAI首款獨立應(yīng)用Grok上線,在蘋果應(yīng)用商店上架華碩CES 2025新品搶先在京東開啟預(yù)約 1元解鎖超值早鳥權(quán)益東哥同款年貨詞典筆備受關(guān)注 有道詞典筆流量環(huán)比增長超270%全球首列商業(yè)化運營碳纖維地鐵列車“CETROVO 1.0 碳星快軌”在青島開啟載客運營Linux 基金會提出“Chromium 瀏覽器支持者”計劃,谷歌、微軟、Meta、Opera 紛紛加入廣汽菲克長沙工廠第 5 次拍賣:起拍價降至 9.92 億元接近腰斬,前 4 次均因無人報名而流拍升起獨立大旗,英特爾旗下可編程芯片子公司 Altera 正式以獨立子公司身份運營商湯科技發(fā)布 “日日新” 融合大模型,與DeepSeek V3不相上下海螺AI推出主體參考功能 一張圖片就能玩轉(zhuǎn)電影大片一加13系列北美歐洲首銷戰(zhàn)報:首小時同比增長167%2024年國游銷量年榜出爐:《黑神話》銷量2800萬穩(wěn)居第一 賺了90億微信官網(wǎng)上線HarmonyOS標識!華為鴻蒙已是全球第三大移動操作系統(tǒng)儲能迎來“集裝箱時刻”:海辰儲能首發(fā)儲能“標準化”新解法,用Pack撬動未來蔚來 firefly 螢火蟲部分配置公布,采用后五連桿獨立懸架
  • 首頁 > 云計算頻道 > 大模型

    司南OpenCompass 2.0評測GLM-4穩(wěn)坐國內(nèi)榜首,智譜AI大模型實力強悍

    2024年05月22日 14:26:37   來源:中文科技資訊

      近期,大模型開源開放評測體系司南(OpenCompass 2.0)公布了2024年4月大語言模型最新評測榜單,智譜AI的GLM-4繼續(xù)保持國產(chǎn)大模型第一的領(lǐng)先身位。

      大模型開源開放評測體系司南(OpenCompass 2.0)由上海人工智能實驗室發(fā)布。其月度榜單從基礎(chǔ)能力和綜合能力的設(shè)計出發(fā),構(gòu)建了一套高質(zhì)量的中英文雙語評測基準體系,對主流開源模型和商業(yè)API模型進行了全面評測分析。評測榜單涉及的大語言模型和多模態(tài)大模型超過150個,更有包括Meta、阿里巴巴、騰訊、百度等30余家國內(nèi)外企業(yè)和科研機構(gòu)采用OpenCompass助力開展技術(shù)研發(fā)。

      在4月客觀評測榜單中,OpenCompass基于語言、知識、推理、數(shù)學、代碼、智能體六個維度構(gòu)建了15000余道高質(zhì)量中英文雙語問題,并引入OpenCompass團隊首創(chuàng)的循環(huán)評估 (Circular Evalution) 策略,系統(tǒng)性分析了國內(nèi)外大模型的客觀性能。其中,GLM-4位列第四名,僅次于GPT-4-Turbo系列與Claude3-Opus,成為國內(nèi)大模型客觀評測月度總榜第一名。在語言維度方面,GLM-4分數(shù)達到57.7分表現(xiàn)突出,超過GPT-4-Turbo系列與Claude3-Opus。在知識維度上,GLM-4得到68.9分,超過第二名的GPT-4-Turbo-1106,與第三名Claude3-Opus不相上下。

      值得一提的是,GLM-4此前便長期占據(jù)OpenCompass 2.0榜單前列,并多次在權(quán)威榜單與全球頂級大模型一較高下。清華《SuperBench大模型綜合能力評測報告》顯示,GLM-4在語義理解等方面的能力表現(xiàn)超過了GPT-4-Turbo等國際一流模型,在代碼、智能體等方面,排名國內(nèi)第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型測評基準中,GLM-4斬獲一項A+及多項A級評價,在國內(nèi)大模型中排名第一。

      據(jù)了解,GLM-4是由智譜AI于今年1月推出的新一代基座大模型。GLM-4整體性能逼近GPT-4,它可以支持更長的上下文,具備更強的多模態(tài)能力。同時,它的推理速度更快,支持更高的并發(fā),大大降低推理成本。依托GLM-4 All Tools能力,GLM-4智能體能夠?qū)崿F(xiàn)自主根據(jù)用戶意圖,自動理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復(fù)雜任務(wù)。

      開發(fā)者可以通過智譜AI大模型開放平臺bigmodel.cn接入GLM-4模型開放API,便捷高效地體驗GLM-4的強大能力。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    [No. s026 ]
    分享到微信

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。