CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型
  • 首頁 > 云計算頻道 > 大模型

    《人工智能大模型體驗報告2.0》出爐:訊飛星火奪冠,得分逼近人類

    2023年08月14日 14:12:39   來源:中文科技資訊

      今年以來,國內(nèi)科技企業(yè)紛紛布局人工智能大模型。為進一步直觀感受我國當(dāng)前主流科技企業(yè)所推出的大模型產(chǎn)品的現(xiàn)狀、優(yōu)勢和特點,8月12日,新華社研究院中國企業(yè)發(fā)展研究中心基于嚴(yán)格測評,發(fā)布《人工智能大模型體驗報告2.0》,對當(dāng)前國內(nèi)各主流大模型的表現(xiàn)給出評述。

      與2023年6月首次發(fā)布的《人工智能大模型體驗報告》相比,本次測評在題目設(shè)計、對標(biāo)Benchmark(人類)、打分權(quán)重、專家測評團隊四大維度進行了全面升級。

      其中,在題目設(shè)計方面,測評題目由300道擴展至500道,并進一步完善了題目分類;

      在對標(biāo)Benchmark方面,本次測評將接受過高等教育的人類作為對照,來考評大模型真實能力;

      在打分標(biāo)準(zhǔn)上,本次測評根據(jù)對產(chǎn)業(yè)、生活的實際價值,對基礎(chǔ)能力、智商能力、情商能力和工具提效四大測評維度進行了權(quán)重設(shè)計;

      在測評團隊方面,本次測評特邀北京大學(xué)文化與傳播研究所及其他產(chǎn)界、學(xué)界專家全程參與。

      本次研究設(shè)置了用戶體驗項目,抓取了7月31日—8月4日數(shù)據(jù),通過人機互動提問等形式,對國內(nèi)主流大模型進行使用體驗評測,旨在為科技企業(yè)調(diào)整努力方向提供參考。

      報告顯示,與2023年6月相比,當(dāng)前中國大模型產(chǎn)品進步顯著。但與接受過高等教育的人類相比,大模型在智商、情商等方面還存在一定程度差距。

      具體來看,訊飛星火在工作提效、智商等方面優(yōu)勢明顯,百度文心一言基礎(chǔ)能力出色,商湯商量則在情商方面表現(xiàn)優(yōu)秀,智譜AI-ChatGLM整體表現(xiàn)不俗。

      歸結(jié)到基礎(chǔ)能力、智商能力、情商能力和工具提效四大維度綜合得分上,科大訊飛星火表現(xiàn)最強,1013分,逼近人類水平(1014分),其次是百度文心一言和商湯商量,總分分別為1010分和983分。

      報告認為,雖然在不同領(lǐng)域中,AI和人類表現(xiàn)出不同的優(yōu)劣勢,但在整體上,AI大模型的發(fā)展為人類工作和生活的提質(zhì)增效帶來了重要的積極影響,大模型正在加速走進生活、走進產(chǎn)業(yè)。

      據(jù)了解,此次測評總分第一的訊飛星火大模型發(fā)布于5月6日。并于6月9日發(fā)布星火1.5版本,與上一個版本相比,升級版不僅各項能力獲得持續(xù)提升,且在綜合能力上實現(xiàn)了三大升級:

      開放式知識問答取得突破,提升24%,較好地解決了當(dāng)前大模型技術(shù)有待攻克的“三大缺陷”:新知識難以更新、事實類問答容易“張冠李戴”、史實傳統(tǒng)典籍等容易“編造情節(jié)”。

      多輪對話躍遷,對話體驗更接近真人;邏輯和數(shù)學(xué)能力明顯提升。

      特別是在數(shù)學(xué)能力,科大訊飛星火大模型不但能綜合應(yīng)用方程、排列組合、經(jīng)典算法等各種數(shù)學(xué)方法,給出正確答案,而且能給出分析過程,讓用戶在“知其然”的同時,還能“知其所以然”。

      除了大模型自身能力進一步提升外,訊飛星火1.5版發(fā)布會上,科大訊飛還正式發(fā)布了星火APP和星火語伴APP等C端產(chǎn)品,加上此前已和大模型融合的科大訊飛AI學(xué)習(xí)機、智能智能辦公本、訊飛聽見、汽車智能座艙語音交互和數(shù)字員工等產(chǎn)品,成為業(yè)內(nèi)第一家實現(xiàn)大模型商業(yè)應(yīng)用落地的公司。

      受大模型加持帶動,2023年5月至6月,科大訊飛C端硬件GMV創(chuàng)歷史新高,同比翻倍增長。其中,搭載訊飛星火認知大模型的訊飛AI學(xué)習(xí)機GMV在5月和6月分別增長136%和217%。

      同時,訊飛人工智能開放平臺的開發(fā)者團隊數(shù)量增長迅猛,兩個月時間增加85萬。截至2023年6月30日,科大訊飛開放平臺開發(fā)者數(shù)已達到497.4萬,近一年增長45%。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    [No. X058-2]
    分享到微信

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。