2025年開年,DeepSeek在國(guó)內(nèi)外大模型行業(yè)掀起了地震。除了深度推理模型DeepSeek-R1在回答問題上的表現(xiàn)優(yōu)異之外,DeepSeek的存在,給國(guó)內(nèi)大模型圈注入了緊張又鮮活的空氣。
其一,憑借技術(shù)優(yōu)勢(shì),DeepSeek一舉進(jìn)入國(guó)際大模型頭部梯隊(duì),這給國(guó)內(nèi)大模型公司看到了彎道超車的可能性。
其二,DeepSeek的訓(xùn)練成果,打破了算力受限的問題,證明通過算法優(yōu)化,同樣可以以低算力訓(xùn)練出高質(zhì)量的模型。
當(dāng)算力“卡脖子”的隱憂被放下,兼顧能耗和精度的大模型應(yīng)該解決哪些問題?在這個(gè)層面上,國(guó)內(nèi)大模型公司紛紛交出了各自的答卷。
最近,由中國(guó)科學(xué)院自動(dòng)化所孵化的AI企業(yè)中科聞歌發(fā)布的雅意大模型旗艦版——YAYI-Ultra在破解大模型落地"精度-能耗"困局前給出了自己的答案。
作為覆蓋全球100+模型的權(quán)威評(píng)測(cè)體系,OpenCompass榜單歷來是觀察大模型技術(shù)路線的"晴雨表",在其近日發(fā)布的OpenCompass大模型公開學(xué)術(shù)榜單中,中科聞歌YAYI-Ultra,以64.5分首次闖入前十,成為TOP10中五個(gè)中國(guó)大模型之一。
在OpenCompass最新大語言模型公開學(xué)術(shù)實(shí)時(shí)榜單中,YAYI-Ultra排名綜合得分64.5,排名第十,其中:
代碼生成:LiveCodeBench排名第五,表現(xiàn)優(yōu)于GPT-4o-20241120版本
復(fù)雜指令理解:IFEval排名第九
知識(shí)推理能力:MMLU-Pro排名第九
在側(cè)重中文理解的C-Eval評(píng)測(cè)中,YAYI-Ultra在允許自主驗(yàn)證的公開訪問榜單位列第二,展現(xiàn)了在中文場(chǎng)景下的技術(shù)優(yōu)勢(shì)。
一手實(shí)測(cè):超長(zhǎng)文輸出復(fù)雜任務(wù)規(guī)劃精準(zhǔn)拿捏
根據(jù)官方信息,YAYI-Ultra在圖表理解、復(fù)雜任務(wù)、長(zhǎng)文理解與生成方面表現(xiàn)突出,我們立馬上手從六個(gè)維度(多模態(tài)圖表深度理解、復(fù)雜圖像理解、復(fù)雜任務(wù)智能規(guī)劃(Function Call)、數(shù)據(jù)統(tǒng)計(jì)分析及超長(zhǎng)文本理解與生成)實(shí)測(cè)下YAYI-Ultra表現(xiàn)到底如何。
01 視覺理解再升級(jí):懂語言,更懂圖表
上來我們先來讀個(gè)圖表試試。
prompt:2000年前后,哪個(gè)價(jià)格區(qū)間的物業(yè)費(fèi)占比變化最多?
YAYI-Ultra可以準(zhǔn)確識(shí)別柱狀圖中的不同顏色和數(shù)字,充分理解圖表并給出回答。
除了中文場(chǎng)景外,在多語言場(chǎng)景中,YAYI-Ultra也能夠準(zhǔn)確理解并遵循用戶指令,提供跨語言的精準(zhǔn)回復(fù)。
prompt:How did the distribution of agriculture-related employment change between 2012 and 2022? Did it increase or decrease, and by what percentage or amount? Answer in Chinese。
可以看到,在視覺理解方面,針對(duì)跨語言多模態(tài)對(duì)齊、多圖推理、可變分辨率等技術(shù)難點(diǎn),YAYI-Ultra全面升級(jí),增強(qiáng)了模型在跨語言圖表理解、多圖表問答、多模態(tài)指令遵循等方面的能力,不僅能輕松應(yīng)對(duì)堆積條形圖、散點(diǎn)圖、混合圖表等復(fù)雜圖表場(chǎng)景,在圖表重繪、圖表轉(zhuǎn)換等任務(wù)上也表現(xiàn)突出。
02 表格智解:萬千表格不在話下
在工作中,復(fù)雜報(bào)告統(tǒng)計(jì)費(fèi)時(shí)又費(fèi)力,我們“喂”給YAYI-Ultra一張包含行業(yè)普通報(bào)告、行業(yè)深度報(bào)告、公司普通報(bào)告三種類型交替出現(xiàn)的表格,YAYI-Ultra準(zhǔn)確統(tǒng)計(jì)出不同類型報(bào)告的數(shù)量。
prompt:每種報(bào)告類型的數(shù)量是多少?
當(dāng)涉及不規(guī)則表格時(shí),YAYI-Ultra依然能夠精準(zhǔn)解析并提取關(guān)鍵數(shù)據(jù)。以下表格包含總分結(jié)構(gòu)及復(fù)雜數(shù)據(jù)表述,YAYI-Ultra能夠準(zhǔn)確理解表格中的模型類型、方法及局部性指標(biāo)變化數(shù)值,并完成對(duì)比分析。
prompt:哪個(gè)基座模型使用IKE方法后局部性下降最多?
在統(tǒng)計(jì)數(shù)據(jù)理解方面,可以看出YAYI-Ultra重點(diǎn)增強(qiáng)了表格問答中復(fù)雜排版理解、跨語言問答等能力。
從金融報(bào)告、學(xué)術(shù)論文,到包含嵌套結(jié)構(gòu)的復(fù)雜表格,YAYI-Ultra都能精準(zhǔn)定位信息、理解用戶意圖;同時(shí),模型也能夠在跨語言表格問答場(chǎng)景中,提供高效、清晰的解答。
03 Function Call:復(fù)雜任務(wù)智能規(guī)劃
繼續(xù)上難度,我們讓YAYI-Ultra繪制一下去年奧運(yùn)會(huì)中國(guó)隊(duì)金、銀、銅獎(jiǎng)牌數(shù)量折線圖(隨時(shí)間變化)。
首先可以看到,YAYI-Ultra準(zhǔn)確理解了用戶意圖,確定“去年奧運(yùn)會(huì)”指的是巴黎奧運(yùn)會(huì),并制定出詳細(xì)的任務(wù)規(guī)劃;接下來,模型通過搜索引擎獲取巴黎奧運(yùn)會(huì)中國(guó)隊(duì)金、銀、銅牌相關(guān)數(shù)據(jù)(包括91枚獎(jiǎng)牌的類型及獲得時(shí)間);再將這些獎(jiǎng)牌數(shù)據(jù)進(jìn)行梳理,歸類分組、按時(shí)排序,并生成代碼,通過調(diào)用代碼解釋器,完成折線圖繪制。
YAYI-Ultra之所以能夠完成這一系列的復(fù)雜任務(wù)拆解與規(guī)劃,離不開其增加的工具調(diào)用能力,主要包含搜索引擎、代碼解釋器、圖像解析、天氣等基礎(chǔ)工具;新聞熱榜追蹤、傳播影響力分析等特色垂直領(lǐng)域工具。
模型顯著增強(qiáng)了在多工具串行調(diào)用場(chǎng)景下的規(guī)劃合理性,同時(shí)提升了復(fù)雜搜索場(chǎng)景下的信息收集能力。
04 多模態(tài)輸出:圖文并茂,直觀簡(jiǎn)潔
在文獻(xiàn)閱讀或者信息收集過程中,我們通常需要從多篇文檔中查找、分析特定信息(如數(shù)值變化、實(shí)驗(yàn)結(jié)果等),現(xiàn)在一句話就能找到想要的內(nèi)容,并且YAYI-Ultra在文字分析描述的基礎(chǔ)上,可同步給出對(duì)應(yīng)的圖片內(nèi)容。
比如,提問:The percentage of different behaviors under different collaborative strategies
YAYI-Ultra根據(jù)問題,從用戶構(gòu)建的“人工智能論文知識(shí)庫”中識(shí)別相關(guān)的多篇人工智能論文,并據(jù)此進(jìn)行回答。答案中不僅有文字,還在對(duì)應(yīng)的引用位置給出了原始圖片,大大提升了閱讀體驗(yàn)及答案可靠性。
05 全棧長(zhǎng)文:吞吐萬言,下筆如神
最讓人眼前一亮的要屬超長(zhǎng)文輸出,YAYI-Ultra支持最長(zhǎng)20萬字輸入和10萬字超長(zhǎng)輸出,形成從“輸入理解”到“內(nèi)容創(chuàng)作”的全鏈路長(zhǎng)文本能力閉環(huán)。
YAYI-Ultra支持聯(lián)網(wǎng)智能創(chuàng)作與文獻(xiàn)錨定創(chuàng)作雙模式,并將長(zhǎng)文寫作任務(wù)拆解為更小、更可控的子任務(wù)(先生成大綱,再根據(jù)大綱生成全文),這樣有效保證了文本結(jié)構(gòu),提升長(zhǎng)文生成質(zhì)量。
● 聯(lián)網(wǎng)智能創(chuàng)作:聯(lián)網(wǎng)收集信息完成創(chuàng)作
prompt:寫一篇30000字的中國(guó)儒家文化發(fā)展歷史分析報(bào)告
● 文獻(xiàn)錨定創(chuàng)作:劃定知識(shí)邊界精準(zhǔn)寫作
prompt:請(qǐng)根據(jù)參考資料寫一篇長(zhǎng)文,寫作的主題是“通用人工智能解決方案:創(chuàng)新與效率的完美結(jié)合”
06 數(shù)據(jù)分析:精準(zhǔn)求解,可視交互
最后,我們也針對(duì)基礎(chǔ)的數(shù)據(jù)分析和可視化圖表繪制進(jìn)行了實(shí)測(cè),YAYI-Ultra準(zhǔn)確完成分析、計(jì)算和圖表繪制任務(wù)。
prompt:根據(jù)表格,計(jì)算人均月收入,然后計(jì)算月收入與人均月收入的差值,繪制一個(gè)柱形圖,橫軸是名字,縱軸是差值,標(biāo)題是“每人收入與平均值差距”。
YAYI-Ultra根據(jù)用戶要求,通過Python of Thought(POT)能力,生成Python代碼并執(zhí)行,精準(zhǔn)完成了統(tǒng)計(jì)推斷、矩陣運(yùn)算、數(shù)值優(yōu)化等數(shù)值密集型任務(wù)。
從“大水漫灌”到“精準(zhǔn)匹配”,YAYI-Ultra用靈活專家配置突破大模型落地瓶頸
當(dāng)前,AI大模型落地正面臨“能力-成本”剪刀差擴(kuò)大的關(guān)鍵節(jié)點(diǎn)。
據(jù)IDC最新報(bào)告顯示,企業(yè)在AI大模型落地過程中,面臨模型精度不能完全滿足業(yè)務(wù)需求的問題;同時(shí),92%的企業(yè)認(rèn)為在大模型工程化落地階段,缺少算力資源是最大的挑戰(zhàn)。
中科聞歌雅意技術(shù)團(tuán)隊(duì)透露,YAYI-Ultra是以多領(lǐng)域能力為特色的混合專家模型,為了提升在不同領(lǐng)域?qū)I(yè)任務(wù)上的表現(xiàn),采用靈活的專家配置模式,支持?jǐn)?shù)學(xué)、代碼、金融、輿情、中醫(yī)、安全等多種領(lǐng)域?qū)<医M合,能顯著緩解稠密模型在垂直領(lǐng)域遷移過程中普遍存在的“蹺蹺板”現(xiàn)象,可針對(duì)不同領(lǐng)域需求,為行業(yè)提供"高精度、低能耗"的智能化解決方案。
譬如,在媒體領(lǐng)域,中科聞歌推出紅旗3.0融媒體智能平臺(tái),基于YAYI能力,幫助客戶將內(nèi)容創(chuàng)作時(shí)間縮短30%-50%,內(nèi)容發(fā)布頻率提升了20%-40%,某客戶在引入自動(dòng)化審核能力后,內(nèi)容差錯(cuò)率從5%降至0.5%左右,目前已廣泛應(yīng)用于新華社、央視、中國(guó)日?qǐng)?bào)等頭部媒體。
在醫(yī)療領(lǐng)域,基于YAYI的大醫(yī)金匱中醫(yī)大模型,可精準(zhǔn)診斷500余種常見病癥,為患者提供個(gè)性化的治療方案,經(jīng)臨床專家測(cè)評(píng)辨證推理準(zhǔn)確率高達(dá)90%,在中醫(yī)師資格考試模擬測(cè)試中表現(xiàn)優(yōu)異,準(zhǔn)確率超過94%,并面向C端用戶推出了“大醫(yī)金匱”中醫(yī)健康管理APP。
在財(cái)稅領(lǐng)域,基于YAYI的財(cái)稅知識(shí)大模型,經(jīng)專項(xiàng)測(cè)評(píng),模型回答準(zhǔn)確率90.1%,高于其他同類型模型,在接入大模型后,客戶實(shí)現(xiàn)24小時(shí)不間斷的咨詢服務(wù),使得用戶減少排隊(duì)時(shí)間約50%,用戶滿意度提升超過30%。
當(dāng)前,YAYI-Ultra(yayi.wenge.com)已在官網(wǎng)開放數(shù)據(jù)分析、知識(shí)庫文獻(xiàn)解析、超長(zhǎng)文寫作功能體驗(yàn),感興趣的小伙伴也可以登錄試用。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。