諾基亞成功在月球部署 4G 網(wǎng)絡(luò),但通話測試因著陸器故障告吹2024 年美國民眾因詐騙損失 125 億美元,社交媒體成詐騙發(fā)生重災(zāi)區(qū)比亞迪儲能與 Greenvolt Power 簽署 1.6GWh 儲能項目,預(yù)計 2026 年第一季度完工董明珠再談“董明珠健康家”:代言十幾年給格力省了十幾億廣告費,不存在綁定大件家電評論區(qū)竟是“翻車”現(xiàn)場! 帶圖評論竟是“坑”!拼單平臺虛假好評套路深?這幾條讓你不再踩雷!文案圖片一模一樣!拼單平臺“買家秀”竟是商家自導(dǎo)自演?工信部:加快 6G 研發(fā)進程,推進算力中心建設(shè)布局優(yōu)化LG 電子稱其接近登頂高端電視市場:坐穩(wěn) OLED 第一大廠,但 Mini LED 及量子點電視仍落后谷歌 Play 版微信 WeChat 已為國內(nèi)用戶激活 FCM 推送功能,避免消息延遲賽睿推出全新QcK Performance系列游戲鼠標墊2025年2月線下家電市場總結(jié)舊電視50塊折舊覺得少,要不給它DIY成“新”電視?AI爭鳴:對著空調(diào)聊天說話,會不會很尷尬?滲透率增長至18%,Mini LED成中國電視行業(yè)逆風(fēng)翻盤的“殺手锏”宇樹科技創(chuàng)始人王興興自稱不是學(xué)霸:高中英語只及格過 3 次,剛創(chuàng)業(yè)時曾四處碰壁全國最大跨度,廣湛高鐵珠三角機場站拱形結(jié)構(gòu)完成施工消息稱阿維塔科技正考慮赴港上市,籌資 10 億美元微軟 Win10 推送 3 月累積更新,修復(fù) SSH 連接等諸多問題消息稱臺積電已向英偉達、AMD、博通提議組建合資企業(yè),共同運營英特爾晶圓代工廠
  • 首頁 > 云計算頻道 > 大模型

    阿里通義宣布開源R1-Omni模型 可提升多模態(tài)情感識別能力

    2025年03月12日 11:29:50   來源:AIbase基地

      3月11日,通義實驗室團隊宣布開源R1-Omni模型,為全模態(tài)模型的發(fā)展帶來了新的突破。該模型結(jié)合了強化學(xué)習(xí)與可驗證獎勵(RLVR)方法,專注于提升多模態(tài)情感識別任務(wù)中的推理能力和泛化性能。

      R1-Omni的訓(xùn)練分為兩個階段。在冷啟動階段,團隊使用包含580條視頻數(shù)據(jù)的組合數(shù)據(jù)集進行微調(diào),這些數(shù)據(jù)來自Explainable Multimodal Emotion Reasoning(EMER)數(shù)據(jù)集和HumanOmni數(shù)據(jù)集。這一階段旨在為模型奠定基礎(chǔ)推理能力,確保其在進入RLVR階段前具備一定的多模態(tài)情感識別能力,從而保障后續(xù)訓(xùn)練的平穩(wěn)性、效率與穩(wěn)定性。

      隨后,在RLVR階段,模型通過強化學(xué)習(xí)與可驗證獎勵機制進一步優(yōu)化。該階段的關(guān)鍵在于策略模型和獎勵函數(shù)。策略模型處理視頻幀和音頻流組成的多模態(tài)輸入數(shù)據(jù),生成帶有詳細推理過程的候選響應(yīng),展示模型如何整合視覺和聽覺信息以得出預(yù)測。獎勵函數(shù)則受DeepSeek R1啟發(fā),分為精確率獎勵和格式獎勵兩部分,共同形成最終獎勵,既鼓勵模型生成正確預(yù)測,又保證輸出結(jié)構(gòu)化且符合預(yù)設(shè)格式。

      實驗結(jié)果顯示,R1-Omni在同分布測試集DFEW和MAFW上,相較于原始基線模型平均提升超過35%,相較于有監(jiān)督微調(diào)(SFT)模型在未加權(quán)平均召回率(UAR)上提升高達10%以上。在不同分布測試集RAVDESS上,其加權(quán)平均召回率(WAR)和UAR均提升超過13%,展現(xiàn)出卓越的泛化能力。此外,R1-Omni還具有顯著的透明性優(yōu)勢,通過RLVR方法,音頻和視頻信息在模型中的作用變得更加清晰可見,能夠明確展示各模態(tài)信息對特定情緒判斷的關(guān)鍵作用,為理解模型決策過程和未來研究提供了重要參考。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。