中山大學(xué)HCP實驗室聯(lián)合Sea AI Lab和哈佛大學(xué)等單位開展的一項研究,成功地讓大型人工智能模型通過講笑話的方式,探索多模態(tài)大模型的創(chuàng)造力,并因此獲得了計算機視覺和模式識別領(lǐng)域的頂級會議CVPR的認(rèn)可。
這項研究的關(guān)鍵在于使用來自日本的“大喜利”(Oogiri)創(chuàng)新響應(yīng)游戲作為數(shù)據(jù)源。傳統(tǒng)的大模型,如GPT-4,處理這類任務(wù)時往往表現(xiàn)得過于正經(jīng),缺乏幽默感。而中山大學(xué)的“梗王大模型”則能夠根據(jù)圖像或文本輸入,生成具有幽默感和創(chuàng)意的響應(yīng)。
“大喜利”游戲要求玩家對提供的多模態(tài)內(nèi)容(如問題、圖像等)給出幽默和創(chuàng)意的回應(yīng)。例如,一張老人向年輕人求助的圖片,傳統(tǒng)回應(yīng)可能是詢問路線,而“大喜利”風(fēng)格的回應(yīng)可能是請求幫助解開手銬,這種出人意料的回答具有強烈的幽默沖擊感。
研究團隊采用了一種新的非順序、創(chuàng)造性思維范式——跳躍思維(Leap-of-Thought,LoT),以及一套基于此范式的訓(xùn)練方法CLoT。CLoT包括關(guān)聯(lián)性指令微調(diào)和探索性自我調(diào)整兩個階段,旨在激發(fā)模型的創(chuàng)新響應(yīng)能力。
性能評估方面,CLoT在Oogiri-GO數(shù)據(jù)集上的選擇題和排序題評估中,顯著提高了多模態(tài)大模型的性能,并超越了包括GPT-4在內(nèi)的其他先進(jìn)模型。用戶調(diào)查也證實了CLoT在生成幽默內(nèi)容方面的優(yōu)越性。此外,CLoT在其他任務(wù)如“看云猜物CGG”和“發(fā)散思維測試DAT”中也展現(xiàn)了良好的泛化能力。
中山大學(xué)人機物智能融合實驗室(HCP Lab)由林倞教授于2010年創(chuàng)立,專注于多模態(tài)內(nèi)容理解、因果及認(rèn)知推理、具身學(xué)習(xí)等領(lǐng)域的研究,并取得了豐富的學(xué)術(shù)成果。此次研究的成功,不僅展示了該實驗室在AI領(lǐng)域的創(chuàng)新能力,也為未來的人工智能研究提供了新的思路和方法。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。