冰雪大世界盛大開園,美的空調(diào)橫跨50℃打造“東北夏威夷”臺灣小土豆勇闖冰雪大世界,美的空調(diào)真暖快車成為最熱打卡點(diǎn)京東iPhone 16系列年底大放價!至高補(bǔ)貼1200元價格低過11.11新一季圓滿假期結(jié)伴大使出發(fā)在即 LG電子十年相伴助力溫暖傳遞中國聯(lián)通組織“魅力亞冬,與智慧同行” 主題采訪活動“萬象分區(qū)”引領(lǐng)電視行業(yè)新潮流,TCL這步棋下得著實(shí)漂亮!百度職業(yè)院校專屬項(xiàng)目“大國智匠”引領(lǐng)職業(yè)教育新范式百度大模型助力2024年碼蹄杯程序設(shè)計大賽,全國高校學(xué)子展現(xiàn)卓越編程實(shí)力碼蹄杯人物特寫:四位編程少年的追夢之旅金倉數(shù)據(jù)庫四項(xiàng)成果入選2024星河案例亞信科技參加2024通信產(chǎn)業(yè)大會 CTO歐陽曄博士等做主題演講用專業(yè)贏得信賴 美好蘊(yùn)育潤康引領(lǐng)孕產(chǎn)營養(yǎng)新風(fēng)尚解鎖新成就!愛企查“度秘書”粉絲突破10萬!英特爾終止x86S架構(gòu)計劃:純64位設(shè)計再度戛然而止豆包大模型全面升級,相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示申通、圓通、韻達(dá)發(fā)布 11 月簡報:快遞業(yè)務(wù)量、收入均同比增長,單票收入均下降SensorTower發(fā)11月中國手游全球收入排行榜 庫洛入榜“YO!原”千里來相會 華為智能生活館·太原茂業(yè)重裝開業(yè)微軟承認(rèn)并調(diào)查Microsoft 365 應(yīng)用出現(xiàn)“產(chǎn)品已停用”錯誤SK 海力士被曝贏得博通HBM訂單,預(yù)計明年 1b DRAM 月產(chǎn)能將擴(kuò)大到 16~17 萬片
  • 首頁 > 云計算頻道 > 大模型

    谷歌推出”自我發(fā)現(xiàn)“框架,極大增強(qiáng)GPT-4等大模型推理能力

    2024年03月28日 09:37:45   來源:AIGC開放社區(qū)公眾號

      隨著ChatGPT的出現(xiàn),大語言模型在生成連貫文本和遵循指令方面獲得了巨大技術(shù)突破。然后在推理和解決復(fù)雜內(nèi)容方面,面臨內(nèi)容不準(zhǔn)確、安全等難題。

      谷歌Deepmind和南加州大學(xué)的研究人員提出了“SELF-DISCOVER”。這是一種用于大語言模型的通用框架,能自行發(fā)現(xiàn)任務(wù)內(nèi)在的推理結(jié)構(gòu),以解決對典型提示方法的復(fù)雜推理問題。

      為了測試性能,研究人員在多個復(fù)雜推理基準(zhǔn)測試上評估了SELF-DISCOVER,包括Big Bench Hard、Thinking for Doing和MATH。

      與僅使用鏈?zhǔn)剿季S(CoT)的方法相比,SELF-DISCOVER在21個任務(wù)上取得了高達(dá)42%的性能提升。在社交智能體推理任務(wù)上,使GPT-4的準(zhǔn)確率達(dá)到了85%,比之前最好的方法提高了33%。

      目前,傳統(tǒng)的提示方法在處理復(fù)雜推理問題時存在一定的局限性。例如,鏈?zhǔn)剿季S隱式假設(shè)了某種推理流程,無法充分利用不同模塊各自的長處。

      此外,雖然鏈?zhǔn)剿季S很適合處理線性和逐步遞進(jìn)的問題,但對于需要非線性思維或考慮多個維度交叉因素的復(fù)雜問題,這種方法可能無法提供幫助。

      而SELF-DISCOVER可以引導(dǎo)大語言模型根據(jù)一組給定的原子推理模塊,自行選擇、調(diào)整和組合這些模塊,形成一個用于解決特定任務(wù)的推理結(jié)構(gòu)。

      這種結(jié)構(gòu)不僅結(jié)合了多個推理模塊的優(yōu)勢,而且對每個任務(wù)都是獨(dú)特定制的,從而極大提高模型的推理和解題能力。

      任務(wù)層,自發(fā)現(xiàn)推理結(jié)構(gòu)

      這是SELF-DISCOVER的第一階段,主要在任務(wù)層面上發(fā)現(xiàn)解決該任務(wù)的推理結(jié)構(gòu),由三個細(xì)分模塊來做引導(dǎo)。

      SELECT模塊:從一組原子推理模塊中選擇出解決給定任務(wù)的關(guān)鍵模塊。這些原子推理模塊包含了各種高層次的問題解決啟發(fā)式,例如“逐步思考”和“分解為子任務(wù)”。SELECT模塊會根據(jù)幾個任務(wù)示例,判斷哪些模塊對解決該任務(wù)至關(guān)重要。

      ADAPT模塊:會細(xì)化每個SELECT模塊選擇出的推理模塊,使其更適合給定任務(wù)。例如,從“分解為子任務(wù)”細(xì)化為“先計算每個算術(shù)運(yùn)算”。

      IMPLEMENT模塊:將ADAPT模塊細(xì)化后的推理模塊實(shí)現(xiàn)為一個結(jié)構(gòu)化的行動計劃,將自然語言描述轉(zhuǎn)化為鍵-值對格式的JSON結(jié)構(gòu),明確定義每一步需要生成什么內(nèi)容。

      使用發(fā)現(xiàn)的結(jié)構(gòu)解決任務(wù)

      在第一階段生成了一個與任務(wù)密切相關(guān)的推理結(jié)構(gòu)之后,第二階段會使用這個結(jié)構(gòu)來解決該任務(wù)的所有實(shí)例。

      并在每個實(shí)例后面追加該結(jié)構(gòu),提示語言模型按照結(jié)構(gòu)逐步填寫每個值,最后得出答案。

      與其他方法相比,SELF-DISCOVER擁有三大優(yōu)勢:1)發(fā)現(xiàn)的推理結(jié)構(gòu)整合了多個推理模塊的優(yōu)點(diǎn);

      2)它的效率很高,只需要在任務(wù)層面額外進(jìn)行3次推理;3)發(fā)現(xiàn)的結(jié)構(gòu)反映了該任務(wù)的內(nèi)在特性,比優(yōu)化后的提示更具解釋性。

      研究還發(fā)現(xiàn),SELF-DISCOVER在需要世界知識的任務(wù)上效果最好。這是因?yàn)榫C合使用多個推理模塊可以使模型從不同視角理解問題,而僅使用鏈?zhǔn)剿季S可能會遺漏一些重要信息。

      此外,與需要大量重復(fù)查詢的方法相比,SELF-DISCOVER也展現(xiàn)出了極高的效率。每次只需要一個查詢,而獲得相似性能的集成方法需要40倍的查詢量,也就是說可以節(jié)省很多算力資源。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。