穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認證并投入市場安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎電動自行車強制性“國標(biāo)”再修訂,綠源電動車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對承壓的小家電市場,小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機僅有iPad大小2024年冷年空調(diào)市場總結(jié):規(guī)模下探,結(jié)構(gòu)降級,空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機型蓄勢待發(fā)云天勵飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充FF發(fā)布第二品牌Faraday X:對標(biāo)豐田 專注增程式混動車型黑神話悟空總收入超67億:銷量已超2000萬份通快成立激光業(yè)務(wù)區(qū)域中心(中國),強勢布局中國市場
  • 首頁 > 云計算頻道 > 大模型

    谷歌推出”自我發(fā)現(xiàn)“框架,極大增強GPT-4等大模型推理能力

    2024年03月28日 09:37:45   來源:AIGC開放社區(qū)公眾號

      隨著ChatGPT的出現(xiàn),大語言模型在生成連貫文本和遵循指令方面獲得了巨大技術(shù)突破。然后在推理和解決復(fù)雜內(nèi)容方面,面臨內(nèi)容不準(zhǔn)確、安全等難題。

      谷歌Deepmind和南加州大學(xué)的研究人員提出了“SELF-DISCOVER”。這是一種用于大語言模型的通用框架,能自行發(fā)現(xiàn)任務(wù)內(nèi)在的推理結(jié)構(gòu),以解決對典型提示方法的復(fù)雜推理問題。

      為了測試性能,研究人員在多個復(fù)雜推理基準(zhǔn)測試上評估了SELF-DISCOVER,包括Big Bench Hard、Thinking for Doing和MATH。

      與僅使用鏈?zhǔn)剿季S(CoT)的方法相比,SELF-DISCOVER在21個任務(wù)上取得了高達42%的性能提升。在社交智能體推理任務(wù)上,使GPT-4的準(zhǔn)確率達到了85%,比之前最好的方法提高了33%。

      目前,傳統(tǒng)的提示方法在處理復(fù)雜推理問題時存在一定的局限性。例如,鏈?zhǔn)剿季S隱式假設(shè)了某種推理流程,無法充分利用不同模塊各自的長處。

      此外,雖然鏈?zhǔn)剿季S很適合處理線性和逐步遞進的問題,但對于需要非線性思維或考慮多個維度交叉因素的復(fù)雜問題,這種方法可能無法提供幫助。

      而SELF-DISCOVER可以引導(dǎo)大語言模型根據(jù)一組給定的原子推理模塊,自行選擇、調(diào)整和組合這些模塊,形成一個用于解決特定任務(wù)的推理結(jié)構(gòu)。

      這種結(jié)構(gòu)不僅結(jié)合了多個推理模塊的優(yōu)勢,而且對每個任務(wù)都是獨特定制的,從而極大提高模型的推理和解題能力。

      任務(wù)層,自發(fā)現(xiàn)推理結(jié)構(gòu)

      這是SELF-DISCOVER的第一階段,主要在任務(wù)層面上發(fā)現(xiàn)解決該任務(wù)的推理結(jié)構(gòu),由三個細分模塊來做引導(dǎo)。

      SELECT模塊:從一組原子推理模塊中選擇出解決給定任務(wù)的關(guān)鍵模塊。這些原子推理模塊包含了各種高層次的問題解決啟發(fā)式,例如“逐步思考”和“分解為子任務(wù)”。SELECT模塊會根據(jù)幾個任務(wù)示例,判斷哪些模塊對解決該任務(wù)至關(guān)重要。

      ADAPT模塊:會細化每個SELECT模塊選擇出的推理模塊,使其更適合給定任務(wù)。例如,從“分解為子任務(wù)”細化為“先計算每個算術(shù)運算”。

      IMPLEMENT模塊:將ADAPT模塊細化后的推理模塊實現(xiàn)為一個結(jié)構(gòu)化的行動計劃,將自然語言描述轉(zhuǎn)化為鍵-值對格式的JSON結(jié)構(gòu),明確定義每一步需要生成什么內(nèi)容。

      使用發(fā)現(xiàn)的結(jié)構(gòu)解決任務(wù)

      在第一階段生成了一個與任務(wù)密切相關(guān)的推理結(jié)構(gòu)之后,第二階段會使用這個結(jié)構(gòu)來解決該任務(wù)的所有實例。

      并在每個實例后面追加該結(jié)構(gòu),提示語言模型按照結(jié)構(gòu)逐步填寫每個值,最后得出答案。

      與其他方法相比,SELF-DISCOVER擁有三大優(yōu)勢:1)發(fā)現(xiàn)的推理結(jié)構(gòu)整合了多個推理模塊的優(yōu)點;

      2)它的效率很高,只需要在任務(wù)層面額外進行3次推理;3)發(fā)現(xiàn)的結(jié)構(gòu)反映了該任務(wù)的內(nèi)在特性,比優(yōu)化后的提示更具解釋性。

      研究還發(fā)現(xiàn),SELF-DISCOVER在需要世界知識的任務(wù)上效果最好。這是因為綜合使用多個推理模塊可以使模型從不同視角理解問題,而僅使用鏈?zhǔn)剿季S可能會遺漏一些重要信息。

      此外,與需要大量重復(fù)查詢的方法相比,SELF-DISCOVER也展現(xiàn)出了極高的效率。每次只需要一個查詢,而獲得相似性能的集成方法需要40倍的查詢量,也就是說可以節(jié)省很多算力資源。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。