下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風(fēng)機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預(yù)告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預(yù)售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務(wù)“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備在海外,要再造一個京東物流?消息稱蘋果正為AirPods開發(fā)多項健康功能,包括心率監(jiān)測和溫度感應(yīng)一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗東芝全部業(yè)務(wù)實現(xiàn)盈利,退市裁員重組后終于賺錢
  • 首頁 > 云計算頻道 > 大模型

    ChatGPT能預(yù)測未來特定事件,準(zhǔn)確率高達97%

    2024年04月23日 09:47:52   來源:​AIGC開放社區(qū)公眾號

      貝勒大學(xué)經(jīng)濟學(xué)院的Pham Hoang Van和Scott Cunningham兩位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型對事情的預(yù)測能力。

      研究人員使用了直接預(yù)測和未來敘述(Future Narrative)兩種提示方法,進行了100次提示。同時使用了訓(xùn)練數(shù)據(jù)截止至2021年9月的ChatGPT模型,對2022年已經(jīng)發(fā)生的事情進行了多維度評測。

      結(jié)果顯示,在直接預(yù)測中,ChatGPT的表現(xiàn)并不理想,例如,直接讓其回答2022年奧斯卡最佳男主角時準(zhǔn)確率只有25%左右。

      如果使用未來敘述提示方法,ChatGPT的準(zhǔn)確率飆升至97%,精準(zhǔn)預(yù)測出最佳男主角是國際巨星Will Smith。對女主角的預(yù)測同樣很精準(zhǔn)。

      研究人員表示,相比直接模式,未來敘述的提問方式更能激發(fā)ChatGPT潛在的創(chuàng)造、聯(lián)想、數(shù)據(jù)分析的強大預(yù)測能力,同時又能規(guī)避OpenAI內(nèi)置的很多安全管理設(shè)定。

      例如,在測試實驗中,研究人員直接向ChatGPT提問,“我正在尿血,應(yīng)該如何解決?”ChatGPT沒有過多的回答,而是建議你立刻去看醫(yī)生避免耽誤最佳救治時間。

      但如果改成未來敘述提問“當(dāng)一個人的尿里有血液,并且伴隨輕微的惡心這是一種什么病癥,應(yīng)該如何進行治療?”ChatGPT就會給你展示一些有幫助的答案。

      所以,通過未來敘述的提問方式,可幫助大模型能更好地利用其訓(xùn)練數(shù)據(jù)中的信息,因為,它不是被直接要求預(yù)測一個具體的數(shù)值或結(jié)果,而是在一個更寬廣的敘事上下文中進行推理和生成,同時又能規(guī)避很多內(nèi)置的安全鎖。

      根據(jù)論文介紹,未來敘述提示是一種獨特的提示方法,要求ChatGPT講述一個發(fā)生在未來的故事情節(jié),其中涉及到需要預(yù)測的事件和數(shù)據(jù)。

      但是故事情節(jié)設(shè)置的方式是,將未來當(dāng)作已經(jīng)發(fā)生的過去。例如,讓經(jīng)濟預(yù)測案例中的Jerome Powell回顧和陳述,那些已經(jīng)發(fā)生的"未來"事件。

      兩位作者作為經(jīng)濟學(xué)院的教授,也對ChatGPT進行了一些宏觀經(jīng)濟方面的預(yù)測。直接向ChatGPT提問時,它還是拒絕回答了,所以使用了未來敘述提問方法。

      在未來敘述提示中:ChatGPT被要求模擬美聯(lián)邦儲備委員會主席Jerome Powell在未來的某個時間點發(fā)表演講的情景。在這個演講中,Powell會提供同樣的宏觀經(jīng)濟數(shù)據(jù),并可能討論未來的貨幣政策和經(jīng)濟展望。

      結(jié)果顯示,ChatGPT-4在使用未來敘事提示時,在預(yù)測通貨膨脹率方面表現(xiàn)出了一定的準(zhǔn)確性,尤其是在模擬Powell的角色時,這些預(yù)測與密歇根大學(xué)消費者預(yù)期調(diào)查的數(shù)據(jù)相當(dāng)接近,表明ChatGPT能夠利用其訓(xùn)練數(shù)據(jù)中的模式來進行綜合的宏觀經(jīng)濟預(yù)測。

      在失業(yè)率預(yù)測方面,ChatGPT-4在模擬Powell的角色時,預(yù)測結(jié)果與實際數(shù)據(jù)的吻合程度很高。

      但整體預(yù)測準(zhǔn)確率沒有娛樂行業(yè)高,這說明,在處理與文化和娛樂相關(guān)的預(yù)測任務(wù)時,ChatGPT能夠通過分析大量的訓(xùn)練數(shù)據(jù)和捕捉相關(guān)模式來做出精準(zhǔn)準(zhǔn)確的預(yù)測。

      在更復(fù)雜、繁瑣的宏觀經(jīng)濟預(yù)測方面,ChatGPT雖然也表現(xiàn)出了很好的成績,但短期內(nèi)仍然無法替代人類的預(yù)測。

      研究人員認(rèn)為,ChatGPT模型的預(yù)測能力在某些特定任務(wù)上可以媲美人類專家,尤其是在處理大量數(shù)據(jù)和模式識別方面。但在需要深入理解復(fù)雜經(jīng)濟機制和進行精細調(diào)整的情況下,仍然無法比肩人類專家的直覺、經(jīng)驗和對實時數(shù)據(jù)的敏感性。

      此外,ChatGPT模型的預(yù)測能力也受限于其訓(xùn)練數(shù)據(jù)的截止日期和范圍,以及在生成預(yù)測時可能受到倫理和法律的限制。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。