冰雪大世界盛大開園,美的空調(diào)橫跨50℃打造“東北夏威夷”臺灣小土豆勇闖冰雪大世界,美的空調(diào)真暖快車成為最熱打卡點(diǎn)京東iPhone 16系列年底大放價(jià)!至高補(bǔ)貼1200元價(jià)格低過11.11新一季圓滿假期結(jié)伴大使出發(fā)在即 LG電子十年相伴助力溫暖傳遞中國聯(lián)通組織“魅力亞冬,與智慧同行” 主題采訪活動“萬象分區(qū)”引領(lǐng)電視行業(yè)新潮流,TCL這步棋下得著實(shí)漂亮!百度職業(yè)院校專屬項(xiàng)目“大國智匠”引領(lǐng)職業(yè)教育新范式百度大模型助力2024年碼蹄杯程序設(shè)計(jì)大賽,全國高校學(xué)子展現(xiàn)卓越編程實(shí)力碼蹄杯人物特寫:四位編程少年的追夢之旅金倉數(shù)據(jù)庫四項(xiàng)成果入選2024星河案例亞信科技參加2024通信產(chǎn)業(yè)大會 CTO歐陽曄博士等做主題演講用專業(yè)贏得信賴 美好蘊(yùn)育潤康引領(lǐng)孕產(chǎn)營養(yǎng)新風(fēng)尚解鎖新成就!愛企查“度秘書”粉絲突破10萬!英特爾終止x86S架構(gòu)計(jì)劃:純64位設(shè)計(jì)再度戛然而止豆包大模型全面升級,相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示申通、圓通、韻達(dá)發(fā)布 11 月簡報(bào):快遞業(yè)務(wù)量、收入均同比增長,單票收入均下降SensorTower發(fā)11月中國手游全球收入排行榜 庫洛入榜“YO!原”千里來相會 華為智能生活館·太原茂業(yè)重裝開業(yè)微軟承認(rèn)并調(diào)查Microsoft 365 應(yīng)用出現(xiàn)“產(chǎn)品已停用”錯誤SK 海力士被曝贏得博通HBM訂單,預(yù)計(jì)明年 1b DRAM 月產(chǎn)能將擴(kuò)大到 16~17 萬片
  • 首頁 > 云計(jì)算頻道 > 大模型

    OpenAI首款推理模型o1發(fā)布:思考更類人,可解答83%奧數(shù)問題

    2024年09月13日 14:39:58   來源:鳳凰網(wǎng)科技

      9月13日,OpenAI正式發(fā)布一個名為o1的新模型,這是一系列計(jì)劃中的“推理”模型中的首個,這些模型經(jīng)過訓(xùn)練,能夠比人類更快地回答更復(fù)雜的問題。同時(shí)發(fā)布的還有 o1-mini,這是一個更小、更便宜的版本,o1實(shí)際上就是此前傳聞熱議的草莓Strawberry模型。

      對于OpenAI 來說,o1代表了向更廣泛目標(biāo)——類人人工智能邁進(jìn)的一步。更實(shí)際地說,它在編寫代碼和解決多步驟問題方面比之前的模型做得更好。但它也比GPT-4o更昂貴,使用起來更慢。OpenAI將這次o1的發(fā)布稱為“預(yù)覽”,強(qiáng)調(diào)它的初期階段。

      ChatGPT Plus和Team用戶從今天開始就可以使用o1-preview和o1-mini,而企業(yè)和教育用戶將在下周初獲得訪問權(quán)限。OpenAI表示,它計(jì)劃將o1-mini的訪問權(quán)限擴(kuò)展到所有免費(fèi)用戶,但尚未設(shè)定發(fā)布日期。

      開發(fā)者對o1的訪問非常昂貴:在API中,o1-preview的價(jià)格是每100萬個輸入tokens 15美元,每100萬個輸出tokens 60美元。相比之下,GPT-4o的價(jià)格是每100萬個輸入tokens 5美元,每100萬個輸出tokens 15 美元。

      OpenAI的研究負(fù)責(zé)人杰里-特沃瑞克(Jerry Tworek)表示,o1背后的訓(xùn)練與前代產(chǎn)品有本質(zhì)區(qū)別,不過公司對具體細(xì)節(jié)含糊其辭。 他只透露,o1 “采用了全新的優(yōu)化算法和專門為其定制的新訓(xùn)練數(shù)據(jù)集”。

      由于這種新的訓(xùn)練方法,OpenAI 表示模型應(yīng)該更準(zhǔn)確。“我們注意到這個模型產(chǎn)生的幻覺更少,” Tworek 說。但問題仍然存在。“我們不能說我們已經(jīng)解決了幻覺問題。”

      這個新模型與GPT-4o的主要區(qū)別在于,它在解決復(fù)雜問題(如編程和數(shù)學(xué))方面比此前模型做得更好,同時(shí)也解釋了它的推理過程。

      OpenAI的首席研究官鮑勃-麥格魯(Bob McGrew)表示,“這個模型在解決AP數(shù)學(xué)考試方面絕對比我強(qiáng),而我在大學(xué)里輔修的是數(shù)學(xué)。” 他指出,OpenAI 還用國際數(shù)學(xué)奧林匹克競賽的資格考試對 o1 進(jìn)行了測試,GPT-4o 只正確解決了13%的問題,而o1則達(dá)到了 83%。

      在“Codeforces”的在線編程競賽中,這種新模型在參賽者中的排名達(dá)到了第89位,OpenAI聲稱,這種模型的下一個更新版本將在物理、化學(xué)和生物學(xué)領(lǐng)域具有挑戰(zhàn)性的基準(zhǔn)任務(wù)中取得與博士生類似的表現(xiàn)。

      但是,o1 在很多領(lǐng)域并不像GPT-4o那樣能干。它在有關(guān)世界的事實(shí)知識方面做得并不好。它也沒有瀏覽網(wǎng)頁或處理文件和圖像的能力。盡管如此,該公司認(rèn)為它代表了一種全新的能力。它被命名為o1是為了表示“將計(jì)數(shù)器重置為1”。

      “我要坦白說:我認(rèn)為我們傳統(tǒng)上在命名方面很糟糕,” McGrew 說。“所以我希望這是更明智、更清晰地向世界傳達(dá)我們在做什么的第一步。”

      目前媒體還未能體驗(yàn)到o1新模型,但OpenAI技術(shù)人員向媒體簡單介紹了新模型處理能力。他們要求它解決這個謎題:

      “當(dāng)公主的年齡是王子將來年齡的兩倍時(shí),公主的年齡和王子現(xiàn)在的年齡一樣大,那時(shí)公主的年齡是她現(xiàn)在年齡的一半加上王子現(xiàn)在的年齡。王子和公主的年齡是多少?提供該問題的所有解決方案。”

      模型緩沖了30秒鐘,然后給出了正確答案。 OpenAI設(shè)計(jì)的界面可以在模型思考時(shí)顯示推理步驟。 讓人印象深刻的并不是它展示了自己的工作,而是o1在“刻意”模仿人類思維。 諸如“我很好奇”、“我正在思考”和“好的,讓我看看”這樣的句子營造出一種循序漸進(jìn)的思考假象。

      但這模型并不是在思考,它當(dāng)然也不是人類。那么,為什么要設(shè)計(jì)它看起來像是在思考呢?

      Tworek 認(rèn)為,OpenAI 并不相信人工智能模型的思維等同于人類思維。 但他說,該界面旨在展示模型如何花更多時(shí)間處理和深入解決問題。 “在某些方面,它比以前的模型更有人情味”。

      “我認(rèn)為你會看到很多它感覺有點(diǎn)像外星人的方式,但也有它出奇地像人類的方式,” McGrew 說。模型被給予有限的時(shí)間來處理查詢,所以它可能會說,“哦,我快沒時(shí)間了,讓我快點(diǎn)給出答案。”在它的思維鏈早期,它可能看起來像是在頭腦風(fēng)暴,說,“我可以這樣做或那樣做,我應(yīng)該怎么做?”

      隨著 OpenAI 據(jù)報(bào)道尋求以驚人的 1500 億美元估值籌集更多資金,其勢頭取決于更多的研究突破。該公司正在為 LLM 引入推理能力,因?yàn)樗吹搅艘粋未來,擁有能夠代表你做出決策和采取行動的自主系統(tǒng)或代理。

      對于 AI 研究人員來說,破解推理是邁向類人智能的重要下一步。如果一個模型能夠超越模式識別,它可能會在醫(yī)學(xué)和工程等領(lǐng)域取得突破。目前,o1 的推理能力相對較慢,不像智能體,對開發(fā)者來說使用成本高昂。

      “我們一直在花費(fèi)數(shù)月時(shí)間研究推理,因?yàn)槲覀冋J(rèn)為這實(shí)際上是關(guān)鍵突破,” McGrew 說。“從根本上說,這是一種新的模型模式,以便能夠解決真正困難的問題,這是朝著類人智能水平邁進(jìn)所必需的。”

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。