iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢(qián)過(guò)億,70%用戶靠投流,大模型算不過(guò)成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣(mài)泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動(dòng)能電商12年 ,ALL IN 小紅書(shū),開(kāi)店3月賣(mài)出1100萬(wàn)Mate 70最受期待!華為三款重磅機(jī)型蓄勢(shì)待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充FF發(fā)布第二品牌Faraday X:對(duì)標(biāo)豐田 專(zhuān)注增程式混動(dòng)車(chē)型黑神話悟空總收入超67億:銷(xiāo)量已超2000萬(wàn)份通快成立激光業(yè)務(wù)區(qū)域中心(中國(guó)),強(qiáng)勢(shì)布局中國(guó)市場(chǎng)Sandalwood Advisors受邀參加第31屆中信里昂投資者論壇淘寶倒逼新風(fēng)向:一場(chǎng)電商減負(fù)運(yùn)動(dòng)博浪AI時(shí)代,阿里、華為“硬碰硬”Youtube將推出人工智能工具 可生成創(chuàng)意、標(biāo)題甚至完整視頻申通、圓通、韻達(dá)發(fā)布 8 月簡(jiǎn)報(bào):快遞業(yè)務(wù)量、收入均同比增長(zhǎng),單票收入均下降蘋(píng)果iPhone 16系列開(kāi)啟發(fā)售,Max最高加2500元TECNO 全球發(fā)布二代折疊屏旗艦—PHANTOM V Fold2 5G及PHANTOM V Flip2 5G科大訊飛還是AI“小甜甜”嗎?消息稱(chēng)美團(tuán)外賣(mài)調(diào)整經(jīng)營(yíng)目標(biāo),從追求 GMV 變?yōu)樽非笥唵瘟?/a>
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    OpenAI首款推理模型o1發(fā)布:思考更類(lèi)人,可解答83%奧數(shù)問(wèn)題

    2024年09月13日 14:39:58   來(lái)源:鳳凰網(wǎng)科技

      9月13日,OpenAI正式發(fā)布一個(gè)名為o1的新模型,這是一系列計(jì)劃中的“推理”模型中的首個(gè),這些模型經(jīng)過(guò)訓(xùn)練,能夠比人類(lèi)更快地回答更復(fù)雜的問(wèn)題。同時(shí)發(fā)布的還有 o1-mini,這是一個(gè)更小、更便宜的版本,o1實(shí)際上就是此前傳聞熱議的草莓Strawberry模型。

      對(duì)于OpenAI 來(lái)說(shuō),o1代表了向更廣泛目標(biāo)——類(lèi)人人工智能邁進(jìn)的一步。更實(shí)際地說(shuō),它在編寫(xiě)代碼和解決多步驟問(wèn)題方面比之前的模型做得更好。但它也比GPT-4o更昂貴,使用起來(lái)更慢。OpenAI將這次o1的發(fā)布稱(chēng)為“預(yù)覽”,強(qiáng)調(diào)它的初期階段。

      ChatGPT Plus和Team用戶從今天開(kāi)始就可以使用o1-preview和o1-mini,而企業(yè)和教育用戶將在下周初獲得訪問(wèn)權(quán)限。OpenAI表示,它計(jì)劃將o1-mini的訪問(wèn)權(quán)限擴(kuò)展到所有免費(fèi)用戶,但尚未設(shè)定發(fā)布日期。

      開(kāi)發(fā)者對(duì)o1的訪問(wèn)非常昂貴:在API中,o1-preview的價(jià)格是每100萬(wàn)個(gè)輸入tokens 15美元,每100萬(wàn)個(gè)輸出tokens 60美元。相比之下,GPT-4o的價(jià)格是每100萬(wàn)個(gè)輸入tokens 5美元,每100萬(wàn)個(gè)輸出tokens 15 美元。

      OpenAI的研究負(fù)責(zé)人杰里-特沃瑞克(Jerry Tworek)表示,o1背后的訓(xùn)練與前代產(chǎn)品有本質(zhì)區(qū)別,不過(guò)公司對(duì)具體細(xì)節(jié)含糊其辭。 他只透露,o1 “采用了全新的優(yōu)化算法和專(zhuān)門(mén)為其定制的新訓(xùn)練數(shù)據(jù)集”。

      由于這種新的訓(xùn)練方法,OpenAI 表示模型應(yīng)該更準(zhǔn)確。“我們注意到這個(gè)模型產(chǎn)生的幻覺(jué)更少,” Tworek 說(shuō)。但問(wèn)題仍然存在。“我們不能說(shuō)我們已經(jīng)解決了幻覺(jué)問(wèn)題。”

      這個(gè)新模型與GPT-4o的主要區(qū)別在于,它在解決復(fù)雜問(wèn)題(如編程和數(shù)學(xué))方面比此前模型做得更好,同時(shí)也解釋了它的推理過(guò)程。

      OpenAI的首席研究官鮑勃-麥格魯(Bob McGrew)表示,“這個(gè)模型在解決AP數(shù)學(xué)考試方面絕對(duì)比我強(qiáng),而我在大學(xué)里輔修的是數(shù)學(xué)。” 他指出,OpenAI 還用國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽的資格考試對(duì) o1 進(jìn)行了測(cè)試,GPT-4o 只正確解決了13%的問(wèn)題,而o1則達(dá)到了 83%。

      在“Codeforces”的在線編程競(jìng)賽中,這種新模型在參賽者中的排名達(dá)到了第89位,OpenAI聲稱(chēng),這種模型的下一個(gè)更新版本將在物理、化學(xué)和生物學(xué)領(lǐng)域具有挑戰(zhàn)性的基準(zhǔn)任務(wù)中取得與博士生類(lèi)似的表現(xiàn)。

      但是,o1 在很多領(lǐng)域并不像GPT-4o那樣能干。它在有關(guān)世界的事實(shí)知識(shí)方面做得并不好。它也沒(méi)有瀏覽網(wǎng)頁(yè)或處理文件和圖像的能力。盡管如此,該公司認(rèn)為它代表了一種全新的能力。它被命名為o1是為了表示“將計(jì)數(shù)器重置為1”。

      “我要坦白說(shuō):我認(rèn)為我們傳統(tǒng)上在命名方面很糟糕,” McGrew 說(shuō)。“所以我希望這是更明智、更清晰地向世界傳達(dá)我們?cè)谧鍪裁吹牡谝徊健?rdquo;

      目前媒體還未能體驗(yàn)到o1新模型,但OpenAI技術(shù)人員向媒體簡(jiǎn)單介紹了新模型處理能力。他們要求它解決這個(gè)謎題:

      “當(dāng)公主的年齡是王子將來(lái)年齡的兩倍時(shí),公主的年齡和王子現(xiàn)在的年齡一樣大,那時(shí)公主的年齡是她現(xiàn)在年齡的一半加上王子現(xiàn)在的年齡。王子和公主的年齡是多少?提供該問(wèn)題的所有解決方案。”

      模型緩沖了30秒鐘,然后給出了正確答案。 OpenAI設(shè)計(jì)的界面可以在模型思考時(shí)顯示推理步驟。 讓人印象深刻的并不是它展示了自己的工作,而是o1在“刻意”模仿人類(lèi)思維。 諸如“我很好奇”、“我正在思考”和“好的,讓我看看”這樣的句子營(yíng)造出一種循序漸進(jìn)的思考假象。

      但這模型并不是在思考,它當(dāng)然也不是人類(lèi)。那么,為什么要設(shè)計(jì)它看起來(lái)像是在思考呢?

      Tworek 認(rèn)為,OpenAI 并不相信人工智能模型的思維等同于人類(lèi)思維。 但他說(shuō),該界面旨在展示模型如何花更多時(shí)間處理和深入解決問(wèn)題。 “在某些方面,它比以前的模型更有人情味”。

      “我認(rèn)為你會(huì)看到很多它感覺(jué)有點(diǎn)像外星人的方式,但也有它出奇地像人類(lèi)的方式,” McGrew 說(shuō)。模型被給予有限的時(shí)間來(lái)處理查詢,所以它可能會(huì)說(shuō),“哦,我快沒(méi)時(shí)間了,讓我快點(diǎn)給出答案。”在它的思維鏈早期,它可能看起來(lái)像是在頭腦風(fēng)暴,說(shuō),“我可以這樣做或那樣做,我應(yīng)該怎么做?”

      隨著 OpenAI 據(jù)報(bào)道尋求以驚人的 1500 億美元估值籌集更多資金,其勢(shì)頭取決于更多的研究突破。該公司正在為 LLM 引入推理能力,因?yàn)樗吹搅艘粋(gè)未來(lái),擁有能夠代表你做出決策和采取行動(dòng)的自主系統(tǒng)或代理。

      對(duì)于 AI 研究人員來(lái)說(shuō),破解推理是邁向類(lèi)人智能的重要下一步。如果一個(gè)模型能夠超越模式識(shí)別,它可能會(huì)在醫(yī)學(xué)和工程等領(lǐng)域取得突破。目前,o1 的推理能力相對(duì)較慢,不像智能體,對(duì)開(kāi)發(fā)者來(lái)說(shuō)使用成本高昂。

      “我們一直在花費(fèi)數(shù)月時(shí)間研究推理,因?yàn)槲覀冋J(rèn)為這實(shí)際上是關(guān)鍵突破,” McGrew 說(shuō)。“從根本上說(shuō),這是一種新的模型模式,以便能夠解決真正困難的問(wèn)題,這是朝著類(lèi)人智能水平邁進(jìn)所必需的。”

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。