OpenAI 傳聞中的“草莓”(Strawberry)AI 模型現(xiàn)已面世,正式名稱為“o1”,是該公司首款具備“推理”能力的模型。
o1 和 o1-mini
OpenAI 表示對該模型進(jìn)行特殊訓(xùn)練,能夠比人類更快地回答更復(fù)雜的問題。與之同時(shí)發(fā)布的還有 o1-mini,一個(gè)更小、成本更低的版本。
OpenAI%20表示%20o1%20模型的發(fā)布,是其邁向類人%20AI%20宏偉目標(biāo)的關(guān)鍵一步。
o1%20模型目前處于“預(yù)覽”階段,官方強(qiáng)調(diào)該模型相關(guān)開發(fā)尚處于初期階段,相比較%20GPT-4o%20模型,使用成本更高且速度更慢,但在編寫代碼和解決多步驟問題方面表現(xiàn)更為優(yōu)秀。
價(jià)格
OpenAI%20公司表示從今天起,ChatGPT%20Plus%20和%20Team%20用戶將可訪問%20o1-preview%20和%20o1-mini,而%20Enterprise%20和%20Edu%20用戶則將在下周初獲得訪問權(quán)限。
OpenAI%20表示計(jì)劃將%20o1-mini%20的訪問權(quán)限擴(kuò)展至所有%20ChatGPT%20免費(fèi)用戶,但尚未確定發(fā)布日期。
開發(fā)者獲取%20o1%20的訪問權(quán)限成本相當(dāng)高昂:如果調(diào)用%20API,o1-preview%20的輸入詞元(tokens)費(fèi)用為每百萬個(gè)成本%2015%20美元(IT之家備注:當(dāng)前約%20107%20元人民幣),輸出詞元費(fèi)用為每百萬個(gè)%2060%20美元(當(dāng)前約%20427%20元人民幣)。
相比之下,GPT-4o%20的輸入詞元費(fèi)用為每百萬個(gè)%205%20美元(當(dāng)前約%2035.6%20元人民幣),輸出詞元費(fèi)用為每百萬個(gè)%2015%20美元(當(dāng)前約%20107%20元人民幣)。因此%20o1%20模型輸入詞元費(fèi)用提高了%202%20倍,輸出詞元費(fèi)用提高了%203%20倍。
訓(xùn)練方式
OpenAI%20的研究負(fù)責(zé)人%20Jerry%20Tworek%20表示,o1%20采用了有別于當(dāng)前模型的訓(xùn)練方法,并他并未透露具體細(xì)節(jié)。
他提到,o1“采用了全新的優(yōu)化算法和專門為其定制的訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練。”
報(bào)道稱 OpenAI 在訓(xùn)練 o1 模型中使用一種稱為強(qiáng)化學(xué)習(xí)(reinforcement learning)的技術(shù),來自行解決問題,該技術(shù)通過獎勵和懲罰來教導(dǎo)系統(tǒng)。隨后,o1 采用“思維鏈”來處理查詢,類似于人類通過逐步推理來解決問題的方式。
由于采用了這種新的訓(xùn)練方法,OpenAI 表示模型應(yīng)該會更加準(zhǔn)確。
Tworek 表示:“我們不能說已經(jīng)解決了幻覺問題,但至少從觀測的結(jié)果來看,這個(gè)模型產(chǎn)生的幻覺明顯減少”。
o1 模型優(yōu)勢
o1 模型與 GPT-4o 的主要區(qū)別在于,它能夠比前代更好地處理復(fù)雜的編程和數(shù)學(xué)問題,并能解釋其推理過程,這是 OpenAI 所強(qiáng)調(diào)的。
OpenAI 的首席研究官 Bob McGrew 表示:
這款模型在解答 AP 數(shù)學(xué)考試題目上的表現(xiàn)無疑比我更出色,而我大學(xué)時(shí)還輔修了數(shù)學(xué)。
他提到,OpenAI 還讓 o1 參加了國際數(shù)學(xué)奧林匹克競賽的資格考試,GPT-4o 僅正確解決了 13% 的問題,o1 模型能夠解決 83% 的問題。
在名為 Codeforces 競賽的在線編程比賽中,這一新型模型達(dá)到了參賽者中的第 89 位,OpenAI 聲稱該模型的下一次更新將在物理、化學(xué)和生物學(xué)中的挑戰(zhàn)性基準(zhǔn)任務(wù)上表現(xiàn)“與博士生相當(dāng)”。
同時(shí),o1 在許多領(lǐng)域的能力不及 GPT-4o。它在世界事實(shí)知識方面的表現(xiàn)也不如后者。此外,它不具備瀏覽網(wǎng)頁、處理文件和圖像的能力。盡管如此,該公司認(rèn)為它代表了一類全新的功能。將其命名為 o1,意在表明“將計(jì)數(shù)器重置回 1”。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
京東11.11采銷直播探廠為消費(fèi)者揭開答案。近日,京東3C數(shù)碼采銷走進(jìn)武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費(fèi)者帶來超值低價(jià)與福利。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。