12 月 15 日消息:Google DeepMind 最近利用一種大型語(yǔ)言模型成功破解了純數(shù)學(xué)中一個(gè)著名的未解問(wèn)題。該團(tuán)隊(duì)在《自然》雜志上發(fā)表的論文中宣稱,這是首次使用大型語(yǔ)言模型發(fā)現(xiàn)長(zhǎng)期科學(xué)難題的解決方案,產(chǎn)生了之前不存在的可驗(yàn)證且有價(jià)值的新信息。Google DeepMind 研究副總裁 Pushmeet Kohli 表示:「這不在訓(xùn)練數(shù)據(jù)中——甚至以前是未知的。」
大型語(yǔ)言模型通常以編造事實(shí)而聞名,而不是提供新事實(shí)。Google DeepMind 的新工具 FunSearch 可能改變這一點(diǎn)。它表明,只要適當(dāng)引導(dǎo),并且舍棄它們提出的大部分內(nèi)容,這些模型確實(shí)可以做出發(fā)現(xiàn)。
FunSearch(之所以這樣命名,是因?yàn)樗阉鲾?shù)學(xué)函數(shù),而不是因?yàn)樗腥?延續(xù)了 DeepMind 使用 AI 在基礎(chǔ)數(shù)學(xué)和計(jì)算機(jī)科學(xué)領(lǐng)域取得的一系列發(fā)現(xiàn)。首先是 AlphaTensor 找到了一種加快多種不同類型代碼核心計(jì)算的方法,打破了 50 年來(lái)的記錄。然后是 AlphaDev 找到了加快每天使用數(shù)萬(wàn)億次的關(guān)鍵算法的方法。
然而,這些工具并沒(méi)有使用大型語(yǔ)言模型。它們都建立在 DeepMind 的游戲 AI AlphaZero 之上,通過(guò)將數(shù)學(xué)問(wèn)題視為圍棋或國(guó)際象棋中的難題來(lái)解決。問(wèn)題是它們局限于自己的領(lǐng)域,如同公司研究員 Bernardino Romera-Paredes 所說(shuō):「AlphaTensor 擅長(zhǎng)矩陣乘法,但基本上沒(méi)有別的!
FunSearch 采用了不同的方法。它結(jié)合了一個(gè)稱為 Codey 的大型語(yǔ)言模型(一種在計(jì)算機(jī)代碼上微調(diào)的 Google PaLM 2 版本)和其他系統(tǒng),后者可以排除不正確或無(wú)意義的答案,并將好的答案重新輸入。
Fawzi,Google DeepMind 的研究科學(xué)家說(shuō):「說(shuō)實(shí)話,我們有假設(shè),但我們不確切知道為什么這有效。項(xiàng)目開(kāi)始時(shí),我們不知道這是否會(huì)奏效!
研究人員首先用 Python(一種流行的編程語(yǔ)言)勾勒出他們想要解決的問(wèn)題,但省略了指定如何解決問(wèn)題的程序行。這就是 FunSearch 介入的地方。它讓 Codey 填補(bǔ)空白——實(shí)際上,提出解決問(wèn)題的代碼建議。
然后,第二個(gè)算法檢查并評(píng)分 Codey 提出的內(nèi)容。最佳建議——即使還不正確——被保存并反饋給 Codey,后者再次嘗試完成程序!冈S多將是無(wú)意義的,一些將是合理的,少數(shù)將是真正有啟發(fā)性的,」Kohli 說(shuō)!改隳弥@些真正有啟發(fā)性的內(nèi)容,然后說(shuō),『好的,拿著這些重復(fù)一遍。』」
經(jīng)過(guò)幾百萬(wàn)次建議和幾十次整體過(guò)程的重復(fù)(歷時(shí)幾天),F(xiàn)unSearch 終于提出了一個(gè)正確且之前未知的解決 cap set 問(wèn)題的代碼,該問(wèn)題涉及尋找某種類型集合的最大尺寸。可以想象在圖表紙上繪制點(diǎn)。cap set 問(wèn)題類似于嘗試確定可以放置多少個(gè)點(diǎn),而不會(huì)讓其中任何三個(gè)點(diǎn)形成一條直線。
這個(gè)問(wèn)題非常細(xì)致,但很重要。數(shù)學(xué)家們甚至不同意如何解決它,更不用說(shuō)解決方案是什么了。(它還與 AlphaTensor 加速的計(jì)算——矩陣乘法——有關(guān)。)加州大學(xué)洛杉磯分校的 Terence Tao,曾獲得多個(gè)數(shù)學(xué)頂級(jí)獎(jiǎng)項(xiàng),包括菲爾茲獎(jiǎng),他在 2007 年的博客文章中稱 cap set 問(wèn)題為「我最喜歡的開(kāi)放性問(wèn)題」。
Tao 對(duì) FunSearch 能做的事情感到好奇。他說(shuō):「這是一個(gè)有前途的范例。這是利用大型語(yǔ)言模型的力量的一種有趣方式。」
與 AlphaTensor 相比,F(xiàn)unSearch 的一個(gè)主要優(yōu)勢(shì)是,理論上它可以用來(lái)找到一系列問(wèn)題的解決方案。這是因?yàn)樗a(chǎn)生代碼——生成解決方案的方法,而不是解決方案本身。不同的代碼將解決不同的問(wèn)題。FunSearch 的結(jié)果也更容易理解。Fawzi 說(shuō),方法通常比它產(chǎn)生的奇怪?jǐn)?shù)學(xué)解決方案更清晰。
為了測(cè)試其多功能性,研究人員使用 FunSearch 來(lái)解決另一個(gè)數(shù)學(xué)難題:bin packing 問(wèn)題,該問(wèn)題涉及嘗試將物品盡可能少地裝入箱子中。這對(duì)計(jì)算機(jī)科學(xué)的一系列應(yīng)用很重要,從數(shù)據(jù)中心管理到電子商務(wù)。FunSearch 提出了一種比人類設(shè)計(jì)的方法更快的解決方案。
Tao 表示,數(shù)學(xué)家們「仍在努力弄清楚如何最好地將大型語(yǔ)言模型納入我們的研究工作流程,以利用它們的力量同時(shí)減輕它們的缺點(diǎn)。」他說(shuō):「這當(dāng)然表明了一種可能的前進(jìn)方向!
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。