OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號(hào)能穿十堵墻一加 Ace 5 Pro首發(fā)電競(jìng)Wi-Fi芯片G1 帶來(lái)「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗(yàn)電視市場(chǎng)又出黑馬!TCL同檔Mini LED音畫(huà)王P12K,萬(wàn)象分區(qū)打造超強(qiáng)控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強(qiáng)者恒強(qiáng)?——《中國(guó)企業(yè)科創(chuàng)力研究報(bào)告(2024)》美團(tuán)年度報(bào)告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開(kāi)發(fā)三款新車,技術(shù)分別來(lái)自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開(kāi)啟全量推送!升級(jí)自動(dòng)泊車/接駕等多項(xiàng)功能華為官方翻新手機(jī)最高降價(jià)4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲(chóng)外觀設(shè)計(jì):看過(guò)實(shí)車的人都喜歡這個(gè)設(shè)計(jì)林杰:未來(lái) A 級(jí)、A0 級(jí)、A00 級(jí)車型都將是領(lǐng)克純電的“主場(chǎng)”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬(wàn)象分區(qū)、絢彩XDR、量子點(diǎn)Pro 2025齊出手,TCL引領(lǐng)觀影體驗(yàn)新變革!QQ音樂(lè)年度聽(tīng)歌報(bào)告發(fā)布:誰(shuí)是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒(méi)有了任何阻礙「送禮物」難撬動(dòng)社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁(yè)技術(shù)報(bào)告出爐2024年結(jié)束,哪里是原創(chuàng)動(dòng)畫(huà)的應(yīng)許之地?深扒一個(gè)正被游戲行業(yè)「搶占」的流量帝國(guó)
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    Google DeepMind 使用大型語(yǔ)言模型解決純數(shù)學(xué)中的著名未解問(wèn)題

    2023年12月15日 11:14:14   來(lái)源:站長(zhǎng)之家

      12 月 15 日消息:Google DeepMind 最近利用一種大型語(yǔ)言模型成功破解了純數(shù)學(xué)中一個(gè)著名的未解問(wèn)題。該團(tuán)隊(duì)在《自然》雜志上發(fā)表的論文中宣稱,這是首次使用大型語(yǔ)言模型發(fā)現(xiàn)長(zhǎng)期科學(xué)難題的解決方案,產(chǎn)生了之前不存在的可驗(yàn)證且有價(jià)值的新信息。Google DeepMind 研究副總裁 Pushmeet Kohli 表示:「這不在訓(xùn)練數(shù)據(jù)中——甚至以前是未知的。」

      大型語(yǔ)言模型通常以編造事實(shí)而聞名,而不是提供新事實(shí)。Google DeepMind 的新工具 FunSearch 可能改變這一點(diǎn)。它表明,只要適當(dāng)引導(dǎo),并且舍棄它們提出的大部分內(nèi)容,這些模型確實(shí)可以做出發(fā)現(xiàn)。

      FunSearch(之所以這樣命名,是因?yàn)樗阉鲾?shù)學(xué)函數(shù),而不是因?yàn)樗腥?延續(xù)了 DeepMind 使用 AI 在基礎(chǔ)數(shù)學(xué)和計(jì)算機(jī)科學(xué)領(lǐng)域取得的一系列發(fā)現(xiàn)。首先是 AlphaTensor 找到了一種加快多種不同類型代碼核心計(jì)算的方法,打破了 50 年來(lái)的記錄。然后是 AlphaDev 找到了加快每天使用數(shù)萬(wàn)億次的關(guān)鍵算法的方法。

      然而,這些工具并沒(méi)有使用大型語(yǔ)言模型。它們都建立在 DeepMind 的游戲 AI AlphaZero 之上,通過(guò)將數(shù)學(xué)問(wèn)題視為圍棋或國(guó)際象棋中的難題來(lái)解決。問(wèn)題是它們局限于自己的領(lǐng)域,如同公司研究員 Bernardino Romera-Paredes 所說(shuō):「AlphaTensor 擅長(zhǎng)矩陣乘法,但基本上沒(méi)有別的!

      FunSearch 采用了不同的方法。它結(jié)合了一個(gè)稱為 Codey 的大型語(yǔ)言模型(一種在計(jì)算機(jī)代碼上微調(diào)的 Google PaLM 2 版本)和其他系統(tǒng),后者可以排除不正確或無(wú)意義的答案,并將好的答案重新輸入。

      Fawzi,Google DeepMind 的研究科學(xué)家說(shuō):「說(shuō)實(shí)話,我們有假設(shè),但我們不確切知道為什么這有效。項(xiàng)目開(kāi)始時(shí),我們不知道這是否會(huì)奏效!

      研究人員首先用 Python(一種流行的編程語(yǔ)言)勾勒出他們想要解決的問(wèn)題,但省略了指定如何解決問(wèn)題的程序行。這就是 FunSearch 介入的地方。它讓 Codey 填補(bǔ)空白——實(shí)際上,提出解決問(wèn)題的代碼建議。

      然后,第二個(gè)算法檢查并評(píng)分 Codey 提出的內(nèi)容。最佳建議——即使還不正確——被保存并反饋給 Codey,后者再次嘗試完成程序!冈S多將是無(wú)意義的,一些將是合理的,少數(shù)將是真正有啟發(fā)性的,」Kohli 說(shuō)!改隳弥@些真正有啟發(fā)性的內(nèi)容,然后說(shuō),『好的,拿著這些重復(fù)一遍。』」

      經(jīng)過(guò)幾百萬(wàn)次建議和幾十次整體過(guò)程的重復(fù)(歷時(shí)幾天),F(xiàn)unSearch 終于提出了一個(gè)正確且之前未知的解決 cap set 問(wèn)題的代碼,該問(wèn)題涉及尋找某種類型集合的最大尺寸。可以想象在圖表紙上繪制點(diǎn)。cap set 問(wèn)題類似于嘗試確定可以放置多少個(gè)點(diǎn),而不會(huì)讓其中任何三個(gè)點(diǎn)形成一條直線。

      這個(gè)問(wèn)題非常細(xì)致,但很重要。數(shù)學(xué)家們甚至不同意如何解決它,更不用說(shuō)解決方案是什么了。(它還與 AlphaTensor 加速的計(jì)算——矩陣乘法——有關(guān)。)加州大學(xué)洛杉磯分校的 Terence Tao,曾獲得多個(gè)數(shù)學(xué)頂級(jí)獎(jiǎng)項(xiàng),包括菲爾茲獎(jiǎng),他在 2007 年的博客文章中稱 cap set 問(wèn)題為「我最喜歡的開(kāi)放性問(wèn)題」。

      Tao 對(duì) FunSearch 能做的事情感到好奇。他說(shuō):「這是一個(gè)有前途的范例。這是利用大型語(yǔ)言模型的力量的一種有趣方式。」

      與 AlphaTensor 相比,F(xiàn)unSearch 的一個(gè)主要優(yōu)勢(shì)是,理論上它可以用來(lái)找到一系列問(wèn)題的解決方案。這是因?yàn)樗a(chǎn)生代碼——生成解決方案的方法,而不是解決方案本身。不同的代碼將解決不同的問(wèn)題。FunSearch 的結(jié)果也更容易理解。Fawzi 說(shuō),方法通常比它產(chǎn)生的奇怪?jǐn)?shù)學(xué)解決方案更清晰。

      為了測(cè)試其多功能性,研究人員使用 FunSearch 來(lái)解決另一個(gè)數(shù)學(xué)難題:bin packing 問(wèn)題,該問(wèn)題涉及嘗試將物品盡可能少地裝入箱子中。這對(duì)計(jì)算機(jī)科學(xué)的一系列應(yīng)用很重要,從數(shù)據(jù)中心管理到電子商務(wù)。FunSearch 提出了一種比人類設(shè)計(jì)的方法更快的解決方案。

      Tao 表示,數(shù)學(xué)家們「仍在努力弄清楚如何最好地將大型語(yǔ)言模型納入我們的研究工作流程,以利用它們的力量同時(shí)減輕它們的缺點(diǎn)。」他說(shuō):「這當(dāng)然表明了一種可能的前進(jìn)方向!

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。