5 月 31 日消息,DeepMind、普林斯頓大學(xué)和斯坦福大學(xué)的研究人員近日提出了一項(xiàng)名為 LATM(LLMs As Tool Makers)的創(chuàng)新框架,該框架可以將像 GPT-4 這樣的大型語言模型轉(zhuǎn)變?yōu)楣ぞ咧圃煺?IT之家注:即讓模型自己生成軟件工具來處理新任務(wù))。
LATM 的創(chuàng)新之處在于它為語言模型引入了工具制造和使用的概念,使得模型能夠自主創(chuàng)建適用于不同任務(wù)的工具。這一框架不僅能夠提高模型的靈活性和適應(yīng)性,還能夠?yàn)樯墒?AI 提供更加高效和經(jīng)濟(jì)的解決方案。該框架主要包含以下兩個關(guān)鍵部分:
工具制造:作為工具制造者,LLM 專門為特定任務(wù)設(shè)計(jì)軟件工具,這些工具以 Python 函數(shù)的形式實(shí)現(xiàn)。
工具使用:另一個 LLM 作為工具使用者,可以調(diào)用這些軟件工具來處理新的請求。
這種設(shè)計(jì)可以讓 LATM 能夠?qū)⑷蝿?wù)分配給最適合的 LLM,將需要具備高強(qiáng)度算力才能實(shí)現(xiàn)的工具制造過程可以分配給功能強(qiáng)大、資源密集型的模型,例如 GPT-4;而將相對簡單的使用工具過程分配給輕量級、經(jīng)濟(jì)高效的模型,例如 GPT-3.5 Turbo。這種方法不僅增強(qiáng)了 LLM 解決問題的能力,而且可以顯著降低處理一系列任務(wù)的平均計(jì)算成本,以最大程度提升框架效率。
實(shí)驗(yàn)結(jié)果驗(yàn)證了 LATM 在復(fù)雜推理任務(wù)上的有效性。研究人員發(fā)現(xiàn),LATM 能夠達(dá)到與資源密集型模型相當(dāng)?shù)男阅,并具有更高的成本效益。這一大型語言模型方法仿照了人類創(chuàng)造和使用工具的進(jìn)化過程,可促進(jìn)大型語言模型生成工具的發(fā)展。
研究人員認(rèn)為,LATM 將為自然語言處理領(lǐng)域帶來重大的突破,并在實(shí)際應(yīng)用中發(fā)揮重要作用,這一創(chuàng)新可高效提升生成式 AI 的效率,以加速促進(jìn)自然語言處理和人工智能領(lǐng)域的發(fā)展。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。