本文概要:
1. 研究發(fā)現(xiàn),語言模型通過閱讀文檔成功學會使用工具,甚至能夠發(fā)明新的方法。
2. 使用文檔訓練的模型在零樣本性能上與僅使用演示訓練的模型相當甚至更好。
3. 通過閱讀文檔,語言模型可以學習復雜的圖像處理和視頻跟蹤功能。
根據(jù)一篇新的研究論文,語言模型可以通過閱讀工具和API文檔來學習使用工具,并在某些情況下甚至發(fā)明新的方法。與傳統(tǒng)的通過演示訓練的方法相比,僅使用文檔的模型在零樣本性能上表現(xiàn)相當或更好。
該團隊使用文檔和演示對六種不同任務的多個模型進行了訓練,并比較了它們的性能。僅使用文檔,零樣本性能等于或優(yōu)于僅從演示中學習的模型。然后,在擴展到包含200個工具的數(shù)據(jù)集后,第一個模型的性能顯著優(yōu)于第二個模型。
在圖像處理領域,該模型能夠通過學習新的、最先進的圖像處理模塊的文檔來執(zhí)行復雜的圖像處理和視頻跟蹤功能,而無需進一步演示。該團隊特別強調,該模型能夠重現(xiàn)最近發(fā)布的圖像處理技術,例如 Grounded-SAM 和 Track Anything 的視頻跟蹤,展示了該方法在自動知識發(fā)現(xiàn)方面的潛力。
論文指出:“總的來說,我們通過關注LLM的內部規(guī)劃和文檔推理能力,而不是通過演示明確指導他們的行為,揭示了LLM使用工具的新視角。”
這項研究揭示了閱讀文檔對于語言模型學習工具使用的重要性,以及文檔對于擴展和自動知識發(fā)現(xiàn)的潛力。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。