" />
一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗(yàn)東芝全部業(yè)務(wù)實(shí)現(xiàn)盈利,退市裁員重組后終于賺錢真我14 Pro+開始提上日程:1.5K等深四微曲屏+潛望長(zhǎng)焦穩(wěn)了消息稱本田和日產(chǎn)計(jì)劃明年6月前敲定合并協(xié)議 2026年8月成立控股公司凱迪拉克最新版OTA開啟推送,新增百度語音大模型和QQ音樂等應(yīng)用中國聯(lián)通11月5G套餐用戶凈增127.8萬戶5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團(tuán)隊(duì)前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過這道檻!Livekit 開源模型精準(zhǔn)識(shí)別“你是否說完”!DeepSeek開源大模型開發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復(fù)合翼飛行汽車 GOVY AirJet:最高飛行速度可達(dá) 250km/h清華大學(xué)聯(lián)合騰訊出品!ColorFlow:自動(dòng)給黑白漫畫上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲(chǔ)能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o(jì)3:AI 推理能力的重大突破,得分高達(dá)87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團(tuán)外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動(dòng)6000億GTV后,抖音計(jì)劃偷襲美團(tuán)大本營(yíng)AGI Open Network(AON):賦能每個(gè)人創(chuàng)建、部署和貨幣化AI Agent
  • 首頁 > 產(chǎn)經(jīng)新聞?lì)l道 > 業(yè)界新聞

    快手開源KwaiAgents系統(tǒng) 性能超越GPT-3.5

    2023年12月28日 10:43:30   來源:站長(zhǎng)之家

      近日,快手聯(lián)合哈爾濱工業(yè)大學(xué)成功開源了「KwaiAgents」系統(tǒng),實(shí)現(xiàn)了7B/13B模型的超越效果。這一成果的背后,是通過Meta-Agent Tuning(MAT)方法提升大模型的通用能力。整個(gè)項(xiàng)目包含了系統(tǒng)、模型、以及評(píng)測(cè)三個(gè)方面的內(nèi)容,并通過GitHub完全開源,為研究者和開發(fā)者提供了極大的便利。

      該系統(tǒng)以大模型為認(rèn)知內(nèi)核,配以記憶機(jī)制和工具庫,形成迭代式自動(dòng)化系統(tǒng)。記憶機(jī)制包含知識(shí)庫、對(duì)話和任務(wù)歷史三類記憶,通過混合向量檢索和關(guān)鍵詞檢索技術(shù),在每一輪對(duì)話中檢索所需信息。工具集包含事實(shí)性增強(qiáng)工具,異構(gòu)的搜索和瀏覽機(jī)制能夠匯集多個(gè)來源的知識(shí),包括網(wǎng)頁、文本百科和視頻百科。自動(dòng)化Loop中,系統(tǒng)在一輪對(duì)話中接收問題,進(jìn)行記憶的更新和檢索,調(diào)用大模型進(jìn)行任務(wù)規(guī)劃,根據(jù)需要調(diào)用工具,最后綜合歷史信息給出回答。

      為避免訓(xùn)練中單一模板引起的過擬合問題,團(tuán)隊(duì)提出了MAT方法。該方法分為兩階段:模板生成階段和指令微調(diào)階段。在模板生成階段,通過設(shè)計(jì)Meta-Agent,生成實(shí)例化的Agent Prompt模板,候選結(jié)果與開源模板進(jìn)行對(duì)比打分,從而篩選出高質(zhì)量的Agent Prompt模板庫。在指令微調(diào)階段,基于上萬的模板構(gòu)建了超過20萬的Agent調(diào)優(yōu)指令微調(diào)數(shù)據(jù)。通過這一方法,模型在任務(wù)規(guī)劃、工具使用、反思等方面的能力得到提升,同時(shí)避免了過度依賴單一模板的問題。

      KAgentBench通過人工精細(xì)化標(biāo)注的數(shù)據(jù),提供開箱即用的Agent能力自動(dòng)化評(píng)測(cè)Benchmark。該Benchmark涵蓋不同種類的能力構(gòu)造輸入,每個(gè)query配備多個(gè)模板和多個(gè)人工編輯的真實(shí)回答,綜合評(píng)測(cè)準(zhǔn)確性和泛化性。評(píng)測(cè)結(jié)果顯示,通過MAT調(diào)優(yōu)后,7B-13B模型在各項(xiàng)能力上均有顯著提升,超越了GPT-3.5的效果。

      團(tuán)隊(duì)表示,AI Agents是一條具有潛力的道路,未來將持之以恒地沉淀核心技術(shù),并積極探索Agents技術(shù)與快手業(yè)務(wù)的結(jié)合,嘗試更多有趣、有價(jià)值的創(chuàng)新應(yīng)用落地。這一開源項(xiàng)目為整個(gè)社區(qū)注入了新的活力,為研究者提供了豐富的資源和參考。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。