上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機(jī)器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機(jī)器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個“0元開店”類目,推出多項新商入駐權(quán)益年內(nèi)狂攬五項第一,“字節(jié)系大模型”何以后發(fā)先至?
  • 首頁 > 云計算頻道 > 大模型

    微軟亞研院新作:讓大模型一口氣調(diào)用數(shù)百萬個API!

    2024年03月28日 16:26:13   來源:量子位公眾號

      近年來,人工智能發(fā)展迅速,尤其是像ChatGPT這樣的基礎(chǔ)大模型,在對話、上下文理解和代碼生成等方面表現(xiàn)出色,能夠為多種任務(wù)提供解決方案。

      但在特定領(lǐng)域任務(wù)上,由于專業(yè)數(shù)據(jù)的缺乏和可能的計算錯誤,它們的表現(xiàn)并不理想。同時,雖然已有一些專門針對特定任務(wù)的AI模型和系統(tǒng)表現(xiàn)良好,但它們往往不易與基礎(chǔ)大模型集成。

      為了解決這些重要問題,TaskMatrix.AI破繭而出、應(yīng)運而生,這是由微軟(Microsoft)設(shè)計發(fā)布的新型AI生態(tài)系統(tǒng)。

      其核心技術(shù)近期在《科學(xué)》合作期刊Intelligent Computing上發(fā)表的論文TaskMatrix.AI: Completing Tasks by Connecting Foundation Models with Millions of APIs中正式亮相,作者為微軟亞洲研究院段楠博士團(tuán)隊:

      TaskMatrix.AI將基礎(chǔ)大模型與數(shù)以百萬計的應(yīng)用程序編程接口(APIs)連接起來完成任務(wù)。

      其核心思想是利用現(xiàn)有的基礎(chǔ)大模型作為類似大腦的中央系統(tǒng),結(jié)合其他AI模型和系統(tǒng)的APIs作為各種子任務(wù)解決者,以完成數(shù)字和物理領(lǐng)域的多樣化任務(wù)。

      TaskMatrix.AI如何工作?

      TaskMatrix.AI的整體架構(gòu)由以下四個關(guān)鍵組件構(gòu)成:

      多模態(tài)對話基礎(chǔ)模型(MCFM):負(fù)責(zé)與用戶溝通,理解他們的目標(biāo)和上下文(多模態(tài)),并基于API生成可執(zhí)行代碼以完成特定任務(wù)。MCFM能夠處理文本、圖像、視頻、音頻和代碼等多模態(tài)輸入,生成執(zhí)行特定任務(wù)的代碼。它還能夠從用戶指令中提取具體任務(wù),并提出合理的解決方案大綱,幫助選擇最合適的API進(jìn)行代碼生成。

      API平臺:提供一個統(tǒng)一的API文檔架構(gòu),用于存儲數(shù)以百萬計具有不同功能的API,并允許API開發(fā)者和所有者注冊、更新和刪除他們的API。API平臺通過統(tǒng)一的文檔架構(gòu)幫助MCFM更好地理解和利用各種API。

      API選擇器:根據(jù)MCFM對用戶指令的理解,推薦相關(guān)的API。API選擇器具備搜索能力,能夠在擁有大量API的平臺上快速定位到與任務(wù)需求和解決方案大綱相匹配的API。

      API執(zhí)行器:通過調(diào)用相關(guān)API執(zhí)行生成的動作代碼,并返回中間和最終的執(zhí)行結(jié)果。API執(zhí)行器設(shè)計用于運行各種API,包括從簡單的HTTP請求到復(fù)雜的算法或需要多個輸入?yún)?shù)的AI模型。

      以上四個組件協(xié)同工作,共同構(gòu)建了一個高效的系統(tǒng)。MCFM作為用戶交互的主要接口,負(fù)責(zé)生成解決方案。API平臺則提供了一個標(biāo)準(zhǔn)化的API文檔格式,并作為一個集中存儲庫,容納了數(shù)百萬API。API選擇器根據(jù)MCFM對用戶需求的理解,從API平臺中選取合適的API。

      最后,API執(zhí)行器負(fù)責(zé)執(zhí)行由選定API生成的代碼,并解決任務(wù)。

      此外,TaskMatrix.AI還提供了兩個可學(xué)習(xí)的機(jī)制,以更有效地將MCFM與API對齊:

      基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF):這是一種基礎(chǔ)大模型的通用技術(shù),它使用強(qiáng)化學(xué)習(xí)方法,利用人類反饋來優(yōu)化機(jī)器學(xué)習(xí)模型。在TaskMatrix.AI中,RLHF利用這些反饋來增強(qiáng)MCFM和API選擇器,從而在處理復(fù)雜任務(wù)時實現(xiàn)更快的收斂和更好的性能。

      向API開發(fā)者提供反饋:TaskMatrix.AI完成任務(wù)后,會將用戶反饋以適當(dāng)?shù)姆绞絺鬟f給API開發(fā)者,指示他們的API是否成功用于完成任務(wù)。這種包含<用戶指令、API調(diào)用和用戶反饋>的三元組不僅展示特定API的使用情況,還可以作為API開發(fā)者改進(jìn)API文檔的參考,使文檔對MCFM和API選擇器更加友好和易于理解。

      因此,TaskMatrix.AI可以被視為一個超級AI,同時也是一個生態(tài)系統(tǒng),具有以下關(guān)鍵優(yōu)勢:

      能夠通過使用基礎(chǔ)大模型作為核心系統(tǒng),首先理解不同類型的多模態(tài)輸入(如文本、圖像、視頻、音頻和代碼),然后生成調(diào)用API完成任務(wù)的代碼,來執(zhí)行各種數(shù)字和物理任務(wù)。

      擁有一個API平臺,作為各種任務(wù)專家的存儲庫。該平臺上的所有API都有一致的文檔格式,這使得基礎(chǔ)大模型可以輕松使用它們,開發(fā)者也便于添加新的API。

      具有強(qiáng)大的終身學(xué)習(xí)能力,因為它的技能可以通過向API平臺添加具有特定功能的新API來擴(kuò)展,以處理新任務(wù)。

      能夠提供更加可解釋的響應(yīng),因為任務(wù)解決邏輯(即行動代碼)和API的結(jié)果都是可理解的。

      TaskMatrix.AI能完成什么任務(wù)?

      TaskMatrix.AI能完成的任務(wù)非常廣泛,小到文字、圖像信息的基本信息處理,大到控制機(jī)器人平臺、接入物聯(lián)網(wǎng)(IoT)等通用平臺任務(wù),TaskMatrix都能勝任。

      圖像處理任務(wù)

      TaskMatrix.AI可以執(zhí)行圖像處理任務(wù),并且能夠接受語言和圖像作為輸入。下圖展示了TaskMatrix.AI的相關(guān)版本Visual ChatGPT,它不僅能夠理解人類意圖,還能處理語言和圖像輸入,以完成包括圖像生成、問題回答和編輯在內(nèi)的復(fù)雜視覺任務(wù)。

      下圖展示了使用多個API協(xié)作生成高分辨率圖像的示例。在該例中,解決方案框架由3個API組成:圖像問答、圖像標(biāo)題以及圖像對象替換。

      左側(cè)框線部分展示了解決方案框架如何協(xié)助將圖像擴(kuò)展至2048×4096分辨率。通過迭代執(zhí)行框架中的預(yù)定義步驟,TaskMatrix.AI可以生成任何所需尺寸的高分辨率圖像。

      辦公自動化

      TaskMatrix.AI能夠通過語音指令理解并自動執(zhí)行計算機(jī)操作系統(tǒng)、專業(yè)軟件以及智能手機(jī)應(yīng)用的操作。利用TaskMatrix.AI,可以快速上手復(fù)雜軟件。

      此外,它還能幫助用戶在不進(jìn)行搜索的情況下直接訪問所需功能。以下是一個PowerPoint自動化的實例,TaskMatrix.AI能夠根據(jù)用戶指定的主題自動生成幻燈片,智能調(diào)整內(nèi)容布局,插入和優(yōu)化圖像,并應(yīng)用相應(yīng)的設(shè)計主題,從而顯著提升工作效率。

      機(jī)器人和物聯(lián)網(wǎng)設(shè)備控制

      TaskMatrix.AI 可以連接機(jī)器人和物聯(lián)網(wǎng)設(shè)備,實現(xiàn)對體力勞動和智能家居操作的自動化管理。通過集成先進(jìn)的機(jī)器人技術(shù),TaskMatrix.AI 能夠執(zhí)行一系列任務(wù),如物體的拾取與放置以及對家庭物聯(lián)網(wǎng)設(shè)備的智能控制。

      此外,該平臺還整合了多種流行的互聯(lián)網(wǎng)服務(wù),包括但不限于日歷API、天氣API和新聞API,提供了更加豐富和便捷的用戶體驗。

      TaskMatrix.AI的挑戰(zhàn)

      盡管TaskMatrix.AI已經(jīng)在各種任務(wù)中證明了其強(qiáng)大的功能和通用性,但仍面臨以下幾個挑戰(zhàn):

      多模態(tài)會話基礎(chǔ)大模型:TaskMatrix.AI需要一個能夠處理多種輸入(文本、圖像、視頻、音頻和代碼)的強(qiáng)大基礎(chǔ)大模型。這個模型需要能夠從上下文中學(xué)習(xí),使用常識進(jìn)行推理和計劃,并生成高質(zhì)量的代碼來完成任務(wù)。此外由于TaskMatrix.AI需要處理更多樣化的輸入模式,這要求確定一個最小模式集來訓(xùn)練MCFM。

      API平臺:構(gòu)建和維護(hù)一個包含數(shù)百萬API的平臺需要解決文檔生成、API質(zhì)量保證和API創(chuàng)建建議等挑戰(zhàn)。API文檔的清晰性和API的質(zhì)量對于TaskMatrix.AI的成功至關(guān)重要。此外,平臺還需要根據(jù)用戶反饋指導(dǎo)API開發(fā)者創(chuàng)建新的API來解決特定任務(wù)。

      API調(diào)用:在處理大量API時,TaskMatrix.AI需要能夠合理選擇和推薦相關(guān)的API來完成任務(wù)。此外還涉及到在線規(guī)劃,即在無法立即生成解決方案時,與用戶交互并嘗試不同的解決方案。

      安全和隱私:在API能夠訪問物理和數(shù)字世界時,確保模型忠實于用戶指令并保持?jǐn)?shù)據(jù)私密性是至關(guān)重要的。這要求在執(zhí)行操作前驗證模型的行為,并確保數(shù)據(jù)傳輸?shù)陌踩院蛿?shù)據(jù)訪問的授權(quán)。

      個性化:TaskMatrix.AI需要個性化策略來幫助開發(fā)者構(gòu)建定制的AI界面,并為用戶提供私人助理。這包括降低擴(kuò)展成本和使用少量示例來學(xué)習(xí)用戶的偏好,以便生成符合用戶需求的解決方案。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。