蘋果公司最新發(fā)布了一款名為MM1的大型多模態(tài)基礎(chǔ)模型,擁有300億參數(shù),采用了MoE架構(gòu),并且超過一半的作者是華人。該模型在多模態(tài)領(lǐng)域具有重要意義,可能預(yù)示著蘋果未來推出與此相關(guān)的產(chǎn)品。
今年以來,蘋果明顯加大了對生成式人工智能(GenAI)領(lǐng)域的投入,這一舉措體現(xiàn)了蘋果在GenAI領(lǐng)域取得重大進展的決心。據(jù)悉,蘋果一部分轉(zhuǎn)向GenAI的團隊原本是從事造車項目的,而如今他們也開始投身于GenAI領(lǐng)域的研發(fā)工作。
MM1的發(fā)布引起了廣泛關(guān)注。據(jù)論文介紹,該模型采用了MoE變體,并且在預(yù)訓(xùn)練指標和多項多模態(tài)基準測試上表現(xiàn)出了領(lǐng)先水平。研究者通過多項消融試驗,探討了模型架構(gòu)、預(yù)訓(xùn)練數(shù)據(jù)選擇以及訓(xùn)練程序等方面的重要性。他們發(fā)現(xiàn),圖像分辨率、視覺編碼器損失和預(yù)訓(xùn)練數(shù)據(jù)在建模設(shè)計中都起著關(guān)鍵作用。
在預(yù)訓(xùn)練數(shù)據(jù)選擇方面,研究者發(fā)現(xiàn)了幾個重要經(jīng)驗:交錯數(shù)據(jù)對提高少樣本和純文本性能有幫助,而字幕數(shù)據(jù)則對提高零樣本性能具有重要作用。
此外,純文本數(shù)據(jù)對于提高少樣本和純文本性能同樣至關(guān)重要。通過合理混合圖像和文本數(shù)據(jù),可以獲得最佳的多模態(tài)性能,并保留較強的文本性能。研究者還發(fā)現(xiàn),人工合成數(shù)據(jù)有助于少樣本學(xué)習(xí)。
最終,研究者確定了MM1的最終配方,包括圖像編碼器、視覺語言連接器和預(yù)訓(xùn)練數(shù)據(jù)的選擇。他們還將LLM的大小擴大到3B、7B和30B個參數(shù),并通過專家混合(MoE)進一步擴展了模型。在監(jiān)督微調(diào)實驗中,MM1在多項基準測試上表現(xiàn)出了競爭力,并且MoE模型在幾乎所有基準測試中均表現(xiàn)優(yōu)于密集模型。
MM1的發(fā)布標志著蘋果在多模態(tài)領(lǐng)域的重要進展,也為未來蘋果可能推出的相關(guān)產(chǎn)品奠定了技術(shù)基礎(chǔ)。該研究的成果對于推動生成式人工智能領(lǐng)域的發(fā)展具有重要意義,值得業(yè)界密切關(guān)注。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。