A系列最大電池!OPPO A5入網(wǎng):6330mAh超越A5 ProOPPO Find X8 Ultra渲染圖首曝:外觀與Pro版幾乎一致微軟重申Win10將結束支持!督促趕緊升級Win11:不升用不了Microsoft 365六年磨一劍!iPhone 17 Air真機泄露:橫向三攝設計大變革小米超級小愛升級計劃公布:小米13/K60等也能用上 1月27日前推送摩托羅拉新款折疊屏手機或提前發(fā)布 型號XT2551獲印度BIS認證攬獲多項CES 2025科技大獎,蟬聯(lián)全球消費電子品牌TOP10國產動畫電影《哪吒之魔童鬧!沸既姹旧嫌常褐С諭MAX、CINITY等多制式擎朗智能攜手科大訊飛,共啟具身智能服務機器人新征程“借機玩!?多家互聯(lián)網(wǎng)公司在小紅書發(fā)英文貼攬客OPPO Find X8 Ultra渲染圖曝光:外觀設計基本保持不變1月16日發(fā)布!真我14 Pro系列官宣:全球首款溫感變色手機三星Galaxy S25 Slim細節(jié)曝光:厚度僅6.5mm 對標iPhone 17 Air斥資134億!TCL買下LG顯示廣州廠訊飛星火X1成為全國產算力平臺上唯一的深度推理大模型董明珠稱格力自研芯片設計制造封裝全鏈條完成微軟再次強調Win10將于10月14日終止支持,敦促用戶免費升級至Win11Arm曾考慮將授權價格提高300% 并曾探討設計自有芯片OpenAI推出新功能“Tasks” ChatGPT可變身成AI私人助理三星Galaxy S25系列手機AI創(chuàng)作新境界:語音/文字加持“草圖轉圖像”
  • 首頁 > 云計算頻道 > 大模型

    Meta 公司發(fā)布 Imagine Yourself:無需為特定對象微調的個性化圖像生成 AI 模型

    2024年08月23日 15:15:49   來源:IT之家

      從社交媒體到虛擬現(xiàn)實,個性化圖像生成因其在各種應用中的潛力而日益受到關注。傳統(tǒng)方法通常需要針對每位用戶進行大量調整,從而限制了效率和可擴展性,為此 Meta 公司創(chuàng)新提出了“Imagine Yourself” AI 模型。

      傳統(tǒng)個性化圖像生成方法挑戰(zhàn)

      目前的個性化圖像生成方法通常依賴于為每個用戶調整模型,這種方法效率低下,而且缺乏通用性。雖然較新的方法試圖在不進行調整的情況下實現(xiàn)個性化,但它們往往過度擬合,導致復制粘貼效應。

      Imagine Yourself 創(chuàng)新

      Imagine Yourself 模型不需要針對特定用戶微調,通過單一模式能夠滿足不同用戶的需求。

      該模型解決了現(xiàn)有方法的不足之處,如傾向于毫無變化地復制參考圖像,從而為更通用、更方便用戶的圖像生成流程鋪平了道路。

      Imagine Yourself 在保存身份、視覺質量和及時對齊等關鍵領域表現(xiàn)出色,大大優(yōu)于之前的模型。

      該模型的主要組成部分包括:

      生成合成配對數(shù)據(jù)以鼓勵多樣性;

      整合了三個文本編碼器和一個可訓練視覺編碼器的完全并行注意力架構;

      以及一個從粗到細的多階段微調過程

      這些創(chuàng)新技術使該模型能夠生成高質量、多樣化的圖像,同時保持強大的身份保護和文本對齊功能。

      Imagine Yourself 使用可訓練的 CLIP 補丁編碼器提取身份信息,并通過并行交叉注意模塊將其與文本提示整合在一起,準確保存身份信息并對復雜的提示做出反應。

      該模型使用低階適配器(LoRA)僅對架構的特定部分進行微調,從而保持較高的視覺質量。

      Imagine Yourself 的一個突出功能是生成合成配對(SynPairs)數(shù)據(jù)。通過創(chuàng)建包含表情、姿勢和光照變化的高質量配對數(shù)據(jù),該模型可以更有效地學習并產生多樣化的輸出結果。

      值得注意的是,在處理復雜的提示詞方面,與最先進的模型相比,它在文本對齊方面實現(xiàn)了 +27.8% 的顯著改進。

      研究人員使用一組 51 種不同身份和 65 個提示對 Imagine Yourself 進行了定量評估,生成了 3315 幅圖像供人類評估。

      該模型與最先進的(SOTA)adapter-based 模型和 control-based 模型進行了比對,重點關注視覺吸引力、身份保持和提示對齊等指標。

      人工注釋根據(jù)身份相似性、及時對齊和視覺吸引力對生成的圖像進行評分。與 adapter-based 模型相比,Imagine Yourself 在提示對齊方面有了 45.1% 的顯著提高,與基于控制的模型相比有了 30.8% 的提高,再次證明了它的優(yōu)越性。

      Imagine Yourself 模型是個性化圖像生成領域的一大進步。該模型無需針對特定對象進行調整,并引入了合成配對數(shù)據(jù)生成和并行注意力架構等創(chuàng)新組件,從而解決了以往方法所面臨的關鍵挑戰(zhàn)。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。