在最新的研究中,提出了一種名為注意力混合模式(MoA)的新架構,旨在個性化文本到圖像擴散模型,可以實現(xiàn)風格參考和人物融合的效果。
受大型語言模型(LLMs)中使用的專家混合機制的啟發(fā),MoA 通過將生成工作負載分配給兩個注意力路徑來實現(xiàn)給定主題和背景的分離生成。具體來說,MoA 保留了原始模型的先驗知識,通過固定先驗分支中的注意力層,同時通過個性化分支最小干預生成過程,學習將主題嵌入由先驗分支生成的布局和背景中。
一種新穎的路由機制管理著每個層中像素在這些分支之間的分布,以優(yōu)化個性化和通用內容創(chuàng)建的混合。經過訓練,MoA 能夠輕松生成高質量的個性化圖像,其主題和背景的組合和交互與原始模型生成的一樣豐富多樣。最重要的是,MoA 增強了模型的現(xiàn)有能力與新增個性化干預之間的區(qū)別,從而提供了一種之前無法實現(xiàn)的更為分離的主題 - 背景控制。
此外,研究還探討了 MoA 在現(xiàn)實應用中的潛力。例如,結合 MoA 和 DDIM 反演技術,可以實現(xiàn)對真實圖像中主體的替換;結合 MoA 和 ControlNet,可以實現(xiàn)帶有姿勢控制的個性化生成;MoA 甚至能夠在面部和身體形狀完全不同的情況下進行主體交換,以及輕松地在主體之間進行形態(tài)變換。這些應用展示了 MoA 在個性化圖像生成領域的潛在價值和廣泛適用性。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。