2月28日 消息:近期,針對(duì)文本到圖像(T2I)生成模型領(lǐng)域中的個(gè)性化主題驅(qū)動(dòng)模型,出現(xiàn)了一些令人印象深刻的進(jìn)展,如 DreamBooth 和 BLIP-Diffusion。然而,這些模型普遍存在著對(duì)微調(diào)的需求較高和參數(shù)規(guī)模龐大的限制。
為了解決這些問題,研究人員引入了 DiffuseKronA,這是一種基于 Kronecker 乘積的自適應(yīng)模塊,不僅可以將可訓(xùn)練參數(shù)數(shù)量顯著降低多達(dá)35%,與 LoRA-DreamBooth 相比甚至降低了99.947%,還提高了圖像合成的質(zhì)量。DiffuseKronA 減少了對(duì)超參數(shù)敏感性的問題,提供了一致高質(zhì)量的生成圖像,從而減少了對(duì)大量微調(diào)的需求。
關(guān)鍵是,DiffuseKronA 減輕了對(duì)超參數(shù)敏感性的問題,能夠在一系列超參數(shù)范圍內(nèi)提供一致的高質(zhì)量生成,從而減少了對(duì)大量精細(xì)調(diào)整的必要性。此外,更可控的分解使 DiffuseKronA 更具解釋性,甚至可以實(shí)現(xiàn)高達(dá)50% 的減少,并且結(jié)果與 LoRA-Dreambooth 相媲美。
DiffuseKronA 的主要思想是利用 Kronecker 乘積來分解 UNet 模型中注意力層的權(quán)重矩陣,以實(shí)現(xiàn)高效的參數(shù)優(yōu)化。與 LoRA 中的低秩分解相比,DiffuseKronA 的 Kronecker 適配器提供了更高階的逼近,參數(shù)數(shù)量更少,靈活性更大。通過實(shí)驗(yàn),DiffuseKronA 在生成圖像的穩(wěn)定性和文本對(duì)齊性方面均優(yōu)于 LoRA-DreamBooth,展現(xiàn)出更高的圖像生成質(zhì)量和更準(zhǔn)確的對(duì)象顏色分布。
綜合對(duì)比實(shí)驗(yàn)結(jié)果,DiffuseKronA 在視覺質(zhì)量、文本對(duì)齊性、可解釋性、參數(shù)效率和模型穩(wěn)定性等方面均優(yōu)于 LoRA-DreamBooth,為 T2I 生成模型的領(lǐng)域帶來了重大進(jìn)展。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。