618開始了,你可能加購(gòu)了很多夏季新衣,想趁優(yōu)惠激情下單,但一想到每件都要試穿,不合適的還要退貨郵寄,其繁瑣程度又讓你望而卻步。
“要是有人能幫我試穿衣服就好了。”
基于這樣的消費(fèi)心聲,多款A(yù)I虛擬試衣產(chǎn)品相繼上線。
據(jù)“頭號(hào)AI玩家”不完全統(tǒng)計(jì),目前AI虛擬試衣相關(guān)工具至少有十余個(gè),既有具備谷歌研究院大廠背景的“TryOnDiffusion”,也有國(guó)內(nèi)獨(dú)立團(tuán)隊(duì)出品的“OOTDiffusion”,還有切合電商平臺(tái)使用需求的“淘寶試衣”、美圖設(shè)計(jì)室推出的“AI模特試衣”等。
近期,我們測(cè)評(píng)了多款不同AI虛擬試衣產(chǎn)品,并和相關(guān)項(xiàng)目負(fù)責(zé)人聊了聊,嘗試了解AI虛擬試衣領(lǐng)域存在哪些機(jī)遇與挑戰(zhàn)。
只需1張照片,就能試穿自由?
虛擬試衣,正成為AI玩家們爭(zhēng)相布局的熱門地帶。
從去年至今,谷歌、阿里、亞馬遜幾大頭部電商平臺(tái)相繼推出虛擬試衣模型,分別為Tryon Diffusion、Outfit Anything、Diffuse to Choose。目前,這幾款模型雖開放了demo試用,但并未技術(shù)開源。
此外,一些獨(dú)立團(tuán)隊(duì)也有所動(dòng)作。今年4月,小i機(jī)器人AIGC團(tuán)隊(duì)上線了一款名為OOTDiffusion的虛擬試衣模型,不僅提供試用demo,更將github項(xiàng)目開源(https://github.com/levihsu/OOTDiffusion)。
目前大部分AI虛擬試衣技術(shù)都是基于擴(kuò)散模型進(jìn)行研發(fā)的,在這樣的背景之下,基本只需三步,AI就能幫你試穿任何一件衣服。
以O(shè)OTDiffusion為例,第一步,上傳試穿者的照片,盡量保證正面,且沒有遮擋身體,身穿衣服最好輕薄貼身;
第二步,上傳想要試穿的衣服,商品白底平鋪圖效果更佳,能夠更好展現(xiàn)試衣效果;
第三步,點(diǎn)擊“Run”并等待幾秒鐘,即可見證換裝時(shí)刻。
OOTDiffusion頁(yè)面提供了半身和全身的服裝試穿,包括上衣、褲子、裙子等類型,可以展現(xiàn)出不同的照片姿勢(shì)和試穿效果。
OOTDiffusion項(xiàng)目負(fù)責(zé)人徐余浩告訴我們,該項(xiàng)目基于Stable Diffusion,在兩個(gè)開源數(shù)據(jù)集VITON-HD (half-body) 和Dress Code (full-body)上進(jìn)行了訓(xùn)練。
在他看來,擴(kuò)散模型的優(yōu)勢(shì)在于能夠?qū)⒎b的細(xì)節(jié)、紋理、圖案、文字與試穿者本人進(jìn)行更自然的貼合,相比此前虛擬試穿產(chǎn)品的直接“套圖”,OOTDiffusion的試穿效果更加可控。
除了上傳試穿者和服裝的照片,還有AI虛擬試衣產(chǎn)品增加了更多維度的數(shù)據(jù)。
以淘寶試衣為例,用戶可以填寫體重、身高、身型、膚色相關(guān)數(shù)據(jù),從而生成數(shù)字人形象進(jìn)行試穿。同樣,淘寶試衣支持使用自己的照片生成試衣分身,要求也是正面全身或半身照,盡量不穿寬大衣物,以及不要遮擋身體。
同款連衣裙不同分身的試穿效果
據(jù)“頭號(hào)AI玩家”觀察,目前大多數(shù)AI虛擬試衣產(chǎn)品只需上傳一張照片即可,但在效果展現(xiàn)上可能存在不夠服帖、服裝穿模、姿態(tài)扭曲等問題。
因此,部分AI虛擬試衣產(chǎn)品會(huì)主動(dòng)要求用戶上傳多張照片,生成更為全面的數(shù)字形象,從而獲取更自然的試衣效果。
以阿里媽媽推出的“Lookie”為例,用戶上傳一張正面照片+12張以上半身照片,可在十幾分鐘內(nèi)生成數(shù)字形象。
Lookie還提供異域風(fēng)情、搖滾辣妹、知識(shí)分子風(fēng)等多種試穿風(fēng)格,其數(shù)字“分身”可在1分鐘內(nèi)完成各種試穿任務(wù)。
不過,通過創(chuàng)建數(shù)字分身來試穿的效果更接近于“換臉”,可能看不出服裝是否合身,所以可以選擇身材相近的模特圖進(jìn)行生成。
AI試衣技術(shù)已達(dá)商用水平,一張商品圖只需2毛
作為AIGC圖片編輯領(lǐng)域的一個(gè)垂直應(yīng)用,虛擬試衣從去年開始已有不少研究進(jìn)展。
谷歌聯(lián)合華盛頓大學(xué)在2023年6月發(fā)布了“TryOnDiffusion”項(xiàng)目,提出了一種基于擴(kuò)散模型的架構(gòu),統(tǒng)一了兩個(gè)UNet,可以輸入兩張圖片進(jìn)行合成,讓圖中的人物更換不同的服飾,并在保留服飾細(xì)節(jié)的情況下適應(yīng)人體的姿勢(shì)和形狀變化。
技術(shù)對(duì)比,從左到右依次是:輸入,TryOnGAN,SDAFN,HR-VITON,TryOnDiffusion
不過這個(gè)模型僅能實(shí)現(xiàn)上身服裝的試穿,訓(xùn)練和測(cè)試數(shù)據(jù)集大多是干凈統(tǒng)一的背景,全身試穿效果和更復(fù)雜的背景下的表現(xiàn)還有待研究。
“當(dāng)時(shí)這個(gè)方向還很不成熟,只能換一些簡(jiǎn)單的衣服比如純色的,稍微復(fù)雜一點(diǎn)的版型生成的效果就很差。”OOTDiffusion團(tuán)隊(duì)介紹道。
虛擬試衣主要面臨兩個(gè)挑戰(zhàn),一是生成的圖像要足夠真實(shí)自然,就像真實(shí)上身的效果;二是提高可控性,要盡可能保留服裝的細(xì)節(jié)特征。
之前的算法可能是通過對(duì)比衣服和模特的身材形狀的區(qū)別,直接對(duì)衣服進(jìn)行變形,然后貼到模特身上,這種“貼圖”的方法會(huì)顯得比較假。而現(xiàn)在有了擴(kuò)散模型,AI可以學(xué)習(xí)衣服的形狀、顏色和花紋文字等特征,然后和模特的特征進(jìn)行融合,生成更自然的效果。
亞馬遜發(fā)布的“Diffuse to Choose”(https://diffuse2choose.github.io/)模型通過在擴(kuò)散模型的潛在特征圖中直接融入?yún)⒖紙D像的細(xì)粒度特征,并結(jié)合感知損失來進(jìn)一步保留參考物品的細(xì)節(jié)。它能讓用戶在任意場(chǎng)景中虛擬試穿服裝或放置其他電商產(chǎn)品,實(shí)現(xiàn)較為真實(shí)的光影。
Diffuse to Choose支持不同的衣服組合,沒有限制
國(guó)內(nèi)方面,2023年12月,阿里巴巴旗下的智能計(jì)算研究院發(fā)布了一項(xiàng)虛擬試衣技術(shù)“Outfit Anyone”,通過雙流條件擴(kuò)散模型克服了高保真和細(xì)節(jié)一致性結(jié)果的問題,能獲得更逼真的服裝變形效果。
不僅是真人,動(dòng)畫角色也支持一鍵試衣,與視頻模型Animate Anyone結(jié)合,還能實(shí)現(xiàn)任何角色的服裝更換和動(dòng)態(tài)視頻生成。
但Outfit Anyone并未對(duì)外開放代碼,用戶可在魔塔社區(qū)中試用。
OOTDiffusion團(tuán)隊(duì)提出的試穿融合過程也有效提高了虛擬試穿的真實(shí)性和可控性,目前相關(guān)的AI試衣產(chǎn)品已在開發(fā)階段。之后團(tuán)隊(duì)還會(huì)繼續(xù)探索解決用圖片指導(dǎo)圖片修改和編輯、人物換臉等問題,讓AIGC技術(shù)更好地應(yīng)用到實(shí)際場(chǎng)景中。
徐余浩認(rèn)為,與大廠相比,小團(tuán)隊(duì)可能在技術(shù)研發(fā)上能領(lǐng)先一步,但如果將虛擬試衣作為一個(gè)獨(dú)立的產(chǎn)品來運(yùn)營(yíng),其商業(yè)前景可能不如已擁有龐大用戶規(guī)模的的電商平臺(tái)。
據(jù)“頭號(hào)AI玩家”觀察,面向C端用戶的AI試衣產(chǎn)品主要來自于大廠。比如淘寶在App內(nèi)置的試衣功能,可以與商品推薦、用戶購(gòu)物車等版塊聯(lián)動(dòng),AI試衣體驗(yàn)更流暢、穿搭選擇更豐富。在技術(shù)上,淘寶也可以及時(shí)應(yīng)用阿里最新推出的虛擬試衣方法。
阿里團(tuán)隊(duì)在今年3月發(fā)布了“Wear-Any-Way”,不僅支持試穿衣服,還能根據(jù)需要改變衣服的樣式,比如卷起袖子,打開/拖動(dòng)外套等。
雖然這項(xiàng)技術(shù)目前還未上線應(yīng)用,但對(duì)消費(fèi)者來說可以改善購(gòu)物體驗(yàn),對(duì)商家來說也有望進(jìn)一步降低廣告營(yíng)銷成本。
除了上文提到的面向消費(fèi)者的AI試衣產(chǎn)品,從市場(chǎng)需求來看,面向電商商家的B端產(chǎn)品對(duì)AI初創(chuàng)公司來說是更有商業(yè)前景的選擇。
很多跨境電商賣家提到請(qǐng)模特拍照又貴又耗時(shí),而使用AI工具出圖正好滿足了降本增效的需求。
比如阿里國(guó)際旗下的AI圖像設(shè)計(jì)工具Pic C o p i l o t近期上線了虛擬試衣功能,據(jù)介紹,出一張商品圖的平均成本被控制在0.2-0.3元人民幣以內(nèi),同時(shí)還有四十多位已授權(quán)模特,覆蓋各個(gè)膚色和年齡段,賣家在商用時(shí)無需擔(dān)心侵權(quán)問題。
從虛擬的QQ秀到真人一鍵試穿,從早期通過3D人體建模開發(fā)的虛擬試衣軟件,到如今生成式AI技術(shù)在電商行業(yè)開啟應(yīng)用,隨著技術(shù)的不斷進(jìn)步和市場(chǎng)的逐漸成熟,可以預(yù)見AI將在我們的消費(fèi)生活中扮演更加重要的角色。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。