Stable Diffusion動(dòng)畫版上線！支持文本圖像視頻多種輸入方式

2023年05月19日 11:09:47 西風(fēng) 來源：量子位

　　西風(fēng) 發(fā)自凹非寺

　　量子位 | 公眾號(hào) QbitAI

　　Stable Diffusion也能生成視頻了!

　　你沒聽錯(cuò)，Stability AI推出了一款新的文本生成動(dòng)畫工具包Stable Animation SDK，可支持文本、文本+初始圖像、文本+視頻多種輸入方式。

　　使用者可以調(diào)用包括Stable Diffusion 2.0、Stable Diffusion XL在內(nèi)的所有Stable Diffusion模型，來生成動(dòng)畫。

　　Stable Animation SDK的強(qiáng)大功能一經(jīng)展現(xiàn)，網(wǎng)友驚呼：

　　哇哦，等不及想試試了!

　　目前，Stability AI疑似還在對(duì)這個(gè)新工具進(jìn)行技術(shù)優(yōu)化，不久后將公開驅(qū)動(dòng)動(dòng)畫API的組件源代碼。

　　3D漫畫攝影風(fēng)，不限時(shí)長(zhǎng)自動(dòng)生成

　　Stable Animation SDK可支持三種創(chuàng)建動(dòng)畫的方式：

　　1、文本轉(zhuǎn)動(dòng)畫：用戶輸入文prompt并調(diào)整各種參數(shù)以生成動(dòng)畫(與Stable Diffusion相似)。

　　2、文本輸入+初始圖像輸入：用戶提供一個(gè)初始圖像，該圖像作為動(dòng)畫的起點(diǎn)。圖像與文本prompt結(jié)合，生成最終的輸出動(dòng)畫。

　　3、視頻輸入+文本輸入：用戶提供一個(gè)初始視頻作為動(dòng)畫的基礎(chǔ)。通過調(diào)整各種參數(shù)，根據(jù)文本prompt生成最終的輸出動(dòng)畫。

　　除此之外，Stable Animation SDK對(duì)生成視頻的時(shí)長(zhǎng)沒有限制，但是長(zhǎng)視頻將需要更長(zhǎng)的時(shí)間來生成。

　　Stability AI發(fā)布了Stable Animation SDK后，有很多網(wǎng)友分享了自己測(cè)試效果，讓我們一起看下吧：

　　Stable Animation SDK可以設(shè)置許多參數(shù)，例如steps、sampler、scale、seed。

　　還有下面這么多的預(yù)設(shè)風(fēng)格可選擇：

　　3D模型、仿真膠片、動(dòng)漫、電影、漫畫書、數(shù)碼藝術(shù)、增強(qiáng)幻想藝術(shù)、等距投影、線稿、低多邊形、造型膠土、霓虹朋克、折紙、攝影、像素藝術(shù)。

　　目前，動(dòng)畫功能API的使用是以積分計(jì)費(fèi)的，10美元可抵1000積分。

　　使用Stable Diffusion v1.5模型，在默認(rèn)設(shè)置值(512x512分辨率，30steps)下，生成100幀(大約8秒)視頻將消耗37.5積分。

　　默認(rèn)情況下，每生成1幀，Cadence值設(shè)置為1個(gè)靜止圖像，可根據(jù)不同的動(dòng)畫模式選擇較低或較高的Cadence值。Cadence值的上限是動(dòng)畫中的總幀數(shù)，即至少生成一張靜止圖像。視頻轉(zhuǎn)視頻的Cadence必須為 1:1。

　　官方也給出了一個(gè)示例，可以看出生成100幀標(biāo)準(zhǔn)動(dòng)畫的標(biāo)準(zhǔn)靜止圖像(512x512/768x768/1024x1024，30 steps)，隨著Cadence值變化，積分的使用情況：