30秒就能完美復(fù)刻你的聲音,這就是當(dāng)今最強(qiáng)的中文AI語音克隆。
但是吧,我沒想到的一點(diǎn)是,居然有N多人問我的一個(gè)問題是:
給我整不會(huì)了。
因?yàn)槟瞧恼轮校覟榱俗尨蠹矣幸粋(gè)更直觀的視覺化的感受,所以把所有的生成的語音,都變成了一段AI視頻,這樣大家的觀感可能會(huì)更好。
那里面的視頻是這樣的:
讓我沒想到的是,不僅語音大家很關(guān)心,這個(gè)對(duì)口型的視覺化的過程,大家也關(guān)心。。。
所以,今天,我也就寫一篇文章,正好跟大家說一下口型驅(qū)動(dòng)的做法,統(tǒng)一解決一下困惑,讓人人,都能做出一些有趣的創(chuàng)作。
首先,還是說工具,工具是我們的老朋友:
即夢。
即夢我已經(jīng)安利過N次了,國慶期間寫過他們的智能畫布,上上周寫過他們的v2.1新模型一鍵生成海報(bào),這次又是它。
說真的,好想說一句:即夢打錢。。。
進(jìn)入首頁后,找到視頻生成。
在視頻生成的界面中。找到這個(gè)對(duì)口型。
這個(gè)功能,就能讓照片,開口說話了。
而我們要做的,就是準(zhǔn)備一張照片和一段語音,就能用這段語音,驅(qū)動(dòng)這張照片,開口說話。
比如,現(xiàn)在我想做一個(gè)帥哥用坤哥聲音模仿《大話西游》里面那個(gè)經(jīng)典的片段。
我們先隨便生成一個(gè)亞洲帥哥的照片。
看看這個(gè)充滿憂郁感的小眼神。
然后,跟上周的教程一樣,我們用海螺Audio跑一段坤哥的聲音克隆,然后,讓他來念出那一段經(jīng)典臺(tái)詞:
“曾經(jīng)有一份真摯的感情擺在我的面前,我沒有珍惜,等我失去的時(shí)候才追悔莫及。
如果上天能給我再來一次的機(jī)會(huì),我會(huì)對(duì)那個(gè)女孩說三個(gè)字:我愛你!如果非要在這份愛上加一個(gè)期限,我希望!是一萬年!”
我們來聽一下,這段音頻。
曾經(jīng)...,數(shù)字生命卡茲克,19秒
再把我們的帥哥的圖片,上傳到角色那,音頻上傳到語音那。
當(dāng)然如果你不想用克隆的聲音,當(dāng)然也可以用即夢自己的文本朗讀,它里面默認(rèn)給你塞了N多音色,你可以選用,可惜就是沒有AI聲音克隆,所以如果對(duì)創(chuàng)作有需求的話,我覺得還是可以用海螺跑完,再扔到即夢里。
最重要的一點(diǎn)是,在最后的生成效果上,一定要選生動(dòng)。
標(biāo)準(zhǔn)是只動(dòng)嘴不動(dòng)頭,看起來就非常不自然,而生動(dòng)模式是真的嘴、眼睛、頭都在自然的運(yùn)動(dòng),真實(shí)也自然很多。
唯一目前最大的缺陷就是,你不管上傳什么比例的角色,都會(huì)給你自動(dòng)裁成1:1的,無法調(diào)整,在一個(gè)群里看到他們說這塊在改了,12月可能會(huì)上,我也還在等。
一切就緒之后,直接點(diǎn)擊生成視頻,開跑,積分消耗的不多,基本就是1s1積分。每天登錄幾乎都會(huì)送60~100的積分。
大概1分鐘不到,一個(gè)19s的視頻就跑完了。
我們來看看效果。
就很堅(jiān)毅,很深情,整體的表情,也都非常的自然。
而這整套,真的也就幾分鐘,就完事了。也真的,有手就行。
而且其實(shí)不止是真人,一些2D、3D的動(dòng)漫人物,也可以用語音驅(qū)動(dòng)讓照片說話。
比如這個(gè)。
而且不止是普通說話,也能做唱歌的。
比如我自己,錄一首奇奇怪怪的《兩只老虎》,讓馬斯克唱出來。
這就是照片說話的魅力。
你看,我把照片喂進(jìn)去,配音扔進(jìn)去,輕輕一點(diǎn)生成,幾分鐘搞定,甚至簡單到無聊。
可就是這么無聊的事情,卻讓人覺得有趣。
大概是因?yàn),平凡中總能偶爾翻起點(diǎn)波浪。
我還記得第一次看到照片說話的作品的時(shí)候,是2023年初,汗青的AI.Talk,年輕的喬布斯和已在太空漫游的年老的馬斯克的對(duì)話。
坦率的講,這個(gè)作品,給我的震撼是相當(dāng)大的,這是可能只有在AI時(shí)代,才會(huì)出現(xiàn)的一種作品形式。
讓不可能再出現(xiàn)的人,讓不可能的時(shí)空,交織在一起。
這就像魔法。
后面,我自己也會(huì)去模仿汗青,做類似形式的作品。不過不像汗青那種非常深度、有哲理性的表達(dá),而是更偏整活為主。
比如今年蘋果發(fā)布會(huì)和華為發(fā)布會(huì)在同一天召開硬碰硬,蘋果又非常拉胯,我就做了一個(gè)相同的形式,來去吐槽蘋果。
數(shù)字生命卡茲克,贊708
這個(gè)片子里的說話鏡頭,就是即夢的對(duì)口型做的。
當(dāng)時(shí)我只有一個(gè)想法,如果喬布斯還在,當(dāng)他看到如今的蘋果,他會(huì)說些什么?
得益于AI,我們可以只花幾個(gè)小時(shí)的時(shí)間,一切都能,躍然紙上。
你甚至不用想太多,只需要?jiǎng)觿?dòng)手,分分鐘,就造一個(gè)世界。
那個(gè)喬布斯和庫克還能在一起對(duì)談的,平行世界。
這是歷史、當(dāng)下和未來。
就像小時(shí)候,我們經(jīng)常在老家的樹林里,偷偷摸摸撿起一根枯樹枝,用它來在地上畫畫,用它來一場小孩子之間的決斗游戲,用它,來肆意的發(fā)揮我們的想象力。
那就像一個(gè),無所不能的神器。
而現(xiàn)在,你手上的AI,就是新的枯樹枝。
這就是技術(shù)的浪漫。
當(dāng)你也想去試試,AI Talk的形式,來做一點(diǎn)自己的小作品的時(shí)候。
那一刻,你會(huì)發(fā)現(xiàn),
這不僅僅是照片開口說話,
而是你心里的某個(gè)聲音。
被放大了。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。