行業(yè)唯一!海爾熱聲熱泵技術(shù)獲全國顛覆性技術(shù)創(chuàng)新大賽最高獎(jiǎng)OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號(hào)能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗(yàn)電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強(qiáng)控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強(qiáng)者恒強(qiáng)?——《中國企業(yè)科創(chuàng)力研究報(bào)告(2024)》美團(tuán)年度報(bào)告竟然用上了AI和短。窟@下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級(jí)自動(dòng)泊車/接駕等多項(xiàng)功能華為官方翻新手機(jī)最高降價(jià)4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲外觀設(shè)計(jì):看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)林杰:未來 A 級(jí)、A0 級(jí)、A00 級(jí)車型都將是領(lǐng)克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬象分區(qū)、絢彩XDR、量子點(diǎn)Pro 2025齊出手,TCL引領(lǐng)觀影體驗(yàn)新變革!QQ音樂年度聽歌報(bào)告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動(dòng)社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術(shù)報(bào)告出爐2024年結(jié)束,哪里是原創(chuàng)動(dòng)畫的應(yīng)許之地?
  • 3分鐘用AI讓照片開口說話,去造屬于自己的夢吧

    2024年12月16日 09:15:37   來源:​數(shù)字生命卡茲克公眾號(hào)

      30秒就能完美復(fù)刻你的聲音,這就是當(dāng)今最強(qiáng)的中文AI語音克隆。

      但是吧,我沒想到的一點(diǎn)是,居然有N多人問我的一個(gè)問題是:

      給我整不會(huì)了。

      因?yàn)槟瞧恼轮校覟榱俗尨蠹矣幸粋(gè)更直觀的視覺化的感受,所以把所有的生成的語音,都變成了一段AI視頻,這樣大家的觀感可能會(huì)更好。

      那里面的視頻是這樣的:

      讓我沒想到的是,不僅語音大家很關(guān)心,這個(gè)對(duì)口型的視覺化的過程,大家也關(guān)心。。。

      所以,今天,我也就寫一篇文章,正好跟大家說一下口型驅(qū)動(dòng)的做法,統(tǒng)一解決一下困惑,讓人人,都能做出一些有趣的創(chuàng)作。

      首先,還是說工具,工具是我們的老朋友:

      即夢。

      即夢我已經(jīng)安利過N次了,國慶期間寫過他們的智能畫布,上上周寫過他們的v2.1新模型一鍵生成海報(bào),這次又是它。

      說真的,好想說一句:即夢打錢。。。

      進(jìn)入首頁后,找到視頻生成。

      在視頻生成的界面中。找到這個(gè)對(duì)口型。

      這個(gè)功能,就能讓照片,開口說話了。

      而我們要做的,就是準(zhǔn)備一張照片和一段語音,就能用這段語音,驅(qū)動(dòng)這張照片,開口說話。

      比如,現(xiàn)在我想做一個(gè)帥哥用坤哥聲音模仿《大話西游》里面那個(gè)經(jīng)典的片段。

      我們先隨便生成一個(gè)亞洲帥哥的照片。

      看看這個(gè)充滿憂郁感的小眼神。

      然后,跟上周的教程一樣,我們用海螺Audio跑一段坤哥的聲音克隆,然后,讓他來念出那一段經(jīng)典臺(tái)詞:

      “曾經(jīng)有一份真摯的感情擺在我的面前,我沒有珍惜,等我失去的時(shí)候才追悔莫及。

      如果上天能給我再來一次的機(jī)會(huì),我會(huì)對(duì)那個(gè)女孩說三個(gè)字:我愛你!如果非要在這份愛上加一個(gè)期限,我希望!是一萬年!”

      我們來聽一下,這段音頻。

      曾經(jīng)...,數(shù)字生命卡茲克,19秒

      再把我們的帥哥的圖片,上傳到角色那,音頻上傳到語音那。

      當(dāng)然如果你不想用克隆的聲音,當(dāng)然也可以用即夢自己的文本朗讀,它里面默認(rèn)給你塞了N多音色,你可以選用,可惜就是沒有AI聲音克隆,所以如果對(duì)創(chuàng)作有需求的話,我覺得還是可以用海螺跑完,再扔到即夢里。

      最重要的一點(diǎn)是,在最后的生成效果上,一定要選生動(dòng)。

      標(biāo)準(zhǔn)是只動(dòng)嘴不動(dòng)頭,看起來就非常不自然,而生動(dòng)模式是真的嘴、眼睛、頭都在自然的運(yùn)動(dòng),真實(shí)也自然很多。

      唯一目前最大的缺陷就是,你不管上傳什么比例的角色,都會(huì)給你自動(dòng)裁成1:1的,無法調(diào)整,在一個(gè)群里看到他們說這塊在改了,12月可能會(huì)上,我也還在等。

      一切就緒之后,直接點(diǎn)擊生成視頻,開跑,積分消耗的不多,基本就是1s1積分。每天登錄幾乎都會(huì)送60~100的積分。

      大概1分鐘不到,一個(gè)19s的視頻就跑完了。

      我們來看看效果。

      就很堅(jiān)毅,很深情,整體的表情,也都非常的自然。

      而這整套,真的也就幾分鐘,就完事了。也真的,有手就行。

      而且其實(shí)不止是真人,一些2D、3D的動(dòng)漫人物,也可以用語音驅(qū)動(dòng)讓照片說話。

      比如這個(gè)。

      而且不止是普通說話,也能做唱歌的。

      比如我自己,錄一首奇奇怪怪的《兩只老虎》,讓馬斯克唱出來。

      這就是照片說話的魅力。

      你看,我把照片喂進(jìn)去,配音扔進(jìn)去,輕輕一點(diǎn)生成,幾分鐘搞定,甚至簡單到無聊。

      可就是這么無聊的事情,卻讓人覺得有趣。

      大概是因?yàn),平凡中總能偶爾翻起點(diǎn)波浪。

      我還記得第一次看到照片說話的作品的時(shí)候,是2023年初,汗青的AI.Talk,年輕的喬布斯和已在太空漫游的年老的馬斯克的對(duì)話。

      坦率的講,這個(gè)作品,給我的震撼是相當(dāng)大的,這是可能只有在AI時(shí)代,才會(huì)出現(xiàn)的一種作品形式。

      讓不可能再出現(xiàn)的人,讓不可能的時(shí)空,交織在一起。

      這就像魔法。

      后面,我自己也會(huì)去模仿汗青,做類似形式的作品。不過不像汗青那種非常深度、有哲理性的表達(dá),而是更偏整活為主。

      比如今年蘋果發(fā)布會(huì)和華為發(fā)布會(huì)在同一天召開硬碰硬,蘋果又非常拉胯,我就做了一個(gè)相同的形式,來去吐槽蘋果。

      數(shù)字生命卡茲克,贊708

      這個(gè)片子里的說話鏡頭,就是即夢的對(duì)口型做的。

      當(dāng)時(shí)我只有一個(gè)想法,如果喬布斯還在,當(dāng)他看到如今的蘋果,他會(huì)說些什么?

      得益于AI,我們可以只花幾個(gè)小時(shí)的時(shí)間,一切都能,躍然紙上。

      你甚至不用想太多,只需要?jiǎng)觿?dòng)手,分分鐘,就造一個(gè)世界。

      那個(gè)喬布斯和庫克還能在一起對(duì)談的,平行世界。

      這是歷史、當(dāng)下和未來。

      就像小時(shí)候,我們經(jīng)常在老家的樹林里,偷偷摸摸撿起一根枯樹枝,用它來在地上畫畫,用它來一場小孩子之間的決斗游戲,用它,來肆意的發(fā)揮我們的想象力。

      那就像一個(gè),無所不能的神器。

      而現(xiàn)在,你手上的AI,就是新的枯樹枝。

      這就是技術(shù)的浪漫。

      當(dāng)你也想去試試,AI Talk的形式,來做一點(diǎn)自己的小作品的時(shí)候。

      那一刻,你會(huì)發(fā)現(xiàn),

      這不僅僅是照片開口說話,

      而是你心里的某個(gè)聲音。

      被放大了。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。