從“深度偽造”到“深度合成”：AI為啥需要一次“正名”？

2020年06月08日 15:32:20 腦極體 來源：品途商業(yè)評論

　　在世人對AI的“邪惡性”進(jìn)行攻詰的浪潮中，AI造假，可能已經(jīng)是現(xiàn)在排首位的理由了。

　　自從2017年Deepfake(深度偽造)橫空出世以后，人們驚呼原來AI在造假方面簡直天賦異稟。此后“AI生成內(nèi)容”技術(shù)，特別是GAN算法的突飛猛進(jìn)更加印證了這一事實。不僅僅是AI換臉，還有AI自動生成文本、語音、圖像、視頻等等一切數(shù)字內(nèi)容。

　　除了AI換臉帶來的色情視頻泛濫之外，人們更進(jìn)一步擔(dān)心AI生成內(nèi)容技術(shù)在隱私侵犯、威脅信息安全、操縱政治選舉等方面帶來全新挑戰(zhàn)。

　　人們往往會假設(shè)，如果任由AI生成的內(nèi)容在互聯(lián)網(wǎng)中蔓延，將會更進(jìn)一步?jīng)_毀互聯(lián)網(wǎng)世界的真實性邊界。

　　Deepfake之后，真相何在?

　　如果哪些是真，哪些是假，普通人都難以分辨的時候，那么組成社會基石的真相和信任將就此坍塌，但我們似乎還沒有做好活在“無信任社會”的準(zhǔn)備吧。

　　德國哲學(xué)家康德在《實踐理性批判》中論證“人為什么不能說謊”的法則，揭示了“無信任社會”的悖論和荒謬。假如“人人可以說謊”是一條社會的通行法則，那么，每個人都不會再信任另一個人說的話，這樣說話人的謊言也就不會得逞。說謊而無人相信，就陷入了自相矛盾的境地，反之“人人不能說謊”，才應(yīng)該是正常社會的通行法則。

　　這就是說，只有在默認(rèn)“人人應(yīng)該誠實”的信任社會里，說謊者才可以通過成功騙到他人獲利，也會因為謊言被戳穿而信譽破產(chǎn)。而在“無信任社會”中，信息的真假判斷都難以進(jìn)行，那只能默認(rèn)一切都為“假”，才會不至于上當(dāng)受騙。但是相應(yīng)的代價是信任全無，合作難以達(dá)成，交流也不再可能，最終將會是社會的分崩離析。

　　當(dāng)然這只是理論上面最極端的演繹。現(xiàn)實世界永遠(yuǎn)會在理論世界之下形成巨大的灰色空間，人性的基石仍將亙古不變，技術(shù)的演進(jìn)也會一往無前，而人性的弱點就會在這兩者的撕扯的張力中一直暴露無遺。每一代的新人類除了持續(xù)的學(xué)習(xí)、進(jìn)化，以適應(yīng)技術(shù)加速帶來的全新挑戰(zhàn)，似乎也沒有什么更好的辦法。

　　回到“Deepfake”為代表的“AI生成內(nèi)容”技術(shù)來說，它既不會成為將我們的社會拖向“無信任”的深淵，也不會讓我們的人性變得更好或更壞一點。在一個即將到來的“虛實相容、真假不分”的后真相世界當(dāng)中，只會讓適應(yīng)這一變化的我們變得更加復(fù)雜和反脆弱。

　　所以。這一略帶“貶義”的Deepfake(深度偽造)的技術(shù)名詞，需要被我們重新塑造為一個技術(shù)中性詞匯——Deep Synthesis(深度合成)。

　　為“深度合成”正名：AI的技術(shù)中性

　　科技的每一次突破，都可能帶來意想不到的“副產(chǎn)品”。

　　就如同愛因斯坦發(fā)現(xiàn)了質(zhì)能方程式之后，即使再不情愿，他也無法阻止原子彈的出現(xiàn)和使用。就在Deepfake這個“妖孽”在美國新聞網(wǎng)站Reddit被放出來之后，AI的領(lǐng)軍人物Yann LeCun也在Twitter上深深反�。�

　　“說真的，要是當(dāng)初知道卷積神經(jīng)網(wǎng)絡(luò)(CNN)會催生Deepfake，我們還要不要發(fā)表它?”

　　隨即LeCun自己就回答了這個問題。LeCun表示，即使不是我們首先公開發(fā)表，CNN也會由其他人或機構(gòu)發(fā)明出來。而在2002年當(dāng)時被公布出來以后，人們也不知道如何來利用它。換句話說，CNN的價值要在技術(shù)人員的不斷探索下才能挖掘出來。

　　現(xiàn)在CNN正在被開發(fā)出各種各樣的應(yīng)用，既對世界有很多正向的積極影響，比如醫(yī)療診斷、自動駕駛、內(nèi)容過濾以及安全監(jiān)控等等，也可能引起一些負(fù)面的效果，比如侵犯隱私、造假詐騙、偏見歧視等等，好壞參半，可以各打五十大板。

　　簡單來說，就是AI無罪，問題還是出在使用AI技術(shù)的人類身上。

　　以Deepfake技術(shù)所引發(fā)的AI換臉的色情視頻泛濫來說，AI技術(shù)被應(yīng)用于色情產(chǎn)業(yè)幾乎是一件“必然如此”的過程。一方面，現(xiàn)代色情產(chǎn)業(yè)一直都是最新科學(xué)技術(shù)應(yīng)用的急先鋒，另一方面，AI在圖像內(nèi)容生成技術(shù)的發(fā)展正好迎來了突破臨界點。最后一步就只剩下這個叫“Deepfakes”的用戶最后的“靈機一動”了。

　　實際上，Deepfake為“AI內(nèi)容生成”技術(shù)的普及起到了推波助瀾的作用，但同時也帶來難以抹去的污名化影響。而鑒于“AI內(nèi)容生成”技術(shù)的發(fā)展早已超出AI換臉的范疇，技術(shù)商業(yè)領(lǐng)域正在試圖用“深度合成”來為這一技術(shù)正名。

　　首先，Deepfake(深度偽造)一詞明顯以偏概全，其僅僅是“AI換臉”技術(shù)的早期代表，不足以包含所有的“AI生成內(nèi)容”的技術(shù)。用Deep Synthesis(深度合成)可以更好地泛指所有AI生成算法和涵蓋自動生成圖像、視頻、語音、文本、音樂等內(nèi)容的合成技術(shù)。

　　其次，Deepfake尚未得到技術(shù)社區(qū)的廣泛認(rèn)可，只是被媒體大眾叫順嘴了而已。況且Deepfake自帶的“腹黑”體質(zhì)，對于AI技術(shù)的應(yīng)用推廣會帶來直接的負(fù)面影響。

　　“深度合成”這個更為中性的技術(shù)名稱，將會代替Deepfake來行使AI內(nèi)容發(fā)展的應(yīng)盡之責(zé)。那么，“深度合成”該如何撐起這重任呢?

　　“深度合成”的底氣：技術(shù)加速和商業(yè)落地

　　“深度合成”技術(shù)，其實就是借助可以自主學(xué)習(xí)的深度學(xué)習(xí)算法模型來實現(xiàn)的，其主要使用的的兩個技術(shù)就是“自動編碼器”人工神經(jīng)網(wǎng)絡(luò)和 “生成對抗網(wǎng)絡(luò)”(GAN)的人工神經(jīng)網(wǎng)絡(luò)組成。前者用于訓(xùn)練數(shù)據(jù)的合成，后者由生成器和鑒別器組成，一個用來進(jìn)行新數(shù)據(jù)的生成和一個用來對其進(jìn)行鑒別，經(jīng)過二者無數(shù)次的對抗，最終生成出“以假亂真”的合成數(shù)據(jù)，其中就包括Deepfake所創(chuàng)造出來的換臉視頻。

　　(GAN相關(guān)論文的發(fā)表情況)

　　從2014年，GAN提出一直到今天，已經(jīng)經(jīng)歷了從CGAN、BigGAN 、StyleGAN等多個版本更新，其中每年的相關(guān)研究論文也在加速增長，可見學(xué)界對于GAN算法的重視和發(fā)展前景的看好。

　　(BigGAN 生成的包含各種類別的高清晰圖片)

　　與此相應(yīng)的，就是圖像生成質(zhì)量的突飛猛進(jìn)，其中不僅可以實現(xiàn)人臉的合成，也能更一步實現(xiàn)圖像疊加融合，或者直接生成全新的高清圖片，以致于人眼根本難以分辨真假。

　　比如，去年MIT和IBM沃森聯(lián)合實驗室發(fā)布的一個基于GAN的AI藝術(shù)畫師，就可以學(xué)習(xí)文藝復(fù)興時期的畫家的繪畫風(fēng)格，直接將現(xiàn)代人類的照片變成文藝復(fù)興時期的畫作。

　　其中的技術(shù)優(yōu)勢在于，GAN神經(jīng)網(wǎng)絡(luò)會根據(jù)自己學(xué)到的技巧為畫面重新構(gòu)圖，也就是它是畫出新的圖片，而不是利用風(fēng)格遷移的方式，改變原圖的色彩。

　　其實，深度合成技術(shù)已經(jīng)可以走得更遠(yuǎn)。除了單一的圖像、音頻合成之外，多維度的內(nèi)容合成已經(jīng)是一個趨勢，這樣可以將語音識別、人臉識別、唇形搜索等結(jié)合起來，進(jìn)行人臉語音的合成，從而可以讓一個人自然流利地說出自己從未說過的話。

　　此外，人臉合成之外，全身合成、3D合成虛擬人技術(shù)也成為當(dāng)前的應(yīng)用熱點。剛剛過去的兩會期間，搜狗聯(lián)合新華社推出上崗的全球首個3D版AI合成主播，就已經(jīng)可以在文本實時驅(qū)動面部表情和唇形，肢體動作、超寫實細(xì)節(jié)呈現(xiàn)上面做到比擬真人的動態(tài)效果。

　　在“深度合成”技術(shù)的商業(yè)化方面，已經(jīng)有眾多行業(yè)和企業(yè)看到其應(yīng)用場景和廣闊市場。目前，“深度合成”已經(jīng)在影視娛樂、社交通訊等多個行業(yè)的場景中開始發(fā)揮作用。

　　比如，在影視劇制作中，最直接的幫助就是提升音視頻制作的效率，拓展創(chuàng)作想象空間;一些特殊情況下，還可以通過合成技術(shù)為影視劇的失聲的演員進(jìn)行聲音合成，為已過世的演員進(jìn)行“數(shù)字復(fù)活”;甚至直接創(chuàng)造虛擬數(shù)字人來進(jìn)行影視劇集的制作。

　　在娛樂應(yīng)用體驗上面，最基本的臉部特效應(yīng)用、換臉視頻、動圖，都已經(jīng)多次在我們的生活中出現(xiàn);虛擬偶像、虛擬主播、虛擬客服也隨著深度合成技術(shù)的成熟而變得越逼真和可信。

　　在社交通訊上面，與其擔(dān)心深度合成技術(shù)會暴露個人隱私，不如可以讓深度合成技術(shù)幫我們在社交網(wǎng)絡(luò)中建立自己的“數(shù)字分身”，就如同《頭號玩家》里面每個人創(chuàng)建的虛擬形象一樣，成為自己在網(wǎng)絡(luò)世界的通行證。

　　此外，像電商營銷、教育藝術(shù)、醫(yī)療科研等領(lǐng)域，深度合成技術(shù)帶來的仿真數(shù)據(jù)和虛擬化內(nèi)容都可以為這些產(chǎn)業(yè)帶來新的應(yīng)用場景或者直接推動該領(lǐng)域的技術(shù)進(jìn)步。

　　顯然，深度合成技術(shù)的這些正向價值正在為其換來更有底氣的話語權(quán)和發(fā)展前景。但是這個一出現(xiàn)就飽受人類質(zhì)疑和恐懼的AI技術(shù)，仍然值得我們認(rèn)真對待其應(yīng)用邊界和規(guī)則。

　　“深度合成”的治理：

　　如何鎖住“虛假內(nèi)容”的惡龍

　　正如一切獲得都必須付出代價一般，我們?nèi)绻胍硎苌疃群铣杉夹g(shù)帶來我們的一切生活便利和精神享受，同時就必須承受其帶來的將數(shù)字世界全面虛擬化的代價。

　　深度合成技術(shù)所帶來的“虛假內(nèi)容”的社會風(fēng)險將長期存在。首先，深度合成的開源技術(shù)和軟件，讓普通人們偽造、操縱音視頻的門檻大幅降低;其次，這些虛假音視頻內(nèi)容足以以假亂真地騙過大多數(shù)“不明真相”的群眾;最后，這些帶有明顯色情、危言聳聽或侵犯隱私的信息又足以吸引人，只要從源頭傳出，就會進(jìn)行源源不斷的擴散。

　　除了少數(shù)能夠辨別真?zhèn)蔚膶I(yè)人士，大多數(shù)人都難以分辨和抵制這些假信息的誘惑。深度合成的技術(shù)濫用風(fēng)險，需要得到來自法律、技術(shù)、行業(yè)、民眾等多方面的制約。

　　第一，法律層面。對AI深度合成內(nèi)容的用途、標(biāo)記、使用范圍以及濫用技術(shù)的處罰，都應(yīng)該進(jìn)行深入研究，并出臺相應(yīng)的規(guī)定，為深度合成的合法使用提供依據(jù)。

　　第二，技術(shù)層面。與深度合成技術(shù)同步進(jìn)化的內(nèi)容鑒別技術(shù)和溯源追蹤技術(shù)也應(yīng)該得到重視。針對合成內(nèi)容的有效鑒別與標(biāo)記，才能從源頭來識別合成內(nèi)容，以防止負(fù)面的虛假內(nèi)容的擴散。

　　第三，行業(yè)層面。深度合成技術(shù)離不開行業(yè)自律，合成內(nèi)容技術(shù)提供者和平臺要承諾在合成內(nèi)容之上必須做出標(biāo)記，或者提供有效的檢測和標(biāo)注工具，來保證合成內(nèi)容被清晰識別出來。

　　最后，民眾層面。相比較于權(quán)威機構(gòu)或者主流精英人群對合成內(nèi)容泛濫的擔(dān)憂，廣大民眾反而可能是這波“虛擬化”浪潮最主要的支持者，甚至是虛假信息的推波助瀾者。

　　在我們即將全面迎來數(shù)字化世界的今天，培養(yǎng)合格“數(shù)字素養(yǎng)”應(yīng)該要成為一件從小就抓起的公民必修課。但這門課教什么、怎么上，仍然需要在深度合成技術(shù)發(fā)展的路上慢慢探索。

　　正如沒有任何一個技術(shù)是我們在做好準(zhǔn)備之后才出現(xiàn)，AI技術(shù)也是如此。

　　從一開始，我們就把AI技術(shù)出發(fā)點定義為，盡可能地學(xué)習(xí)和模仿人類的能力，以致于最終能夠代替人類行駛那些繁重、重復(fù)甚至極高難度的任務(wù)。

　　而深度合成技術(shù)不正是這一目標(biāo)的實現(xiàn)過程。我們既然選擇喚醒AI這條巨龍，就不能再“葉公好龍”地?fù)?dān)心AI越來越像人類這件事情。

　　最后，反過來看我們?nèi)祟愡@個物種，一方面我們有極致的智慧去探索世界的因果規(guī)律，始終去探索那個“真相”;一方面我們又抱著極大熱情來發(fā)明各種工具，來承擔(dān)人類的各種工作。

　　這兩種能力也直接促成了我們今天的工業(yè)世界，以及未來要進(jìn)入的數(shù)字虛擬世界。

　　樂觀來說，我們不僅不用太過擔(dān)心“后真相時代”的來臨，甚至于，我們還會很快適應(yīng)這個徹底“虛擬化”的美麗新世界。

　　對于絕大多數(shù)人來說，追求真相，遠(yuǎn)遠(yuǎn)沒有追求舒適更具吸引力。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信

即時

TCL實業(yè)榮獲IFA2024多項大獎，展示全球科技創(chuàng)新力量

近日，德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革，全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎，有力證明了其在全球市場的強大影響力。

服貿(mào)會高通展示開放創(chuàng)新生態(tài)，以5G、AI等技術(shù)促進(jìn)合作共贏

OPPO續(xù)約歐洲冠軍聯(lián)賽未來三季再續(xù)輝煌

新聞

敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

近日，中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相，以敢為精神勇闖技術(shù)無人區(qū)，斬獲四項AWE 2024艾普蘭大獎。

企業(yè)IT

重慶創(chuàng)新公積金應(yīng)用，“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

“以前都要去窗口辦，一套流程下來都要半個月了，現(xiàn)在方便多了!”打開“重慶公積金”微信小程序，按照提示流程提交相關(guān)材料，僅幾秒鐘，重慶市民曾某的賬戶就打進(jìn)了21600元。

3C消費

“純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

2024年3月12日，由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

研究

2024全球開發(fā)者先鋒大會即將開幕

由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo)，由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”，將于2024年3月23日至24日舉辦。

專題

2021 CCF全國高性能計算學(xué)術(shù)年會

返回主頁 ┊ 關(guān)于我們 ┊ 內(nèi)容聯(lián)系 ┊ 聯(lián)系我們 ┊ 免責(zé)聲明 ┊ 原創(chuàng)新聞 ┊ 友情鏈接 ┊ 舊版首頁

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网
久久精品视频国产女人扒开腿让人桶视频男女做爰猛烈叫床视频免费 99精品久久久中文字幕欧美日韩一区精品视频

從“深度偽造”到“深度合成”：AI為啥需要一次“正名”？

擴展閱讀

從“深度偽造”到“深度合成”：AI為啥需要一次“正名”？