CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運(yùn)行時安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗(yàn)全面升級機(jī)器人公司1X推出世界模型
  • 首頁 > 企業(yè)IT頻道 > 數(shù)字化

    AI開始為數(shù)字人注入靈魂

    2023年05月15日 11:29:34   來源:格隆匯APP

      這幾天,國內(nèi)“冷門歌手”憑借AI翻唱再度走紅。

      B站網(wǎng)友用AI模型生成了歌手孫燕姿的AI分身,其實(shí)跟車載導(dǎo)航上的“林志玲”、“郭德綱”類似。拿歌手本人的音頻去訓(xùn)練,生成一個音色一模一樣的“孫燕姿”。

      然后,讓偶像唱自己喜歡的歌的心愿,就以這樣一種詭異的方式實(shí)現(xiàn)了。

      圖源:B站

      海外的玩法更加離譜。

      美國一個擁有180萬粉絲的23歲女網(wǎng)紅,通過用GPT-4復(fù)刻了自己的AI分身,然后同時與1000多個網(wǎng)友談戀愛,每分鐘收費(fèi)1美元。

      僅一周,她就狂賺了7.16萬美元。

      并且還遠(yuǎn)不止如此,現(xiàn)在她的“男友”還在急速增加中,目前已經(jīng)增加到了近萬人,排隊等待與她“談戀愛”時間已經(jīng)長達(dá)96小時。

      有分析認(rèn)為,按照趨勢,她月入500萬美元沒有任何難度,如果不是技術(shù)限制,她賺到的錢,將可能是一個天文數(shù)字。

      這些現(xiàn)象已經(jīng)可以充分說明,一個由AI+帶來的新技術(shù)紅利時代,正在被急速到來。

      01

      數(shù)字人軍團(tuán)涌入直播間

      直播帶貨是虛擬IP變現(xiàn)*潛力的場景。

      Z世代對社交、視頻、網(wǎng)購等工具的使用深度遙遙*于全網(wǎng)平均水平,數(shù)字人和虛擬空間結(jié)合的新玩法給他們帶來了體驗(yàn)感和交互性,虛擬IP的核心粉絲大多來自18-24歲的年輕群體。

      這一趨勢讓品牌方看到了讓產(chǎn)品打破圈層的機(jī)會。

      2020年,虛擬歌手洛天依和樂正綾等來到淘寶直播間,為博士倫、美的、歐舒丹等品牌帶貨。這場直播觀看人數(shù)高達(dá)270萬,有近200萬人打賞互動。

      這在當(dāng)時一度掀起巨大的討論,虛擬數(shù)字人直播的時代已經(jīng)來了。

      而隨著今年由chatGPT掀起的人工智能大模型熱潮,虛擬數(shù)字人領(lǐng)域又迎來一輪更加磅礴的爆發(fā)。

      一大批量的虛擬數(shù)字人開始扎堆涌進(jìn)直播間。

      今年4月份,天娛數(shù)科旗下的虛擬數(shù)字人“朏朏”已完成 ChatGPT 模型接入,并完成直播首秀,不僅能夠?qū)崟r響應(yīng)顧客的提問,還能根據(jù)不同問題進(jìn)行自主回答。

      圖源:抖音

      在短視頻上,出現(xiàn)過很多這樣的場景:一家公司的整個辦公室里空無一人,只有一排排辦公桌上有數(shù)十臺電腦屏幕里的AI美女們正在直播......

      圖源:短視頻

      這家公司,只靠2D超寫實(shí)的虛擬形象,提前準(zhǔn)備好的話術(shù)和背景,就可以直播一天,雖然單個效果不如真人直播,但成本低到令人發(fā)指,而且還可以超低成本復(fù)制,勝在以量取勝,真正是做到躺著讓AI掙錢也并非不可能。

      這一切,在說明,一場基于“AI+”的內(nèi)容效率革命,正在數(shù)字人領(lǐng)域爆發(fā)。

      虛擬數(shù)字人根據(jù)制作技術(shù)、應(yīng)用場景、形象特點(diǎn)分為很多種。

      與3D人氣偶像不同,現(xiàn)在大多數(shù)直播間里說話的根據(jù)真人原型復(fù)刻聲音、表情的2D寫實(shí)數(shù)字人,你根本分辨不出是真是假,但制作成本遠(yuǎn)低于勇闖娛樂圈的A-Soul IP們。

      一個虛擬主播可以進(jìn)行7*24全天候的直播工作,隨叫隨到,也不用擔(dān)心人設(shè)翻車的問題,減少了直播運(yùn)營中的人工成本。

      這背后,是AIGC在重新塑造數(shù)字人的生產(chǎn)流程。

      2D數(shù)字人的制作用上了深度學(xué)習(xí),只需要確定形象設(shè)計,圖文音頻數(shù)據(jù)經(jīng)過采集、預(yù)處理后上傳到模型訓(xùn)練,制作方式相對3D更簡單,更標(biāo)準(zhǔn)化,制作效能不斷提升。

      這種工廠流水線的方式,使數(shù)字人的制作門檻、成本和周期得到了大幅縮短。

      同時,隨著行業(yè)制作端的技術(shù)迭代和成本驟降,針對小型客戶的數(shù)字人解決方案也開始涌現(xiàn)。

      在4月份,騰訊云發(fā)布的數(shù)字人生產(chǎn)平臺,需要生成真人形象的數(shù)字分身可以在平臺上采購服務(wù),只需上傳圖像音視頻即可實(shí)現(xiàn)定制,根據(jù)不同音色、視頻時長收費(fèi)。

      除了制作數(shù)字人,還可以提供整套數(shù)字人直播解決方案,功能包括了真人音頻接管直播間,獲取用戶評論智能回復(fù),定價僅需要千元級別。

      而有些渠道商,打包售賣AI主播的定價甚至只要200元以內(nèi)。

      這些主播形象大多來自模特經(jīng)紀(jì)公司的授權(quán),投放質(zhì)量雖然粗糙,摳圖痕跡明顯,聲音也沒有特點(diǎn)。

      但對普通的中小企業(yè)來說,沒有大V帶貨,花不起上百萬定制高端IP,想要壓縮運(yùn)營成本, 快速起量,幾千塊的數(shù)字人已經(jīng)夠香了。

      數(shù)字人直播間,硅基

      企業(yè)如果想要自己修改代碼,產(chǎn)出不同的數(shù)字人,還可以向技術(shù)提供商購買源碼,售價要比直接買AI主播更貴,不僅能自用,還可以使用源碼發(fā)展代理,甚至比自己做數(shù)字人直播還賺錢。

      但AI數(shù)字人的故事,還沒有講完。

      02

      AI注入靈魂

      IDC在《中國AI數(shù)字人市場現(xiàn)狀與機(jī)會分析》報告中將數(shù)字人分為五個等級,目前數(shù)字人發(fā)展經(jīng)歷從手工制作到AI建模的階段,初步具備人的外形,但還只能做簡單的交互決策。

      當(dāng)智能化水平來到L4、L5級別時,AI驅(qū)動的數(shù)字人能夠接管大多數(shù)場景決策,支持更多模態(tài)的實(shí)時交互,類似鋼鐵俠的私人AI管家“賈維斯”。

      虛擬數(shù)字人過去三十年的發(fā)展,技術(shù)發(fā)展和市場需求基本圍繞著兩點(diǎn)在演變,一是視覺效果;二是交互體驗(yàn)。

      虛擬數(shù)字人最早出現(xiàn)在游戲、動漫、電影里,對新潮事物的情感連接和IP價值的延伸遙相呼應(yīng)。

      早期的角色型IP使用手繪,動作要一張一張地畫。1982年,日本動畫《超時空要塞》的女主角林明美成為了*發(fā)行音樂專輯的虛擬歌手。

      初代歌姬林明美

      在電影里,形象可以用計算機(jī)建模,但動作還得讓人來做,CG技術(shù)和動作捕捉等技術(shù)逐漸普及,依靠綠幕,捕捉設(shè)備,演員可以成為任何角色。

      千禧年后,從02年的《指環(huán)王》到去年的《阿凡達(dá)2》,角色的渲染效果已經(jīng)細(xì)致入微,為藝術(shù)創(chuàng)作帶來了巨大便利。

      《指環(huán)王》中“咕嚕”的形象由真人捕捉

      到這里,數(shù)字人技術(shù)的發(fā)展圍繞更像“人”的極限一步步逼近,不僅僅要求外觀、服裝上的視覺效果趨近真實(shí),還包括驅(qū)動(呈現(xiàn)真實(shí)細(xì)膩的表情和動作)和渲染(讓畫面更加精細(xì)實(shí)時)。

      不過,總覺得還是缺了點(diǎn)什么。

      1970 年,日本機(jī)器人專家森昌弘提出“恐怖谷”理論,由于機(jī)器人與人類在外表、動作上相似,所以人類會對機(jī)器人產(chǎn)生正面的情感。

      當(dāng)機(jī)器人與人類的相似程度達(dá)到一個特定程度的時候,一點(diǎn)點(diǎn)的差別都會被放大,并帶來負(fù)面和反感情緒。而當(dāng)機(jī)器人與人類的相似度繼續(xù)上升,人類對其情感會再度回到正面。

      與電影不同,社交屬性更強(qiáng)的應(yīng)用場景對數(shù)字人實(shí)時交互的要求更高,不只是滿足于制作一個好看的“花瓶”而已。

      在交互方面,自然語言模型填補(bǔ)了這一空缺。

      文本生成能力已經(jīng)驚艷眾人的GPT,給數(shù)字人的“智商”加上了兩道杠。

      NLP大模型是AI驅(qū)動虛擬人的技術(shù)基石,簡單來講就是讓虛擬數(shù)字人能說會道,減少標(biāo)準(zhǔn)化內(nèi)容的制作成本,被訓(xùn)練來擔(dān)任智能客服、主持人、導(dǎo)游等角色。長期來看,隨著個性化和情感理解的能力提高,為老人提供陪伴關(guān)懷,成為小孩子的”私人教師“也將實(shí)現(xiàn)。

      此外,嘴型動作也可以由AI驅(qū)動,建立起與文本的映射關(guān)系,隨著寫實(shí)程度的提高,微表情也就更豐富,說話的時候表情、口型能夠?qū)Φ蒙希@樣的數(shù)字人不僅“形似人”,而且“神似人”。

      新華社:全球首位數(shù)字航天員:小諍

      Midjourney是基于diffusion model擴(kuò)散模型的爆款產(chǎn)品,在去年7月發(fā)布,通過文本輸入指令訓(xùn)練AI繪畫。

      一對情侶,由Midjourney制圖

      有機(jī)構(gòu)測算過,目前其年收入就已經(jīng)能夠達(dá)到1億美元的規(guī)模。

      有B站up主用Midjourney復(fù)原了奶奶的寫實(shí)形象,從外觀上看,衰老的皮紋和白頭發(fā)細(xì)節(jié)感十足,加上過去的音頻重現(xiàn)奶奶的聲音,最后通過D-ID生成了奶奶的數(shù)字分身。

      為了彌補(bǔ)未與奶奶好好告別的小遺憾,孫子和眼前的數(shù)字“奶奶”開啟了對話,而“奶奶”親切地回應(yīng),其實(shí)是ChatGPT提供的回答素材。

      圖源:B站

      正是通過這些用戶端的越來越多的嘗試,反過來為AI的“人格化”不斷添加海量訓(xùn)練素材,加速豐富AI模型數(shù)據(jù),最終讓AI為數(shù)字人注入靈魂,帶來更大可能。

      03

      尾聲

      對虛擬分身的探索至今持續(xù)了三十余年,從手繪到真人驅(qū)動,再到AI驅(qū)動,擬真感和交互性的體驗(yàn)進(jìn)步打開了廣闊的應(yīng)用場景,涓流匯成大海。

      AIGC幫助將普通人的外觀、聲音等特征全面數(shù)字化,更低的制作門檻打開了市場的想象空間。

      IDC預(yù)計,到2026年中國AI數(shù)字人市場規(guī)模將達(dá)到102.4億元人民幣,但能夠給我們帶來多么良好的體驗(yàn),決定了數(shù)字人最終的命運(yùn)。

      同時,AI數(shù)字人具備下一代人機(jī)交互入口的潛質(zhì),未來我們面對的或不再是冰冷的屏幕,而是生動活潑的數(shù)字人類,越能夠挖掘最深層次的情感需求,成為我們生活里的參與者。

      或許正如AI教父所言,人類只是智慧演化的過渡階段,以便創(chuàng)造出數(shù)字智能,如今我們終于有一個長得像人類的數(shù)字分身,像我們一樣說話,以后或許還能像我們一樣思考。(全文完)

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。