隨著元宇宙概念的推出,數(shù)字人也逐漸出圈,應(yīng)用于傳媒、文旅等各行各業(yè),但高昂的制作和運營成本讓不少企業(yè)望而卻步。因此,“如何讓數(shù)字人成為小微企業(yè)經(jīng)營的‘可選項’,甚至成為個人創(chuàng)作者的創(chuàng)作工具?”成為致力于數(shù)字人領(lǐng)域企業(yè)關(guān)注的焦點。
4月25日,騰訊云智能推出了騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,可以輕松實現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。
通過騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,用戶只需要3分鐘真人口播視頻、100句語音素材,便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實時建模并生成高清人像,在24小時內(nèi)制作出與真人近似的“數(shù)智人”。
千元級別的成本、小時級的制作時長,大幅降低數(shù)字人使用門檻。騰訊云智能小樣本數(shù)智人為短視頻創(chuàng)作、知識分享、帶貨直播等場景應(yīng)用提供了更多可能性。
奔向“更智慧、更懂行”
從騰訊數(shù)智人的發(fā)展脈絡(luò)來看,騰訊一直在致力于數(shù)字人發(fā)展。
據(jù)介紹,從2016年開始,騰訊就已經(jīng)開始接觸對話式AI,也就是早期的數(shù)字人,之后是語音對話方向。2018年,騰訊正式投入數(shù)智人研發(fā)和服務(wù),成為國內(nèi)最早投入數(shù)字人領(lǐng)域的企業(yè)之一,目前騰訊已發(fā)布數(shù)百篇相關(guān)技術(shù)頂會、期刊論文、專利近百份。騰訊云智能數(shù)智人已經(jīng)覆蓋3D寫實、3D半寫實、3D卡通、2D真人、2D卡通五種形象風(fēng)格。
一路走來,在騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊看來,騰訊數(shù)智人主要追求兩大方向——更智能、更懂行。
以此次騰訊重點推介的2D真人小樣本數(shù)智人為例,小樣本數(shù)智人不僅支持半身、全身形象展示,手勢動作會根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。
在技術(shù)解讀中,騰訊優(yōu)圖實驗室研究總監(jiān)汪鋮杰表示,2D小樣本技術(shù)的背后是3D技術(shù)。“小樣本數(shù)智人從直觀上感受是2D視頻,背后其實是3D人像在做支撐。從‘文本/音頻’信息到‘3D人像驅(qū)動’再到‘2D人像視頻’的模式,通3D人臉結(jié)構(gòu)的先驗信息引入,使數(shù)智人口型、表情更到位,讓小樣本數(shù)智人形象實現(xiàn)‘皺紋級’還原。”
另一方面,“小(樣本)"的背后是"大”。基于自監(jiān)督機制的通用多模態(tài)模型經(jīng)過大規(guī)模數(shù)據(jù)訓(xùn)練,可以將語音、文本與人像的表情、口型進行關(guān)聯(lián)。“3分鐘”的訓(xùn)練視頻正是基于這個模型,學(xué)習(xí)每個人個性化的發(fā)音和口型特征。
除了數(shù)字人外形、交互等智能外,要看懂行,則離不開真實的落地應(yīng)用。
陳磊坦言稱:“騰訊數(shù)智人從2018年到2023年,我們一直追求的目標是‘我們更懂行’。”目前,騰訊云智能數(shù)智人從金融、傳媒,到文旅、出行、政務(wù)等十余個行業(yè),上百個具體的業(yè)務(wù)場景均已落地。
實現(xiàn)數(shù)智人快速普及的“背后”
使用門檻和運營成本是數(shù)字人發(fā)展過程中的兩座“大山”。
為加速數(shù)智人服務(wù)普及,騰訊云智能提出自動化“AI+數(shù)智人工廠”的方向。開箱即用的數(shù)智人生產(chǎn)服務(wù),依托騰訊云TI平臺,內(nèi)置超過10項AI算法能力。未來,無需任何算法、研發(fā)經(jīng)驗,只要在平臺導(dǎo)入視頻、語音訓(xùn)練素材,即可通過“自助式”服務(wù),完成大批量數(shù)智人形象、音色定制。
針對數(shù)智人運營,騰訊云智能提供播報數(shù)智人平臺、交互數(shù)智人平臺服務(wù)。播報數(shù)智人平臺支持通過文字、語音輸入快速生成數(shù)智人視頻;交互數(shù)智人平臺可打造“超長待機”的數(shù)智員工,可定制專屬問答庫,提供7*24小時人機雙向交互服務(wù)。同時,也可實現(xiàn)數(shù)智人直播服務(wù),直播間7*24小時不斷檔,自由切換真人語音接管,與用戶問答互動。
陳磊表示,騰訊云智能專注做厚aPaaS數(shù)智人平臺,以API接口形式向合作伙伴開放“產(chǎn)、銷、服”一體化服務(wù),支持合作伙伴開發(fā)更多適用于垂直行業(yè)、垂直場景的數(shù)智人SaaS服務(wù)。目前,已經(jīng)有數(shù)十家合作伙伴依托平臺,向行業(yè)提供數(shù)智人直播SaaS、知識口播SaaS應(yīng)用,覆蓋醫(yī)療、傳媒、金融多個行業(yè)。
作為騰訊云智能的生態(tài)集成伙伴,醫(yī)微訊創(chuàng)始人、CEO潘耿表示,騰訊云智能數(shù)智人生產(chǎn)及運營能力的開放,助力我們?yōu)榭蛻舸蛟炝诉m用于醫(yī)療行業(yè)的數(shù)字人服務(wù)。微媒數(shù)字會議CEO天狐表示,微媒將全力和云智能共創(chuàng)數(shù)字分身解決方案,形成可持續(xù)發(fā)展的品牌營銷生態(tài),為企業(yè)與個人進行IP打造。
此外,騰訊研究院高級研究員宋揚對未來數(shù)字人的發(fā)展給予了厚望。他認為,數(shù)字人的本質(zhì)是降本增效,它將會成為交互的新入口,在深度上和應(yīng)用上會有深度的挖掘。同時,數(shù)字人未來的應(yīng)用是非常廣泛的,技術(shù)+行業(yè)會擦出有深度的應(yīng)用。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。