隨著元宇宙概念的推出,數(shù)字人也逐漸出圈,應(yīng)用于傳媒、文旅等各行各業(yè),但高昂的制作和運(yùn)營成本讓不少企業(yè)望而卻步。因此,“如何讓數(shù)字人成為小微企業(yè)經(jīng)營的‘可選項(xiàng)’,甚至成為個(gè)人創(chuàng)作者的創(chuàng)作工具?”成為致力于數(shù)字人領(lǐng)域企業(yè)關(guān)注的焦點(diǎn)。
4月25日,騰訊云智能推出了騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,可以輕松實(shí)現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。
通過騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,用戶只需要3分鐘真人口播視頻、100句語音素材,便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實(shí)時(shí)建模并生成高清人像,在24小時(shí)內(nèi)制作出與真人近似的“數(shù)智人”。
千元級別的成本、小時(shí)級的制作時(shí)長,大幅降低數(shù)字人使用門檻。騰訊云智能小樣本數(shù)智人為短視頻創(chuàng)作、知識分享、帶貨直播等場景應(yīng)用提供了更多可能性。
奔向“更智慧、更懂行”
從騰訊數(shù)智人的發(fā)展脈絡(luò)來看,騰訊一直在致力于數(shù)字人發(fā)展。
據(jù)介紹,從2016年開始,騰訊就已經(jīng)開始接觸對話式AI,也就是早期的數(shù)字人,之后是語音對話方向。2018年,騰訊正式投入數(shù)智人研發(fā)和服務(wù),成為國內(nèi)最早投入數(shù)字人領(lǐng)域的企業(yè)之一,目前騰訊已發(fā)布數(shù)百篇相關(guān)技術(shù)頂會、期刊論文、專利近百份。騰訊云智能數(shù)智人已經(jīng)覆蓋3D寫實(shí)、3D半寫實(shí)、3D卡通、2D真人、2D卡通五種形象風(fēng)格。
一路走來,在騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊看來,騰訊數(shù)智人主要追求兩大方向——更智能、更懂行。
以此次騰訊重點(diǎn)推介的2D真人小樣本數(shù)智人為例,小樣本數(shù)智人不僅支持半身、全身形象展示,手勢動(dòng)作會根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。
在技術(shù)解讀中,騰訊優(yōu)圖實(shí)驗(yàn)室研究總監(jiān)汪鋮杰表示,2D小樣本技術(shù)的背后是3D技術(shù)。“小樣本數(shù)智人從直觀上感受是2D視頻,背后其實(shí)是3D人像在做支撐。從‘文本/音頻’信息到‘3D人像驅(qū)動(dòng)’再到‘2D人像視頻’的模式,通3D人臉結(jié)構(gòu)的先驗(yàn)信息引入,使數(shù)智人口型、表情更到位,讓小樣本數(shù)智人形象實(shí)現(xiàn)‘皺紋級’還原。”
另一方面,“小(樣本)"的背后是"大”;谧员O(jiān)督機(jī)制的通用多模態(tài)模型經(jīng)過大規(guī)模數(shù)據(jù)訓(xùn)練,可以將語音、文本與人像的表情、口型進(jìn)行關(guān)聯(lián)。“3分鐘”的訓(xùn)練視頻正是基于這個(gè)模型,學(xué)習(xí)每個(gè)人個(gè)性化的發(fā)音和口型特征。
除了數(shù)字人外形、交互等智能外,要看懂行,則離不開真實(shí)的落地應(yīng)用。
陳磊坦言稱:“騰訊數(shù)智人從2018年到2023年,我們一直追求的目標(biāo)是‘我們更懂行’。”目前,騰訊云智能數(shù)智人從金融、傳媒,到文旅、出行、政務(wù)等十余個(gè)行業(yè),上百個(gè)具體的業(yè)務(wù)場景均已落地。
實(shí)現(xiàn)數(shù)智人快速普及的“背后”
使用門檻和運(yùn)營成本是數(shù)字人發(fā)展過程中的兩座“大山”。
為加速數(shù)智人服務(wù)普及,騰訊云智能提出自動(dòng)化“AI+數(shù)智人工廠”的方向。開箱即用的數(shù)智人生產(chǎn)服務(wù),依托騰訊云TI平臺,內(nèi)置超過10項(xiàng)AI算法能力。未來,無需任何算法、研發(fā)經(jīng)驗(yàn),只要在平臺導(dǎo)入視頻、語音訓(xùn)練素材,即可通過“自助式”服務(wù),完成大批量數(shù)智人形象、音色定制。
針對數(shù)智人運(yùn)營,騰訊云智能提供播報(bào)數(shù)智人平臺、交互數(shù)智人平臺服務(wù)。播報(bào)數(shù)智人平臺支持通過文字、語音輸入快速生成數(shù)智人視頻;交互數(shù)智人平臺可打造“超長待機(jī)”的數(shù)智員工,可定制專屬問答庫,提供7*24小時(shí)人機(jī)雙向交互服務(wù)。同時(shí),也可實(shí)現(xiàn)數(shù)智人直播服務(wù),直播間7*24小時(shí)不斷檔,自由切換真人語音接管,與用戶問答互動(dòng)。
陳磊表示,騰訊云智能專注做厚aPaaS數(shù)智人平臺,以API接口形式向合作伙伴開放“產(chǎn)、銷、服”一體化服務(wù),支持合作伙伴開發(fā)更多適用于垂直行業(yè)、垂直場景的數(shù)智人SaaS服務(wù)。目前,已經(jīng)有數(shù)十家合作伙伴依托平臺,向行業(yè)提供數(shù)智人直播SaaS、知識口播SaaS應(yīng)用,覆蓋醫(yī)療、傳媒、金融多個(gè)行業(yè)。
作為騰訊云智能的生態(tài)集成伙伴,醫(yī)微訊創(chuàng)始人、CEO潘耿表示,騰訊云智能數(shù)智人生產(chǎn)及運(yùn)營能力的開放,助力我們?yōu)榭蛻舸蛟炝诉m用于醫(yī)療行業(yè)的數(shù)字人服務(wù)。微媒數(shù)字會議CEO天狐表示,微媒將全力和云智能共創(chuàng)數(shù)字分身解決方案,形成可持續(xù)發(fā)展的品牌營銷生態(tài),為企業(yè)與個(gè)人進(jìn)行IP打造。
此外,騰訊研究院高級研究員宋揚(yáng)對未來數(shù)字人的發(fā)展給予了厚望。他認(rèn)為,數(shù)字人的本質(zhì)是降本增效,它將會成為交互的新入口,在深度上和應(yīng)用上會有深度的挖掘。同時(shí),數(shù)字人未來的應(yīng)用是非常廣泛的,技術(shù)+行業(yè)會擦出有深度的應(yīng)用。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。
近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。