還能再漲23%!AI寵兒NVIDIA成大摩明年首選AMD FSR 4.0將與RX 9070 XT顯卡同步登場羅永浩細紅線最新進展,暫別AR,迎來AI Jarvis構(gòu)建堅實數(shù)據(jù)地基,南京打造可信數(shù)據(jù)空間引領(lǐng)數(shù)字城市建設(shè)下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風(fēng)機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預(yù)告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預(yù)售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務(wù)“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    騰訊云智能推出“自助式”AI數(shù)智人生產(chǎn) 3分鐘樣本訓(xùn)練即可定制

    2023年04月27日 09:52:43   來源:DoNews

      隨著元宇宙概念的推出,數(shù)字人也逐漸出圈,應(yīng)用于傳媒、文旅等各行各業(yè),但高昂的制作和運營成本讓不少企業(yè)望而卻步。因此,“如何讓數(shù)字人成為小微企業(yè)經(jīng)營的‘可選項’,甚至成為個人創(chuàng)作者的創(chuàng)作工具?”成為致力于數(shù)字人領(lǐng)域企業(yè)關(guān)注的焦點。

      4月25日,騰訊云智能推出了騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,可以輕松實現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。

      通過騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,用戶只需要3分鐘真人口播視頻、100句語音素材,便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實時建模并生成高清人像,在24小時內(nèi)制作出與真人近似的“數(shù)智人”。

      千元級別的成本、小時級的制作時長,大幅降低數(shù)字人使用門檻。騰訊云智能小樣本數(shù)智人為短視頻創(chuàng)作、知識分享、帶貨直播等場景應(yīng)用提供了更多可能性。

      奔向“更智慧、更懂行”

      從騰訊數(shù)智人的發(fā)展脈絡(luò)來看,騰訊一直在致力于數(shù)字人發(fā)展。

      據(jù)介紹,從2016年開始,騰訊就已經(jīng)開始接觸對話式AI,也就是早期的數(shù)字人,之后是語音對話方向。2018年,騰訊正式投入數(shù)智人研發(fā)和服務(wù),成為國內(nèi)最早投入數(shù)字人領(lǐng)域的企業(yè)之一,目前騰訊已發(fā)布數(shù)百篇相關(guān)技術(shù)頂會、期刊論文、專利近百份。騰訊云智能數(shù)智人已經(jīng)覆蓋3D寫實、3D半寫實、3D卡通、2D真人、2D卡通五種形象風(fēng)格。

      一路走來,在騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊看來,騰訊數(shù)智人主要追求兩大方向——更智能、更懂行。

      以此次騰訊重點推介的2D真人小樣本數(shù)智人為例,小樣本數(shù)智人不僅支持半身、全身形象展示,手勢動作會根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。

      在技術(shù)解讀中,騰訊優(yōu)圖實驗室研究總監(jiān)汪鋮杰表示,2D小樣本技術(shù)的背后是3D技術(shù)。“小樣本數(shù)智人從直觀上感受是2D視頻,背后其實是3D人像在做支撐。從‘文本/音頻’信息到‘3D人像驅(qū)動’再到‘2D人像視頻’的模式,通3D人臉結(jié)構(gòu)的先驗信息引入,使數(shù)智人口型、表情更到位,讓小樣本數(shù)智人形象實現(xiàn)‘皺紋級’還原。”

      另一方面,“小(樣本)"的背后是"大”。基于自監(jiān)督機制的通用多模態(tài)模型經(jīng)過大規(guī)模數(shù)據(jù)訓(xùn)練,可以將語音、文本與人像的表情、口型進行關(guān)聯(lián)。“3分鐘”的訓(xùn)練視頻正是基于這個模型,學(xué)習(xí)每個人個性化的發(fā)音和口型特征。

      除了數(shù)字人外形、交互等智能外,要看懂行,則離不開真實的落地應(yīng)用。

      陳磊坦言稱:“騰訊數(shù)智人從2018年到2023年,我們一直追求的目標是‘我們更懂行’。”目前,騰訊云智能數(shù)智人從金融、傳媒,到文旅、出行、政務(wù)等十余個行業(yè),上百個具體的業(yè)務(wù)場景均已落地。

      實現(xiàn)數(shù)智人快速普及的“背后”

      使用門檻和運營成本是數(shù)字人發(fā)展過程中的兩座“大山”。

      為加速數(shù)智人服務(wù)普及,騰訊云智能提出自動化“AI+數(shù)智人工廠”的方向。開箱即用的數(shù)智人生產(chǎn)服務(wù),依托騰訊云TI平臺,內(nèi)置超過10項AI算法能力。未來,無需任何算法、研發(fā)經(jīng)驗,只要在平臺導(dǎo)入視頻、語音訓(xùn)練素材,即可通過“自助式”服務(wù),完成大批量數(shù)智人形象、音色定制。

      針對數(shù)智人運營,騰訊云智能提供播報數(shù)智人平臺、交互數(shù)智人平臺服務(wù)。播報數(shù)智人平臺支持通過文字、語音輸入快速生成數(shù)智人視頻;交互數(shù)智人平臺可打造“超長待機”的數(shù)智員工,可定制專屬問答庫,提供7*24小時人機雙向交互服務(wù)。同時,也可實現(xiàn)數(shù)智人直播服務(wù),直播間7*24小時不斷檔,自由切換真人語音接管,與用戶問答互動。

      陳磊表示,騰訊云智能專注做厚aPaaS數(shù)智人平臺,以API接口形式向合作伙伴開放“產(chǎn)、銷、服”一體化服務(wù),支持合作伙伴開發(fā)更多適用于垂直行業(yè)、垂直場景的數(shù)智人SaaS服務(wù)。目前,已經(jīng)有數(shù)十家合作伙伴依托平臺,向行業(yè)提供數(shù)智人直播SaaS、知識口播SaaS應(yīng)用,覆蓋醫(yī)療、傳媒、金融多個行業(yè)。

      作為騰訊云智能的生態(tài)集成伙伴,醫(yī)微訊創(chuàng)始人、CEO潘耿表示,騰訊云智能數(shù)智人生產(chǎn)及運營能力的開放,助力我們?yōu)榭蛻舸蛟炝诉m用于醫(yī)療行業(yè)的數(shù)字人服務(wù)。微媒數(shù)字會議CEO天狐表示,微媒將全力和云智能共創(chuàng)數(shù)字分身解決方案,形成可持續(xù)發(fā)展的品牌營銷生態(tài),為企業(yè)與個人進行IP打造。

      此外,騰訊研究院高級研究員宋揚對未來數(shù)字人的發(fā)展給予了厚望。他認為,數(shù)字人的本質(zhì)是降本增效,它將會成為交互的新入口,在深度上和應(yīng)用上會有深度的挖掘。同時,數(shù)字人未來的應(yīng)用是非常廣泛的,技術(shù)+行業(yè)會擦出有深度的應(yīng)用。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。