合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?
  • 首頁 > 云計算頻道 > 大模型

    抖音“嫌棄”數(shù)字人

    2023年09月11日 14:26:40   來源:微信公眾號定焦

      本文來自于微信公眾號定焦(dingjiaoone),作者:向園。

      午夜1點的直播間,一位女主播還在引導(dǎo)用戶購買團購券。“她”是王力餐飲店的主播,最長記錄持續(xù)賣貨13個小時,偶爾有路過的觀眾提問,“她”也沒有回應(yīng)。

      這位主播并非真人,是王力花兩千多元買來的數(shù)字人,使用權(quán)一年。

      “成本比請博主探店低很多”,王力起初對這個新雇來的“員工”很滿意,現(xiàn)在卻信心全無。“數(shù)字人公司說可以一天24小時循環(huán)播,可實際情況是,賬號動不動就被平臺封禁,想售后也聯(lián)系不上銷售”。

      王力覺得自己沒賺到錢、沒圈到流量,反而被割了韭菜。不止他一個人,大量商家稱自己用數(shù)字人直播被平臺判定為違規(guī)封號,很多人也和王力一樣售后無門。

      去年底,借著AIGC的東風(fēng),潤米咨詢創(chuàng)始人劉潤等財經(jīng)大V自曝使用數(shù)字人分身以來,虛擬數(shù)字人急速升溫。

      今年,國內(nèi)上演“百模大戰(zhàn)”,低沉本的數(shù)字人進入市場,百元級別的數(shù)字分身迅速被炒成一本萬利的財富經(jīng)。每到深夜,打開主流平臺(抖音、淘寶、快手、視頻號、京東、拼多多),有大量數(shù)字人堅守在直播間。

      但這幾個月以來,關(guān)于數(shù)字人的質(zhì)疑聲漸起,諸如效果太假、市場混亂、價格不透明等,平臺也在加強監(jiān)管。5月9日,抖音發(fā)布《抖音關(guān)于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議(以下簡稱數(shù)字人行業(yè)倡議)》。截至目前,其他平臺暫未跟進。

      抖音一紙規(guī)范在圈內(nèi)掀起了不小的討論。接近抖音的運營人士周一路告訴「定焦」,這代表抖音明確開放了人工智能生成的圖片、視頻,和衍生的虛擬人直播,也意味著數(shù)字人要被“管”了。

      而抖音最先出手,是因為一方面,抖音上的數(shù)字人最盛行,內(nèi)容風(fēng)險把控成本很大,另一方面,數(shù)字人直播對抖音的商業(yè)貢獻不大,舉個例子,抖音的興趣電商主打的是情緒和隨機性,數(shù)字人完全比不了真人。

      大眾熟知的數(shù)字人,有IP向的,例如虛擬偶像洛天依、虛擬博主AYAYI,還有功能型的,如數(shù)字銀行的數(shù)字人客服。本文討論的是幫企業(yè)和主播賣貨、拍視頻的數(shù)字人。

      不同公司對它可能有不同的叫法,包括數(shù)字人、虛擬人、虛擬數(shù)字人、數(shù)字分身甚至AI主播等,市面上大量數(shù)字人沒有接入AI大腦,本文統(tǒng)一稱為數(shù)字人。

      數(shù)字人作為AIGC技術(shù)目前最容易應(yīng)用和變現(xiàn)的領(lǐng)域,太多人蠢蠢欲動,企業(yè)想靠它降本、創(chuàng)收,主播想借它輔助創(chuàng)作、抓住流量。但很多人和王力有一樣的疑問:為什么賬號很容易被封?數(shù)字人市場為什么這么亂?這些平臺到底歡不歡迎數(shù)字人?

      被封的數(shù)字人,易踩四大坑

      “哥們,你被坑了,這是錄播。”王力把數(shù)字人直播的視頻發(fā)到幾個行業(yè)群里請教,有人這樣告訴他。

      當(dāng)數(shù)字人席卷各大直播間,“封禁潮”也在同時發(fā)生。結(jié)合多位受訪者的說法,錄播是目前數(shù)字人直播最容易踩的坑之一。

      因為市面上錄播的數(shù)字人“橫行”,它成本更低、技術(shù)相對落后,只需要寫好腳本,錄入相應(yīng)的軟件,讓“數(shù)字人”按照腳本生成視頻,直播時播放視頻就行。

      “最早一批嘗試數(shù)字人直播技術(shù)的商家,很多是被錄播割了韭菜。”數(shù)字人代理公司負責(zé)人張現(xiàn)說,很多商家此前沒做過直播,不熟悉平臺規(guī)則,但對數(shù)字人很感興趣,花萬八千,從代理商那里買到一款錄好視頻的數(shù)字人,但很容易被封”。

      其實不論是真人還是數(shù)字人,錄播在抖音和淘寶直播都是被嚴厲打擊的。直播平臺運營人士宋欣鑫稱,因為平臺要求直播時根據(jù)現(xiàn)場情況做出實時反應(yīng),但錄播做不到。

      抖音的《數(shù)字人行業(yè)倡議》中提到,數(shù)字人直播必須由真人驅(qū)動進行實時互動,不允許完全由AI驅(qū)動進行互動。

      51數(shù)字人創(chuàng)始人陳鴻告訴「定焦」,“如果直播內(nèi)容長時間重復(fù),或是一套直播話術(shù)短時間內(nèi)重復(fù)使用,都有可能被判錄播封禁。”

      “撞臉”,也有可能被平臺識別為錄播,被封號的概率也會增加。

      “如果你刷到好幾個賬號,使用的是同樣的數(shù)字人,說明很有可能買的是同一個數(shù)字人模特。”周一路說,這非常影響用戶體驗,因為理論上同一個人不可能同時出現(xiàn)在多個直播間、講著不同的內(nèi)容。

      AI領(lǐng)域創(chuàng)業(yè)者高叢對定焦稱,制作足夠逼真、現(xiàn)象級的數(shù)字分身,例如劉潤,成本上百萬元,而大多數(shù)中小企業(yè)只用得起百元、千元價位的數(shù)字人,多數(shù)人選的是公模,很容易撞臉、撞聲音。

      目前數(shù)字人的產(chǎn)品模式,分為公模(公用模特)、主播定制和源碼系統(tǒng),價格從百元到幾萬元不等,主要差別是形象、聲音的真實度。

    圖片

      定焦制圖

      其中公模最便宜,市面上主流的數(shù)字人平臺,都提供一定數(shù)量的公模,單月費用幾十到幾百元。

      想用自己形象出鏡的,一般會選擇主播定制模式。這個價格經(jīng)歷過跳水,從之前的幾十萬降到了現(xiàn)在的幾百元到幾千元不等。后期的視頻生成需另外按時長收費。

      外界認為最貴的是第三種模式,即數(shù)字人系統(tǒng)源碼或是SaaS軟件,購買之后可以自主修改數(shù)字人,多家公司的報價都在五萬元左右。

      沒有進行實名注冊和標識,也是一些數(shù)字人賬號被封的原因。抖音在《數(shù)字人行業(yè)倡議》中提到,需要虛擬人在平臺進行實名注冊,并標識虛擬人直播,以便公眾判斷等。

      陳鴻告訴定焦,其中的注冊流程,對一些中小企業(yè)來說“不容易走通”。

      不過,站在平臺的角度,數(shù)字人內(nèi)容的風(fēng)險把控問題,的確日益嚴峻。人工智能生成的內(nèi)容本身就很難識別真假,有些數(shù)字人又高度逼真,如果被黑灰產(chǎn)鉆了空子難以追責(zé)。

      網(wǎng)經(jīng)社電子商務(wù)研究中心特約研究員、上海漢盛律師事務(wù)所高級合伙人李旻律師曾對媒體指出,抖音發(fā)布這個規(guī)范的主要目的是規(guī)范平臺上的人工智能生成內(nèi)容,并防止其產(chǎn)生侵權(quán)等問題。同時,抖音通過發(fā)布規(guī)范,有利于在發(fā)生侵權(quán)案件后減少平臺責(zé)任。目前法律規(guī)定,如果平臺對平臺內(nèi)的侵權(quán)案件未采取必要措施的,對于擴大的損失需要與侵權(quán)人承擔(dān)連帶責(zé)任。

      周一路稱,還有一些賬號的封禁原因是,內(nèi)容侵權(quán)、違規(guī),或存在虛構(gòu)虛假宣傳和欺詐。

      此外,數(shù)字人內(nèi)容質(zhì)量差,也會引起平臺的注意。

      陳鴻總結(jié)了低質(zhì)數(shù)字人的三大表現(xiàn):口型對不上,或是音畫不同步;視頻質(zhì)量粗糙,用720分辨率的冒充1080高清的,摳像有綠邊,人物動作不自然,實際交付和廣告招商的案例貨不對板;交互差,主要表現(xiàn)是用錄播冒充直播,直播間問答反饋慢,無法實時互動,后臺用真人聲音驅(qū)動并沒有節(jié)省人力成本。

      如果客戶遇到封號的情況,張現(xiàn)稱,會提醒客戶把產(chǎn)品下線、指導(dǎo)解封,“但如果無法解決問題,我們也沒有辦法”。他提醒,現(xiàn)在沒有公司能保證不會被封號。

      數(shù)字人火了,也亂了

      監(jiān)管加碼,說到底還是因為視頻和直播間里的數(shù)字人良莠不齊。效果好的數(shù)字人,讓人辨不出真假,甚至被當(dāng)成牟利工具;效果差的,一看就是“假人”,影響用戶體驗。

      結(jié)合多位受訪者的分析,因為這個產(chǎn)業(yè)發(fā)展不久,技術(shù)方離市場端較遠,容易導(dǎo)致產(chǎn)品和市場需求不匹配,而且數(shù)字人技術(shù)有“進場容易做深難”的特點。

      陳鴻對「定焦」梳理了近期陸續(xù)出現(xiàn)的優(yōu)質(zhì)數(shù)字人案例,有劉潤數(shù)字人分身、萬達的數(shù)字人主播、換臉科技給明亞保險做的數(shù)字保險代理人等等,很多人感嘆,“原來數(shù)字人可以做得這么真實”。還有硅基智能、風(fēng)平智能等近百家數(shù)字人企業(yè)的大量數(shù)字人案例共同推動了行業(yè)發(fā)展。

      最興奮的是兩撥人。一撥是原本想做短視頻、但受制于制作門檻,或精力有限、不具備表達能力的中小創(chuàng)業(yè)者。讓他們興奮的是,用幾百幾千元就可以擁有一個數(shù)字人分身。

      輸出數(shù)字人產(chǎn)品的技術(shù)型公司也很興奮,但很多小公司銷售渠道不完善、缺乏客戶資源;大公司因為2D數(shù)字人客單價偏低、售后成本過高,不愿意投入過多服務(wù)人員。而這個全新的領(lǐng)域還沒有專門的代運營公司,因此,另一撥人,也就是手握大批有客戶資源的代理商高調(diào)入場了。

      產(chǎn)品是數(shù)字人技術(shù)公司做的,代理商是客戶和產(chǎn)品方中間的角色。因為數(shù)字人市場潛力大,很多代理商公司提供一條龍服務(wù),從兜售數(shù)字人產(chǎn)品,到線下數(shù)字人培訓(xùn),目標是拿下那些想做短視頻和電商的中小企業(yè)。這期間,很多代理商用數(shù)字人視頻銷售、講課,噱頭十足。

      種種因素帶來的結(jié)果是,不只是數(shù)字人產(chǎn)品價格不透明,供給端也很難看清真實的市場需求,做出來的產(chǎn)品解決不了痛點。

      根據(jù)陳鴻對市場的觀察,客戶對數(shù)字人產(chǎn)品的核心需求是,在預(yù)算基礎(chǔ)上,盡可能追求真實。但市面上很多數(shù)字人,“24小時循環(huán)講解,一口水都不喝,不笑,沒有氛圍、沒有互動,真實性和體驗感很差,用戶就算看到,大概率也會劃過去”。

      很多人覺得數(shù)字人“太假”,還因為這個新興市場進場者太多,但技術(shù)受限,做出來的精品不多,用戶體驗不佳。

      虛擬人技術(shù)種類 圖源 / 中商產(chǎn)業(yè)研究院

      現(xiàn)在視頻和直播里的數(shù)字人多是2D真人,相比3D超寫實的柳葉熙、2D卡通的A-SOUL,制作成本更低、制作周期更短,但實際效果參差不齊。

      播報型數(shù)字人因為講解話術(shù)統(tǒng)一,已滿足基本體驗,比較典型的是知識付費、健康知識領(lǐng)域;但直播間里的交互型數(shù)字人,還比較“假”。

      “數(shù)字人直播主流交互的方式是,準備一個標準題庫,觸發(fā)關(guān)鍵詞后,直接從題庫里選取答案,讓數(shù)字人‘說’出來。”陳鴻介紹。

      華盟新媒集團CEO、淘寶聯(lián)盟成都理事長黃博告訴定焦,即時互動是直播間交易轉(zhuǎn)化的關(guān)鍵,很多公司的宣傳重點是“數(shù)字人可以替代真人主播和用戶互動”,但真正具備AI自動對話、自動聊天功能的數(shù)字人很少。

      「定焦」在多個使用數(shù)字人的頭部品牌直播間通過評論區(qū)提問,一類是不給出相應(yīng);另一類能給出“XX收到了你的提問,稍等回復(fù)哦”的話術(shù),但要么是幾分鐘后給出答非所問的回復(fù),要么是等待五分鐘后還沒有回復(fù)。

      多位受訪者提到,解決不了交互性差的硬傷,數(shù)字人的市場空間就會受限。目前大量直播間是在黃金時間段用真人主播,在閑時用數(shù)字人作為補充。

      高叢告訴「定焦」,下一代數(shù)字人直播產(chǎn)品會向改進中之人、接入大模型兩個方向發(fā)展,都是為了改進互動體驗,更接近真人,但目前成本較高。

      “抖音”上的數(shù)字人,會涼嗎?

      “中小企業(yè)主被割韭菜了,代理公司賺了一波錢,數(shù)字人技術(shù)公司走上了風(fēng)口,造就了一批明星創(chuàng)業(yè)公司。”宋欣鑫這樣總結(jié)當(dāng)前的數(shù)字人產(chǎn)業(yè)鏈。至于后續(xù)的發(fā)展如何,除了技術(shù)進展,要看市場的接受度,而主要的需求方都在觀望平臺的態(tài)度。

      客戶使用數(shù)字人,無非是想降本或創(chuàng)收。“包括過去一段時間,跨境電商、本地生活領(lǐng)域(餐飲、酒旅為主)的商家,對數(shù)字人熱情高漲,就是因為跨境電商對降本的訴求更迫切,本地生活商家正處在線上化的階段。”周一路分析。

      就連MCN(主播和網(wǎng)絡(luò)紅人運營方)也因此盯上了數(shù)字人。電商平臺相關(guān)負責(zé)人程成告訴「定焦」,謙尋等一些頭部MCN在做數(shù)字人相關(guān)產(chǎn)品,不是給當(dāng)家主播做一個數(shù)字版的“XXX”,而是打造成招商案例賣給商家。

      代理、MCN、市場都在傳遞一種觀點,店播是數(shù)字人直播的主場。很多商家的確對數(shù)字人產(chǎn)品很感興趣,但最顧慮的除了效果不理想,就是賬號封停。

      “據(jù)我所知,很多商家都被封怕了”,跨境電商商家王晨對「定焦」介紹,自己半年前花費3萬,從一家數(shù)字人技術(shù)公司那里,定制了一款數(shù)字人,當(dāng)時對方承諾不會被平臺封禁,但在TikTok直播時還是屢次被封。

      他補充說,一個數(shù)字人直播間成本幾千元,對比每月成本至少兩萬的真人直播,的確降了成本,但加上被封的風(fēng)險,就太不劃算了。最關(guān)鍵的是,平臺會給數(shù)字人推多少流量,轉(zhuǎn)化怎么樣,都要打個問號。

      張現(xiàn)說,以抖音為主的平臺加大監(jiān)管力度后,近三個月數(shù)字人產(chǎn)品的銷售明顯受到影響;因為試錯成本太高,很多正在談的客戶更不愿意用大號嘗試數(shù)字人。

      過去平臺對數(shù)字人的態(tài)度是模糊的。因為平臺的KPI是用戶體驗和商業(yè)轉(zhuǎn)化,數(shù)字人都不是平臺完成KPI的最優(yōu)解。宋欣鑫對「定焦」分析,平臺希望內(nèi)容池不斷豐富,創(chuàng)作門檻降低,理想情況下,數(shù)字人視頻和直播能滿足這一點,但現(xiàn)狀是,數(shù)字人內(nèi)容質(zhì)量不穩(wěn)定,只是拉時長而已。

      近期,這個產(chǎn)業(yè)的發(fā)展超出預(yù)期,各方勢力涌入,甚至亂象滋生,平臺有必要加大管控力度,但如果平臺監(jiān)管過嚴,也有可能把流量和商家“推”向其他平臺。

      如今,主流的視頻、直播平臺的態(tài)度逐漸清晰:抖音推出《數(shù)字人行業(yè)倡議》;淘寶向商家開放數(shù)字人,價格比第三方高,但被封的概率低;還有快手、京東,都在把數(shù)字人作為一個功能工具推向達人、MCN。

      但因為平臺特性不同,各家還是存在差別。淘寶直播、快手,以及拼多多、京東整體比較寬松;抖音的平臺規(guī)則最為嚴格。

      “抖音和淘寶直播都是直播電商,為什么態(tài)度不同?”周一路對「定焦」分析,核心是看數(shù)字人直播對平臺的商業(yè)轉(zhuǎn)化貢獻如何。抖音的興趣電商,主打的是興趣、情緒和隨機性,現(xiàn)在的數(shù)字人完全比不了真人;而淘寶直播是貨架電商,用戶帶著購買目標進直播間,即便看到是機器人在賣貨,只要價格便宜,也不太影響下單。

      大量從業(yè)者在揣摩平臺的想法,程成總結(jié)道,其實不復(fù)雜,站在平臺的立場,平臺需要數(shù)字人相關(guān)工具提高真人內(nèi)容的效率,但絕非完全取代真人,所以,讓數(shù)字人24小時開播,試圖取代真人的,是平臺打擊的,反之,則是平臺允許的。

      數(shù)字人此前應(yīng)用到了影視、游戲和金融領(lǐng)域,當(dāng)它進入直播和視頻,幾百元一個的數(shù)字人似乎正在“飛入尋常百姓家”,但表象之下,這個市場正處于爆發(fā)與無序的狀態(tài)。

      結(jié)合多位受訪者的觀點,和很多新鮮事物一樣,數(shù)字人必然要經(jīng)歷這樣一個發(fā)展階段:起初是被追捧、被嚴重高估,在遭遇問題后質(zhì)疑聲四起,問題集中爆發(fā)后平臺下場整治。經(jīng)歷調(diào)整、去泡沫,等待技術(shù)相對成熟后,數(shù)字人才會迎來真正的黃金期,到時候只有少部分人能站穩(wěn)腳跟。

      而在此之前的很長一段時間里,技術(shù)方還會繼續(xù)鼓吹A(chǔ)I和數(shù)字人是大勢所趨,同類型公司在資本市場非常搶手,代理商總是搶先嗅到商機,更有無數(shù)商家前赴后繼入場,平臺則繼續(xù)在內(nèi)容和商業(yè)之間尋找平衡。這之中有機會也有陷阱,身處其中的我們,要時刻保持對新變化的關(guān)注和警醒。

      *應(yīng)受訪者要求,文中王力、周一路、宋欣鑫、張現(xiàn)、程成、王晨、高叢為化名。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。