撰文 | 小不董
編輯 | 李信馬
生成式AI在中國的發(fā)展究竟是快還是慢?
最近國外的Sora風(fēng)頭正勁,讓不少國人產(chǎn)生了悲觀情緒。其實,國內(nèi)生成式AI也在迅速的發(fā)展中,就在Sora發(fā)布后不久的2月18日,網(wǎng)信辦發(fā)布了第四批深度合成服務(wù)算法備案信息,從中可以一窺我國生成式AI的現(xiàn)狀。
什么是深度合成服務(wù)?是指利用深度學(xué)習(xí)、虛擬現(xiàn)實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網(wǎng)絡(luò)信息的技術(shù),包括但不限于:
(一)篇章生成、文本風(fēng)格轉(zhuǎn)換、問答對話等生成或者編輯文本內(nèi)容的技術(shù);
(二)文本轉(zhuǎn)語音、語音轉(zhuǎn)換、語音屬性編輯等生成或者編輯語音內(nèi)容的技術(shù);
(三)音樂生成、場景聲編輯等生成或者編輯非語音內(nèi)容的技術(shù);
(四)人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態(tài)操控等生成或者編輯圖像、視頻內(nèi)容中生物特征的技術(shù);
(五)圖像生成、圖像增強、圖像修復(fù)等生成或者編輯圖像、視頻內(nèi)容中非生物特征的技術(shù);
(六)三維重建、數(shù)字仿真等生成或者編輯數(shù)字人物、虛擬場景的技術(shù)。
《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》是在2022年11月3日審議通過的,在不到一個月后的11月30日,ChatGPT就橫空出世了。
圖片來源:網(wǎng)信辦
不難發(fā)現(xiàn),深度合成服務(wù)的概念與生成式AI有很大的重合——半年后我國發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》中,定義生成式人工智能技術(shù)是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)。
按照規(guī)定,在我國境內(nèi)提供深度合成服務(wù),需要進行相應(yīng)的備案,從2023年6月至今,已經(jīng)有4批備案,合計546個算法,可以說是迎來了生成式AI的“物種大爆炸”。
從圖不難看到,算法備案的數(shù)量和頻率都在上升,第四批備案距離發(fā)布第三批備案僅有一個月,算法數(shù)量也從129個增長到了266個。其中,服務(wù)技術(shù)支持者和服務(wù)提供者累計下來分別為151和395個。(深度合成服務(wù)提供者,是指提供深度合成服務(wù)的組織、個人;深度合成服務(wù)技術(shù)支持者,是指為深度合成服務(wù)提供技術(shù)支持的組織、個人。)
01.
大廠成為主力軍
在這些算法中,既有來自互聯(lián)網(wǎng)大廠的,也包括垂直領(lǐng)域的領(lǐng)軍企業(yè),還有一眾的創(chuàng)業(yè)公司。
先看服務(wù)技術(shù)支持者,算法備案數(shù)量的前十名基本都來自大廠,在后面的榜單中,也有科大訊飛、京東科技、出門問問、360、獵戶星空等知名互聯(lián)網(wǎng)公司。相對來說,對外提供技術(shù)服務(wù)的門檻要高于自用,會出現(xiàn)這種情況也就不奇怪了。
去年大模型爆火,備案的546個算法中,大模型的算法足足有70個,不過大多數(shù)都是企業(yè)用于自身業(yè)務(wù)的,對外提供技術(shù)支持的僅有19個,并且包含多個垂類大模型,通用大模型為數(shù)并不多,可見“百模大戰(zhàn)”有些名不副實。
再來看服務(wù)提供者,由于數(shù)量過多(395個),就不一一列舉了,重點說一下大模型,表單中的內(nèi)容和上表有些許重合,比如百度的文心大模型,因為有的大模型既可對外做技術(shù)支持,也可以用于自家的產(chǎn)品。
值得一提的是,2023年生成式AI的浪潮中,騰訊表現(xiàn)的較為低調(diào),卻在技術(shù)支持者榜單中數(shù)量排名第一。除了技術(shù)力量強大外,大廠涉獵的行業(yè)多,因此有更多的落地場景,可以身兼“賣水人”和“掘金者”兩個角色,例如騰訊,深度合成服務(wù)算法備案中,囊括了人臉融合、語音合成、繪畫、P圖等多個領(lǐng)域。
與之類似的是網(wǎng)易,作為服務(wù)技術(shù)支持者,算法涉及圖像、語音生成、文本生成、三維場景等多個行業(yè);作為服務(wù)提供者,算法則服務(wù)了有道詞典、逆水寒手游等應(yīng)用。
但要說自身應(yīng)用算法最廣泛的大廠,則莫過于阿里巴巴?赡茉从诮M織拆分的緣故,阿里巴巴對外提供技術(shù)支持的算法都來自達摩院,但淘寶、釘釘以及天貓等,又都有各自的算法備案。DoNews向達摩院了解到,淘寶、釘釘?shù)却蟛糠旨夹g(shù)來自于自研,也有部分技術(shù)有達摩院提供或者聯(lián)合研發(fā)。
百度的文心大模型是目前國內(nèi)大模型的領(lǐng)軍者,在數(shù)字人、語音合成及識別、文生文/圖、人臉融合等領(lǐng)域都有算法,不過在產(chǎn)品層面就明顯單調(diào)許多,只展現(xiàn)了文心一言大模型的App和網(wǎng)站。由此可見,單純看算法數(shù)量,并不能全面體現(xiàn)企業(yè)的AI能力。
華為云則是徹底走“2B”路線,目前擁有6個算法備案,全部作為服務(wù)技術(shù)支持者,主要分為兩類:盤古及MetaStudio(數(shù)字內(nèi)容生產(chǎn)線)。
02.
行業(yè)應(yīng)用加速落地
通過整理算法備案的資料,我們還發(fā)現(xiàn)另一個情況,生成式AI在互聯(lián)網(wǎng)領(lǐng)域迅速擴展,并在向更多垂直領(lǐng)域蔓延。
比如,電商就是一個重點發(fā)展大模型的行業(yè),阿里巴巴旗下的電商最積極擁抱AI。
短視頻領(lǐng)域也大量應(yīng)用了生成式AI技術(shù),抖音和快手一如既往是領(lǐng)頭羊,應(yīng)用場景集中在特效、合成、換臉幾大方向。
傳統(tǒng)行業(yè)也在積極擁抱生成式AI,比如醫(yī)療健康,應(yīng)用主要集中在健康咨詢、醫(yī)療內(nèi)容生成上。
2024年開年,AI手機成為了熱點話題,OPPO和vivo都提前進行了大模型的算法備案。
此外,不少令人意想不到的行業(yè),也在應(yīng)用生成式AI。比如家電巨頭TCL,看似和生成式AI不沾邊,卻通過TCL智能文本生成算法,在APP中根據(jù)用戶輸入的文本內(nèi)容,生成產(chǎn)品說明和使用指導(dǎo)。
在教育領(lǐng)域,好未來一共備案了多達8個算法,既有自用也有對外做輸出的,展現(xiàn)了強大的科技實力。母嬰行業(yè),寶寶樹孕育(APP)應(yīng)用的寶寶樹母嬰家庭領(lǐng)域大模型生成合成算法,可以根據(jù)用戶提出的備孕育兒問題,生成備孕育兒等相關(guān)知識內(nèi)容,輸出文本內(nèi)容回復(fù)。
還有一個重要的落地場景,就是汽車行業(yè)。年初的CES上,奔馳、寶馬、大眾等汽車廠商都展示了融合最新AI大模型技術(shù)的車機系統(tǒng),比亞迪也在近期推出了全新的整車智能化架構(gòu)“璇璣”及其AI大模型“璇璣AI大模型”,“智駕”正在成為新能源汽車標(biāo)配。
通過深度合成服務(wù)算法備案信息,我們可以看到,生成式AI在中國蓬勃發(fā)展,雖然有只見廣度不見深度的嫌疑,但隨著生成式AI的不斷深入產(chǎn)業(yè)落地,未來我們也將看到更多和更好行業(yè)案例涌現(xiàn)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。