撰文 | 小不董
編輯 | 李信馬
生成式AI在中國的發(fā)展究竟是快還是慢?
最近國外的Sora風頭正勁,讓不少國人產(chǎn)生了悲觀情緒。其實,國內(nèi)生成式AI也在迅速的發(fā)展中,就在Sora發(fā)布后不久的2月18日,網(wǎng)信辦發(fā)布了第四批深度合成服務算法備案信息,從中可以一窺我國生成式AI的現(xiàn)狀。
什么是深度合成服務?是指利用深度學習、虛擬現(xiàn)實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網(wǎng)絡(luò)信息的技術(shù),包括但不限于:
(一)篇章生成、文本風格轉(zhuǎn)換、問答對話等生成或者編輯文本內(nèi)容的技術(shù);
(二)文本轉(zhuǎn)語音、語音轉(zhuǎn)換、語音屬性編輯等生成或者編輯語音內(nèi)容的技術(shù);
(三)音樂生成、場景聲編輯等生成或者編輯非語音內(nèi)容的技術(shù);
(四)人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態(tài)操控等生成或者編輯圖像、視頻內(nèi)容中生物特征的技術(shù);
(五)圖像生成、圖像增強、圖像修復等生成或者編輯圖像、視頻內(nèi)容中非生物特征的技術(shù);
(六)三維重建、數(shù)字仿真等生成或者編輯數(shù)字人物、虛擬場景的技術(shù)。
《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》是在2022年11月3日審議通過的,在不到一個月后的11月30日,ChatGPT就橫空出世了。
圖片來源:網(wǎng)信辦
不難發(fā)現(xiàn),深度合成服務的概念與生成式AI有很大的重合——半年后我國發(fā)布的《生成式人工智能服務管理暫行辦法》中,定義生成式人工智能技術(shù)是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)。
按照規(guī)定,在我國境內(nèi)提供深度合成服務,需要進行相應的備案,從2023年6月至今,已經(jīng)有4批備案,合計546個算法,可以說是迎來了生成式AI的“物種大爆炸”。
從圖不難看到,算法備案的數(shù)量和頻率都在上升,第四批備案距離發(fā)布第三批備案僅有一個月,算法數(shù)量也從129個增長到了266個。其中,服務技術(shù)支持者和服務提供者累計下來分別為151和395個。(深度合成服務提供者,是指提供深度合成服務的組織、個人;深度合成服務技術(shù)支持者,是指為深度合成服務提供技術(shù)支持的組織、個人。)
01.
大廠成為主力軍
在這些算法中,既有來自互聯(lián)網(wǎng)大廠的,也包括垂直領(lǐng)域的領(lǐng)軍企業(yè),還有一眾的創(chuàng)業(yè)公司。
先看服務技術(shù)支持者,算法備案數(shù)量的前十名基本都來自大廠,在后面的榜單中,也有科大訊飛、京東科技、出門問問、360、獵戶星空等知名互聯(lián)網(wǎng)公司。相對來說,對外提供技術(shù)服務的門檻要高于自用,會出現(xiàn)這種情況也就不奇怪了。
去年大模型爆火,備案的546個算法中,大模型的算法足足有70個,不過大多數(shù)都是企業(yè)用于自身業(yè)務的,對外提供技術(shù)支持的僅有19個,并且包含多個垂類大模型,通用大模型為數(shù)并不多,可見“百模大戰(zhàn)”有些名不副實。
再來看服務提供者,由于數(shù)量過多(395個),就不一一列舉了,重點說一下大模型,表單中的內(nèi)容和上表有些許重合,比如百度的文心大模型,因為有的大模型既可對外做技術(shù)支持,也可以用于自家的產(chǎn)品。
值得一提的是,2023年生成式AI的浪潮中,騰訊表現(xiàn)的較為低調(diào),卻在技術(shù)支持者榜單中數(shù)量排名第一。除了技術(shù)力量強大外,大廠涉獵的行業(yè)多,因此有更多的落地場景,可以身兼“賣水人”和“掘金者”兩個角色,例如騰訊,深度合成服務算法備案中,囊括了人臉融合、語音合成、繪畫、P圖等多個領(lǐng)域。
與之類似的是網(wǎng)易,作為服務技術(shù)支持者,算法涉及圖像、語音生成、文本生成、三維場景等多個行業(yè);作為服務提供者,算法則服務了有道詞典、逆水寒手游等應用。
但要說自身應用算法最廣泛的大廠,則莫過于阿里巴巴?赡茉从诮M織拆分的緣故,阿里巴巴對外提供技術(shù)支持的算法都來自達摩院,但淘寶、釘釘以及天貓等,又都有各自的算法備案。DoNews向達摩院了解到,淘寶、釘釘?shù)却蟛糠旨夹g(shù)來自于自研,也有部分技術(shù)有達摩院提供或者聯(lián)合研發(fā)。
百度的文心大模型是目前國內(nèi)大模型的領(lǐng)軍者,在數(shù)字人、語音合成及識別、文生文/圖、人臉融合等領(lǐng)域都有算法,不過在產(chǎn)品層面就明顯單調(diào)許多,只展現(xiàn)了文心一言大模型的App和網(wǎng)站。由此可見,單純看算法數(shù)量,并不能全面體現(xiàn)企業(yè)的AI能力。
華為云則是徹底走“2B”路線,目前擁有6個算法備案,全部作為服務技術(shù)支持者,主要分為兩類:盤古及MetaStudio(數(shù)字內(nèi)容生產(chǎn)線)。
02.
行業(yè)應用加速落地
通過整理算法備案的資料,我們還發(fā)現(xiàn)另一個情況,生成式AI在互聯(lián)網(wǎng)領(lǐng)域迅速擴展,并在向更多垂直領(lǐng)域蔓延。
比如,電商就是一個重點發(fā)展大模型的行業(yè),阿里巴巴旗下的電商最積極擁抱AI。
短視頻領(lǐng)域也大量應用了生成式AI技術(shù),抖音和快手一如既往是領(lǐng)頭羊,應用場景集中在特效、合成、換臉幾大方向。
傳統(tǒng)行業(yè)也在積極擁抱生成式AI,比如醫(yī)療健康,應用主要集中在健康咨詢、醫(yī)療內(nèi)容生成上。
2024年開年,AI手機成為了熱點話題,OPPO和vivo都提前進行了大模型的算法備案。
此外,不少令人意想不到的行業(yè),也在應用生成式AI。比如家電巨頭TCL,看似和生成式AI不沾邊,卻通過TCL智能文本生成算法,在APP中根據(jù)用戶輸入的文本內(nèi)容,生成產(chǎn)品說明和使用指導。
在教育領(lǐng)域,好未來一共備案了多達8個算法,既有自用也有對外做輸出的,展現(xiàn)了強大的科技實力。母嬰行業(yè),寶寶樹孕育(APP)應用的寶寶樹母嬰家庭領(lǐng)域大模型生成合成算法,可以根據(jù)用戶提出的備孕育兒問題,生成備孕育兒等相關(guān)知識內(nèi)容,輸出文本內(nèi)容回復。
還有一個重要的落地場景,就是汽車行業(yè)。年初的CES上,奔馳、寶馬、大眾等汽車廠商都展示了融合最新AI大模型技術(shù)的車機系統(tǒng),比亞迪也在近期推出了全新的整車智能化架構(gòu)“璇璣”及其AI大模型“璇璣AI大模型”,“智駕”正在成為新能源汽車標配。
通過深度合成服務算法備案信息,我們可以看到,生成式AI在中國蓬勃發(fā)展,雖然有只見廣度不見深度的嫌疑,但隨著生成式AI的不斷深入產(chǎn)業(yè)落地,未來我們也將看到更多和更好行業(yè)案例涌現(xiàn)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。