中國生成式AI的“物種大爆炸”

2024年03月06日 18:05:59 小不董 來源：DoNews

　　撰文 | 小不董

　　編輯 | 李信馬

　　生成式AI在中國的發(fā)展究竟是快還是慢?

　　最近國外的Sora風(fēng)頭正勁，讓不少國人產(chǎn)生了悲觀情緒。其實，國內(nèi)生成式AI也在迅速的發(fā)展中，就在Sora發(fā)布后不久的2月18日，網(wǎng)信辦發(fā)布了第四批深度合成服務(wù)算法備案信息，從中可以一窺我國生成式AI的現(xiàn)狀。

　　什么是深度合成服務(wù)?是指利用深度學(xué)習(xí)、虛擬現(xiàn)實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網(wǎng)絡(luò)信息的技術(shù)，包括但不限于：

　　(一)篇章生成、文本風(fēng)格轉(zhuǎn)換、問答對話等生成或者編輯文本內(nèi)容的技術(shù);

　　(二)文本轉(zhuǎn)語音、語音轉(zhuǎn)換、語音屬性編輯等生成或者編輯語音內(nèi)容的技術(shù);

　　(三)音樂生成、場景聲編輯等生成或者編輯非語音內(nèi)容的技術(shù);

　　(四)人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態(tài)操控等生成或者編輯圖像、視頻內(nèi)容中生物特征的技術(shù);

　　(五)圖像生成、圖像增強、圖像修復(fù)等生成或者編輯圖像、視頻內(nèi)容中非生物特征的技術(shù);

　　(六)三維重建、數(shù)字仿真等生成或者編輯數(shù)字人物、虛擬場景的技術(shù)。

　　《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》是在2022年11月3日審議通過的，在不到一個月后的11月30日，ChatGPT就橫空出世了。

　　圖片來源：網(wǎng)信辦

　　不難發(fā)現(xiàn)，深度合成服務(wù)的概念與生成式AI有很大的重合——半年后我國發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》中，定義生成式人工智能技術(shù)是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)。

　　按照規(guī)定，在我國境內(nèi)提供深度合成服務(wù)，需要進行相應(yīng)的備案，從2023年6月至今，已經(jīng)有4批備案，合計546個算法，可以說是迎來了生成式AI的“物種大爆炸”。

　　從圖不難看到，算法備案的數(shù)量和頻率都在上升，第四批備案距離發(fā)布第三批備案僅有一個月，算法數(shù)量也從129個增長到了266個。其中，服務(wù)技術(shù)支持者和服務(wù)提供者累計下來分別為151和395個。(深度合成服務(wù)提供者，是指提供深度合成服務(wù)的組織、個人;深度合成服務(wù)技術(shù)支持者，是指為深度合成服務(wù)提供技術(shù)支持的組織、個人。)

　　01.

　　大廠成為主力軍

　　在這些算法中，既有來自互聯(lián)網(wǎng)大廠的，也包括垂直領(lǐng)域的領(lǐng)軍企業(yè)，還有一眾的創(chuàng)業(yè)公司。

　　先看服務(wù)技術(shù)支持者，算法備案數(shù)量的前十名基本都來自大廠，在后面的榜單中，也有科大訊飛、京東科技、出門問問、360、獵戶星空等知名互聯(lián)網(wǎng)公司。相對來說，對外提供技術(shù)服務(wù)的門檻要高于自用，會出現(xiàn)這種情況也就不奇怪了。

　　去年大模型爆火，備案的546個算法中，大模型的算法足足有70個，不過大多數(shù)都是企業(yè)用于自身業(yè)務(wù)的，對外提供技術(shù)支持的僅有19個，并且包含多個垂類大模型，通用大模型為數(shù)并不多，可見“百模大戰(zhàn)”有些名不副實。

　　再來看服務(wù)提供者，由于數(shù)量過多(395個)，就不一一列舉了，重點說一下大模型，表單中的內(nèi)容和上表有些許重合，比如百度的文心大模型，因為有的大模型既可對外做技術(shù)支持，也可以用于自家的產(chǎn)品。

　　值得一提的是，2023年生成式AI的浪潮中，騰訊表現(xiàn)的較為低調(diào)，卻在技術(shù)支持者榜單中數(shù)量排名第一。除了技術(shù)力量強大外，大廠涉獵的行業(yè)多，因此有更多的落地場景，可以身兼“賣水人”和“掘金者”兩個角色，例如騰訊，深度合成服務(wù)算法備案中，囊括了人臉融合、語音合成、繪畫、P圖等多個領(lǐng)域。

　　與之類似的是網(wǎng)易，作為服務(wù)技術(shù)支持者，算法涉及圖像、語音生成、文本生成、三維場景等多個行業(yè);作為服務(wù)提供者，算法則服務(wù)了有道詞典、逆水寒手游等應(yīng)用。

　　但要說自身應(yīng)用算法最廣泛的大廠，則莫過于阿里巴巴�？赡茉从诮M織拆分的緣故，阿里巴巴對外提供技術(shù)支持的算法都來自達摩院，但淘寶、釘釘以及天貓等，又都有各自的算法備案。DoNews向達摩院了解到，淘寶、釘釘?shù)却蟛糠旨夹g(shù)來自于自研，也有部分技術(shù)有達摩院提供或者聯(lián)合研發(fā)。

　　百度的文心大模型是目前國內(nèi)大模型的領(lǐng)軍者，在數(shù)字人、語音合成及識別、文生文/圖、人臉融合等領(lǐng)域都有算法，不過在產(chǎn)品層面就明顯單調(diào)許多，只展現(xiàn)了文心一言大模型的App和網(wǎng)站。由此可見，單純看算法數(shù)量，并不能全面體現(xiàn)企業(yè)的AI能力。

　　華為云則是徹底走“2B”路線，目前擁有6個算法備案，全部作為服務(wù)技術(shù)支持者，主要分為兩類：盤古及MetaStudio(數(shù)字內(nèi)容生產(chǎn)線)。

　　02.

　　行業(yè)應(yīng)用加速落地

　　通過整理算法備案的資料，我們還發(fā)現(xiàn)另一個情況，生成式AI在互聯(lián)網(wǎng)領(lǐng)域迅速擴展，并在向更多垂直領(lǐng)域蔓延。

　　比如，電商就是一個重點發(fā)展大模型的行業(yè)，阿里巴巴旗下的電商最積極擁抱AI。

　　短視頻領(lǐng)域也大量應(yīng)用了生成式AI技術(shù)，抖音和快手一如既往是領(lǐng)頭羊，應(yīng)用場景集中在特效、合成、換臉幾大方向。

　　傳統(tǒng)行業(yè)也在積極擁抱生成式AI，比如醫(yī)療健康，應(yīng)用主要集中在健康咨詢、醫(yī)療內(nèi)容生成上。

　　2024年開年，AI手機成為了熱點話題，OPPO和vivo都提前進行了大模型的算法備案。

　　此外，不少令人意想不到的行業(yè)，也在應(yīng)用生成式AI。比如家電巨頭TCL，看似和生成式AI不沾邊，卻通過TCL智能文本生成算法，在APP中根據(jù)用戶輸入的文本內(nèi)容，生成產(chǎn)品說明和使用指導(dǎo)。

　　在教育領(lǐng)域，好未來一共備案了多達8個算法，既有自用也有對外做輸出的，展現(xiàn)了強大的科技實力。母嬰行業(yè)，寶寶樹孕育(APP)應(yīng)用的寶寶樹母嬰家庭領(lǐng)域大模型生成合成算法，可以根據(jù)用戶提出的備孕育兒問題，生成備孕育兒等相關(guān)知識內(nèi)容，輸出文本內(nèi)容回復(fù)。

　　還有一個重要的落地場景，就是汽車行業(yè)。年初的CES上，奔馳、寶馬、大眾等汽車廠商都展示了融合最新AI大模型技術(shù)的車機系統(tǒng)，比亞迪也在近期推出了全新的整車智能化架構(gòu)“璇璣”及其AI大模型“璇璣AI大模型”，“智駕”正在成為新能源汽車標(biāo)配。

　　通過深度合成服務(wù)算法備案信息，我們可以看到，生成式AI在中國蓬勃發(fā)展，雖然有只見廣度不見深度的嫌疑，但隨著生成式AI的不斷深入產(chǎn)業(yè)落地，未來我們也將看到更多和更好行業(yè)案例涌現(xiàn)。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信