2023 年 8 月 18 日,字節(jié)跳動旗下AI對話產(chǎn)品Grace,更名為「豆包」。
在百模大戰(zhàn)一波又一波密集的“重磅發(fā)布”中,這條當時看著毫不起眼的消息,悄然開啟了字節(jié)大模型的多重宇宙。
從時間線來看,字節(jié)跳動的確晚了。相比于當時反應迅速的百度和阿里,沒有發(fā)布基礎模型的字節(jié),彼時并無法靠「豆包」來說服質疑它的觀眾們。
據(jù)字節(jié)內(nèi)部人士透露, 2023 年年初,集團內(nèi)部才剛剛開始訓練基礎模型,而后,字節(jié)跳動明確了戰(zhàn)略方向,之后字節(jié)開始高舉高打,內(nèi)部的組織架構以及外部策略都開始進行了大變革。
11 月 27 日,也就是確認字節(jié)將放棄游戲業(yè)務的同一天,字節(jié)跳動傳出已成立了一個新 AI 部門 Flow。
緊接著,字節(jié)系各類AI應用如流水線上的產(chǎn)品一般,快速涌向市場。據(jù)硅星人統(tǒng)計, 2024 年至今,字節(jié)在國內(nèi)外推出包括「豆包」在內(nèi)的 20 余款App,從集成式的聊天助手,到圖像、視頻、音樂等效率工具,加速滲透到教育、辦公助手、開發(fā)平臺、代碼生成等行業(yè),而且,這些應用的表現(xiàn)亮眼,一個個在AI應用大亂斗里殺出重圍。
今年 3 月「豆包」的下載量和月活躍用戶開始雙雙登頂。而據(jù)a16z發(fā)布的全球 Top 100 AI 應用榜單顯示,字節(jié)系的Cici、Coze、Gauth、Hypic、CapCut五款產(chǎn)品名列前茅。與此同時,字節(jié)依然不斷在海外推出新的產(chǎn)品進行試點。
10 月份,這種勢頭仍在繼續(xù),據(jù)Sensor Tower10 月份最新數(shù)據(jù)免費榜前 10 中,Gauth排名第六、TikTok排名第七、CapCut排名第九。
這些都是令所有AI應用創(chuàng)業(yè)者眼饞的成績。字節(jié)AI究竟為何能如此兇猛?
1
重啟“APP工廠”
字節(jié)系AI產(chǎn)品全線突飛猛進的同時,許多人越來越明顯感到一絲熟悉的味道——“APP工廠”回來了。
在移動互聯(lián)網(wǎng)時期,“App工廠”的打法是字節(jié)快速開疆擴土的重要策略之一。公開數(shù)據(jù)顯示,2018 年-2020 年,也就是字節(jié)增長最為迅速的幾年間,它自研和收購了大量的項目,其中在App Store上線的應用就有約 140 個,占其成立以來的七成。
期間,字節(jié)通過批量生產(chǎn),在今日頭條和抖音之后,也成功推出了剪映、懂車帝、皮皮蝦、番茄小說、輕顏相機等爆款。
從 2023 年 11 月,APP工廠在AI時代重啟了,字節(jié)陸續(xù)密集上線了眾多APP。經(jīng)硅星人整理如下表:
值得注意的是,其中海內(nèi)外產(chǎn)品幾乎一比一對應,一部分國內(nèi)產(chǎn)品如豆包、剪映復制到國外;另一部分則是在海外高排名的產(chǎn)品復制回國內(nèi)。
在整理的過程中我們發(fā)現(xiàn),不少產(chǎn)品的名字在幾個月內(nèi)頻繁變動,比如對標星野的AnyDoor,早期進入國內(nèi)時名為「話爐」,在今年 4 月份名稱改為「貓箱」,「河馬愛學」改名為「豆包愛學」等等。
這背后是字節(jié)系產(chǎn)品對于AI產(chǎn)品命名和定位的思考。
彼時大模型產(chǎn)品的命名常常引經(jīng)據(jù)典,與文心、通義、混元、星火、天工相比,「豆包」聽起來土味十足。“當時準備將Grace推向市場的時候,內(nèi)部一致認為必須要改名,要做中國市場,英文名限制太大。陸陸續(xù)續(xù)起了 100 多個名字,有一部分有硬傷直接被Pass了,剩下的做了一些田野調(diào)查,有負面關聯(lián)又淘汰了一部分,最終是朱駿拍板定了「豆包」這個名字。”
豆包團隊的人員告訴我們:“我們私底下討論過,豆包這個詞在中國的滲透率差不多80%-90%,沒有硬傷。字節(jié)內(nèi)部起名字有一整套的流程,再經(jīng)歷田野調(diào)查,這個名字有沒有什么負面關聯(lián)。”
相比于創(chuàng)業(yè)公司和其他互聯(lián)網(wǎng)大廠,字節(jié)的優(yōu)勢在于成熟的產(chǎn)品方法論,來保證產(chǎn)品的水平在 60 分以上,形成穩(wěn)定的產(chǎn)出。
而在場景的選擇上,目前根據(jù)我們整理的結果發(fā)現(xiàn),字節(jié)系產(chǎn)品其實并沒有真正在開拓新的場景,它其實很少“教育市場”,而是更多“順應市場”,在已經(jīng)被部分驗證的場景下進行產(chǎn)品的迭代和優(yōu)化。同時,海外市場更多承擔新產(chǎn)品孵化地的角色,產(chǎn)品在國內(nèi)和國外是隔離的,通常一側上線,完成市場和用戶數(shù)據(jù)分析后再在另一側上線類似產(chǎn)品。
簡單地說,它的策略就是復制小爆款,成為大爆款。
比如「豆包」雖然推出得晚,但上線便集齊了對話、Agent、語音通話等當時分散在不同產(chǎn)品中的大模型功能,「貓箱」完全對標「星野」、「星繪」對標「妙鴨」、「海綿音樂」對標「Suno」,在此基礎上,結合用戶體驗對產(chǎn)品進行迭代。
哪些產(chǎn)品要放棄,哪些產(chǎn)品又要繼續(xù)投入資源?答案依然是,數(shù)據(jù)。
字節(jié)跳動有專門負責產(chǎn)品增長的團隊。這個團隊構建了一個強大的數(shù)據(jù)監(jiān)測系統(tǒng),他們會花大價錢去買市面上的數(shù)據(jù),盡可能監(jiān)控所有產(chǎn)品,用來指導研發(fā)。
基于信息差的實驗+地毯式孵化+數(shù)據(jù)增長,形成了一條新的AIAPP生產(chǎn)線。
1
爭奪“豆包”,模型也賽馬
App工廠的背后,是字節(jié)式的賽馬機制。
“Grace是 2022 年我們團隊開發(fā)的,在字節(jié)內(nèi)部使用的產(chǎn)品,員工可以用它來學習一下內(nèi)部資料。”豆包初始團隊的同學告訴硅星人:“到了 2023 年年初,字節(jié)內(nèi)部有好幾個團隊還有自發(fā)組成的新團隊,都在嘗試新產(chǎn)品,但我們團隊因為做得早,有產(chǎn)品雛形,公司開始計劃基于原來的框架推一個移動端的產(chǎn)品。”
「豆包」誕生初期,賽馬并沒有那么激烈,隨著AI產(chǎn)品戰(zhàn)略逐漸明確,內(nèi)部也逐漸開始了新一輪的賽馬。
據(jù)硅星人了解,目前字節(jié)內(nèi)部形成了多輪賽馬制:
第一階段,創(chuàng)新產(chǎn)品中心負責前期孵化、產(chǎn)品創(chuàng)意、內(nèi)部審核以及完成產(chǎn)品的前期打造,到產(chǎn)品測試上線。在這個階段幾乎不會有流量支持,靠產(chǎn)品自身的形態(tài)吸引自然用戶;
進入第二階段的產(chǎn)品,開始可以拿到一部分初始預算進行外部推廣,由專門負責增長的團隊負責拉新留存,進行產(chǎn)品排名,數(shù)據(jù)表現(xiàn)好結合內(nèi)部分析,從創(chuàng)新產(chǎn)品中心進入到具體的產(chǎn)品組;
而第三階段,成型的產(chǎn)品開始進行大規(guī)模推廣,如「貓箱」、「星繪」從去年年底開始在抖音投流以及通過KOL推廣。
早期產(chǎn)品生產(chǎn)內(nèi)部架構
“有點內(nèi)部創(chuàng)業(yè)的意思吧,項目做好了團隊內(nèi)部分獎金,大家都希望能獲得更好的資源,但產(chǎn)品這邊的競爭其實比較良性,畢竟大家并不交叉。”
不過,和移動互聯(lián)網(wǎng)時期的模式不同的是,當時所有的產(chǎn)品都是基于個性推薦算法團隊生長,而如今,在今天的AI產(chǎn)品們底下的模型層,字節(jié)其實并沒有達到統(tǒng)一。
產(chǎn)品層,豆包已經(jīng)是一個統(tǒng)一的品牌,所有產(chǎn)品向豆包靠攏。但在模型層,“豆包”更像是一個代號,究竟誰能成為“豆包”,更像是一場爭奪行動。
舉個例子, 9 月 24 日,火山引擎一口氣發(fā)布了兩款視頻生產(chǎn)模型,但對外并沒有展示詳細解釋兩款模型的差異,我們發(fā)現(xiàn)PixelDance和Seaweed在發(fā)布前,在Github上發(fā)布過對應的模型細節(jié),它們分別屬于兩個團隊,但最終均被冠以“豆包”之名對外發(fā)布。
從內(nèi)部結構來看,模型和算法歸屬于模型算法團隊Seed,由朱文佳(曾任TikTok產(chǎn)品技術負責人)負責; 2023 年 11 月成立的Flow團隊主要負責打造C端產(chǎn)品,在最新的人事調(diào)動中顯示,朱文佳為整體業(yè)務負責人、朱駿(原Music.ly創(chuàng)始人、原TikTok負責人)為產(chǎn)品負責人、洪定坤為技術負責人,向下包括豆包、AI教育、社區(qū)、國際化四個部門,同時PC端和移動端也分為兩條業(yè)務線;而豆包大模型to B的商業(yè)化業(yè)務主要由火山引擎對外提供,并通過API的方式接入飛書。
Seed團隊由原來的搜索團隊、AILab團隊、AML團隊聯(lián)合而成,但實際上,這幾個團隊都在暗自較勁。
“現(xiàn)在的豆包更像是一個統(tǒng)一的出口,連接用戶。豆包產(chǎn)品后端連接了多個模型測試,是一個訓練場,通過API的結果反饋來評測模型效果,但一時間很難有取舍。”上述內(nèi)部人士講道。
在GitHub和HuggingFace上面,字節(jié)的各類視頻和圖像模型,都分屬于各個小團隊,包含有 4 款不同功能的視頻模型。
根據(jù)公開資料和介紹,我們整理了各個模型的功能,發(fā)現(xiàn)目前主流視頻模型的能力散落在了各個模型里,比如視頻編輯、運動筆刷、端到端視頻生成等等,也有在Github上評分較高的開源模型,顯示測試效果比已在國內(nèi)發(fā)布的PixelsDance要更好。
比如MagicVideo的V2 版本是目前開發(fā)者評價字節(jié)旗下最可用的一款文生視頻模型,V2 版本采用了模塊化式生產(chǎn)流程,第一模塊從文本到圖像、第二模塊從圖像到視頻生產(chǎn)關鍵幀、第三模塊從視頻到視頻擴展、第四模塊視頻幀插值,平滑過渡。目前整體的生成效果、色彩和審美高于Pika1. 0 和Gen2.0。
有算法工程師就分析道:“如果幾個模型的能力加起來,其實會比現(xiàn)在公開發(fā)布的版本更好,至少能達到可靈的效果,但是現(xiàn)在發(fā)布版本比較一般,可能也是內(nèi)部賽馬資源沒有談妥的結果。”
字節(jié)AI產(chǎn)品今天的突飛猛進,是其賽馬機制下,一套屢試不爽的產(chǎn)品開發(fā)方法論加持的結果。但與移動互聯(lián)網(wǎng)時代字節(jié)的“生產(chǎn)體系”很不同的是,今天在底層的模型側,字節(jié)也在進行著賽馬。
字節(jié)可能寄希望于它也像應用一樣,百花齊放后篩選出最強的那一個,但同時它也客觀上帶來著資源無法集中的問題。尤其是在一個最需要大力出奇跡的時刻,這可能也會帶來新的挑戰(zhàn)。
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。