智譜AI戰(zhàn)略失焦，B端C端難兼顧

2024年12月11日 13:07:02 林書編輯丨蕨影 來源：科技新知

　　@科技新知原創(chuàng)作者丨林書編輯丨蕨影

　　在2024年的一個尋常冬日，國產(chǎn)AI再次改變了我們與技術交互的方式。

　　11月29日，智譜AI在其技術開放日上上演了一幕令人矚目的科技大戲：歷史上首次!AI發(fā)出了第一個紅包!

　　公司CEO張鵬僅僅通過三句語音指令，就讓旗下的智能體AutoGLM跨越微信、支付寶等多個應用，給現(xiàn)場和線上的觀眾發(fā)了兩個大紅包。

　　這一幕背后，折射出的是 AI Agent技術的革命性突破。

　　當前，傳統(tǒng)的AI助手停留在被動響應和單一場景的交互，而智譜AI的AutoGLM已經(jīng)能夠主動理解復雜指令，跨應用協(xié)同，并精準執(zhí)行用戶意圖。

　　除了發(fā)紅包這樣的操作外，即使面對多個復雜操作的超長任務，例如訂外賣時橫跨多個APP比價，AutoGLM也能行云流水般自主執(zhí)行。

　　然而這樣的“驚喜”，只是今年智譜在AI方向上結出的眾多”碩果“之一。

　　今年7月，智譜AI 代碼生成大模型 CodeGeeX 第四代正式發(fā)布，支持代碼補全、代碼注釋、代碼修復、代碼翻譯等基礎功能;7月末，智譜AI的視頻生成模型「智譜清影」正式發(fā)布，可生成時長 6 秒，清晰度達到 1440×960的視頻。

　　到了10月，智譜推出并開源端到端語音模型 GLM-4-Voice，與GPT-4o的語音功能一樣， GLM-4-Voice可以進行實時語音對話，同時在情緒表達、多語言等方面實現(xiàn)突破，且可隨時打斷。

　　由此可見，今年的智譜，在代碼、多模態(tài)、Agent等多個方向上，都進行了“突擊”。這種全方位的技術布局，展示了智譜AI在追趕全球AI巨頭的決心。

　　然而，在這看似全面的進展背后，也不免讓人產(chǎn)生一種冷靜的思考：在體量、資本均不及OpenAI等巨頭的情況下，如此廣泛的技術覆蓋，是否會影響智譜在各個領域的深耕程度?

　　多線進軍的隱憂

　　從總體上離開，在今年的AI賽道上，身為“AI六小虎”之一的智譜，雖然布局甚廣，但其在每一條戰(zhàn)線上的表現(xiàn)，都相對比較“平均”，其產(chǎn)品方向更趨向于跟隨，而鮮少有獨創(chuàng)性的突破。

　　以智譜最近發(fā)布的旗艦大模型GLM-4-Plus為例，該模型定位是一種類似OpenAI 的o1那樣的深度推理模型。雖然其在深度推理、長文本處理和指令遵循等方面表現(xiàn)突出，且能夠處理更復雜的數(shù)學和邏輯問題，然而，這種“強大”并不意味著絕對的優(yōu)勢，反而暴露出一些潛在的矛盾。

　　這樣的矛盾就在于，GLM-4-Plus這種“類o1”的深度推理模型，實質上與智譜本身的生態(tài)定位之間，已經(jīng)發(fā)生了錯位。

　　因為智譜的定位與OpenAI這類巨頭有所不同，雖然智譜AI確實更偏向于B端市場，但B端市場并非單一結構，而是由不同層級和類型的需求構成。

　　對高性能深度推理的需求，主要來自科研、高技術行業(yè)或特定領域(如編程或科學計算)，這些領域的規(guī)模相對有限。

　　智譜AI的B端客戶，則聚焦于更廣泛的行業(yè)應用的B端客戶，包括金融、教育、能源，通信等行業(yè)，這樣的企業(yè)，更需要的是性價比高、易集成且靈活的模型，而非動輒需要高算力支持的深度推理大模型。

　　如果說，進入高端推理模型的競爭，只是智譜AI在“scaling Law 失效”威脅下，一種展示核心技術實力的必要手段，那么在多模態(tài)方向上的布局，則反映了其更深層次的“定位迷失”。

　　力所不及的多模態(tài)

　　智譜AI在2024年發(fā)布的多模態(tài)語音助手功能，特別是其基于GLM系列的“智譜清言”系統(tǒng)，通過融合實時語音、視頻通話和多模態(tài)理解技術，試圖在C端應用領域拓展新的場景。

　　然而，與科大訊飛的“星火”大模型和字節(jié)跳動的“豆包”語音AI相比，智譜AI的表現(xiàn)呈現(xiàn)出一些耐人尋味的矛盾。

　　科大訊飛已深耕語音領域多年，其語音識別、翻譯和場景化應用(如會議記錄、智能客服)不僅成熟，而且在實際場景中有良好的落地率。字節(jié)的“豆包”則依托強大的內(nèi)容生態(tài)，具有將語音AI應用到社交、娛樂和短視頻生成等消費級場景中的潛力。

　　在生態(tài)布局均不如人的情況下，智譜AI的多模態(tài)語音助手，卻仍未能體現(xiàn)亮眼的差異，其視頻通話功能雖然支持低延遲，更自然的交互，但智力水平的表現(xiàn)，卻與文本狀態(tài)下有著很大差距。與字節(jié)的“豆包”、訊飛的”星火都犯了同樣的通病。

　　除此之外，智譜AI在2024年的文生視頻領域也展現(xiàn)了雄心，通過其最新發(fā)布的CogVideoX v1.5模型和開放平臺“清影”，提供了從文本生成視頻(T2V)到多模態(tài)整合的一系列功能。其技術亮點包括支持5到10秒的高清視頻生成、4K分辨率、多通道輸出(一次性生成多個視頻)等。

　　然而，平心而論，與字節(jié)、快手等大廠的文生視頻大模型相比，“清影”的表現(xiàn)還是太嫩了點。

　　雖然其主打免費、高清，甚至還在后期加入了AI音效的選項，但從效果上看，其生成的視頻不僅古怪、扭曲，并且還有一些很明顯的運動錯誤。

　　例如，在輸入提示詞：“一片廣闊的海灘上，一個人形機器人和一只貓在一起散步”后，清影生成的視頻里，出現(xiàn)了兩個機器人，而非一個，同時它們還像螃蟹一樣，用一種橫著走路的奇怪方式在移動。

　　更詭異的則是畫面中的貓，走著走著，頭就變成了尾巴，仿佛器官發(fā)生了換位。

　　價格戰(zhàn)下的無奈

　　上述提到的種種“博而不精”的現(xiàn)象，反映出的更深層次的問題在于，智譜AI似乎在B端與C端兩個方向上出現(xiàn)了搖擺的情況。

　　以視頻生成為例，字節(jié)跳動通過其強大的內(nèi)容生態(tài)，將MagicVideo-V2緊密結合到TikTok和抖音等平臺，實現(xiàn)了技術與商業(yè)的雙向賦能。同樣地，快手也可將視頻生成嵌入自身的短視頻平臺。

　　短視頻賽道，是天然離C端最近，也最具親和力的一條賽道。

　　而現(xiàn)在的智譜AI，從生態(tài)布局來看，其整體戰(zhàn)略更偏向于B端市場，服務的客戶包括金融、教育、能源和制造業(yè)，這些合作大多集中在需要高技術支持和私有化部署的場景中，如工業(yè)流程優(yōu)化、客戶服務智能化等。

　　但今年智譜AI的多線布局的策略，似乎表明了其既希望拓展ToB市場，又想在C端打造多模態(tài)互動的超級應用，形成一種“兩頭抓”的戰(zhàn)略。

　　在總體資源不及OpenAI，也不及BAT等巨頭的情況下，這一策略的結果最終導致了其資源分散，難以在一個方向上形成突出的競爭優(yōu)勢。

　　但實際上，這種多線進軍的策略，透露出的是一種在商業(yè)化困境下的“無奈突圍”。

　　《中國大模型中標項目監(jiān)測報告》顯示，2024年1-9月份，智譜華章中標的大模型項目達到22個，中標項目披露的中標金額為2472.3萬元。22個中標項目主要分布在通信、金融、能源、教科等行業(yè)，以央國企客戶為主。

　　從大模型中標項目數(shù)量來看，智譜華章可以跟科大訊飛、百度一樣，位列第一梯隊。但是獲得這些項目的過程中，智譜華章付出的“代價”也不小。

　　這樣的“代價”，就是卷到極致的價格戰(zhàn)。

　　今年以來，為了應對同行的價格壓制，智譜AI將模型調(diào)用價格降低到行業(yè)最低水平，如GLM-4-Flash的價格僅0.06元/百萬tokens;對比之下，OpenAI的GPT-4 Turbo版本為 10美元/百萬tokens，差距超過千倍。在一年的時間里，智譜AI從最初的 0.5元/千tokens 降至當前價格，降幅接近1萬倍。

　　這種激進的降價策略，導致利潤空間進一步被壓縮。于是，作為大模型廠商的智譜AI，要活下來，只能依靠融資。

　　過去半年，資本對于國內(nèi)大模型廠商的態(tài)度逐漸冷靜下來。如果大模型廠商想要拿到新一輪融資，最重要的就是要證明自己商業(yè)化的能力。

　　而這樣的“能力”，反映在具體的業(yè)務上，就是一個又一個的“技術奇觀”的出現(xiàn)。

　　過去幾個月，智譜AI接連發(fā)布了AI生成視頻模型清影(Ying)、情感語音模型GLM-4-Voice ，以及AI助理工具AutoGLM 等，這無一不是想通過追逐技術熱點，來吸引市場關注的表現(xiàn)。

　　然而，縱觀整個AI行業(yè)來看，即使在大模型商業(yè)化困難的瓶頸期，除了“多線出擊”的策略外，相關的AI企業(yè)并不是沒有其他選擇的余地。

　　在大模型尚未在C端取得明顯盈利化的階段，是否有AI企業(yè)保持住了自身的定力，專注于特定的方向，并取得了突破行業(yè)上限的進展?

　　答案當然是有的，OpenAI的勁敵——Anthropic就是個很好的例子。

　　與其他多線布局的大廠相比，Anthropic明確聚焦于機制可解釋性和AI對齊問題。它的研究目標高度集中，例如通過“憲法AI”的理念改進AI的安全性和倫理性，使其模型的行為更加透明和可控。這種專注不僅增強了其科研資源的深度與質量，也吸引了對該領域有長期投資意愿的資本，包括Sam Bankman-Fried的FTX基金會、Google Cloud等。

　　Anthropic之所以能做到這點，而智譜AI卻被迫“多線進軍”，背后折射出了一個深層次的現(xiàn)實：在中國的AI創(chuàng)新生態(tài)與投資環(huán)境中，“快”往往比“深”更受青睞。

　　這并非簡單的企業(yè)選擇問題，而是整個創(chuàng)新生態(tài)的產(chǎn)物。

　　智譜AI等國產(chǎn)大模型廠商普遍“追熱點”困境，本質上是一個“囚徒困境”：每家企業(yè)都知道深耕細作的重要性，但在激烈的市場競爭和資本壓力下，不得不選擇更激進的策略。這種現(xiàn)象的背后，是中國技術創(chuàng)新生態(tài)尚未形成對“慢變量”的充分理解和尊重。

　　文章內(nèi)容僅供閱讀，不構成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信