@科技新知 原創(chuàng)作者丨林書 編輯丨蕨影
在2024年的一個尋常冬日,國產(chǎn)AI再次改變了我們與技術交互的方式。
11月29日,智譜AI在其技術開放日上上演了一幕令人矚目的科技大戲:歷史上首次!AI發(fā)出了第一個紅包!
公司CEO張鵬僅僅通過三句語音指令,就讓旗下的智能體AutoGLM跨越微信、支付寶等多個應用,給現(xiàn)場和線上的觀眾發(fā)了兩個大紅包。
這一幕背后,折射出的是 AI Agent技術的革命性突破。
當前,傳統(tǒng)的AI助手停留在被動響應和單一場景的交互,而智譜AI的AutoGLM已經(jīng)能夠主動理解復雜指令,跨應用協(xié)同,并精準執(zhí)行用戶意圖。
除了發(fā)紅包這樣的操作外,即使面對多個復雜操作的超長任務,例如訂外賣時橫跨多個APP比價,AutoGLM也能行云流水般自主執(zhí)行。
然而這樣的“驚喜”,只是今年智譜在AI方向上結出的眾多”碩果“之一。
今年7月,智譜AI 代碼生成大模型 CodeGeeX 第四代正式發(fā)布,支持代碼補全、代碼注釋、代碼修復、代碼翻譯等基礎功能;7月末,智譜AI的視頻生成模型「智譜清影」正式發(fā)布,可生成時長 6 秒,清晰度達到 1440×960的視頻。
到了10月,智譜推出并開源端到端語音模型 GLM-4-Voice,與GPT-4o的語音功能一樣, GLM-4-Voice可以進行實時語音對話,同時在情緒表達、多語言等方面實現(xiàn)突破,且可隨時打斷。
由此可見,今年的智譜,在代碼、多模態(tài)、Agent等多個方向上,都進行了“突擊”。這種全方位的技術布局,展示了智譜AI在追趕全球AI巨頭的決心。
然而,在這看似全面的進展背后,也不免讓人產(chǎn)生一種冷靜的思考:在體量、資本均不及OpenAI等巨頭的情況下,如此廣泛的技術覆蓋,是否會影響智譜在各個領域的深耕程度?
多線進軍的隱憂
從總體上離開,在今年的AI賽道上,身為“AI六小虎”之一的智譜,雖然布局甚廣,但其在每一條戰(zhàn)線上的表現(xiàn),都相對比較“平均”,其產(chǎn)品方向更趨向于跟隨,而鮮少有獨創(chuàng)性的突破。
以智譜最近發(fā)布的旗艦大模型GLM-4-Plus為例,該模型定位是一種類似OpenAI 的o1那樣的深度推理模型。雖然其在深度推理、長文本處理和指令遵循等方面表現(xiàn)突出,且能夠處理更復雜的數(shù)學和邏輯問題,然而,這種“強大”并不意味著絕對的優(yōu)勢,反而暴露出一些潛在的矛盾。
這樣的矛盾就在于,GLM-4-Plus這種“類o1”的深度推理模型,實質上與智譜本身的生態(tài)定位之間,已經(jīng)發(fā)生了錯位。
因為智譜的定位與OpenAI這類巨頭有所不同,雖然智譜AI確實更偏向于B端市場,但B端市場并非單一結構,而是由不同層級和類型的需求構成。
對高性能深度推理的需求,主要來自科研、高技術行業(yè)或特定領域(如編程或科學計算),這些領域的規(guī)模相對有限。
智譜AI的B端客戶,則聚焦于更廣泛的行業(yè)應用的B端客戶,包括金融、教育、能源,通信等行業(yè),這樣的企業(yè),更需要的是性價比高、易集成且靈活的模型,而非動輒需要高算力支持的深度推理大模型。
如果說,進入高端推理模型的競爭,只是智譜AI在“scaling Law 失效”威脅下,一種展示核心技術實力的必要手段,那么在多模態(tài)方向上的布局,則反映了其更深層次的“定位迷失”。
力所不及的多模態(tài)
智譜AI在2024年發(fā)布的多模態(tài)語音助手功能,特別是其基于GLM系列的“智譜清言”系統(tǒng),通過融合實時語音、視頻通話和多模態(tài)理解技術,試圖在C端應用領域拓展新的場景。
然而,與科大訊飛的“星火”大模型和字節(jié)跳動的“豆包”語音AI相比,智譜AI的表現(xiàn)呈現(xiàn)出一些耐人尋味的矛盾。
科大訊飛已深耕語音領域多年,其語音識別、翻譯和場景化應用(如會議記錄、智能客服)不僅成熟,而且在實際場景中有良好的落地率。字節(jié)的“豆包”則依托強大的內(nèi)容生態(tài),具有將語音AI應用到社交、娛樂和短視頻生成等消費級場景中的潛力。
在生態(tài)布局均不如人的情況下,智譜AI的多模態(tài)語音助手,卻仍未能體現(xiàn)亮眼的差異,其視頻通話功能雖然支持低延遲,更自然的交互,但智力水平的表現(xiàn),卻與文本狀態(tài)下有著很大差距。與字節(jié)的“豆包”、訊飛的”星火都犯了同樣的通病。
除此之外,智譜AI在2024年的文生視頻領域也展現(xiàn)了雄心,通過其最新發(fā)布的CogVideoX v1.5模型和開放平臺“清影”,提供了從文本生成視頻(T2V)到多模態(tài)整合的一系列功能。其技術亮點包括支持5到10秒的高清視頻生成、4K分辨率、多通道輸出(一次性生成多個視頻)等。
然而,平心而論,與字節(jié)、快手等大廠的文生視頻大模型相比,“清影”的表現(xiàn)還是太嫩了點。
雖然其主打免費、高清,甚至還在后期加入了AI音效的選項,但從效果上看,其生成的視頻不僅古怪、扭曲,并且還有一些很明顯的運動錯誤。
例如,在輸入提示詞:“一片廣闊的海灘上,一個人形機器人和一只貓在一起散步”后,清影生成的視頻里,出現(xiàn)了兩個機器人,而非一個,同時它們還像螃蟹一樣,用一種橫著走路的奇怪方式在移動。
更詭異的則是畫面中的貓,走著走著,頭就變成了尾巴,仿佛器官發(fā)生了換位。
價格戰(zhàn)下的無奈
上述提到的種種“博而不精”的現(xiàn)象,反映出的更深層次的問題在于,智譜AI似乎在B端與C端兩個方向上出現(xiàn)了搖擺的情況。
以視頻生成為例,字節(jié)跳動通過其強大的內(nèi)容生態(tài),將MagicVideo-V2緊密結合到TikTok和抖音等平臺,實現(xiàn)了技術與商業(yè)的雙向賦能。同樣地,快手也可將視頻生成嵌入自身的短視頻平臺。
短視頻賽道,是天然離C端最近,也最具親和力的一條賽道。
而現(xiàn)在的智譜AI,從生態(tài)布局來看,其整體戰(zhàn)略更偏向于B端市場,服務的客戶包括金融、教育、能源和制造業(yè),這些合作大多集中在需要高技術支持和私有化部署的場景中,如工業(yè)流程優(yōu)化、客戶服務智能化等。
但今年智譜AI的多線布局的策略,似乎表明了其既希望拓展ToB市場,又想在C端打造多模態(tài)互動的超級應用,形成一種“兩頭抓”的戰(zhàn)略。
在總體資源不及OpenAI,也不及BAT等巨頭的情況下,這一策略的結果最終導致了其資源分散,難以在一個方向上形成突出的競爭優(yōu)勢。
但實際上,這種多線進軍的策略,透露出的是一種在商業(yè)化困境下的“無奈突圍”。
《中國大模型中標項目監(jiān)測報告》顯示,2024年1-9月份,智譜華章中標的大模型項目達到22個,中標項目披露的中標金額為2472.3萬元。22個中標項目主要分布在通信、金融、能源、教科等行業(yè),以央國企客戶為主。
從大模型中標項目數(shù)量來看,智譜華章可以跟科大訊飛、百度一樣,位列第一梯隊。但是獲得這些項目的過程中,智譜華章付出的“代價”也不小。
這樣的“代價”,就是卷到極致的價格戰(zhàn)。
今年以來,為了應對同行的價格壓制,智譜AI將模型調(diào)用價格降低到行業(yè)最低水平,如GLM-4-Flash的價格僅0.06元/百萬tokens;對比之下,OpenAI的GPT-4 Turbo版本為 10美元/百萬tokens,差距超過千倍。在一年的時間里,智譜AI從最初的 0.5元/千tokens 降至當前價格,降幅接近1萬倍。
這種激進的降價策略,導致利潤空間進一步被壓縮。于是,作為大模型廠商的智譜AI,要活下來,只能依靠融資。
過去半年,資本對于國內(nèi)大模型廠商的態(tài)度逐漸冷靜下來。如果大模型廠商想要拿到新一輪融資,最重要的就是要證明自己商業(yè)化的能力。
而這樣的“能力”,反映在具體的業(yè)務上,就是一個又一個的“技術奇觀”的出現(xiàn)。
過去幾個月,智譜AI接連發(fā)布了AI生成視頻模型清影(Ying)、情感語音模型GLM-4-Voice ,以及AI助理工具AutoGLM 等,這無一不是想通過追逐技術熱點,來吸引市場關注的表現(xiàn)。
然而,縱觀整個AI行業(yè)來看,即使在大模型商業(yè)化困難的瓶頸期,除了“多線出擊”的策略外,相關的AI企業(yè)并不是沒有其他選擇的余地。
在大模型尚未在C端取得明顯盈利化的階段,是否有AI企業(yè)保持住了自身的定力,專注于特定的方向,并取得了突破行業(yè)上限的進展?
答案當然是有的,OpenAI的勁敵——Anthropic就是個很好的例子。
與其他多線布局的大廠相比,Anthropic明確聚焦于機制可解釋性和AI對齊問題。它的研究目標高度集中,例如通過“憲法AI”的理念改進AI的安全性和倫理性,使其模型的行為更加透明和可控。這種專注不僅增強了其科研資源的深度與質量,也吸引了對該領域有長期投資意愿的資本,包括Sam Bankman-Fried的FTX基金會、Google Cloud等。
Anthropic之所以能做到這點,而智譜AI卻被迫“多線進軍”,背后折射出了一個深層次的現(xiàn)實:在中國的AI創(chuàng)新生態(tài)與投資環(huán)境中,“快”往往比“深”更受青睞。
這并非簡單的企業(yè)選擇問題,而是整個創(chuàng)新生態(tài)的產(chǎn)物。
智譜AI等國產(chǎn)大模型廠商普遍“追熱點”困境,本質上是一個“囚徒困境”:每家企業(yè)都知道深耕細作的重要性,但在激烈的市場競爭和資本壓力下,不得不選擇更激進的策略。這種現(xiàn)象的背后,是中國技術創(chuàng)新生態(tài)尚未形成對“慢變量”的充分理解和尊重。
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。