近兩年,無論你身處什么行業(yè),處于何種生活狀態(tài),相信大家對AIGC、大模型等熱詞并不陌生,從之前大火的AI作圖、AI腳本、到AI戀愛,人工智能正在一步步地改變我們的生活方式。
與此同時,大模型行業(yè)也在不斷地進行迭代升級。近日,隨著阿里云一則直降97%定價策略的“橫空問世”,成功地將大模型行業(yè)的競爭格局,從“百花齊放”推向了更為激烈的“百家爭鳴”階段。
據(jù)了解,阿里云把旗下通義千問GPT-4級主力模型——Qwen-Long的API輸入價格,從0.02元/千tokens降至0.0005元/千tokens,相當于OpenAI——GPT-4的400分之一,而此舉也被行業(yè)稱為“擊穿全球底價”的重磅“炸彈”。
緊接著,百度、科大訊飛、騰訊云等企業(yè)紛紛響應(yīng)“號召”,宣布旗下部分大模型免費開放,進一步為這次“降價潮”注入了動力。
“燒錢”的大模型為何會集體降價?越來越多大模型免費開放后,能否替代搜索引擎?以及目前國內(nèi)大模型中“誰”最聰明?又是如何實現(xiàn)商業(yè)化落地的?
“燒錢”的大模型為什么進入降價時代了?
“便宜到不需要猶豫”OR“羊毛出在豬身上”
“我們希望不斷降低情報成本,讓這些東西變得非常便宜,便宜到你根本不需要猶豫。”OpenAI首席執(zhí)行官Sam Altman在新加坡管理大學(xué)演講時,曾回答過關(guān)于大模型降價的問題。
他還進一步表示:OpenAI 每三個月左右就能將推理成本降低90%。從去年開始,OpenAI 一直在頻繁降價。比如,在去年6月,OpenAI把當時最先進、用戶最多的嵌入模型Text-embedding-ada-002降價75%,把當時用戶最多的聊天模型gpt-3.5-turbo降價25%,還推出了gpt4-16k平替版——gpt-3.5-turbo-16k,降價95%。
今年5月,國內(nèi)大模型紛紛跟進降價,加速了行業(yè)降價潮。5月6日,私募基金幻方量化旗下公司深度求索推出了DeepSeek-V2模型。據(jù)介紹,該模型在性能上比肩GPT-4Turbo,但API 價格只有GPT-4-Turbo 的近百分之一,引發(fā)行業(yè)高度關(guān)注。
之后,智譜 AI 、字節(jié)豆包大模型跟進降價。其中,智譜 AI 宣布將其 GLM-3Turbo 模型的調(diào)用價格下調(diào)80%;字節(jié)豆包大模型首次對外開放,就把價格單位從元變?yōu)榱死濉R远拱ㄓ么竽P?pro-32k 版為例,其推理輸入價格為0.0008元/千 tokens,較行業(yè)價格低了99.3%。
從目前參與降價或免費的大模型來看,大多都是各家公司的入門模型,并且降幅較大的都是有云服務(wù)的公司,而企業(yè)級的模型仍維持原價。因此,對企業(yè)用戶影響有限。一般而言,企業(yè)對大模型的需求更加定制化、私有化,而要想實現(xiàn)這些需求,勢必是需要花錢的。
據(jù)媒體不完全統(tǒng)計,截至今年4月底,國內(nèi)共推出了約305個大模型。由此來看,國內(nèi)大模型迎來“降價潮”是行業(yè)的必然趨勢,這不僅僅是要從上百個模型中“優(yōu)勝劣汰”,更重要的是要建立用戶心智,也就是“教用戶如何玩大模型”。
比如,除了對大模型的常規(guī)提問之外,用戶還可以在大模型上創(chuàng)建自己的AI應(yīng)用。
此前,OpenAI 上線GPT商店曾引發(fā)行業(yè)熱議,在GPT商店里可以搜索到各種各樣的AI相關(guān)應(yīng)用,像是圖標設(shè)計神器—— Logo Creator、學(xué)術(shù)助手Consensus等等,還可以按需自主創(chuàng)建GPT。現(xiàn)在,國內(nèi)大模型也可以實現(xiàn)這一“玩法”,比如智譜清言GLM-4、字節(jié)的豆包、百度文心一言等,都在大模型界面設(shè)置了“智能體中心”窗口,不僅可以按類型搜索已有熱門智能體應(yīng)用,還可以自主創(chuàng)建新的智能體,通過復(fù)
而這種現(xiàn)象也為大模型公司提供了另一種生存路徑,即轉(zhuǎn)型成為應(yīng)用公司。順福資本創(chuàng)始人李明順對此也持相同態(tài)度,他進一步表示,“有一些大模型公司的創(chuàng)始人有Plan A和Plan B的雙計劃,就是一旦我的模型實在是拼不過前面的5家之后,就要被迫在一些垂直領(lǐng)域里面找到生存之地,它就會轉(zhuǎn)型為一家應(yīng)用公司。”
另外,此次降價也對大模型創(chuàng)業(yè)公司有一定的沖擊。5月,跟進降價的大模型創(chuàng)業(yè)公司只有智譜AI,而零一萬物、MiniMax、月之暗面等大模型創(chuàng)業(yè)公司并沒有跟進。這主要是因為,這些大模型創(chuàng)業(yè)公司其主要模型的定價從一開始就維持在行業(yè)較低水平,所他們的降價空間相對有限。
這也是大模型初創(chuàng)公司和大體量模型公司之間的一個重要差異表現(xiàn)。獵豹移動董事長兼CEO、獵戶星空董事長傅盛表示:“大公司通過大模型來獲取云客戶,羊毛出在豬身上。但大模型創(chuàng)業(yè)公司沒有“云”這樣的生態(tài),必須另尋商業(yè)模式。”
與此同時,此次降價潮還會吸引更多開發(fā)者參與進來,尤其是中小團隊的開發(fā)者,他們往往不缺想法,缺的就是“燒錢”的算力資源,甚至還有可能促成一些小團隊之間的“強強聯(lián)合”。這種合作不僅能夠推動創(chuàng)新,加速大模型的開發(fā)和優(yōu)化,還可能產(chǎn)生全新的應(yīng)用和解決方案,為市場帶來新的活力和機會。
聰明的大模型,
如何匹配現(xiàn)實中的日常需求?
在科技日益融入我們生活的當下,大模型技術(shù)已“隨處可見”。而馬斯克關(guān)于AI可能在兩年內(nèi)超越人類的預(yù)測,更是為這一領(lǐng)域注入了更多的期待和關(guān)注。
那么,在當前一眾競相“超越GPT”的大模型浪潮中,哪個國產(chǎn)大模型可以讓用戶實現(xiàn)“科技改變生活”呢? 據(jù)大模型開源開放評測體系司南(OpenCompass2.0)數(shù)據(jù),在2024年4月大語言模型最新評測中,智譜 AI 的 GLM-4排名行業(yè)第4,位居國產(chǎn)大模型第一,緊隨其后的是MiniMax的abab6.5。 值得一提的是,在4月的大模型榜單中,前十名里有6位都是國產(chǎn)大模型選手,這充分證明了我國在大模型技術(shù)領(lǐng)域的迅猛發(fā)展態(tài)勢。像是私募基金幻方量化旗下公司深度求索的DeepSeek-V2-Chat、阿里云qwen1.5-110b-chat和百度的旗艦級ERNIE-4.0-8K-0329等優(yōu)秀模型均位列其中。 那么,這些大模型在我們?nèi)粘I钪械降缀貌缓?ldquo;用”呢? 為了回答這個問題,我們選取了五個(豆包、通義前問、智譜清言、Kimi、文心一言)業(yè)內(nèi)口碑較好的免費大模型,進行日常測評。 接下來,我們將從用戶的角度出發(fā),基于實際使用場景,深入體驗并評估這些大模型在實際應(yīng)用中的表現(xiàn)。
以克勞銳編輯部為例,我們的工作場景是不停的和內(nèi)容“打交道”,包括但不限于找選題、寫文章等等。目前我們獲取選題的方式來自于行業(yè)資訊、報告等,而找資料的方式則來自各種搜索引擎。
打開5個大模型,基本都有熱點搜索功能,甚至還會推薦近期相關(guān)熱點。但從實際使用感受來講,除了智譜清言可以直接點開相關(guān)熱點的原網(wǎng)頁之外,其他的大模型回復(fù)仍以總結(jié)性文字為主,需要進一步核對文字的來源以及準確性,可參考意義不大。
值得一提的是,在英文翻譯方面,這五個大模型的體驗明顯優(yōu)于搜索引擎自帶的翻譯功能。搜索引擎自帶的翻譯往往是實時進行的,當你需要翻譯一份英文財報并頻繁“翻頁”時,常常會遇到長時間的等待和加載。然而,大模型在處理此類翻譯任務(wù)時,由于其更高的計算效率和先進的處理能力,不會出現(xiàn)類似的等待情況,不僅翻譯完之后,可隨時查閱,還可以在歷史記錄中查詢以往的翻譯記錄。
在編輯工作中,檢查錯字是一項至關(guān)重要的任務(wù)。然而,在對五個大模型進行“查找錯字”功能測試時,它們卻直接上演了一場“婆說婆有理”的大戲,各自給出了不同的結(jié)果和解釋,甚至一些大模型無法理解我們上傳文檔中的“文字內(nèi)容”,開始了“自我創(chuàng)造”。
我們在5個大模型中上傳了一篇帶有2處明顯錯誤的文章,其中,豆包、通義千問、Kimi直接按照“自己的理解”,創(chuàng)造了一些新“問題”,比如,豆包建議我們把“透過618,平臺想要什么?”改為“透過618,平臺想要什么?”,改了個“寂寞”;Kimi建議我們把"店播" 改為 "店鋪直播",走的是擴寫風(fēng)格;通義千問建議我們把“今年618,改為今年6.18”......而文心一言和智譜清言則直接表示:“經(jīng)過仔細檢查,并未發(fā)現(xiàn)明顯的錯別字”。
從提問方式來看,這5個大模型都喜歡“角色扮演”。如果首次提問沒有得到滿意的答案,可以用“假設(shè)你是一個......”來追問,得到的回答會比第一次問全面很多。在智譜清言中,我們針對首次沒有發(fā)現(xiàn)錯別字的文檔進行二次追問,在假設(shè)該大模型一個電商行業(yè)專家的條件下,它給出了10條“改錯”。比如,把文章中的“451改為415”。
大模型在處理文本時,雖然能夠展現(xiàn)出強大的語言理解和生成能力,但由于各種因素(如模型架構(gòu)、訓(xùn)練數(shù)據(jù)、算法等)的限制,它們在某些細節(jié)和特定任務(wù)上的表現(xiàn)可能并不盡如人意。從我們測試的結(jié)果來看,這種不準確性可能源于多個方面,例如模型對語言規(guī)則的掌握不夠全面,或者對特定領(lǐng)域和上下文的理解不夠深入。
因此,目前大模型在提取信息的準確性方面仍有待觀察和提高,并不能完全替代傳統(tǒng)的搜索引擎。
大模型的商業(yè)化進程如何?
在降價潮和落地應(yīng)用背景之下,大模型的商業(yè)化問題再次被擺在臺面上。
目前,大模型的商業(yè)化類型主要可以分為兩大類。一類是模型本身的訂閱付費模式,這一模式允許用戶根據(jù)自身的需求選擇適合的模型,并按照使用量或時長進行付費。而另一類則是大模型機制下——AI落地的各種應(yīng)用。在ChatGPT等先進模型出現(xiàn)之前,被公眾廣泛關(guān)注的AI模型往往專注于單一任務(wù),如“阿爾法狗”(AlphaGo)等。
目前,其應(yīng)用場景已經(jīng)從最初的文本生成、語言翻譯,擴展到如今的圖像識別、智能推薦等領(lǐng)域,這種轉(zhuǎn)變也為大模型的商業(yè)化提供了更多可能。
在電商領(lǐng)域,大模型的應(yīng)用已經(jīng)十分普遍。例如,淘寶自研的“星辰”大模型,京東的言犀大模型,都是通過數(shù)據(jù)學(xué)習(xí)為消費者和商家提供智能決策等多元服務(wù),從而進一步挖掘平臺用戶的潛在需求。再往前還有各種品牌的數(shù)字人直播帶貨、元宇宙發(fā)布會等等。
而在汽車行業(yè),AI大模型的引入更是重塑了人機交互場景,為新能源汽車賦予了新的魅力和賣點。在今年的北京車展中,能與“新能源”等熱詞“齊驅(qū)并駕”要數(shù)“大模型”了。不僅商湯絕影、騰訊等科技企業(yè)紛紛發(fā)布用于汽車的智能駕駛和智能座艙的垂類大模型,小鵬、哪吒等車企也紛紛宣布“大模型上車”。
然而,這些都只是大模型商業(yè)化道路上的冰山一角。隨著科技技術(shù)的迭代和成本的降低,未來會跑通越來越多的大模型商業(yè)化場景。百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖認為,現(xiàn)在是大模型企業(yè)勇敢創(chuàng)新、大膽嘗試的絕佳時機。一旦某個應(yīng)用場景“跑通”了,就可以“復(fù)制粘貼”,加速落地。
那么,你認為哪個領(lǐng)域?qū)⒆钤鐚崿F(xiàn)大模型的批量商業(yè)化?歡迎評論區(qū)留言討論。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。