大模型內(nèi)心OS：聰明大腦如何匹配現(xiàn)實需求？

2024年05月29日 11:39:26 來源：TopKlout克勞銳公眾號

　　近兩年，無論你身處什么行業(yè)，處于何種生活狀態(tài)，相信大家對AIGC、大模型等熱詞并不陌生，從之前大火的AI作圖、AI腳本、到AI戀愛，人工智能正在一步步地改變我們的生活方式。

　　與此同時，大模型行業(yè)也在不斷地進行迭代升級。近日，隨著阿里云一則直降97%定價策略的“橫空問世”，成功地將大模型行業(yè)的競爭格局，從“百花齊放”推向了更為激烈的“百家爭鳴”階段。

　　據(jù)了解，阿里云把旗下通義千問GPT-4級主力模型——Qwen-Long的API輸入價格，從0.02元/千tokens降至0.0005元/千tokens，相當于OpenAI——GPT-4的400分之一，而此舉也被行業(yè)稱為“擊穿全球底價”的重磅“炸彈”。

　　緊接著，百度、科大訊飛、騰訊云等企業(yè)紛紛響應(yīng)“號召”，宣布旗下部分大模型免費開放，進一步為這次“降價潮”注入了動力。

　　“燒錢”的大模型為何會集體降價?越來越多大模型免費開放后，能否替代搜索引擎?以及目前國內(nèi)大模型中“誰”最聰明?又是如何實現(xiàn)商業(yè)化落地的?

　　“燒錢”的大模型為什么進入降價時代了?

　　“便宜到不需要猶豫”OR“羊毛出在豬身上”

　　“我們希望不斷降低情報成本，讓這些東西變得非常便宜，便宜到你根本不需要猶豫。”OpenAI首席執(zhí)行官Sam Altman在新加坡管理大學(xué)演講時，曾回答過關(guān)于大模型降價的問題。

　　他還進一步表示:OpenAI 每三個月左右就能將推理成本降低90%。從去年開始，OpenAI 一直在頻繁降價。比如，在去年6月，OpenAI把當時最先進、用戶最多的嵌入模型Text-embedding-ada-002降價75%，把當時用戶最多的聊天模型gpt-3.5-turbo降價25%，還推出了gpt4-16k平替版——gpt-3.5-turbo-16k，降價95%。

　　今年5月，國內(nèi)大模型紛紛跟進降價，加速了行業(yè)降價潮。5月6日，私募基金幻方量化旗下公司深度求索推出了DeepSeek-V2模型。據(jù)介紹，該模型在性能上比肩GPT-4Turbo，但API 價格只有GPT-4-Turbo 的近百分之一，引發(fā)行業(yè)高度關(guān)注。

　　之后，智譜 AI 、字節(jié)豆包大模型跟進降價。其中，智譜 AI 宣布將其 GLM-3Turbo 模型的調(diào)用價格下調(diào)80%;字節(jié)豆包大模型首次對外開放，就把價格單位從元變?yōu)榱死濉Ｒ远拱ㄓ么竽Ｐ?pro-32k 版為例，其推理輸入價格為0.0008元/千 tokens，較行業(yè)價格低了99.3%。

　　從目前參與降價或免費的大模型來看，大多都是各家公司的入門模型，并且降幅較大的都是有云服務(wù)的公司，而企業(yè)級的模型仍維持原價。因此，對企業(yè)用戶影響有限。一般而言，企業(yè)對大模型的需求更加定制化、私有化，而要想實現(xiàn)這些需求，勢必是需要花錢的。

　　據(jù)媒體不完全統(tǒng)計，截至今年4月底，國內(nèi)共推出了約305個大模型。由此來看，國內(nèi)大模型迎來“降價潮”是行業(yè)的必然趨勢，這不僅僅是要從上百個模型中“優(yōu)勝劣汰”，更重要的是要建立用戶心智，也就是“教用戶如何玩大模型”。

　　比如，除了對大模型的常規(guī)提問之外，用戶還可以在大模型上創(chuàng)建自己的AI應(yīng)用。

　　此前，OpenAI 上線GPT商店曾引發(fā)行業(yè)熱議，在GPT商店里可以搜索到各種各樣的AI相關(guān)應(yīng)用，像是圖標設(shè)計神器—— Logo Creator、學(xué)術(shù)助手Consensus等等，還可以按需自主創(chuàng)建GPT。現(xiàn)在，國內(nèi)大模型也可以實現(xiàn)這一“玩法”，比如智譜清言GLM-4、字節(jié)的豆包、百度文心一言等，都在大模型界面設(shè)置了“智能體中心”窗口，不僅可以按類型搜索已有熱門智能體應(yīng)用，還可以自主創(chuàng)建新的智能體，通過復(fù)

　　而這種現(xiàn)象也為大模型公司提供了另一種生存路徑，即轉(zhuǎn)型成為應(yīng)用公司。順福資本創(chuàng)始人李明順對此也持相同態(tài)度，他進一步表示，“有一些大模型公司的創(chuàng)始人有Plan A和Plan B的雙計劃，就是一旦我的模型實在是拼不過前面的5家之后，就要被迫在一些垂直領(lǐng)域里面找到生存之地，它就會轉(zhuǎn)型為一家應(yīng)用公司。”

　　另外，此次降價也對大模型創(chuàng)業(yè)公司有一定的沖擊。5月，跟進降價的大模型創(chuàng)業(yè)公司只有智譜AI，而零一萬物、MiniMax、月之暗面等大模型創(chuàng)業(yè)公司并沒有跟進。這主要是因為，這些大模型創(chuàng)業(yè)公司其主要模型的定價從一開始就維持在行業(yè)較低水平，所他們的降價空間相對有限。

　　這也是大模型初創(chuàng)公司和大體量模型公司之間的一個重要差異表現(xiàn)。獵豹移動董事長兼CEO、獵戶星空董事長傅盛表示:“大公司通過大模型來獲取云客戶，羊毛出在豬身上。但大模型創(chuàng)業(yè)公司沒有“云”這樣的生態(tài)，必須另尋商業(yè)模式。”

　　與此同時，此次降價潮還會吸引更多開發(fā)者參與進來，尤其是中小團隊的開發(fā)者，他們往往不缺想法，缺的就是“燒錢”的算力資源，甚至還有可能促成一些小團隊之間的“強強聯(lián)合”。這種合作不僅能夠推動創(chuàng)新，加速大模型的開發(fā)和優(yōu)化，還可能產(chǎn)生全新的應(yīng)用和解決方案，為市場帶來新的活力和機會。

　　聰明的大模型，

　　如何匹配現(xiàn)實中的日常需求?

　　在科技日益融入我們生活的當下，大模型技術(shù)已“隨處可見”。而馬斯克關(guān)于AI可能在兩年內(nèi)超越人類的預(yù)測，更是為這一領(lǐng)域注入了更多的期待和關(guān)注。

　　那么，在當前一眾競相“超越GPT”的大模型浪潮中，哪個國產(chǎn)大模型可以讓用戶實現(xiàn)“科技改變生活”呢? 據(jù)大模型開源開放評測體系司南(OpenCompass2.0)數(shù)據(jù)，在2024年4月大語言模型最新評測中，智譜 AI 的 GLM-4排名行業(yè)第4，位居國產(chǎn)大模型第一，緊隨其后的是MiniMax的abab6.5。值得一提的是，在4月的大模型榜單中，前十名里有6位都是國產(chǎn)大模型選手，這充分證明了我國在大模型技術(shù)領(lǐng)域的迅猛發(fā)展態(tài)勢。像是私募基金幻方量化旗下公司深度求索的DeepSeek-V2-Chat、阿里云qwen1.5-110b-chat和百度的旗艦級ERNIE-4.0-8K-0329等優(yōu)秀模型均位列其中。那么，這些大模型在我們?nèi)粘Ｉ钪械降缀貌缓?ldquo;用”呢? 為了回答這個問題，我們選取了五個(豆包、通義前問、智譜清言、Kimi、文心一言)業(yè)內(nèi)口碑較好的免費大模型，進行日常測評。接下來，我們將從用戶的角度出發(fā)，基于實際使用場景，深入體驗并評估這些大模型在實際應(yīng)用中的表現(xiàn)。

　　以克勞銳編輯部為例，我們的工作場景是不停的和內(nèi)容“打交道”，包括但不限于找選題、寫文章等等。目前我們獲取選題的方式來自于行業(yè)資訊、報告等，而找資料的方式則來自各種搜索引擎。

　　打開5個大模型，基本都有熱點搜索功能，甚至還會推薦近期相關(guān)熱點。但從實際使用感受來講，除了智譜清言可以直接點開相關(guān)熱點的原網(wǎng)頁之外，其他的大模型回復(fù)仍以總結(jié)性文字為主，需要進一步核對文字的來源以及準確性，可參考意義不大。

　　值得一提的是，在英文翻譯方面，這五個大模型的體驗明顯優(yōu)于搜索引擎自帶的翻譯功能。搜索引擎自帶的翻譯往往是實時進行的，當你需要翻譯一份英文財報并頻繁“翻頁”時，常常會遇到長時間的等待和加載。然而，大模型在處理此類翻譯任務(wù)時，由于其更高的計算效率和先進的處理能力，不會出現(xiàn)類似的等待情況，不僅翻譯完之后，可隨時查閱，還可以在歷史記錄中查詢以往的翻譯記錄。

　　在編輯工作中，檢查錯字是一項至關(guān)重要的任務(wù)。然而，在對五個大模型進行“查找錯字”功能測試時，它們卻直接上演了一場“婆說婆有理”的大戲，各自給出了不同的結(jié)果和解釋，甚至一些大模型無法理解我們上傳文檔中的“文字內(nèi)容”，開始了“自我創(chuàng)造”。

　　我們在5個大模型中上傳了一篇帶有2處明顯錯誤的文章，其中，豆包、通義千問、Kimi直接按照“自己的理解”，創(chuàng)造了一些新“問題”，比如，豆包建議我們把“透過618，平臺想要什么?”改為“透過618，平臺想要什么?”，改了個“寂寞”;Kimi建議我們把"店播" 改為 "店鋪直播"，走的是擴寫風(fēng)格;通義千問建議我們把“今年618，改為今年6.18”......而文心一言和智譜清言則直接表示:“經(jīng)過仔細檢查，并未發(fā)現(xiàn)明顯的錯別字”。

　　從提問方式來看，這5個大模型都喜歡“角色扮演”。如果首次提問沒有得到滿意的答案，可以用“假設(shè)你是一個......”來追問，得到的回答會比第一次問全面很多。在智譜清言中，我們針對首次沒有發(fā)現(xiàn)錯別字的文檔進行二次追問，在假設(shè)該大模型一個電商行業(yè)專家的條件下，它給出了10條“改錯”。比如，把文章中的“451改為415”。

　　大模型在處理文本時，雖然能夠展現(xiàn)出強大的語言理解和生成能力，但由于各種因素(如模型架構(gòu)、訓(xùn)練數(shù)據(jù)、算法等)的限制，它們在某些細節(jié)和特定任務(wù)上的表現(xiàn)可能并不盡如人意。從我們測試的結(jié)果來看，這種不準確性可能源于多個方面，例如模型對語言規(guī)則的掌握不夠全面，或者對特定領(lǐng)域和上下文的理解不夠深入。

　　因此，目前大模型在提取信息的準確性方面仍有待觀察和提高，并不能完全替代傳統(tǒng)的搜索引擎。

　　大模型的商業(yè)化進程如何?

　　在降價潮和落地應(yīng)用背景之下，大模型的商業(yè)化問題再次被擺在臺面上。

　　目前，大模型的商業(yè)化類型主要可以分為兩大類。一類是模型本身的訂閱付費模式，這一模式允許用戶根據(jù)自身的需求選擇適合的模型，并按照使用量或時長進行付費。而另一類則是大模型機制下——AI落地的各種應(yīng)用。在ChatGPT等先進模型出現(xiàn)之前，被公眾廣泛關(guān)注的AI模型往往專注于單一任務(wù)，如“阿爾法狗”(AlphaGo)等。

　　目前，其應(yīng)用場景已經(jīng)從最初的文本生成、語言翻譯，擴展到如今的圖像識別、智能推薦等領(lǐng)域，這種轉(zhuǎn)變也為大模型的商業(yè)化提供了更多可能。

　　在電商領(lǐng)域，大模型的應(yīng)用已經(jīng)十分普遍。例如，淘寶自研的“星辰”大模型，京東的言犀大模型，都是通過數(shù)據(jù)學(xué)習(xí)為消費者和商家提供智能決策等多元服務(wù)，從而進一步挖掘平臺用戶的潛在需求。再往前還有各種品牌的數(shù)字人直播帶貨、元宇宙發(fā)布會等等。

　　而在汽車行業(yè)，AI大模型的引入更是重塑了人機交互場景，為新能源汽車賦予了新的魅力和賣點。在今年的北京車展中，能與“新能源”等熱詞“齊驅(qū)并駕”要數(shù)“大模型”了。不僅商湯絕影、騰訊等科技企業(yè)紛紛發(fā)布用于汽車的智能駕駛和智能座艙的垂類大模型，小鵬、哪吒等車企也紛紛宣布“大模型上車”。

　　然而，這些都只是大模型商業(yè)化道路上的冰山一角。隨著科技技術(shù)的迭代和成本的降低，未來會跑通越來越多的大模型商業(yè)化場景。百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖認為，現(xiàn)在是大模型企業(yè)勇敢創(chuàng)新、大膽嘗試的絕佳時機。一旦某個應(yīng)用場景“跑通”了，就可以“復(fù)制粘貼”，加速落地。

　　那么，你認為哪個領(lǐng)域?qū)⒆钤鐚崿F(xiàn)大模型的批量商業(yè)化?歡迎評論區(qū)留言討論。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風(fēng)險自擔。

[No. ]
分享到微信