沸騰的大模型：誰在成為主角？

2023年09月07日 15:04:39 來源：新摘商業(yè)評論

　　作者/皮爺

　　出品/新摘商業(yè)評論

　　670.4%——這是在2023年中期業(yè)績報告中，商湯給出的生成式AI相關(guān)業(yè)務(wù)增長數(shù)字。與此同時，今年上半年，商湯整體營收增速轉(zhuǎn)正，實現(xiàn)收入14.3億元。

　　商湯，這個AI老兵，再次站到了舞臺中央。

　　過去半年的大模型浪潮里，如果說在一眾中國選手里誰的身影更為清晰，商湯絕對是最佳選項之一。關(guān)于這家AI原生的企業(yè)，市場已經(jīng)看到了太多的亮眼標簽。比如商湯是最早發(fā)布大模型系列產(chǎn)品的廠商之一，旗下商量SenseChat是國內(nèi)最早推出的基于千億參數(shù)大語言模型的聊天機器人產(chǎn)品之一;再比如，商湯聯(lián)合多家國內(nèi)頂尖科研機構(gòu)發(fā)布了首個綜合性能全面超越GPT-3.5-turbo的基模型InternLM等等。

　　對于商湯，人們不陌生。但盡管如此，對于如今在大模型潮流里有足夠清晰的聲音傳遞出來的商湯而言，其也在AI加速落地的當下不斷刷新著人們對它的新定義。

　　在如今“百模征戰(zhàn)”的大模型時代，一個經(jīng)常被提出，也更是市場關(guān)心的問題恰是：誰能成為最終的底層大模型選項?或者說，誰能成為中國產(chǎn)業(yè)數(shù)字化浪潮的真正賦能者?

　　在大模型熱度逐漸冷靜的當下，這個問題的答案已然不僅是關(guān)于技術(shù)本身，也更是關(guān)于產(chǎn)品，關(guān)于服務(wù)，關(guān)于對產(chǎn)業(yè)的理解和深耕。

　　而這里，也已然成為商湯們自證價值的最佳考場。

　　一、AI潮水里，一張新成績單

　　“商湯迎來了極其關(guān)鍵的發(fā)展時期。”商湯CEO徐立在財報公布的電話會上這樣說道。作為商湯董事會執(zhí)行主席兼首席執(zhí)行官，在過去的半年時間里，他和商湯一起站上了AI的舞臺。

　　今年5月份，陸奇在北京舉行了一場超千人規(guī)模、主題為《新范式新時代新機會》的演講，全程超三個小時，其中他的核心觀點是，大模型將帶來范式技術(shù)革命，它將改變一切產(chǎn)業(yè)世界，未來也將無處不在。

　　在具體的闡述環(huán)節(jié)，他也更明確表達，中國大模型企業(yè)要奮起直追，在基礎(chǔ)模型層面，要建立達到GPT-3.5到GPT-4的模型能力，搶先進入第一梯隊。

　　就在這番話落地的僅1個月后，有一家企業(yè)就宣布其基模型性能超過GPT-3.5-turbo，正是商湯聯(lián)合多家國內(nèi)頂尖科研機構(gòu)發(fā)布的大語言模型書生·浦語(InternLM)，參數(shù)規(guī)模為1040億，成為當時國內(nèi)首個在多個權(quán)威評測集上超越ChatGPT水平的基模型。

　　8月，更新的模型成果被披露，新模型 InternLM-123B 完成訓練，參數(shù)量提升至1230億，在全球51個知名評測集共計30萬道問題中測試成績整體排名全球第二，超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型。

　　據(jù)介紹，InternLM-123B的語言、知識、理解、推理和學科等能力均顯著提高，還重點升級了代碼解釋器及插件調(diào)用能力(function calling)，可使用python解釋器、API調(diào)用和搜索三類常用工具來解決復(fù)雜任務(wù)、靈活搭建AI智能體應(yīng)用。

　　徐立在財報電話會上重申了工具調(diào)用能力的意義。“只會‘聊天’的模型是很難轉(zhuǎn)化成生產(chǎn)力的，能夠準確使用工具的大模型是解放行業(yè)生產(chǎn)力的關(guān)鍵。”

　　商湯的文生圖大模型秒畫也在飛速迭代，短短幾個月內(nèi)由1.0版本升級至3.0版本，基模型參數(shù)量提升至70億參數(shù)，其核心算法在COCObenchmark上超過了谷歌的Imagen與OpenAI的DALL·E2，出圖效果躋身全球前列。

　　這僅僅是商湯交出的成績單之一。

　　更亮眼的成績來自商湯基于基模型的上層表達。在基模型之上，除了商量和秒畫，商湯還推出了如影、瓊宇、格物等AI產(chǎn)品，分別對應(yīng)數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI場景。

　　這些產(chǎn)品在過去半年時間里不僅被廣泛應(yīng)用到C端，也在一眾B端市場落地。

　　財報數(shù)據(jù)顯示，今年上半年商湯智慧商業(yè)板塊收入同比增長50.2%，收入占比提升至60%，與十個行業(yè)的數(shù)百家客戶合作定制行業(yè)大模型，覆蓋能源、金融、地產(chǎn)、人力資源、傳媒、工業(yè)制造、咨詢等一眾垂直行業(yè)場景，單客戶收入提高59.9%。

　　智慧生活板塊的表現(xiàn)同樣亮眼。商湯在財報中透露，智慧生活已通過對手機、移動互聯(lián)網(wǎng)行業(yè)上百個客戶提供大模型賦能的新產(chǎn)品及新功能，最終觸達數(shù)億終端、中小企業(yè)與個人用戶。例如“如影”數(shù)字人如今已服務(wù)于央視、廣電、工商銀行等頭部客戶，并落地各類電商和直播類客戶;“格物”則已與香港最大的珠寶集團實現(xiàn)商品3D數(shù)字化合作等等。

　　可以說，透過這次財報數(shù)據(jù)，能清晰看到的是一根向上的企業(yè)發(fā)展陽線。在這條勢頭強勁的曲線里，商湯向外界展示的不僅是自身的產(chǎn)品、技術(shù)和產(chǎn)業(yè)落地，更是商湯這家企業(yè)在AI浪潮下被無限放大的戰(zhàn)略活性。

　　為什么商湯可以?或者說，為什么在如今波折不定的大模型潮水里，商湯走出的是一條足夠有確定性的曲線?

　　二、誰在領(lǐng)跑大模型?

　　實際上，這并不是一件容易的事。

　　從企業(yè)的層面來看，大模型的落地背后對應(yīng)的不僅是其在參數(shù)、產(chǎn)品層面的不斷訓練和調(diào)整，更是在一個個產(chǎn)業(yè)場景中基于行業(yè)know-how的沉淀，不斷改進和適配，由定制化走向通用場景。

　　想要實現(xiàn)真正的AGI，大模型仍要不斷進化迭代。這背后需要的則是算力、數(shù)據(jù)、系統(tǒng)等全方位的支撐。

　　根據(jù)相關(guān)消息顯示，在如今OpenAI基于GPT-4的訓練中，其參數(shù)量級達1.8萬億巨量參數(shù)，訓練一次的成本則是高達6300萬美元，甚至不止。其中不僅包括單純的邏輯推理，更包括如數(shù)據(jù)清洗、高質(zhì)量數(shù)據(jù)標注等等環(huán)節(jié)。

　　但商湯卻有另外一條路。其頗具前瞻性的布局打造了算力基礎(chǔ)設(shè)施SenseCore AI大裝置。2022年全國最大智算中心上海臨港AIDC正式運營，推動商湯的大裝置持續(xù)升級。

　　今年3月底，商湯大裝置就已經(jīng)完成2.7萬塊GPU的部署并實現(xiàn)了5ExaFLOPS的算力輸出能力，可最多支持20個千億參數(shù)量大模型(以千卡并行)同時訓練，最高可支持萬億參數(shù)超大模型的訓練，而根據(jù)此次財報數(shù)據(jù)，如今其上線GPU數(shù)量提升到約3萬塊，算力規(guī)模已提升20%至6ExaFLOPS。

　　基于大裝置的底層積累和充沛算力，商湯可以以更低成本和更高效地完成大模型從數(shù)據(jù)清洗、數(shù)據(jù)標注到邏輯訓練等一系列大模型“進化”所需工作。

　　優(yōu)勢不僅在成本和速度，更在模型質(zhì)量和企業(yè)落地效果。盡管如今市面上大部分開源模型可以自由調(diào)用接口和模型能力，但其背后對應(yīng)的模型底層能力以及配套工具鏈相關(guān)能力并不完備，具體到產(chǎn)業(yè)場景側(cè)則是實際落地效果極差，甚至無法落地。

　　而商湯的開源模型具備足夠扎實的底層模型能力，這離不開其豐富的高質(zhì)量原始語料數(shù)據(jù)儲備。據(jù)了解，如今商湯可以每月產(chǎn)出超過2萬億token的高質(zhì)量數(shù)據(jù)，預(yù)計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token。

　　值得一提的是，商湯一直以來都是開源的積極擁護者。在徐立看來，大模型開源能夠使行業(yè)和自身從更廣泛的合作創(chuàng)新中受益。大語言模型同樣通過擁抱開源，從生態(tài)中吸取力量。

　　比如近期商湯開源的InternLM-7B(70億參數(shù))，在多個模型測試榜單高踞榜首，成為性能最好的輕量級基模型。在部分榜單上，InternLM-7B甚至超過了參數(shù)量更大的130億參數(shù)的LLaMA2的模型。接下來InternLM-20B模型(200億參數(shù))也將迎來開源。據(jù)悉，InternLM-20B具備優(yōu)秀的工具調(diào)用能力，且運行成本較低，適合構(gòu)建各類AI應(yīng)用。

　　而在開源之外，商湯同樣致力于打造具有競爭力且好用的“基座模型”，支持上萬個潛在行業(yè)大模型的需求。

　　這恰構(gòu)成了一個完善的閉環(huán)�？梢岳斫鉃椋陂_源、閉源的大模型服務(wù)模式，商湯在向外界展示強大底層模型的技術(shù)實力的同時，也更建立起新的飛輪，這個飛輪不僅是基于更大量級大模型使用頻次帶來的模型優(yōu)化，也更是從開源到閉源的“技術(shù)——商業(yè)”變現(xiàn)。

　　而這些，最終構(gòu)建出的恰是過去半年里商湯在大模型曲線上的不斷向上。

　　三、在新戰(zhàn)略里，重新理解商湯

　　在今年3月商湯科技發(fā)布的2022財報中，除了財務(wù)數(shù)字的披露外，另外一個值得關(guān)注的是商湯這家企業(yè)的公司愿景和戰(zhàn)略目標的進化。

　　這次改變的具體細節(jié)是，從之前“以人工智能實現(xiàn)物理世界和數(shù)字世界的連接，促進社會生產(chǎn)力可持續(xù)發(fā)展，并為人們帶來更好的虛實結(jié)合生活體驗”，轉(zhuǎn)型為“將通用人工智能(AGI)作為核心戰(zhàn)略目標，以期在未來幾年內(nèi)實現(xiàn)AGI技術(shù)的重大突破”。

　　在近期的財報電話會上，徐立將這一戰(zhàn)略進一步細化。“下半年，我們會借助豐厚的數(shù)據(jù)和算力資源，來制作更強的基模型。通過開源和商業(yè)化的雙重推動，2024年，商湯的目標是成為領(lǐng)先的生成式AI應(yīng)用生態(tài)平臺。”

　　徐立表示，希望給行業(yè)帶來更強的大模型能力，助力用戶在生成式AI的時代作出顛覆性的產(chǎn)品，來獲得成功。”

　　一個明顯的感知是，商湯對未來的戰(zhàn)略路徑已然更加清晰。

　　對于始終深耕AI的企業(yè)，有人曾有一個形象的比喻，這波大模型驅(qū)動的新AI浪潮的來臨，恰像是一場球賽進行到中場，一些站在球門附近的人，“突然”接到了球。

　　站在球門附近，這是對商湯們的最佳側(cè)寫。幾個數(shù)字是，在今年上半年，商湯基于AI的研發(fā)投入超過17.83億元，而在過去5年里，其累計研發(fā)投入更是超過140億。

　　這些資金背后對應(yīng)的是商湯對于AI路徑的絕對堅持和持續(xù)深耕。而在過去AI不具備強工程落地能力的幾年時間里，這種一直站在“門口”的動作往往不被外界理解。

　　但在如今的大模型時代，這些超過10年的積累和投入最終轉(zhuǎn)化成為商湯在AGI落地的絕對加速度，以及當下愈發(fā)明確的前進和自證路徑。

　　這種證明更來自社會層面。

　　根據(jù)弗若斯特沙利文發(fā)布的《AI大模型市場研究報告(2023)》顯示，商湯在產(chǎn)品技術(shù)、戰(zhàn)略愿景以及生態(tài)開放構(gòu)建等綜合競爭力位列國內(nèi)第一。此外，就在上周，商湯“商量SenseChat”正式成為首批獲批上線向社會開放的大模型產(chǎn)品。

　　可以說，商湯還是那個商湯，始終堅持在AGI領(lǐng)域持續(xù)研發(fā)和深耕。但在大模型AI形態(tài)的加持下，它更多的產(chǎn)品、更多的技術(shù)，正在越來越多地落地到一眾產(chǎn)業(yè)場景，也更多地被市場和企業(yè)看見和接納。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信