拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資植物生長好幫手:廣明源金線蓮組培燈照亮生長每一步ROG純白系列DIY好物:簡約不失高雅,買它準沒錯!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認證并投入市場安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎電動自行車強制性“國標(biāo)”再修訂,綠源電動車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對承壓的小家電市場,小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機僅有iPad大小2024年冷年空調(diào)市場總結(jié):規(guī)模下探,結(jié)構(gòu)降級,空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機型蓄勢待發(fā)云天勵飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革
  • 首頁 > 云計算頻道 > 大模型

    沸騰的大模型:誰在成為主角?

    2023年09月07日 15:04:39   來源:新摘商業(yè)評論

      作者/皮爺

      出品/新摘商業(yè)評論

      670.4%——這是在2023年中期業(yè)績報告中,商湯給出的生成式AI相關(guān)業(yè)務(wù)增長數(shù)字。與此同時,今年上半年,商湯整體營收增速轉(zhuǎn)正,實現(xiàn)收入14.3億元。

      商湯,這個AI老兵,再次站到了舞臺中央。

      過去半年的大模型浪潮里,如果說在一眾中國選手里誰的身影更為清晰,商湯絕對是最佳選項之一。關(guān)于這家AI原生的企業(yè),市場已經(jīng)看到了太多的亮眼標(biāo)簽。比如商湯是最早發(fā)布大模型系列產(chǎn)品的廠商之一,旗下商量SenseChat是國內(nèi)最早推出的基于千億參數(shù)大語言模型的聊天機器人產(chǎn)品之一;再比如,商湯聯(lián)合多家國內(nèi)頂尖科研機構(gòu)發(fā)布了首個綜合性能全面超越GPT-3.5-turbo的基模型InternLM等等。

      對于商湯,人們不陌生。但盡管如此,對于如今在大模型潮流里有足夠清晰的聲音傳遞出來的商湯而言,其也在AI加速落地的當(dāng)下不斷刷新著人們對它的新定義。

      在如今“百模征戰(zhàn)”的大模型時代,一個經(jīng)常被提出,也更是市場關(guān)心的問題恰是:誰能成為最終的底層大模型選項?或者說,誰能成為中國產(chǎn)業(yè)數(shù)字化浪潮的真正賦能者?

      在大模型熱度逐漸冷靜的當(dāng)下,這個問題的答案已然不僅是關(guān)于技術(shù)本身,也更是關(guān)于產(chǎn)品,關(guān)于服務(wù),關(guān)于對產(chǎn)業(yè)的理解和深耕。

      而這里,也已然成為商湯們自證價值的最佳考場。

      一、AI潮水里,一張新成績單

      “商湯迎來了極其關(guān)鍵的發(fā)展時期。”商湯CEO徐立在財報公布的電話會上這樣說道。作為商湯董事會執(zhí)行主席兼首席執(zhí)行官,在過去的半年時間里,他和商湯一起站上了AI的舞臺。

      今年5月份,陸奇在北京舉行了一場超千人規(guī)模、主題為《新范式新時代新機會》的演講,全程超三個小時,其中他的核心觀點是,大模型將帶來范式技術(shù)革命,它將改變一切產(chǎn)業(yè)世界,未來也將無處不在。

      在具體的闡述環(huán)節(jié),他也更明確表達,中國大模型企業(yè)要奮起直追,在基礎(chǔ)模型層面,要建立達到GPT-3.5到GPT-4的模型能力,搶先進入第一梯隊。

      就在這番話落地的僅1個月后,有一家企業(yè)就宣布其基模型性能超過GPT-3.5-turbo,正是商湯聯(lián)合多家國內(nèi)頂尖科研機構(gòu)發(fā)布的大語言模型書生·浦語(InternLM),參數(shù)規(guī)模為1040億,成為當(dāng)時國內(nèi)首個在多個權(quán)威評測集上超越ChatGPT水平的基模型。

      8月,更新的模型成果被披露,新模型 InternLM-123B 完成訓(xùn)練,參數(shù)量提升至1230億,在全球51個知名評測集共計30萬道問題中測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型。

      據(jù)介紹,InternLM-123B的語言、知識、理解、推理和學(xué)科等能力均顯著提高,還重點升級了代碼解釋器及插件調(diào)用能力(function calling),可使用python解釋器、API調(diào)用和搜索三類常用工具來解決復(fù)雜任務(wù)、靈活搭建AI智能體應(yīng)用。

      徐立在財報電話會上重申了工具調(diào)用能力的意義。“只會‘聊天’的模型是很難轉(zhuǎn)化成生產(chǎn)力的,能夠準確使用工具的大模型是解放行業(yè)生產(chǎn)力的關(guān)鍵。”

      商湯的文生圖大模型秒畫也在飛速迭代,短短幾個月內(nèi)由1.0版本升級至3.0版本,基模型參數(shù)量提升至70億參數(shù),其核心算法在COCObenchmark上超過了谷歌的Imagen與OpenAI的DALL·E2,出圖效果躋身全球前列。

      這僅僅是商湯交出的成績單之一。

      更亮眼的成績來自商湯基于基模型的上層表達。 在基模型之上,除了商量和秒畫,商湯還推出了如影、瓊宇、格物等AI產(chǎn)品,分別對應(yīng)數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI場景。

      這些產(chǎn)品在過去半年時間里不僅被廣泛應(yīng)用到C端,也在一眾B端市場落地。

      財報數(shù)據(jù)顯示,今年上半年商湯智慧商業(yè)板塊收入同比增長50.2%,收入占比提升至60%,與十個行業(yè)的數(shù)百家客戶合作定制行業(yè)大模型,覆蓋能源、金融、地產(chǎn)、人力資源、傳媒、工業(yè)制造、咨詢等一眾垂直行業(yè)場景,單客戶收入提高59.9%。

      智慧生活板塊的表現(xiàn)同樣亮眼。 商湯在財報中透露,智慧生活已通過對手機、移動互聯(lián)網(wǎng)行業(yè)上百個客戶提供大模型賦能的新產(chǎn)品及新功能,最終觸達數(shù)億終端、中小企業(yè)與個人用戶。例如“如影”數(shù)字人如今已服務(wù)于央視、廣電、工商銀行等頭部客戶,并落地各類電商和直播類客戶;“格物”則已與香港最大的珠寶集團實現(xiàn)商品3D數(shù)字化合作等等。

      可以說,透過這次財報數(shù)據(jù),能清晰看到的是一根向上的企業(yè)發(fā)展陽線。 在這條勢頭強勁的曲線里,商湯向外界展示的不僅是自身的產(chǎn)品、技術(shù)和產(chǎn)業(yè)落地,更是商湯這家企業(yè)在AI浪潮下被無限放大的戰(zhàn)略活性。

      為什么商湯可以?或者說,為什么在如今波折不定的大模型潮水里,商湯走出的是一條足夠有確定性的曲線?

      二、誰在領(lǐng)跑大模型?

      實際上,這并不是一件容易的事。

      從企業(yè)的層面來看,大模型的落地背后對應(yīng)的不僅是其在參數(shù)、產(chǎn)品層面的不斷訓(xùn)練和調(diào)整,更是在一個個產(chǎn)業(yè)場景中基于行業(yè)know-how的沉淀,不斷改進和適配,由定制化走向通用場景。

      想要實現(xiàn)真正的AGI,大模型仍要不斷進化迭代。這背后需要的則是算力、數(shù)據(jù)、系統(tǒng)等全方位的支撐。

      根據(jù)相關(guān)消息顯示,在如今OpenAI基于GPT-4的訓(xùn)練中,其參數(shù)量級達1.8萬億巨量參數(shù),訓(xùn)練一次的成本則是高達6300萬美元,甚至不止。其中不僅包括單純的邏輯推理,更包括如數(shù)據(jù)清洗、高質(zhì)量數(shù)據(jù)標(biāo)注等等環(huán)節(jié)。

      但商湯卻有另外一條路。其頗具前瞻性的布局打造了算力基礎(chǔ)設(shè)施SenseCore AI大裝置。2022年全國最大智算中心上海臨港AIDC正式運營,推動 商湯的大裝置 持續(xù)升級。

      今年3月底,商湯大裝置就已經(jīng)完成2.7萬塊GPU的部署并實現(xiàn)了5ExaFLOPS的算力輸出能力,可最多支持20個千億參數(shù)量大模型(以千卡并行)同時訓(xùn)練,最高可支持萬億參數(shù)超大模型的訓(xùn)練,而根據(jù)此次財報數(shù)據(jù),如今其上線GPU數(shù)量提升到約3萬塊,算力規(guī)模已提升20%至6ExaFLOPS。

      基于大裝置的底層積累和充沛算力,商湯可以以更低成本和更高效地完成大模型從數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注到邏輯訓(xùn)練等一系列大模型“進化”所需工作。

      優(yōu)勢不僅在成本和速度,更在模型質(zhì)量和企業(yè)落地效果。盡管如今市面上大部分開源模型可以自由調(diào)用接口和模型能力,但其背后對應(yīng)的模型底層能力以及配套工具鏈相關(guān)能力并不完備,具體到產(chǎn)業(yè)場景側(cè)則是實際落地效果極差,甚至無法落地。

      而商湯的開源模型具備足夠扎實的底層模型能力,這離不開其豐富的高質(zhì)量原始語料數(shù)據(jù)儲備。 據(jù)了解,如今商湯可以每月產(chǎn)出超過2萬億token的高質(zhì)量數(shù)據(jù),預(yù)計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token。

      值得一提的是,商湯一直以來都是開源的積極擁護者。在徐立看來,大模型開源能夠使行業(yè)和自身從更廣泛的合作創(chuàng)新中受益。大語言模型同樣通過擁抱開源,從生態(tài)中吸取力量。

      比如近期商湯開源的InternLM-7B(70億參數(shù)),在多個模型測試榜單高踞榜首,成為性能最好的輕量級基模型。在部分榜單上,InternLM-7B甚至超過了參數(shù)量更大的130億參數(shù)的LLaMA2的模型。接下來InternLM-20B模型(200億參數(shù))也將迎來開源。據(jù)悉,InternLM-20B具備優(yōu)秀的工具調(diào)用能力,且運行成本較低,適合構(gòu)建各類AI應(yīng)用。

      而在開源之外,商湯同樣致力于打造具有競爭力且好用的“基座模型”,支持上萬個潛在行業(yè)大模型的需求。

      這恰構(gòu)成了一個完善的閉環(huán)。可以理解為,基于開源、閉源的大模型服務(wù)模式,商湯在向外界展示強大底層模型的技術(shù)實力的同時,也更建立起新的飛輪,這個飛輪不僅是基于更大量級大模型使用頻次帶來的模型優(yōu)化,也更是從開源到閉源的“技術(shù)——商業(yè)”變現(xiàn)。

      而這些,最終構(gòu)建出的恰是過去半年里商湯在大模型曲線上的不斷向上。

      三、在新戰(zhàn)略里,重新理解商湯

      在今年3月商湯科技發(fā)布的2022財報中,除了財務(wù)數(shù)字的披露外,另外一個值得關(guān)注的是商湯這家企業(yè)的公司愿景和戰(zhàn)略目標(biāo)的進化。

      這次改變的具體細節(jié)是,從之前“以人工智能實現(xiàn)物理世界和數(shù)字世界的連接,促進社會生產(chǎn)力可持續(xù)發(fā)展,并為人們帶來更好的虛實結(jié)合生活體驗”,轉(zhuǎn)型為“將通用人工智能(AGI)作為核心戰(zhàn)略目標(biāo),以期在未來幾年內(nèi)實現(xiàn)AGI技術(shù)的重大突破”。

      在近期的財報電話會上,徐立將這一戰(zhàn)略進一步細化。“下半年,我們會借助豐厚的數(shù)據(jù)和算力資源,來制作更強的基模型。通過開源和商業(yè)化的雙重推動,2024年,商湯的目標(biāo)是成為領(lǐng)先的生成式AI應(yīng)用生態(tài)平臺。”

      徐立表示,希望給行業(yè)帶來更強的大模型能力,助力用戶在生成式AI的時代作出顛覆性的產(chǎn)品,來獲得成功。”

      一個明顯的感知是,商湯對未來的戰(zhàn)略路徑已然更加清晰。

      對于始終深耕AI的企業(yè),有人曾有一個形象的比喻,這波大模型驅(qū)動的新AI浪潮的來臨,恰像是一場球賽進行到中場,一些站在球門附近的人,“突然”接到了球。

      站在球門附近,這是對商湯們的最佳側(cè)寫。幾個數(shù)字是,在今年上半年,商湯基于AI的研發(fā)投入超過17.83億元,而在過去5年里,其累計研發(fā)投入更是超過140億。

      這些資金背后對應(yīng)的是商湯對于AI路徑的絕對堅持和持續(xù)深耕。而在過去AI不具備強工程落地能力的幾年時間里,這種一直站在“門口”的動作往往不被外界理解。

      但在如今的大模型時代,這些超過10年的積累和投入最終轉(zhuǎn)化成為商湯在AGI落地的絕對加速度,以及當(dāng)下愈發(fā)明確的前進和自證路徑。

      這種證明更來自社會層面。

      根據(jù)弗若斯特沙利文發(fā)布的《AI大模型市場研究報告(2023)》顯示,商湯在產(chǎn)品技術(shù)、戰(zhàn)略愿景以及生態(tài)開放構(gòu)建等綜合競爭力位列國內(nèi)第一。此外,就在上周,商湯“商量SenseChat”正式成為首批獲批上線向社會開放的大模型產(chǎn)品。

      可以說,商湯還是那個商湯,始終堅持在AGI領(lǐng)域持續(xù)研發(fā)和深耕。但在大模型AI形態(tài)的加持下,它更多的產(chǎn)品、更多的技術(shù),正在越來越多地落地到一眾產(chǎn)業(yè)場景,也更多地被市場和企業(yè)看見和接納。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。