5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團隊前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過這道檻!Livekit 開源模型精準識別“你是否說完”!DeepSeek開源大模型開發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復(fù)合翼飛行汽車 GOVY AirJet:最高飛行速度可達 250km/h清華大學聯(lián)合騰訊出品!ColorFlow:自動給黑白漫畫上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o3:AI 推理能力的重大突破,得分高達87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動6000億GTV后,抖音計劃偷襲美團大本營AGI Open Network(AON):賦能每個人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來電”有詐?抖音客服上線“驗證助手”助用戶識別詐騙OpenAI新模型GPT-5研發(fā)未達預(yù)期:成本高昂 效果不佳曝天馬打入果鏈:為蘋果HomePod供應(yīng)LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運營商e&,展示全球首個固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案
  • 首頁 > 云計算頻道 > 大模型

    沸騰的大模型:誰在成為主角?

    2023年09月07日 15:04:39   來源:新摘商業(yè)評論

      作者/皮爺

      出品/新摘商業(yè)評論

      670.4%——這是在2023年中期業(yè)績報告中,商湯給出的生成式AI相關(guān)業(yè)務(wù)增長數(shù)字。與此同時,今年上半年,商湯整體營收增速轉(zhuǎn)正,實現(xiàn)收入14.3億元。

      商湯,這個AI老兵,再次站到了舞臺中央。

      過去半年的大模型浪潮里,如果說在一眾中國選手里誰的身影更為清晰,商湯絕對是最佳選項之一。關(guān)于這家AI原生的企業(yè),市場已經(jīng)看到了太多的亮眼標簽。比如商湯是最早發(fā)布大模型系列產(chǎn)品的廠商之一,旗下商量SenseChat是國內(nèi)最早推出的基于千億參數(shù)大語言模型的聊天機器人產(chǎn)品之一;再比如,商湯聯(lián)合多家國內(nèi)頂尖科研機構(gòu)發(fā)布了首個綜合性能全面超越GPT-3.5-turbo的基模型InternLM等等。

      對于商湯,人們不陌生。但盡管如此,對于如今在大模型潮流里有足夠清晰的聲音傳遞出來的商湯而言,其也在AI加速落地的當下不斷刷新著人們對它的新定義。

      在如今“百模征戰(zhàn)”的大模型時代,一個經(jīng)常被提出,也更是市場關(guān)心的問題恰是:誰能成為最終的底層大模型選項?或者說,誰能成為中國產(chǎn)業(yè)數(shù)字化浪潮的真正賦能者?

      在大模型熱度逐漸冷靜的當下,這個問題的答案已然不僅是關(guān)于技術(shù)本身,也更是關(guān)于產(chǎn)品,關(guān)于服務(wù),關(guān)于對產(chǎn)業(yè)的理解和深耕。

      而這里,也已然成為商湯們自證價值的最佳考場。

      一、AI潮水里,一張新成績單

      “商湯迎來了極其關(guān)鍵的發(fā)展時期。”商湯CEO徐立在財報公布的電話會上這樣說道。作為商湯董事會執(zhí)行主席兼首席執(zhí)行官,在過去的半年時間里,他和商湯一起站上了AI的舞臺。

      今年5月份,陸奇在北京舉行了一場超千人規(guī)模、主題為《新范式新時代新機會》的演講,全程超三個小時,其中他的核心觀點是,大模型將帶來范式技術(shù)革命,它將改變一切產(chǎn)業(yè)世界,未來也將無處不在。

      在具體的闡述環(huán)節(jié),他也更明確表達,中國大模型企業(yè)要奮起直追,在基礎(chǔ)模型層面,要建立達到GPT-3.5到GPT-4的模型能力,搶先進入第一梯隊。

      就在這番話落地的僅1個月后,有一家企業(yè)就宣布其基模型性能超過GPT-3.5-turbo,正是商湯聯(lián)合多家國內(nèi)頂尖科研機構(gòu)發(fā)布的大語言模型書生·浦語(InternLM),參數(shù)規(guī)模為1040億,成為當時國內(nèi)首個在多個權(quán)威評測集上超越ChatGPT水平的基模型。

      8月,更新的模型成果被披露,新模型 InternLM-123B 完成訓練,參數(shù)量提升至1230億,在全球51個知名評測集共計30萬道問題中測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型。

      據(jù)介紹,InternLM-123B的語言、知識、理解、推理和學科等能力均顯著提高,還重點升級了代碼解釋器及插件調(diào)用能力(function calling),可使用python解釋器、API調(diào)用和搜索三類常用工具來解決復(fù)雜任務(wù)、靈活搭建AI智能體應(yīng)用。

      徐立在財報電話會上重申了工具調(diào)用能力的意義。“只會‘聊天’的模型是很難轉(zhuǎn)化成生產(chǎn)力的,能夠準確使用工具的大模型是解放行業(yè)生產(chǎn)力的關(guān)鍵。”

      商湯的文生圖大模型秒畫也在飛速迭代,短短幾個月內(nèi)由1.0版本升級至3.0版本,基模型參數(shù)量提升至70億參數(shù),其核心算法在COCObenchmark上超過了谷歌的Imagen與OpenAI的DALL·E2,出圖效果躋身全球前列。

      這僅僅是商湯交出的成績單之一。

      更亮眼的成績來自商湯基于基模型的上層表達。 在基模型之上,除了商量和秒畫,商湯還推出了如影、瓊宇、格物等AI產(chǎn)品,分別對應(yīng)數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI場景。

      這些產(chǎn)品在過去半年時間里不僅被廣泛應(yīng)用到C端,也在一眾B端市場落地。

      財報數(shù)據(jù)顯示,今年上半年商湯智慧商業(yè)板塊收入同比增長50.2%,收入占比提升至60%,與十個行業(yè)的數(shù)百家客戶合作定制行業(yè)大模型,覆蓋能源、金融、地產(chǎn)、人力資源、傳媒、工業(yè)制造、咨詢等一眾垂直行業(yè)場景,單客戶收入提高59.9%。

      智慧生活板塊的表現(xiàn)同樣亮眼。 商湯在財報中透露,智慧生活已通過對手機、移動互聯(lián)網(wǎng)行業(yè)上百個客戶提供大模型賦能的新產(chǎn)品及新功能,最終觸達數(shù)億終端、中小企業(yè)與個人用戶。例如“如影”數(shù)字人如今已服務(wù)于央視、廣電、工商銀行等頭部客戶,并落地各類電商和直播類客戶;“格物”則已與香港最大的珠寶集團實現(xiàn)商品3D數(shù)字化合作等等。

      可以說,透過這次財報數(shù)據(jù),能清晰看到的是一根向上的企業(yè)發(fā)展陽線。 在這條勢頭強勁的曲線里,商湯向外界展示的不僅是自身的產(chǎn)品、技術(shù)和產(chǎn)業(yè)落地,更是商湯這家企業(yè)在AI浪潮下被無限放大的戰(zhàn)略活性。

      為什么商湯可以?或者說,為什么在如今波折不定的大模型潮水里,商湯走出的是一條足夠有確定性的曲線?

      二、誰在領(lǐng)跑大模型?

      實際上,這并不是一件容易的事。

      從企業(yè)的層面來看,大模型的落地背后對應(yīng)的不僅是其在參數(shù)、產(chǎn)品層面的不斷訓練和調(diào)整,更是在一個個產(chǎn)業(yè)場景中基于行業(yè)know-how的沉淀,不斷改進和適配,由定制化走向通用場景。

      想要實現(xiàn)真正的AGI,大模型仍要不斷進化迭代。這背后需要的則是算力、數(shù)據(jù)、系統(tǒng)等全方位的支撐。

      根據(jù)相關(guān)消息顯示,在如今OpenAI基于GPT-4的訓練中,其參數(shù)量級達1.8萬億巨量參數(shù),訓練一次的成本則是高達6300萬美元,甚至不止。其中不僅包括單純的邏輯推理,更包括如數(shù)據(jù)清洗、高質(zhì)量數(shù)據(jù)標注等等環(huán)節(jié)。

      但商湯卻有另外一條路。其頗具前瞻性的布局打造了算力基礎(chǔ)設(shè)施SenseCore AI大裝置。2022年全國最大智算中心上海臨港AIDC正式運營,推動 商湯的大裝置 持續(xù)升級。

      今年3月底,商湯大裝置就已經(jīng)完成2.7萬塊GPU的部署并實現(xiàn)了5ExaFLOPS的算力輸出能力,可最多支持20個千億參數(shù)量大模型(以千卡并行)同時訓練,最高可支持萬億參數(shù)超大模型的訓練,而根據(jù)此次財報數(shù)據(jù),如今其上線GPU數(shù)量提升到約3萬塊,算力規(guī)模已提升20%至6ExaFLOPS。

      基于大裝置的底層積累和充沛算力,商湯可以以更低成本和更高效地完成大模型從數(shù)據(jù)清洗、數(shù)據(jù)標注到邏輯訓練等一系列大模型“進化”所需工作。

      優(yōu)勢不僅在成本和速度,更在模型質(zhì)量和企業(yè)落地效果。盡管如今市面上大部分開源模型可以自由調(diào)用接口和模型能力,但其背后對應(yīng)的模型底層能力以及配套工具鏈相關(guān)能力并不完備,具體到產(chǎn)業(yè)場景側(cè)則是實際落地效果極差,甚至無法落地。

      而商湯的開源模型具備足夠扎實的底層模型能力,這離不開其豐富的高質(zhì)量原始語料數(shù)據(jù)儲備。 據(jù)了解,如今商湯可以每月產(chǎn)出超過2萬億token的高質(zhì)量數(shù)據(jù),預(yù)計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token。

      值得一提的是,商湯一直以來都是開源的積極擁護者。在徐立看來,大模型開源能夠使行業(yè)和自身從更廣泛的合作創(chuàng)新中受益。大語言模型同樣通過擁抱開源,從生態(tài)中吸取力量。

      比如近期商湯開源的InternLM-7B(70億參數(shù)),在多個模型測試榜單高踞榜首,成為性能最好的輕量級基模型。在部分榜單上,InternLM-7B甚至超過了參數(shù)量更大的130億參數(shù)的LLaMA2的模型。接下來InternLM-20B模型(200億參數(shù))也將迎來開源。據(jù)悉,InternLM-20B具備優(yōu)秀的工具調(diào)用能力,且運行成本較低,適合構(gòu)建各類AI應(yīng)用。

      而在開源之外,商湯同樣致力于打造具有競爭力且好用的“基座模型”,支持上萬個潛在行業(yè)大模型的需求。

      這恰構(gòu)成了一個完善的閉環(huán)?梢岳斫鉃椋陂_源、閉源的大模型服務(wù)模式,商湯在向外界展示強大底層模型的技術(shù)實力的同時,也更建立起新的飛輪,這個飛輪不僅是基于更大量級大模型使用頻次帶來的模型優(yōu)化,也更是從開源到閉源的“技術(shù)——商業(yè)”變現(xiàn)。

      而這些,最終構(gòu)建出的恰是過去半年里商湯在大模型曲線上的不斷向上。

      三、在新戰(zhàn)略里,重新理解商湯

      在今年3月商湯科技發(fā)布的2022財報中,除了財務(wù)數(shù)字的披露外,另外一個值得關(guān)注的是商湯這家企業(yè)的公司愿景和戰(zhàn)略目標的進化。

      這次改變的具體細節(jié)是,從之前“以人工智能實現(xiàn)物理世界和數(shù)字世界的連接,促進社會生產(chǎn)力可持續(xù)發(fā)展,并為人們帶來更好的虛實結(jié)合生活體驗”,轉(zhuǎn)型為“將通用人工智能(AGI)作為核心戰(zhàn)略目標,以期在未來幾年內(nèi)實現(xiàn)AGI技術(shù)的重大突破”。

      在近期的財報電話會上,徐立將這一戰(zhàn)略進一步細化。“下半年,我們會借助豐厚的數(shù)據(jù)和算力資源,來制作更強的基模型。通過開源和商業(yè)化的雙重推動,2024年,商湯的目標是成為領(lǐng)先的生成式AI應(yīng)用生態(tài)平臺。”

      徐立表示,希望給行業(yè)帶來更強的大模型能力,助力用戶在生成式AI的時代作出顛覆性的產(chǎn)品,來獲得成功。”

      一個明顯的感知是,商湯對未來的戰(zhàn)略路徑已然更加清晰。

      對于始終深耕AI的企業(yè),有人曾有一個形象的比喻,這波大模型驅(qū)動的新AI浪潮的來臨,恰像是一場球賽進行到中場,一些站在球門附近的人,“突然”接到了球。

      站在球門附近,這是對商湯們的最佳側(cè)寫。幾個數(shù)字是,在今年上半年,商湯基于AI的研發(fā)投入超過17.83億元,而在過去5年里,其累計研發(fā)投入更是超過140億。

      這些資金背后對應(yīng)的是商湯對于AI路徑的絕對堅持和持續(xù)深耕。而在過去AI不具備強工程落地能力的幾年時間里,這種一直站在“門口”的動作往往不被外界理解。

      但在如今的大模型時代,這些超過10年的積累和投入最終轉(zhuǎn)化成為商湯在AGI落地的絕對加速度,以及當下愈發(fā)明確的前進和自證路徑。

      這種證明更來自社會層面。

      根據(jù)弗若斯特沙利文發(fā)布的《AI大模型市場研究報告(2023)》顯示,商湯在產(chǎn)品技術(shù)、戰(zhàn)略愿景以及生態(tài)開放構(gòu)建等綜合競爭力位列國內(nèi)第一。此外,就在上周,商湯“商量SenseChat”正式成為首批獲批上線向社會開放的大模型產(chǎn)品。

      可以說,商湯還是那個商湯,始終堅持在AGI領(lǐng)域持續(xù)研發(fā)和深耕。但在大模型AI形態(tài)的加持下,它更多的產(chǎn)品、更多的技術(shù),正在越來越多地落地到一眾產(chǎn)業(yè)場景,也更多地被市場和企業(yè)看見和接納。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。