中國品牌,讓東南亞感受“消費升級”小紅書本地“坐抖望團”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    生成式AI之戰(zhàn) 誰能破局而出?

    2023年04月21日 10:48:56   來源:互聯(lián)網(wǎng)那些事

      隨著騰訊的入局,國內(nèi)生成式AI大模型賽道集齊BAT三大巨頭,競爭日趨白熱化。

      4月14日,騰訊云發(fā)布面向大模型訓(xùn)練的新一代高性能計算集群,搭載英偉達(dá)最新一代H800 GPU,服務(wù)器互聯(lián)帶寬高達(dá)3.2T,算力性能較上一代提升3倍,號稱目前國內(nèi)性能最強的大模型計算集群。

      除了算力基礎(chǔ)設(shè)施,騰訊去年6月發(fā)布混元大模型,微信也在去年10月發(fā)布WeML大模型。在上月底的財報電話會議上,騰訊總裁劉熾平表示,對于騰訊整個業(yè)務(wù)來說,AI及大模型是一個增長的擴大器。

      在騰訊下場之前,百度、阿里和華為等公司已經(jīng)先后落子這一領(lǐng)域。

      3月中旬,百度推出“文心一言”;半個多月后,華為在一場行業(yè)峰會上披露了“盤古”大模型的研發(fā)及落地情況;4月11日,阿里大模型“通義千問”高調(diào)亮相,未來將接入阿里全線業(yè)務(wù)。

      與此同時,360、網(wǎng)易、知乎、科大訊飛、昆侖萬維等先后公布自己的大模型;此前淡出中心舞臺的王慧文和王小川重出江湖,迅速敲定數(shù)千萬美元的融資,正在四處招兵買馬。

      掀起新技術(shù)浪潮的AI大模型,已經(jīng)成為科技公司必須參加的一場大考。在AI領(lǐng)域深耕多年的商湯科技,也在本月交出自己的答卷。

      Part 1 入局AI大模型“馬拉松”

      4月10日,商湯公布以“大模型+大算力”推進AGI(通用人工智能)發(fā)展的戰(zhàn)略布局,并發(fā)布“日日新SenseNova”大模型體系,涵蓋自然語言處理、圖片視頻及3D內(nèi)容生成、自動化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力。

      其中,最引人關(guān)注的是“商量SenseChat”,一款千億級參數(shù)的自然語言處理大模型。在現(xiàn)場演示中,SenseChat能夠結(jié)合上下文語境,流暢準(zhǔn)確地回答各類問題,還具備超長文本理解能力,可以從復(fù)雜文檔中提取和概括信息,幫助開發(fā)者編程,提供個性化的健康咨詢等。

      此外,商湯還展示了多款基于大模型體系的生成式AI模型及應(yīng)用:“秒畫SenseMirage”AI內(nèi)容創(chuàng)作社區(qū)平臺可以根據(jù)文本生成圖片,擁有超10億參數(shù),支持二次元、三次元等多種生成風(fēng)格,最高支持6K分辨率,還可支持自行上傳數(shù)據(jù)集進行finetune、自訓(xùn)練等功能,定制訓(xùn)練屬于自己風(fēng)格的LoRA模型,顯著降低模型的訓(xùn)練門檻;“如影SenseAvatar”AI數(shù)字人視頻生成平臺僅需一段5分鐘的真人視頻素材,即可生成數(shù)字人分身;“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺能夠生成大模型3D場景和精細(xì)3D物件,為搭建元宇宙虛擬空間提供高效、低成本的工具。

      AI大模型是中國科技企業(yè)的又一塊兵家必爭之地。隨著BAT等互聯(lián)網(wǎng)公司,以及商湯、科大訊飛等AI老兵的入局,每個人都摩拳擦掌、躍躍欲試,準(zhǔn)備大干一場。

      業(yè)內(nèi)人士普遍認(rèn)為,國產(chǎn)大模型與GPT至少有2~3年的差距。怎樣盡快趕上世界先進水平,是擺在大大小小玩家面前的命題。將這一命題拆解開來,最關(guān)鍵的是數(shù)據(jù)、算法和算力三大要素。

      三要素中,算法的研發(fā)難度相對較低,且有眾多開源項目可作為參考,中國公司最容易縮短甚至抹平差距;但在數(shù)據(jù)和算力方面,想要拉近與OpenAI的距離要困難得多。它需要更漫長的積累沉淀,也需要企業(yè)持之以恒地拿出真金白銀,投入到AI相關(guān)的“硬科技”中。

      這也意味著,大模型之爭不是一場停留在應(yīng)用層面的百米賽跑,而是一場由綜合能力定勝負(fù)的馬拉松。誰能在數(shù)據(jù)和算力上建立壁壘,誰就有望率先踏入生成式AI的新時代,在新技術(shù)浪潮中吃到更多紅利。

      Part 2 數(shù)據(jù)和算力,AI大模型兩大根基

      ChatGPT之所以一鳴驚人、經(jīng)受住了上億用戶不同場景下的考驗,首先得益于OpenAI給它“投喂”了大量數(shù)據(jù)。

      OpenAI此前披露,為了AI像人類那樣流暢交談,研發(fā)人員給GPT-3.5提供多達(dá)45TB的文本語料,相當(dāng)于472萬套中國“四大名著”。這些語料的來源包括維基百科、網(wǎng)絡(luò)文章、書籍期刊等,甚至還將代碼開源平臺Github納入其中。

      豐富而龐大的語料庫,讓ChatGPT不僅能夠聊天、講故事,還會回答專業(yè)問題、幫學(xué)生寫作業(yè)、給碼農(nóng)寫代碼。在一些讀寫測試中,ChatGPT展現(xiàn)出來的能力不亞于高中生。

      與之類似,商湯語言大模型SenseChat也使用了大量數(shù)據(jù)進行訓(xùn)練,并充分考慮中文語境,能夠更好地理解和處理中文文本。在發(fā)布會上,SenseChat一問一答應(yīng)對自如,甚至還能夠根據(jù)《專利法》答疑解惑,結(jié)合法條和最新資訊給出合理答案。

      可以看出,足夠多、足夠豐富的數(shù)據(jù),是生成式AI大模型的根基。商湯在這方面有自己的獨特優(yōu)勢。

      商湯的AI技術(shù)和產(chǎn)品已經(jīng)在眾多領(lǐng)域得到應(yīng)用,在長期實踐中,商湯積累了大量真實世界的高質(zhì)量視覺數(shù)據(jù),視覺信息可以轉(zhuǎn)化為更多結(jié)構(gòu)化的表達(dá),形成豐富的多模態(tài)語料庫,為大模型研發(fā)奠定基礎(chǔ)。正如商湯董事長兼CEO徐立所言,“商湯積累了大量視覺類信息,這類信息作為知識,輸入我們的多模態(tài)網(wǎng)絡(luò)中,會帶來完全不一樣的數(shù)據(jù)基礎(chǔ)。”不斷增長的多模態(tài)數(shù)據(jù)池,讓商湯從源頭上建立了壁壘。

      視覺大模型是商湯的核心技術(shù)突破點。早在2019年,商湯就發(fā)布了10億參數(shù)的視覺大模型,2022年擴大至320億參數(shù),為迄今為止全球最大的視覺模型。而在自然語言處理、多模態(tài)和生成式AI大模型方面,商湯也已有產(chǎn)品落地。這些大模型的迭代生長和融合匯聚,最終造就了商湯SenseNova大模型體系。

      除了海量數(shù)據(jù),大算力是大模型的另一個根基。

      AI大模型所需要的計算量,大致上相當(dāng)于參數(shù)量與數(shù)據(jù)量的乘積。而大模型之所以“大”,就是因為參數(shù)眾多和數(shù)據(jù)量龐大。過去5年,AI大模型的參數(shù)量幾乎每年提升一個數(shù)量級,例如GPT-4參數(shù)量是GPT-3的16倍,達(dá)到1.6萬億個;而隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入,大模型的數(shù)據(jù)量也在飛速膨脹。

      這意味著,想要玩轉(zhuǎn)大模型,必須擁有大算力。OpenAI在生成式AI賽道上一騎絕塵,關(guān)鍵能力之一就是空前強大的算力底座。僅僅是為了跑出GPT-3.5模型,OpenAI就使用了約1萬顆英偉達(dá)GPU來訓(xùn)練。

      商湯很早就開始建設(shè)自己的算力底座。2018年前后,商湯就著手籌備大模型所需的算力、算法、數(shù)據(jù)等方面的工作;2022年1月,造價數(shù)十億元的商湯人工智能計算中心(AIDC)交付使用,初始峰值算力達(dá)到3740 Petaflops,已具備完整訓(xùn)練萬億參數(shù)規(guī)模的大模型的能力。再加上數(shù)據(jù)層和模型層,商湯AI大裝置逐漸成型。

      如今,商湯的AI大裝置SenseCore,依靠2.7萬塊GPU,其算力達(dá)到5000 Petaflops,可支持20個千億參數(shù)超大模型同時訓(xùn)練,并提供涵蓋數(shù)據(jù)、訓(xùn)練工具、推理部署、性能優(yōu)化一條龍的大模型基礎(chǔ)設(shè)施服務(wù)體系。

      不過,AI大裝置的效能如何,總算力并不是唯一指標(biāo)。在日常應(yīng)用中,AI大裝置需要盡可能提高多卡并行狀態(tài)下的算力利用率,盡可能保持長時間穩(wěn)定運行。目前,SenseCore支持最大4000卡并行單任務(wù)訓(xùn)練,實現(xiàn)了多卡并行狀態(tài)下的高算力利用率,還能持續(xù)7天以上不間斷穩(wěn)定訓(xùn)練。

      此外,SenseCore提供了模塊化、全鏈條的數(shù)據(jù)、訓(xùn)練及推理能力,可實現(xiàn)百億級數(shù)據(jù)管理及檢索、人工標(biāo)注服務(wù),一鍵量化、一鍵部署、一鍵應(yīng)用,實現(xiàn)大模型快速上線驗證。

      自研自建的算力底座,為商湯在大模型領(lǐng)域施展手腳提供了舞臺。

      像SenseCore這樣的AI大裝置,其價值不僅體現(xiàn)在對于商湯現(xiàn)有大模型的支撐上,更指向未來發(fā)展。在源源不斷的數(shù)據(jù)澆灌下,AI大裝置能夠以更高效、更經(jīng)濟的方式批量訓(xùn)練大模型,并縮短從研發(fā)到部署再到應(yīng)用的鏈條,成為商湯大模型體系應(yīng)用落地的推力引擎。

      Part 3 政策指引行業(yè)發(fā)展,AI大模型加速落地

      目前,生成式AI大模型已經(jīng)成為全球各國的關(guān)注焦點。作為下一代互聯(lián)網(wǎng)的關(guān)鍵基礎(chǔ)設(shè)施,中國科技行業(yè)正在積極自主研發(fā)大模型,而配套的監(jiān)管政策也已在路上。

      近日,國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》。征求意見稿指出,國家支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應(yīng)用、國際合作,鼓勵優(yōu)先采用安全可信的軟件、工具、計算和數(shù)據(jù)資源。

      同時,征求意見稿對于生成式AI產(chǎn)品及服務(wù)的提供者做出多項明確要求,包括遵守法律法規(guī)的要求,尊重社會公德、公序良俗等,為其發(fā)展路徑指明方向、劃定紅線。

      上述文件有望成為國內(nèi)生成式AI產(chǎn)業(yè)的首份監(jiān)管文件。它在釋放鼓勵發(fā)展的積極信號的同時,也設(shè)置了一系列監(jiān)管規(guī)則,目標(biāo)是促進生成式AI的健康發(fā)展和規(guī)范應(yīng)用。

      各領(lǐng)域企業(yè)正在積極擁抱生成式AI,利用新技術(shù)實現(xiàn)降本增效,并把AI能力輸出給第三方企業(yè),勾勒出充滿想象空間的商業(yè)化圖景。

      以阿里為例,除了通義千問接入阿里的所有產(chǎn)品外,阿里云的AI能力和算力也已經(jīng)在多個企業(yè)和機構(gòu)落地,包括OPPO、南方電網(wǎng)、復(fù)旦大學(xué)等。此外,吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌閱科技等多家企業(yè)表示,將與阿里云在大模型相關(guān)場景展開技術(shù)合作的探索和共創(chuàng)。

      商湯最新發(fā)布的日日新SenseNova大模型體系,同樣應(yīng)用于諸多行業(yè)和場景,目前已落地20多個業(yè)務(wù)場景。

      比如,智能汽車是商湯長期布局的賽道。2022年,商湯智能汽車板塊量產(chǎn)交付數(shù)超50萬輛,新增定點數(shù)超800萬輛,覆蓋30多家車企的80多款車型。如今,隨著SenseNova大模型體系的推出,商湯正通過AI大模型進一步賦能自動駕駛和智能車艙的產(chǎn)品研發(fā)。

      在本周的上海車展上,商湯展示了與SenseNova深入融合的絕影未來展示艙。在展示艙內(nèi),商量SenseChat可以與用戶交流、推薦個性化內(nèi)容,甚至自動提煉郵件信息,幫助節(jié)省閱讀時間,如果是兒童上車后還會自動推薦進入兒童模式;而秒畫SenseMirage能夠為用戶自動生成各種風(fēng)格的照片,為出行增添樂趣。

      借助大模型能力,商湯實現(xiàn)了BEV環(huán)視感知在國內(nèi)首批量產(chǎn)落地,還首創(chuàng)自動駕駛GOP感知體系。此外,商湯絕影通過大模型進行自動化數(shù)據(jù)標(biāo)注和產(chǎn)品檢測,搭建的完整數(shù)據(jù)閉環(huán)體系,將模型迭代效率提升數(shù)百倍,目前已獲得知名車企的定點。

      此外,在生物制藥領(lǐng)域,商湯與企業(yè)合作,利用AI大裝置為蛋白質(zhì)結(jié)構(gòu)大模型提供AI推理算力,并為蛋白質(zhì)相互作用模型,提供研發(fā)平臺及訓(xùn)練算力,使得抗體篩選效率提升60%。

      商湯以AI賦能實體經(jīng)濟的能力矩陣進一步擴充。SenseNova一方面服務(wù)商湯自身業(yè)務(wù),另一方面,向政企客戶開放了多種API(應(yīng)用程序接口)?蛻艨筛鶕(jù)自身需求調(diào)用SenseNova的各項AI技術(shù)能力,比如文本生成、圖片生成、視覺感知、標(biāo)注服務(wù)等,從而低門檻、低成本、高效率地實現(xiàn)各類AI應(yīng)用。

      基于商湯大裝置和SenseNova大模型體系,商湯面向行業(yè)提供 “大模型即服務(wù)(Model-as-a-Service)”,涵蓋自動化數(shù)據(jù)標(biāo)注、自定義大模型訓(xùn)練、模型增量訓(xùn)練、模型推理部署、開發(fā)效率提升等多項能力。

      可以說,商湯已經(jīng)實現(xiàn)了“技術(shù)-產(chǎn)品-應(yīng)用”的商業(yè)化內(nèi)外雙循環(huán)。長期重注AI的商湯,正站在新一波技術(shù)革新的潮頭之上繼續(xù)前行。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。