繼續(xù)見證5G+AI成長,進博會全勤生高通確認明年第八次參展來采銷直播間看京東11.11外設(shè)辦公總裁直播 11日14點準時開播第七屆進博會盤點:高通攜手伙伴展示的驍龍8至尊版旗艦終端備受關(guān)注產(chǎn)業(yè)合作推動AI發(fā)展 高通孟樸:攜手伙伴共抓5G+AI新機遇進博會看技術(shù)變化,從5G手機到AI終端,高通技術(shù)支持行業(yè)拓展    高通獲頒“2024新消費創(chuàng)新案例”,5G-A推動數(shù)字消費高質(zhì)量發(fā)展3G追趕,4G并行,5G趕超!高通孟樸進博會談與中國伙伴合作歷程京東11.11巔峰28小時倒計時 爆款耳機音箱5折開搶手機內(nèi)卷下一站,AI Agent消息稱著名 AI 學(xué)者、天工智能首席科學(xué)家顏水成離開昆侖萬維昆侖萬維SkyReels AI短劇平臺將于12月10日在美國正式上線韓國今年進口柴油車銷量預(yù)計跌破 1 萬輛,創(chuàng)近 17 年新低讓游戲黨一秒種草的大屏電視?海信這款百吋旗艦做到了!為用戶節(jié)省超120萬元 京東11.11攜手奔圖加速打印國產(chǎn)化進程京東3C數(shù)碼“瘋狂星期一”驚喜放價 TP-LINK攝像頭限時直降210元11月9日晚8點京東11.11火熱開啟!潮流配件9.9元起京東11.11最后一波Apple大放價 iPhone 16 Pro系列持續(xù)加補1600元2024 ROG DAY狂歡啟航,ROG電競顯示器助力三大戰(zhàn)車燃爆鄭州站!來京東11.11一次性搞定視頻、音頻等APP會員充值 省錢又省心歐萊雅中國"FUN YOUniverTH有意思青年"創(chuàng)變盛典耀動進博會
  • 首頁 > 云計算頻道 > 大模型

    拆解騰訊的“大模型觀”

    2023年09月14日 15:43:20   來源:數(shù)字力場

      ▲BAT大模型的對照。

      文 | 佘宗明

      在《5000天后的世界》中,著名未來學(xué)家凱文·凱利預(yù)言:“在未來的50年里,AI將成為可以與自動化和產(chǎn)業(yè)革命相提并論的,不,應(yīng)該是影響更為深遠的趨勢。”

      而今,大模型似乎就是那根杠桿。自ChatGPT問世以來,“工業(yè)革命級的生產(chǎn)力工具”“有史以來最大的平臺革命”“新范式的新拐點”之類的說法,已將大模型“封神”。

      公開數(shù)據(jù)顯示,截至今年7月底,國內(nèi)已經(jīng)有130個大模型產(chǎn)品亮相或宣布。“百模大戰(zhàn)”中的“百”,已非虛指。

      有意思的是,在大廠們爭前恐后入局之時,騰訊卻一直保持自己的節(jié)奏。

      9月7日,在2023騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式亮相,騰訊宣告全面擁抱大模型。

      在廠商們爭搶頭啖湯時不出來,在大模型密集發(fā)布期不出來,等大模型的喧鬧消退后終于現(xiàn)身。

      有人說這是“遲”,雖遲但到的遲,但騰訊方面更想說它是“實”,腳踏實地的實。這跟騰訊的“大模型觀”有些內(nèi)在相通——它追求的就是實用至上。

      01

      說到“混元”,許多人可能會想到道家的“混元即無極,無極生太極”。混元所指,是鴻蒙狀態(tài),是萬物根源。

      道可道,非常道。道家始祖老子曾說過“我有三寶,持而保之”,其中之一就是信奉敢為天下后。

      而在“中國巴菲特”段永平的闡釋中,“敢為天下后”還有后半句:后中爭先。

      騰訊早在2021年就推出了千億和萬億參數(shù)的NLP(自然語言處理)稀疏大模型,打破了CLUE三大榜單記錄,但混元大模型的推出也是千呼萬喚始出來。

      “做三四月的事情,在八九月自有答案。”有些玩家在打通概念炒作跟對韭當割鏈路后一哄而上,“三四月”的事情剛開始做就掏出了PPT,騰訊卻在“六七月”里不事張揚,直到“八九月”有了答案才讓其面世。

      騰訊董事會主席兼CEO馬化騰的那番話,為此提供了解釋:“我們最開始以為這(指AI大模型)是互聯(lián)網(wǎng)十年不遇的機會,但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機遇。”

      他認為,“對于工業(yè)革命來講,早一個月把電燈泡拿出來,在長的時間跨度上來看是不那么重要的。關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實實做好。”

      馬拉松長跑中,方向?qū)、策略準往往比起步快更重要?/p>

      騰訊的通用大模型發(fā)布節(jié)奏,也被解讀為以慢為快,后中爭先。

      混元大模型參數(shù)展示的樸實,似乎可堪佐證——沒有狂堆參數(shù),也沒展示打了多少榜,騰訊方面主要披露了兩個數(shù)字:超千億參數(shù)規(guī)模,幾乎是當前通用大模型的標配;預(yù)訓(xùn)練語料超2萬億tokens,和目前最強開源模型Llama 2持平。

      與樸實對應(yīng)的是實用取向:混元大模型不追求Chat(聊天)上的花哨,而追求應(yīng)用場景上的實效;不是基于國外開源模型訓(xùn)練求快,而是從零開始、全鏈路自研。

      02

      實用取向,指向的是讓大模型從“可用”變?yōu)?ldquo;好用”。

      不得不說,當下的大模型正陷入“又強大,又弱雞”的悖論:一方面,很多大模型在問答時能秀得一手好打油詩、抖出一番機靈,另一方面,在行業(yè)應(yīng)用中又沒太多實質(zhì)性用處。

      大模型研究者李莉就認為,現(xiàn)在很多模型的研究者和應(yīng)用的制作者,考慮的是如何讓別人記住自己,所以效果特別視覺化,“每個視頻讓人看得血脈賁張,我們紛紛表示太酷炫了,但是靜下心來,我們對于技術(shù)該怎么用一般都沒有答案……如果真正放到經(jīng)濟中,你會發(fā)現(xiàn)根本用不上。”

      這正是ChatGPT熱度滑坡的主要原因:前不久,Newsweek調(diào)查顯示,ChatGPT的用戶數(shù)量已經(jīng)比今年年初高峰時期下降了近95%。用戶選的最多的理由就是,感覺“ChatGPT對工作的促進能力沒有想象那么強”。

      這難言奇怪:在行業(yè)應(yīng)用場景中,用戶在意的,可不是大模型能玩什么梗、扯什么淡,而是能否提供專業(yè)知識和行業(yè)數(shù)據(jù)。“大”不是最重要的,“專”才是。ChatGPT上生成的很多回答,就被指看上去專業(yè),專業(yè)人士一看卻似是而非。

      而今,隨著大模型進入Gartner曲線的相對冷靜階段,越來越多的人已意識到,應(yīng)用場景是決定大模型能否走遠的關(guān)鍵因素。沒有落地場景,就沒商業(yè)前景,也就難以走遠。

      正因如此,大模型行業(yè)正在從拼參數(shù)變?yōu)槠绰涞兀珺端行業(yè)應(yīng)用已成主戰(zhàn)場。這勾勒出的,是大模型正從“技術(shù)力”轉(zhuǎn)向“生產(chǎn)力”的商業(yè)化圖譜。

      ▲中國大模型,很多都很注重跟應(yīng)用場景結(jié)合。

      很早之前,騰訊對大模型的認知就是:大模型的長期價值將通過行業(yè)應(yīng)用來體現(xiàn),絕不僅限于聊天機器人這樣簡單的問答場景。

      這次發(fā)布會上,騰訊就強調(diào)面向產(chǎn)業(yè),明確要以提效為第一要義。騰訊高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生就表示,“大模型需要基于產(chǎn)業(yè)場景,與企業(yè)數(shù)據(jù)融合,才能釋放出最大的價值。”

      以垂(垂直大模型)應(yīng)垂(垂直細分行業(yè)的需求),方為實用。今年6月,騰訊云從產(chǎn)業(yè)客戶需求場景出發(fā),依托騰訊云TI平臺打造模型精選商店。這次發(fā)布的混元大模型,則將作為騰訊云MaaS服務(wù)的底座,為各業(yè)務(wù)領(lǐng)域提供支持。

      推出的是為應(yīng)用而生的“從實踐中來,到實踐中去”的實用級大模型,而非花里胡哨的AI“大玩具”,就是“實”的體現(xiàn)。

      03

      實用取向,內(nèi)在要求是讓大模型更成熟更靠譜。

      大模型要走入行業(yè)產(chǎn)業(yè)場景,就得減少“幻覺(即胡言亂語)”、避免“誘導(dǎo)(即誘導(dǎo)偏見或欺騙等)”。

      克勞德·香農(nóng)認為,信息的本質(zhì)是消除不確定性。但體驗過的用戶都知道,當下的大模型都有著很強的“不確定性”——它經(jīng)常會變成CheatGPT,給你胡編亂造一通。

      若這只是大模型跟用戶相互“調(diào)戲”,那無非是提供了些笑料,可行業(yè)場景專業(yè)度要求高、邊際容錯率低,若是提供了錯誤信息,很可能引發(fā)嚴重后果。

      正因如此,面向產(chǎn)業(yè)的大模型必須變得更專業(yè)更成熟更靠譜,不能是初看什么都懂、細看什么都不“專”。

      騰訊為此采取的策略可以歸結(jié)為兩點:1,全鏈路自研;2,將內(nèi)部業(yè)務(wù)場景當“磨刀石”。

      騰訊的混元大模型,從高速網(wǎng)絡(luò)、底層服務(wù)器到網(wǎng)卡、高速組網(wǎng)和平臺、模型、算法都是自研,AI基礎(chǔ)設(shè)施、機器學(xué)習(xí)框架、語料庫與模型算法等也是從零訓(xùn)練。

      騰訊解鎖全鏈路自研,瞄準的既是運用自身的技術(shù)棧體系,實現(xiàn)根本的業(yè)務(wù)技術(shù)能力突破,也是利用自主體系的研發(fā)道路,更好地應(yīng)對旗下海量高并發(fā)業(yè)務(wù)的沖擊。

      客觀上講,基于國外開源模型進行“本土化改良”固然是一條更容易的路子,可大模型既然是工業(yè)革命級的機會,只依靠國外的“開源模型”遠不夠。

      騰訊集團副總裁蔣杰說:“外界其實一般多會用到知識圖譜,甚至搜索外掛來讓模型的檢索支持能力變得更強,騰訊也會用,但不能用的比例很高。我們一定要在整個的大模型的預(yù)訓(xùn)練階段把這個問題解決掉,控制掉。”依托自研的“探真”算法,混元大模型幻覺比例比其他開源大模型下降了30%到50%。

      騰訊還在向外部推出大模型前,將其在騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等50多個內(nèi)部業(yè)務(wù)中先行驗證。

      先打磨好大模型產(chǎn)品,再拿出來服務(wù)行業(yè)產(chǎn)業(yè),看上去,也是主打一個“實”。

      04

      實用取向,還得讓大模型回歸服務(wù)屬性。

      湯道生說:“從一個大模型,到提供一個用戶可以感受到的服務(wù),中間有很多的環(huán)節(jié)和工序。騰訊其實是提供整個端到端的AI服務(wù)流程中所需要的‘全鏈條工具’。我們的TI平臺就是一個能滿足整個工序、環(huán)節(jié)的需求,給客戶提供高效模型搭建服務(wù)的重要工具。這可能是大家比較少從友商那里聽到的。”

      將基于自研的大模型技術(shù)能力開放,將其用于從田間到產(chǎn)線的很多角落,這注重的還是落地效果。

      大模型很熱,但本質(zhì)上,大模型是信息化的下一幕。過去十多年的信息化對應(yīng)的時代大幕上,寫著的主題是“數(shù)字化”。大模型同樣是數(shù)智化變革的助推器。

      只不過,以往互聯(lián)網(wǎng)發(fā)展撬動的是流通環(huán)節(jié)減少、流通效率提升,以AI為代表的數(shù)字化工具要介入的層次更深——其核心是要增加基礎(chǔ)價值。

      這就需要,將數(shù)字化觸角伸向生產(chǎn)端與供應(yīng)側(cè),覆蓋包括從工業(yè)制造到冶金采礦、從港口運輸?shù)睫r(nóng)林牧副漁的各行各業(yè)。

      這對國內(nèi)大模型的發(fā)展不無啟示:自從ChatGPT面世后,中國大模型廠商跟OpenAI差距有多遠,就成了行業(yè)關(guān)心的話題。

      應(yīng)用場景,或許正是中國大模型彎道超車的突破口。

      國家信息中心專家張振翼就指出,當前美國在大模型發(fā)展中具備一定的領(lǐng)先優(yōu)勢,我國需要加強自身獨特優(yōu)勢的探索。在他看來,當前我國發(fā)展大模型人工智能主要有三個方面的優(yōu)勢:應(yīng)用場景資源極為豐富、數(shù)據(jù)要素政策設(shè)計較為領(lǐng)先、在相關(guān)領(lǐng)域的技術(shù)創(chuàng)新上已經(jīng)具有一定積累等。

      可以看到,在移動互聯(lián)網(wǎng)時代,中國互聯(lián)網(wǎng)企業(yè)就憑著衣食住行康樂教和產(chǎn)業(yè)領(lǐng)域的豐富場景,跑通了模式,做大了規(guī)模。

      在今天,中國龐大市場上積累了海量數(shù)據(jù),包括物流、電商、醫(yī)療等各個領(lǐng)域的,各個行業(yè)數(shù)字化轉(zhuǎn)型的強烈需要,又為大模型落地提供了需求端支撐。

      順勢而為,以實用實干之“實”,加速大模型的產(chǎn)業(yè)應(yīng)用,中國大模型從跟跑到并跑再到領(lǐng)跑的圖景,才會愈發(fā)可期。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔。

    即時

    京東11.11跟著采銷走進科大訊飛 直播間享專享價與超值福利

    京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數(shù)碼采銷走進武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費者帶來超值低價與福利。

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。