正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報(bào)到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務(wù)最后一道防線阿里云盤出“BUG”客服回應(yīng):已修復(fù)圍剿BBA,比亞迪和騰勢也準(zhǔn)備出一份力阿里云服務(wù)器操作系統(tǒng)Alibaba Cloud Linux全新升級,核心場景性能提升超20%屏幕面板 10 月出貨,蘋果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋果史上最大:iPhone 16系列電池容量公布后移動互聯(lián)網(wǎng)時(shí)代,移動App兼容測試持續(xù)占據(jù)核心地位歐盟警告蘋果:六個(gè)月內(nèi)開放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實(shí)現(xiàn)營收5970億元,同比增長13.53%傳三星計(jì)劃2025年推出卷軸屏手機(jī)蘋果新專利探索折疊iPhone未來,任意表面實(shí)現(xiàn)觸敏控制蘋果iPhone16/Pro系列手機(jī)今日首銷,5999~9999元起各方媒體的聚焦關(guān)注,中南高科實(shí)力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 首頁 > 云計(jì)算頻道 > 大模型

    大模型時(shí)代 騰訊云“復(fù)制”騰訊

    2023年07月13日 14:09:53   來源:光錐智能

      文|郝鑫

      編|劉雨琦

      剛過去的WAIC(世界人工智能大會)儼然成為了大模型廠商的成果匯報(bào)大會。

      百度文心大模型升級到3.5版本,訓(xùn)練速度提升2倍,推理速度提升30倍;華為云發(fā)布盤古大模型3.0,包含L0基礎(chǔ)大模型、L1行業(yè)大模型和L2場景模型;阿里云發(fā)布AI繪畫創(chuàng)作模型通義萬相;騰訊云MaaS底座、行業(yè)大模型場景全面升級;商湯“日日新”大模型升級,金融、醫(yī)療等行業(yè)場景落地已超20個(gè)。

      大模型走過從無到有,在當(dāng)下的階段,即使是站在同一起跑線的廠商,也走上了不同的分叉路:有人做通用大模型,有人做行業(yè)大模型;有人在為大模型的安全運(yùn)行保駕護(hù)航,有人在提供造大模型的工具。

      7月7日,在中國信通院發(fā)布的《2023大模型和AIGC產(chǎn)業(yè)圖譜》中,將大模型和AIGC產(chǎn)業(yè)鏈上下游分成了行業(yè)應(yīng)用、產(chǎn)品服務(wù)、模型與工具和基礎(chǔ)層四個(gè)主要部分。

      (圖源:中國通訊院)

      從圖上看,大模型就像造房子,很難有一家企業(yè)完成所有環(huán)節(jié)。也就是說,如同互聯(lián)網(wǎng)的大航海時(shí)代一般,大模型生態(tài)建設(shè),所有人都有機(jī)會。

      正如騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲告訴光錐智能:“大模型時(shí)代,開放是非常重要的特點(diǎn)。大模型要結(jié)合行業(yè)落地,需要花費(fèi)大量的成本,在這種情況下,要想發(fā)揮最大的價(jià)值,只有開放,通過讓各行各業(yè)的專家、各類角色的人員加入進(jìn)來,才能讓整個(gè)生態(tài)體系更健康,從而產(chǎn)生更多的可能性。”

      發(fā)展的同時(shí),問題也在逐漸暴露出來。相較于國外成熟的大模型市場,中國到現(xiàn)在還未構(gòu)建起完整的大模型產(chǎn)業(yè)鏈,在底層的數(shù)據(jù)、芯片、計(jì)算能力存在欠缺,在模型訓(xùn)練、部署等環(huán)節(jié)還十分薄弱。

      針對大模型產(chǎn)業(yè)鏈存在的痛點(diǎn),騰訊云MaaS大模型精選商店升級技術(shù)底座,發(fā)布向量數(shù)據(jù)庫和星脈網(wǎng)絡(luò),創(chuàng)新行業(yè)大模型的應(yīng)用場景。

      追本溯源,可以看出騰訊延續(xù)互聯(lián)網(wǎng)時(shí)代的思路,騰訊云依然不做通用大模型,要繼續(xù)做工具箱和連接器。

      Always工具箱和連接器

      據(jù)光錐智能了解到,早在6月19日,騰訊云就公布了行業(yè)大模型技術(shù)解決方案。該方案依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶提供MaaS一站式服務(wù),客戶只需要加入自己獨(dú)有的場景數(shù)據(jù),就可以快速生成專屬模型,結(jié)合實(shí)際業(yè)務(wù)場景需求,開發(fā)低成本、高可用的智能應(yīng)用和服務(wù)。

      騰訊云MaaS大模型商店重點(diǎn)突出了兩個(gè)特點(diǎn),一是精專,二是靈活。

      “精專”主要體現(xiàn)在對行業(yè)模型的訓(xùn)練上,騰訊云在其技術(shù)底座就內(nèi)置了金融、政務(wù)、文旅、傳媒、教育等多個(gè)行業(yè)大模型,這意味著從預(yù)訓(xùn)練時(shí)期開始,大模型便明確了方向,開始與行業(yè)經(jīng)驗(yàn)結(jié)合。

      打個(gè)比方,就好比大學(xué)生一入學(xué)就被分到了不同的專業(yè),之后在此基礎(chǔ)上繼續(xù)研究生、博士深造。騰訊云的思路也是如此,把訓(xùn)練的數(shù)據(jù)先在行業(yè)大模型中磨礪一遍,然后再結(jié)合企業(yè)的私有數(shù)據(jù),精調(diào)后生成企業(yè)專屬模型?梢哉f,行業(yè)認(rèn)知貫穿了模型訓(xùn)練、推理、部署的全過程,由此來提升行業(yè)場景的應(yīng)用能力。

      “靈活”主要體現(xiàn)在企業(yè)調(diào)取、使用模型能力、工具上;ヂ(lián)網(wǎng)時(shí)代,馬化騰曾將騰訊的角色定位為“工具箱”,在大模型時(shí)代,騰訊云TI平臺的角色有著異曲同工之處。

      工具鏈決定著企業(yè)能不能把大模型能力和自己的業(yè)務(wù)、產(chǎn)品相結(jié)合,為此,騰訊云提供了包括數(shù)據(jù)標(biāo)注、訓(xùn)練、評估、測試和部署等大模型工具箱和配套服務(wù)。企業(yè)可以在本地按需選用和組合工具,在保障安全的前提下進(jìn)行私有化數(shù)據(jù)訓(xùn)練,還可根據(jù)業(yè)務(wù)場景需求,按需定制不同參數(shù)、規(guī)格的模型服務(wù)。

      以前,騰訊連接了B端商家和C端用戶,現(xiàn)在騰訊云也將這種能力復(fù)刻到大模型商店。工具組合形成的工具鏈還只是平臺中的一環(huán),連接起企業(yè)產(chǎn)品和大模型;另一條主線——數(shù)據(jù)(私有+公有),則串連起了大模型、企業(yè)、產(chǎn)業(yè)和用戶。

      行業(yè)應(yīng)用是起點(diǎn),也是終點(diǎn),正如吳運(yùn)聲所言,“不管是什么樣的技術(shù),我們最根本的出發(fā)點(diǎn),還是要解決實(shí)際的問題。”

      大模型加速器

      如何在大模型賽道上找到合適自己的節(jié)奏,騰訊云似乎已經(jīng)摸到了脈路。

      騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生曾表示:“關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)做好,而且更關(guān)鍵的是場景落地。”

      延續(xù)著這樣的思路,騰訊云一手抓底層算法、算力和數(shù)據(jù),一手落地場景,MaaS大模型商店實(shí)現(xiàn)了全面的升級。

      (拍攝:光錐智能)

      在技術(shù)底座環(huán)節(jié),騰訊云聚焦一個(gè)“快”字,發(fā)布了星脈網(wǎng)絡(luò)和向量數(shù)據(jù)庫,為大模型安上了“風(fēng)火輪”。

      大模型進(jìn)入萬億參數(shù)時(shí)代,單體服務(wù)器算力有限,需要將大量服務(wù)器通過高性能網(wǎng)絡(luò)相連,打造大規(guī)模算力集群。

      基于此,騰訊云通過對處理器、網(wǎng)絡(luò)架構(gòu)和存儲性能的全面優(yōu)化,攻克下了大集群場景下算力損耗問題,正式發(fā)布新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群。

      該集群采用騰訊云星星海自研服務(wù)器,搭載英偉達(dá)最新代次H800 GPU,能提升40%的GPU利用率,節(jié)省30%-60%的模型訓(xùn)練成本,為AI大模型帶來10倍通信性能提升;隍v訊云新一代算力集群HCC,可支持10萬卡的超大計(jì)算規(guī)模。

      據(jù)騰訊云透露,騰訊云新一代集群的算力性能較前代提升高達(dá)3倍,是國內(nèi)性能最強(qiáng)的大模型計(jì)算集群。

      高性能計(jì)算群是一種底座能力,其技術(shù)的應(yīng)用體現(xiàn)了通過技術(shù)手段的降本增效。

      首先,相比于大量分散的計(jì)算機(jī),高性能計(jì)算集群可以降低硬件成本和運(yùn)維成本,同時(shí)方便集中管理。其次,它可以提升計(jì)算、搜索的效率。提供分布式的計(jì)算能力,為向量數(shù)據(jù)庫提供支持;還能進(jìn)行復(fù)雜的科學(xué)計(jì)算和建模,這也是騰訊云“AI for Science”能迅速在天文、甲骨文考釋取得成果的原因。

      在大模型訓(xùn)練過程中,湯道生談起過數(shù)據(jù)質(zhì)量的問題,他表示:“目前通用大模型一般都是基于廣泛的公開文獻(xiàn)與網(wǎng)絡(luò)信息來訓(xùn)練的,網(wǎng)上的信息可能有錯(cuò)誤、有謠言、有偏見,許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致模型的行業(yè)針對性與精準(zhǔn)度不夠,數(shù)據(jù)噪音過大。”

      數(shù)據(jù)對大模型訓(xùn)練的意義不言而喻,當(dāng)前,除了數(shù)據(jù)噪聲過大,還存在數(shù)據(jù)處理、數(shù)據(jù)更新、數(shù)據(jù)安全等眾多問題。

      此外,大模型還存在一個(gè)致命的缺點(diǎn)——沒有長期記憶,C端對話場景還可以重新提問,但應(yīng)用在行業(yè),就可能造成系統(tǒng)崩潰。

      OpenAI 很早就意識到這個(gè)問題,通過與Zilliz、Pinecone、Weaviate等向量數(shù)據(jù)庫公司合作,為ChatGPT配置上了“外置緩存”,向量數(shù)據(jù)庫+大模型也被稱之為“黃金搭檔”。

      國外向量數(shù)據(jù)庫大熱帶動了國內(nèi)廠商加速,騰訊云也趕上了第一波,發(fā)布了國內(nèi)首個(gè)AI 原生向量數(shù)據(jù)庫。

      針對大模型場景,它在接入層、計(jì)算層、存儲層實(shí)現(xiàn)了全面AI化:

      在接入層,智能化支持自然語言文本的直接檢索;

      在計(jì)算層,通過AI算子替代企業(yè)尋找/調(diào)優(yōu)AI算法,將接入工期從一個(gè)月縮短到3天;

      在存儲層,融合智能壓縮算法,把向量存儲成本降低50%。

      企業(yè)數(shù)據(jù)接入需要分為三步,分別為文本切分、向量化以及導(dǎo)入。以前,這三步分別由不同的公司來做,因此周期被拉得無限長,而騰訊云將三步化作一步,直接實(shí)現(xiàn)了一站式接入,效率提升了10倍。

      不過,從參數(shù)來看,目前騰訊云向量數(shù)據(jù)庫性能依舊在初級的階段。

      舉個(gè)例子,騰訊云向量數(shù)據(jù)庫最高支持10億級向量檢索規(guī)模,并將延遲控制在毫秒級。作為對比Milvus最大能支持560億向量檢索規(guī)模,支持每秒進(jìn)行上百萬的向量相似性搜索。

      但10億級也可以說是向量數(shù)據(jù)庫的入門級參數(shù)。Pinecone 官方demo 表明其可以在 10 億條向量中實(shí)時(shí)搜索;Weaviate算法可支持十億量級的向量索引。

      工欲善其事,必先利其器。從最底層一步步砸實(shí)技術(shù),看似騰訊云走了一條慢路,但小布快走,實(shí)現(xiàn)快速迭代后,帶動的將是整個(gè)生態(tài)系統(tǒng)的提升。

      50個(gè)場景,騰訊云批量著陸

      場景一直是騰訊所強(qiáng)調(diào)的產(chǎn)品文化,即做一個(gè)產(chǎn)品或者上線一個(gè)功能,首先考慮的是,能不能找到場景,找到用戶。

      同樣切入MaaS,站在新的起跑線上,騰訊云通過沉淀的行業(yè)Konw-how,瞄準(zhǔn)企業(yè)應(yīng)用剛需,推進(jìn)大模型應(yīng)用落地,將場景作為訓(xùn)練大模型的磨刀石。

      “大模型雖好,但用起來還是有很高的門檻。尤其對一些傳統(tǒng)領(lǐng)域企業(yè)而言,通用大模型無法精準(zhǔn)適配、達(dá)到降本增效的預(yù)期。企業(yè)需要的,是在實(shí)際場景中真正解決某個(gè)問題,而不是在100個(gè)場景中解決了70%-80%的問題。”吳運(yùn)聲道。

      騰訊云認(rèn)為,大模型不只是少數(shù)人的游戲,把大模型從“通才”轉(zhuǎn)變?yōu)?ldquo;專才”,對企業(yè)來說或許是一個(gè)可行的路徑。騰訊云在其中承擔(dān)的角色,就是要將門檻打下來,提供一條龍服務(wù),幫助企業(yè)跳過模型訓(xùn)練、部署的“冷啟動”階段。

      據(jù)光錐智能了解,基于騰訊在互聯(lián)網(wǎng)行業(yè)的長期沉淀,騰訊云已聯(lián)合金融、文旅、政務(wù)、傳媒、教育等十多個(gè)行業(yè)頭部客戶,共同打造了超過50個(gè)行業(yè)大模型解決方案,這些都是騰訊 CSIG 的重點(diǎn)服務(wù)行業(yè)。

      在金融風(fēng)控場景,騰訊云風(fēng)控大模型融合了騰訊過去20多年黑灰產(chǎn)對抗經(jīng)驗(yàn),和上千個(gè)真實(shí)業(yè)務(wù)場景,提供了金融風(fēng)控解決方案。企業(yè)可以基于prompt模式,迭代風(fēng)控能力,從樣本收集、模型訓(xùn)練到部署上線,實(shí)現(xiàn)全流程零人工參與,目前,建模時(shí)間已經(jīng)做到從2周減少到僅需2天。

      在交互翻譯場景,基于行業(yè)大模型技術(shù),騰訊云無需百萬級的訓(xùn)練數(shù)據(jù),使用小樣本訓(xùn)練也可以獲得不錯(cuò)的翻譯結(jié)果,讓每一次交互翻譯,都能對下一句的翻譯提升發(fā)揮實(shí)時(shí)作用。

      以行業(yè)場景為切入,技術(shù)、應(yīng)用同時(shí)迭代升級,這樣的速度明顯要更快,效果也更加顯著。

      據(jù)騰訊云在WAIC最新數(shù)據(jù),上述金融風(fēng)控解決方案,相比之前已有了10倍效率的提升,整體反欺詐效果比傳統(tǒng)模式有20%左右的提升;騰訊云數(shù)智人工廠,內(nèi)置超過10個(gè)AI算法模型,騰訊云MaaS能力,可以讓2D數(shù)智人分身復(fù)刻縮短至24小時(shí)。

      技術(shù)和應(yīng)用兩條腿同時(shí)跑,底層大模型支撐應(yīng)用場景落地,場景也反過來反哺大模型。

      正如同騰訊云所強(qiáng)調(diào)的一個(gè)觀點(diǎn)“產(chǎn)業(yè)場景是大模型的最佳練兵場”,前期大模型所學(xué)習(xí)到的行業(yè)經(jīng)驗(yàn)可以在現(xiàn)實(shí)應(yīng)用場景中得到矯正,再次沉淀到騰訊云MaaS平臺行業(yè)模型底座,重新更新認(rèn)知,以此循環(huán)往復(fù),行業(yè)大模型將越調(diào)越精,企業(yè)也越用越靈。

      另一方面,成熟的應(yīng)用落地場景,或許又將為大模型商業(yè)化開拓出新的道路。

      事實(shí)證明,貪圖一時(shí)的熱鬧并不長遠(yuǎn),即使是擁有絕對技術(shù)壁壘的ChatGPT也面臨著流量下滑的命運(yùn),OpenAI 創(chuàng)始人更是直言,ChatGPT插件不如預(yù)期的原因在于,人們更想把GPT的能力用到自己的應(yīng)用當(dāng)中。

      開啟大模型下一個(gè)競爭階段,場景與商業(yè)化能力或?qū)⒆兊酶用芮小?/p>

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。