6月19日,騰訊云在國家科技傳播中心召開行業(yè)大模型及智能應(yīng)用技術(shù)峰會(huì),首次公布騰訊云行業(yè)大模型研發(fā)進(jìn)展,依托騰訊云TI平臺(tái)打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),助力客戶構(gòu)建專屬大模型及智能應(yīng)用。
峰會(huì)上,騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生發(fā)表《模型扎根產(chǎn)業(yè),共建智能生態(tài)》的主題演講,分別從模型、數(shù)據(jù)、應(yīng)用與算力四個(gè)角度分享了對(duì)大語言模型在產(chǎn)業(yè)落地的思考。
騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO 湯道生
首先,就模型而言,比起通用大模型,企業(yè)更需要針對(duì)具體行業(yè)的大模型,并結(jié)合企業(yè)自身的數(shù)據(jù)進(jìn)行訓(xùn)練和精調(diào),以打造出更實(shí)用的智能服務(wù)。企業(yè)對(duì)提供的專業(yè)服務(wù)要求高且容錯(cuò)性低,因此使用的大模型必須具備可控、可追溯和可修正的特點(diǎn),并經(jīng)過反復(fù)充分的測試。
其次是數(shù)據(jù)的重要性。數(shù)據(jù)是大模型的原材料,針對(duì)具體場景,數(shù)據(jù)的覆蓋和質(zhì)量至關(guān)重要。在模型的開發(fā)過程中,需要關(guān)注敏感數(shù)據(jù)的保護(hù)和安全合規(guī),并有效管理大量的數(shù)據(jù)和標(biāo)簽,不斷進(jìn)行測試和模型的迭代。騰訊云也推出基于TI平臺(tái)的行業(yè)大模型精調(diào)解決方案,幫助模型開發(fā)者和算法工程師高效率、高品質(zhì)、低成本地處理數(shù)據(jù),創(chuàng)建和使用大模型。
在應(yīng)用方面,騰訊自身也應(yīng)用行業(yè)大模型,優(yōu)化自身企業(yè)級(jí)應(yīng)用,為用戶提高工作效率。例如,通過基于行業(yè)模型的智能小助手,騰訊會(huì)議可以協(xié)助用戶進(jìn)行日程安排、會(huì)管、會(huì)控等操作,并自動(dòng)生成智能總結(jié)摘要,提升會(huì)議的效率。騰訊企點(diǎn)智能客服和AI代碼助手等應(yīng)用也通過行業(yè)模型的訓(xùn)練和精調(diào),提供更精準(zhǔn)、詳細(xì)的回答和高效的編程輔助。
最后是算力的支持。算力是模型持續(xù)運(yùn)轉(zhuǎn)的基礎(chǔ),高性能、高彈性和高穩(wěn)定的算力對(duì)于大模型的訓(xùn)練和使用至關(guān)重要。騰訊云也提供新一代高性能計(jì)算集群,為客戶提供穩(wěn)定計(jì)算、高速網(wǎng)絡(luò)與專業(yè)運(yùn)維。同時(shí),推出面向AI運(yùn)算的向量數(shù)據(jù)庫,支撐對(duì)圖像、音頻和文本等非結(jié)構(gòu)化數(shù)據(jù)的高效處理,數(shù)據(jù)接入AI的效率,也比傳統(tǒng)方案提升10倍。
湯道生表示,大模型只是開端,AI與產(chǎn)業(yè)的融合,將綻放出更有創(chuàng)造力的未來。生態(tài)共建是AI發(fā)展的有效路徑,騰訊將堅(jiān)持生態(tài)開放,為企業(yè)提供高質(zhì)量模型服務(wù),同時(shí)支持客戶多模型訓(xùn)練任務(wù),加速大模型在產(chǎn)業(yè)場景的創(chuàng)新探索。
以下為演講全文:
各位嘉賓、各位媒體朋友,大家好!
歡迎參加今天的技術(shù)峰會(huì),非常高興有機(jī)會(huì)和大家一起探討產(chǎn)業(yè)智能化升級(jí)的機(jī)遇;也非常期待與客戶共建,以企業(yè)場景與行業(yè)數(shù)據(jù)為基礎(chǔ)的行業(yè)大模型。
過去半年,大家都為大語言模型的發(fā)展感到興奮,不少人已經(jīng)試遍各個(gè)通用大模型的聊天機(jī)器人,但大部分互聯(lián)網(wǎng)用戶可能還只是有所聽聞。市面上的通用大模型在一些聊天問答上,確實(shí)有讓人驚艷的表現(xiàn);诖罅恐R(shí)與公開信息的訓(xùn)練,通過推測下一個(gè)字的語言生成,它能回答不同領(lǐng)域的提問,生成人性化的回復(fù),連貫地對(duì)話。
同時(shí),許多企業(yè)管理者也在思考,如何把大模型技術(shù)應(yīng)用到自己企業(yè)場景中。比如在客服與營銷環(huán)節(jié),為業(yè)務(wù)經(jīng)營帶來更多降本增效。但在具體的企業(yè)場景中,通用大模型可能還不能滿足企業(yè)很多需求,比如,它不一定懂行業(yè)的專業(yè)術(shù)語,不了解企業(yè)內(nèi)部的獨(dú)特情況,回答會(huì)比較虛、比較籠統(tǒng),偶爾還會(huì)一本正經(jīng)地胡說八道,信息也不夠及時(shí)。
大家既期待著,能力越來越強(qiáng)大的通用大模型,同時(shí)也在思考,如何在使用大模型時(shí),保護(hù)企業(yè)數(shù)據(jù)的產(chǎn)權(quán)與隱私?如何降低大模型的使用成本?這些都是企業(yè)需要考慮的現(xiàn)實(shí)問題。
借今天這個(gè)機(jī)會(huì),我想講講,我對(duì)大語言模型在產(chǎn)業(yè)落地的思考,分別從模型、數(shù)據(jù)、應(yīng)用與算力四個(gè)角度來探討。
首先是模型。雖然大家對(duì)通用大模型期待很高,但它不一定是滿足行業(yè)場景需求的最優(yōu)解。
目前,通用大模型一般都是基于廣泛的公開文獻(xiàn)與網(wǎng)絡(luò)信息來訓(xùn)練的,網(wǎng)上的信息可能有錯(cuò)誤、有謠言、有偏見,許多專業(yè)知識(shí)與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致模型的行業(yè)針對(duì)性與精準(zhǔn)度不夠,數(shù)據(jù)“噪音”過大。但是,在很多產(chǎn)業(yè)場景中,用戶對(duì)企業(yè)提供的專業(yè)服務(wù)要求高,容錯(cuò)性低。企業(yè)一旦提供了錯(cuò)誤信息,可能引起巨大的法律責(zé)任或公關(guān)危機(jī)。因此,企業(yè)使用的大模型必須可控、可追溯、可修正,而且必須反復(fù)與充分測試才能上線。
我們認(rèn)為,客戶更需要有行業(yè)針對(duì)性的行業(yè)大模型,再加上企業(yè)自己的數(shù)據(jù)做訓(xùn)練或精調(diào),才能打造出實(shí)用性高的智能服務(wù)。企業(yè)所需要的是在實(shí)際場景中真正解決了某個(gè)問題,而不是在100個(gè)場景中解決了70%-80%的問題。
另外,訓(xùn)練數(shù)據(jù)越多,模型越大,訓(xùn)練與推理的成本也越高。實(shí)際上,大部分的企業(yè)場景,可能也不需要萬能的通用AI來滿足需要。因此,如何在合理成本下,選擇合適的模型,是企業(yè)客戶所需要思考與決策的。
今天,我們也正式公布騰訊云MaaS服務(wù)解決方案,基于TI平臺(tái)打造行業(yè)精選模型商店,覆蓋金融、文旅、政務(wù)、傳媒、教育等10大行業(yè),提供超過50個(gè)解決方案。在這些能力模型基礎(chǔ)上,客戶只需要加入自己獨(dú)有的場景數(shù)據(jù),就可以快速生成自己的“專屬模型”。
比如,我們和國內(nèi)的頭部在線旅游公司,基于“文旅大模型”,打造了機(jī)器人客服,可以自動(dòng)判斷用戶意圖,并自動(dòng)調(diào)用相應(yīng)的API,高質(zhì)量完成用戶咨詢及服務(wù)。
如果一個(gè)用戶問,“節(jié)假日有哪些比較經(jīng)濟(jì)的旅游景點(diǎn)推薦?”基于通用大模型的客服機(jī)器人,只能給出一些簡單的景點(diǎn)介紹和路線規(guī)劃。但是,當(dāng)我們用大量有針對(duì)性的行業(yè)數(shù)據(jù)來做模型精調(diào)之后,客服機(jī)器人的回答就變得更加細(xì)致,能夠規(guī)劃出每天的交通、景點(diǎn)安排,給出經(jīng)濟(jì)實(shí)惠的定制化推薦方案。
接下來談?wù)剶?shù)據(jù)。數(shù)據(jù)是大模型的原材料,針對(duì)具體場景,相關(guān)數(shù)據(jù)的覆蓋與質(zhì)量都至關(guān)重要,標(biāo)注數(shù)據(jù)的管理也是模型迭代中的重要工作。
模型最終要在真實(shí)場景落地,要達(dá)到理想的服務(wù)效果,往往需要把企業(yè)自身的數(shù)據(jù)也用起來。在模型研發(fā)過程中,既要關(guān)注敏感數(shù)據(jù)的保護(hù)與安全合規(guī),也需要管理好大量的數(shù)據(jù)與標(biāo)簽,不斷測試與迭代模型。
因此,我們也推出基于騰訊云TI平臺(tái)的行業(yè)大模型精調(diào)解決方案。幫助模型開發(fā)者與算法工程師,一站式解決數(shù)據(jù)的處理問題,高效率、高品質(zhì)、低成本地創(chuàng)建和使用大模型。我們也可以通過TI平臺(tái)以及模型的私有化部署、權(quán)限管控和數(shù)據(jù)加密等方式,讓企業(yè)用戶在打造模型與使用模型時(shí)都更放心。
最近,我們攜手中央電視臺(tái)打造“央視人工智能開放平臺(tái)”。其間也面臨數(shù)據(jù)量龐大、形態(tài)復(fù)雜的問題,導(dǎo)致傳統(tǒng)的數(shù)據(jù)標(biāo)簽體系都無法達(dá)標(biāo)。我們重新構(gòu)建了一套傳媒專屬的數(shù)據(jù)標(biāo)簽體系,同時(shí)也研發(fā)了創(chuàng)新的“標(biāo)簽權(quán)重引擎”,讓數(shù)據(jù)標(biāo)簽顆粒度更細(xì),并按照核心度排序。在這樣的數(shù)據(jù)標(biāo)簽體系支撐下,視頻編輯用自然語言就能實(shí)現(xiàn)跨模態(tài)檢索。比如,輸入“居民消費(fèi)力”,系統(tǒng)可自動(dòng)提供商場、超市相關(guān)素材,再搭配智能剪輯,就能快速生成視頻。
接著講講應(yīng)用。騰訊自身的企業(yè)級(jí)應(yīng)用,已經(jīng)率先應(yīng)用了行業(yè)大模型,針對(duì)不同應(yīng)用場景提供更智能的服務(wù),為用戶提高工作效率。
例如,騰訊會(huì)議即將推出覆蓋會(huì)議全流程場景的智能小助手。通過簡單自然的會(huì)議指令,協(xié)助用戶進(jìn)行日程安排、會(huì)管、會(huì)控等一系列操作。會(huì)后可以自動(dòng)生成智能總結(jié)摘要,還能基于智能錄制的能力,幫助用戶高效回顧,提升用戶開會(huì)和信息流轉(zhuǎn)效率。
新一代的騰訊企點(diǎn)智能客服,基于行業(yè)模型,結(jié)合客戶業(yè)務(wù)需求進(jìn)行訓(xùn)練與精調(diào),客服機(jī)器人可以提供更精準(zhǔn)、更詳細(xì)的回答,甚至調(diào)用業(yè)務(wù)系統(tǒng)來提供實(shí)時(shí)數(shù)據(jù)。對(duì)比上一代智能客服的機(jī)械回答,用戶體驗(yàn)有很大的提升。
在企點(diǎn)分析平臺(tái)上,銷售人員只要問一句“哪個(gè)產(chǎn)品賣的最好”,就可以實(shí)現(xiàn)準(zhǔn)確的商業(yè)分析,不需要花費(fèi)大量的時(shí)間,學(xué)習(xí)復(fù)雜的軟件、制作看板。
借助騰訊云新一代AI代碼助手,程序員也可以快速、高品質(zhì)地完成代碼的補(bǔ)充、糾錯(cuò)和解釋,覆蓋編碼、評(píng)審、測試等不同場景。
最后講講算力。算力是模型持續(xù)運(yùn)轉(zhuǎn)的基礎(chǔ),高性能、高彈性和高穩(wěn)定的算力需要借助專業(yè)的云服務(wù)。
在大模型的訓(xùn)練和使用過程中,需要大量異構(gòu)算力的支持,對(duì)網(wǎng)絡(luò)速度與穩(wěn)定性要求也很高,加上GPU服務(wù)器比一般服務(wù)器穩(wěn)定性更低一些,服務(wù)器的運(yùn)維、問題的排查更頻繁,整體運(yùn)維的難度與工作量會(huì)高很多。
例如,在訓(xùn)練集群中,一旦網(wǎng)絡(luò)有波動(dòng),訓(xùn)練的速度就會(huì)受到很大的影響;只要一臺(tái)服務(wù)器過熱宕機(jī),整個(gè)集群都可能要停下來,然后訓(xùn)練任務(wù)要重啟,這些事件會(huì)使得訓(xùn)練時(shí)間大大增加,投入在大模型的成本也會(huì)飆升。因此,騰訊云所提供的穩(wěn)定計(jì)算、高速網(wǎng)絡(luò)與專業(yè)運(yùn)維,可以為算法工程師大大減輕設(shè)備運(yùn)維的壓力,讓他們把精力放在模型的構(gòu)建與算法的優(yōu)化上。
騰訊云也打造了面向模型訓(xùn)練的新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群,搭載最新次代GPU,結(jié)合多層加速的高性能存儲(chǔ)系統(tǒng),加上高帶寬、低延遲的網(wǎng)絡(luò)傳輸,整體性能比過去提升了3倍,獲得了很多客戶的高度認(rèn)可,幾家AI獨(dú)角獸都與我們展開了合作。
在計(jì)算集群的“硬實(shí)力”之外,今天,我們也會(huì)推出更適合AI運(yùn)算的“軟能力”——向量數(shù)據(jù)庫,它能更高效地處理圖像、音頻和文本等非結(jié)構(gòu)化數(shù)據(jù),支持單索引10億級(jí)規(guī)模,比單機(jī)插件式檢索規(guī)模提升10倍,數(shù)據(jù)接入AI的效率,也比傳統(tǒng)方案提升10倍。
回顧過去,人工智能的發(fā)展是結(jié)合開放數(shù)據(jù)的積累、算法的創(chuàng)新與算力的突破共同推動(dòng)的;也是全球科技企業(yè)、高校與研究機(jī)構(gòu)共同努力,通過代碼的開源與研究成果的分享,開放共建的成果。
騰訊云也將在大模型的產(chǎn)業(yè)應(yīng)用上,堅(jiān)持生態(tài)開放,支持多模型的選擇,提供訓(xùn)練與推理的算力,滿足不同行業(yè)、不同場景的多樣化需求。
今天,我們?cè)僖淮握驹跀?shù)字科技革命的奇點(diǎn)上,大模型只是開端,AI與產(chǎn)業(yè)的融合,將綻放出更有創(chuàng)造力的未來。在這個(gè)過程中,騰訊愿意貢獻(xiàn)自己的能力,與行業(yè)伙伴攜手,用智能照亮行業(yè),讓AI普惠生活。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。