隨著 AI 熱潮席卷各行各業(yè),其落地應(yīng)用已經(jīng)成為企業(yè)技術(shù)研發(fā)升級的工作重心。人工智能應(yīng)用的升級不僅需要軟件層面的升級迭代,還需要大規(guī);A(chǔ)設(shè)施的支撐。然而,自行搭建大規(guī)模算力、存儲基礎(chǔ)設(shè)施對于大多數(shù)企業(yè)而言都存在技術(shù)難度、人力資源、成本投入等多方面的挑戰(zhàn)。因此,企業(yè)在探索 AI 實踐時往往更傾向于選擇云服務(wù),尤其是云計算大廠提供的成熟云端計算實例來部署 AI 模型和服務(wù),而在具體落地過程中,不同行業(yè)存在的痛點各異,對云基礎(chǔ)設(shè)施的需求也有所不同。
好玩有趣的關(guān)卡背后,創(chuàng)新 AI 模型的突破與挑戰(zhàn)
由于游戲行業(yè)的需求復(fù)雜,其相對較晚受到 AI 創(chuàng)新浪潮的影響,獨特的創(chuàng)新周期、對游戲性和故事性的高要求,以及市場接受度和玩家期望的多樣性,也延緩了 AI 在游戲中的廣泛應(yīng)用。再加上對經(jīng)濟因素和開發(fā)成本的考量,使得游戲行業(yè)在采納 AI 技術(shù)時持謹慎態(tài)度。
然而,隨著 AI 技術(shù)的不斷進步和成本的降低,以及市場對高質(zhì)量游戲體驗需求的日益增長,游戲行業(yè)正積極地探索和應(yīng)用 AI 技術(shù)來提升游戲品質(zhì)和玩家體驗,更常見的選擇是對成熟的模型方案進行微調(diào),以滿足自身需求。
在這種場景下,對上層應(yīng)用出色的推理能力與性價比則顯得更為關(guān)鍵。通過基于成熟方案改造的推理模型以及能夠輸出高效推理性能的基礎(chǔ)設(shè)施,使游戲開發(fā)團隊可以迅速獲得 AI 創(chuàng)新的收益,為終端用戶帶來更好的體驗。
樂元素是經(jīng)典休閑消除游戲《開心消消樂》的開發(fā)商,《開心消消樂》憑借著簡單易上手的游戲原理和激發(fā)玩家好勝心的設(shè)計,使得玩家能夠迅速融入游戲并享受其中。
《開心消消樂》擁有 9 大關(guān)卡類型、60 余種障礙設(shè)計、8000 多個精心設(shè)計的關(guān)卡。用戶每日都可以進行游戲關(guān)卡挑戰(zhàn),因此,關(guān)卡的質(zhì)量對于游戲的收入和用戶留存起著至關(guān)重要的作用。樂元素的游戲團隊不僅要持續(xù)推出新關(guān)卡和玩法,還要不斷調(diào)整線上關(guān)卡的體驗和難度,為玩家?guī)硇迈r的游戲體驗。
過去,樂元素團隊主要通過人工流程制作關(guān)卡,但效率相對較低,導(dǎo)致新關(guān)卡的上線流程較長,很難確保難度一致性,又要考慮玩家離線游玩時是否通過特殊方式“作弊”,新玩法和已有關(guān)卡陣容的完整兼容問題,相關(guān)的設(shè)計和驗證工作費時費力。
為此,樂元素創(chuàng)新地在關(guān)卡設(shè)計等流程引入了自研的 AI 推理模型。對于新增和調(diào)整的關(guān)卡,推理模型通過大量自動打關(guān)任務(wù),確保關(guān)卡配置無錯誤,難度符合預(yù)期,并快速驗證關(guān)卡;對于新開發(fā)的玩法,AI 也通過大量自動打關(guān)任務(wù)確保邏輯無錯誤。
如今,該模型每天平均運行超過 1 億次打關(guān)任務(wù),推理次數(shù)超過 30 億次。通過 AI 創(chuàng)新,樂元素可以大大減輕開發(fā)團隊設(shè)計新關(guān)卡和新玩法時的驗證測試負擔(dān),使團隊將精力從枯燥的驗證工作中轉(zhuǎn)移到開發(fā)任務(wù)上,顯著提升開發(fā)效率,為玩家?guī)砀嘈迈r好玩的游戲內(nèi)容。
然而,隨著《開心消消樂》玩家群規(guī)模增長和游戲內(nèi)容更新,樂元素的 AI 推理模型在實踐中開始遇到性能、成本和靈活性三大挑戰(zhàn):
性能挑戰(zhàn):
隨著游戲用戶數(shù)量的增加和游戲內(nèi)容的擴充,推理模型需要處理的關(guān)卡數(shù)量不斷增多,對玩家玩法的模擬也更加復(fù)雜,這就意味著運行模型的服務(wù)器需要足夠的算力來支持模型完成推理任務(wù)。
成本挑戰(zhàn):
游戲運營成本隨著用戶數(shù)量和游戲內(nèi)容的增加而增加,特別是當(dāng)部署專用的模型服務(wù)器時。因此,樂元素亟需尋找更適合推理的算力選項。
靈活性挑戰(zhàn):
面對不斷變化的游戲內(nèi)容和用戶需求,特別是不同的模型推理需求,要求游戲服務(wù)器具備足夠的靈活性支持。
今年,騰訊云推出的新一代 S8 實例,為樂元素提供了高性能、低成本和靈活性的解決方案,滿足了其持續(xù)發(fā)展的訴求。
聚集三大優(yōu)勢,樂元素將 AI 推理加速方案轉(zhuǎn)向 CPU
在以往的解決方案中,大多數(shù)游戲行業(yè)的 AI 推理場景會更偏向于性能強大的 GPU 作為算力基礎(chǔ)設(shè)施。但隨著近年來芯片短缺情況惡化,GPU 推理方案成本迅速上升,很多企業(yè)開始將目光投向了 CPU,并發(fā)現(xiàn)了 CPU 方案的一些顯著優(yōu)勢:
成本顯著降低:打關(guān)模型的 AI 推理任務(wù)以離線為主,任務(wù)運行時間也相對寬松。因此選用基于低成本、易獲得的 CPU 進行推理的云實例在運行時間上可以滿足樂元素要求,還可以節(jié)約日常開發(fā)成本。
資源利用率高:除了打關(guān)推理模型外,樂元素日常也有很多通用計算任務(wù)需求,使用 CPU 來運行推理模型,可以在閑時繼續(xù)運行其他通用任務(wù),甚至在游戲流量高峰時快速擴展服務(wù)器資源池,有效提升了資源利用率,避免造成資源浪費;
易開發(fā)、易部署:基于 CPU 的云實例搭配成熟的軟件棧,使游戲公司開發(fā)團隊能夠快速部署推理模型,無需復(fù)雜的移植和優(yōu)化工作。在一些需要快速部署新模型的情況下,所需的時間甚至更短。
CPU 突破 AI 推理難關(guān),英特爾® AMX 引擎成為取勝關(guān)鍵
新一代騰訊云實例 S8 基于全新優(yōu)化虛擬化平臺,提供了平衡、穩(wěn)定的計算、內(nèi)存和網(wǎng)絡(luò)資源。其中,標(biāo)準型實例采用第五代英特爾® 至強® 可擴展處理器,內(nèi)存采用最新 DDR5,默認網(wǎng)絡(luò)優(yōu)化,最高內(nèi)網(wǎng)收發(fā)能力達 4500 萬 pps,最高內(nèi)網(wǎng)帶寬可支持 120Gbps。
騰訊云實例 S8 搭載的第五代至強® 可擴展處理器憑借內(nèi)置加速器實現(xiàn)單核性能提升,相較上一代產(chǎn)品,其整體性能提升 21%,內(nèi)存速度提升 16%,且與上一代產(chǎn)品的軟件和平臺兼容,部署新系統(tǒng)時可大大減少測試和驗證工作。
樂元素遷移到騰訊云實例 S8 后,單個實例能夠處理的游戲數(shù)據(jù)和用戶請求規(guī)模更大,平均成本更低,自研 AI 推理模型的效能大幅提升。
第五代至強® 可擴展處理器內(nèi)置了英特爾® AMX 加速引擎,可加速基于 CPU 的深度學(xué)習(xí)推理,避免了使用獨立加速器帶來的成本和復(fù)雜性。英特爾® AMX 引入了一種用于矩陣處理的新框架(包括了兩個新的組件,一個二維寄存器文件,其中包含稱為 “tile” 的寄存器,以及一組能在這些 tile 上操作的加速器),從而能高效地處理各類 AI 任務(wù)所需的大量矩陣乘法運算,提升其在訓(xùn)練和推理時的工作效能。
*英特爾® AMX 架構(gòu)
通過采用英特爾® AMX 技術(shù),樂元素得以顯著提升自研 AI 推理模型的性能,除了提升模型的關(guān)卡驗證測試效率外,還能滿足更多場景的需求。例如英特爾® AMX 技術(shù)可以助力快速處理玩家數(shù)據(jù),以實現(xiàn)快速的游戲元素調(diào)整;快速處理大量數(shù)據(jù),創(chuàng)造更加真實和吸引人的在線互動,以提供更加平滑和快速的在線游戲體驗。
樂元素還對新一代騰訊云 S8 實例進行了性能測試,驗證了其代際性能提升。在 AI 打關(guān)推理模型的測試中,對比騰訊云與英特爾聯(lián)合定制優(yōu)化的第三代至強® 可擴展處理器,啟用了英特爾® AMX 技術(shù)將模型從 FP32 轉(zhuǎn)化為 BF16 后,第五代至強® 可擴展處理器的推理性能提升達 3.44 倍。
*自研打關(guān)模型推理性能測試數(shù)據(jù)
樂元素還在《開心消消樂》中引入了新春掃龍字活動,在玩家上傳掃描的圖片后,樂元素會通過圖像分類識別領(lǐng)域常用的 ResNet-50 模型進行圖片識別并返回結(jié)果。該模型在第五代至強® 可擴展處理器上的測試結(jié)果表明,啟用了英特爾® AMX 后推理性能提升高達 5.19 倍。
*《開心消消樂》新春掃龍字活動模型測試數(shù)據(jù)
除了硬件加持以外,英特爾® oneDNN 還提供了深度學(xué)習(xí)構(gòu)建塊的高度優(yōu)化實現(xiàn),深度學(xué)習(xí)應(yīng)用程序和框架開發(fā)人員可以對 CPU、GPU 或兩者使用相同的 API,從而抽象出指令集和其他復(fù)雜的性能優(yōu)化,大大降低編程人員優(yōu)化 AI 推理性能的難度。
從以上實踐案例不難看出,啟用基于第五代英特爾® 至強® 可擴展處理器的新一代騰訊云實例 S8 后,開發(fā)廠商能游刃有余地應(yīng)對自動打關(guān)等模型的推理需求,提升游戲開發(fā)和運營效率。開發(fā)廠商也很容易實現(xiàn)模型擴展,在更多環(huán)節(jié)引入 AI 技術(shù),滿足更多場景的需求。
通過部署第五代英特爾® 至強® 可擴展處理器的騰訊云實例,樂元素?zé)o需采用昂貴的專用 AI 服務(wù)器,還可以快速根據(jù)市場需求進行擴展,使企業(yè)在保持輕資產(chǎn)、輕運營壓力的同時獲得更高的投資回報率。
對于樂元素這樣缺少大規(guī)模自建 AI 集群的企業(yè)而言,基于第五代至強® 可擴展處理器的騰訊云實例,讓他們能夠快速享受 AI 技術(shù)創(chuàng)新帶來的價值,進而為廣大終端用戶帶來更滿意的產(chǎn)品和服務(wù)體驗。
第五代英特爾® 至強® 可擴展處理器,為游戲行業(yè) AI 創(chuàng)新注入持續(xù)動能
如今,AI 技術(shù)已經(jīng)成為游戲產(chǎn)業(yè)發(fā)展的熱門技術(shù)方向。一份研究報告預(yù)計,2024 年 AI 技術(shù)應(yīng)用將為游戲公司帶來約 21% 的人力成本下降。在此背景下,構(gòu)建面向游戲開發(fā)與運營的 AI 算力平臺,推動 AI + 游戲應(yīng)用的創(chuàng)新,正在成為影響游戲公司競爭力的關(guān)鍵因素。
樂元素的實踐證實,基于第五代英特爾® 至強® 可擴展處理器的騰訊云實例 S8 能夠滿足典型 AI 模型在推理算力上的需求,同時具備更高的經(jīng)濟性與靈活性,能夠成為游戲企業(yè)拓展 AI 應(yīng)用的理想選擇。在當(dāng)前合作成果的基礎(chǔ)上,英特爾將與騰訊云和樂元素展開更多合作,加快步伐,將 AI 融入到游戲開發(fā)與運營的整體流程之中。英特爾與騰訊云的成果也將惠及更多游戲企業(yè),持續(xù)為他們提供助力,滿足輕資產(chǎn)、重人力類型的游戲廠商在激烈的競爭環(huán)境中降本增效的迫切需求。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。