宏景智駕完成數(shù)億元C輪融資植物生長好幫手:廣明源金線蓮組培燈照亮生長每一步ROG純白系列DIY好物:簡約不失高雅,買它準沒錯!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認證并投入市場安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎電動自行車強制性“國標”再修訂,綠源電動車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對承壓的小家電市場,小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機僅有iPad大小2024年冷年空調(diào)市場總結(jié):規(guī)模下探,結(jié)構(gòu)降級,空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機型蓄勢待發(fā)云天勵飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充
  • 首頁 > 云計算頻道 > 大模型

    “技術(shù)故障”背刺巴菲特,金融大模型到底靠不靠譜?

    2024年06月29日 11:45:59   來源:CSDN博客

      一個“技術(shù)問題”,導致巴菲特的伯克希爾-哈撒韋公司股價暴跌近100%。

      想必很多小伙伴已經(jīng)感受過了這則鋪天蓋地的消息,所帶來的億點點震撼。

      而根據(jù)事后的消息來看,這個大故障是紐交所的合并報價系統(tǒng)(CTA)在更新軟件時出現(xiàn)了問題。

      許多專家都對此做了分析,有人認為是CTA軟件在進行版本更新時出現(xiàn)了數(shù)據(jù)一致性問題;也有人提出最大的問題應(yīng)該是出現(xiàn)在了數(shù)據(jù)庫。

      但總而言之,這并非是紐交所今年來第一次出現(xiàn)的故障,而是眾多里的一個:

      甚至某開源數(shù)據(jù)庫聯(lián)合創(chuàng)始人Jason直言不諱地表示:

      >紐交所在CTA軟件上相關(guān)的IT水平還不及中國的大型金融機構(gòu)和互聯(lián)網(wǎng)公司,在中國已經(jīng)很少會發(fā)生這種低級錯誤了。

      即便如此,這也不禁令人產(chǎn)生更大的顧慮和擔憂——

      傳統(tǒng)軟件問題尚能引發(fā)如此大的問題,那么站在大模型時代當下,AI+金融,是否又能做到準確可信?

      正所謂實踐是檢驗真理唯一標準,要回答的這個問題,我們不妨了解一下已經(jīng)在金融領(lǐng)域“上崗”了的AI大模型。

      大模型上崗金融,都在做什么?

      誠然AI大模型的發(fā)展已然呈現(xiàn)勢不可擋的趨勢,但在金融領(lǐng)域真正應(yīng)用的時候,依舊存在一些顯著的困難和挑戰(zhàn)。

      例如數(shù)據(jù)隱私和安全方面,金融數(shù)據(jù)往往高度敏感,涉及個人和企業(yè)的財務(wù)信息,確保數(shù)據(jù)隱私和安全是首要挑戰(zhàn)之一。

      并且這些數(shù)據(jù)具有多源和異構(gòu)的特點,需要進行有效的整合和處理,才能確保它們的準確性和完整性。

      再如模型本身,大模型往往被視為“黑箱”,因為其內(nèi)部決策過程難以解釋;在金融領(lǐng)域,尤其是涉及風險管理和監(jiān)管合規(guī)時,可解釋性和決策透明性是非常重要的。

      還有在實時性和資源消耗方面,金融市場瞬息萬變,需要實時數(shù)據(jù)處理和決策支持,大模型的推理涉及到大量的矩陣乘法計算,對硬件的矩陣乘法計算能力提出較高要求,計算復雜性可能導致響應(yīng)時間延遲,不利于實時應(yīng)用。

      加之大模型訓練和推理過程需要大量的計算資源和能量消耗,這對企業(yè)的成本和環(huán)保要求提出了挑戰(zhàn)。

      而成立于1998年的老牌金融科技公司金證,面對上述固有的重重困難,卻有著自己的一套解法。

      在金證看來,大模型的優(yōu)勢在于文本及非結(jié)構(gòu)化數(shù)據(jù)處理能力、人機交互能力、生成能力和邏輯推理能力較強。

      而相比小模型而言,大模型也存在明顯的劣勢,例如大模型“幻覺”問題(即大模型答非所問),大模型的部署算力要求高造成算力資源浪費,部署成本高等問題。

      因此,金證的解法就是——通過組合式AI,即大模型+小模型+工具,以此來支撐各個業(yè)務(wù)場景AI需求。

      大模型方面,包含金證去年年底推出的K-GPT以及業(yè)內(nèi)眾多頂流的大模型,在特定的金融任務(wù)中發(fā)揮大模型的特長。

      小模型則是指諸如OCR、NLP、人臉識別、文字識別、財務(wù)分析等傳統(tǒng)模型,可以細分任務(wù)做到快準狠地處理。

      至于工具,則是指地圖、天氣、CRM、郵件、OA等。

      一言蔽之,在某個金融領(lǐng)域任務(wù)中,這種模式可以讓大模型、小模型和工具做到“專業(yè)的人干專業(yè)事”,尤其能極大地提高效率。

      值得一提的是,相比于通用大模型,金證的K-GPT在數(shù)據(jù)查詢的準確性方面表現(xiàn)更佳,能夠更好地理解金融術(shù)語,提供專業(yè)且數(shù)據(jù)扎實的回復。

      據(jù)了解,K-GPT 還支持查看引用的知識源,并具備與實時數(shù)據(jù)和模塊化集成的能力,可以調(diào)取實時數(shù)據(jù)和組件。

      依托龐大的金融知識庫,K-GPT專為金融場景服務(wù),其核心優(yōu)勢在于對金融的深入理解、數(shù)據(jù)準確、可驗證性以及支持調(diào)用Agent功能。

      從效果上不難看出,金證已然讓大模型在金融領(lǐng)域中合格地上崗,那么針對成本和資源上的痛點,金證又是如何解決的呢?

      背后是高帶寬內(nèi)存(HBM)的至強處理器在發(fā)力

      金證K-GPT方案中,還有一點比較特別:與英特爾合作,采用了基于CPU的大模型推理方案。

      據(jù)了解,他們主要是看中的是英特爾® 至強® CPU Max 系列處理器。

      這是英特爾唯一一款基于x86架構(gòu)并采用高帶寬內(nèi)存(HBM)的CPU系列,采用了片上HBM設(shè)計,內(nèi)存帶寬高達4TB/s。和傳統(tǒng)DDR5內(nèi)存相比,HBM具有更多的訪存通道和更長的讀取位寬,理論帶寬可達DDR5的4倍之多。

      要知道,大模型推理涉及大量的權(quán)重數(shù)據(jù)讀取,對硬件平臺的內(nèi)存訪問帶寬提出了很高的要求。

      至強® CPU Max具有64GB HBM,每個內(nèi)核可以分攤到超過1GB的內(nèi)存,對于包括大模型推理任務(wù)在內(nèi)的絕大多數(shù)計算任務(wù),HBM都可以容納全部的權(quán)重數(shù)據(jù)。

      內(nèi)存帶寬還不是金證選擇這款CPU的全部理由。

      英特爾® 至強® CPU Max系列還內(nèi)置了英特爾® 高級矩陣擴展 (英特爾®️ AMX)引擎,大幅提升了大規(guī)模矩陣乘法運算性能。

      金證K-GPT基于Transformer架構(gòu),其核心特點包括多頭注意力機制和前饋神經(jīng)網(wǎng)絡(luò)層,這其中都包含大量矩陣運算,而英特爾® AMX通過1024位TMUL指令和8個獨立的矩陣計算單元,可以每時鐘周期執(zhí)行8次獨立的矩陣乘累加操作,為這些運算提供強大的加速能力。

      如此一來,大模型推理的效果如何呢?

      在只用單顆 CPU 的情況下,推理130億參數(shù)大模型,首個詞元生成時間就能壓到1秒左右,模型推理TPS超過10 tokens/s,用戶提問后約2秒內(nèi)就能得到響應(yīng)。

      別忘了遇到負載高峰等情況,還可以同時啟用2顆CPU,性能還能提升將近一倍,可以說足以滿足金融場景的大部分應(yīng)用需求了。

      除了硬件層面的突破,英特爾還提供了經(jīng)過優(yōu)化的軟件工具來挖掘硬件潛力。

      比如廣泛使用的OpenVINO™ 工具套件,就被用來專門調(diào)優(yōu)加速模型的Embedding處理進行。

      金融場景涉及大量專業(yè)文檔的輸入任務(wù),Emedding正是把文本從離散變量轉(zhuǎn)變?yōu)檫B續(xù)向量的過程,好讓AI能夠理解。

      經(jīng)過OpenVINO™ 工具套件優(yōu)化后,K-GPT大模型的批量Embedding性能提升到3倍之多。

      圖注:OpenVINO™ 工具套件優(yōu)化前后 Embedding 性能比較

      再比如金證與K-GPT配合使用的開源向量數(shù)據(jù)庫Faiss,英特爾也提供了優(yōu)化版本,以提升在至強® CPU Max上的模型推理性能。

      在大規(guī)模向量相似性檢索任務(wù)中,經(jīng)英特爾優(yōu)化過的版本性能可提升至4倍左右。

      圖注:英特爾優(yōu)化版 Faiss 與原始 Faiss 性能對比(越高越好)

      除了性能方面之外,金證選擇英特爾® 至強® CPU Max系列作為算力底座還帶來其他方面的優(yōu)勢:

      首先是靈活性。由于與主流的 x86 架構(gòu)完全兼容,金證可以繼續(xù)使用原有的機器,靈活搭配適合自身業(yè)務(wù)的配置。而且 CPU 能同時應(yīng)對推理和通用計算,可根據(jù)負載情況隨時調(diào)配資源。

      第二是總擁有成本 (TCO)。從長遠來看,CPU路線能以更低的部署和維護開銷,實現(xiàn)與專用加速器相媲美的性能。這對于需要控制預算的金融機構(gòu)來說至關(guān)重要。

      綜合看下來,英特爾® 至強® CPU Max系列處理器在硬件能力、軟件優(yōu)化、生態(tài)適配、總擁有成本優(yōu)勢等方面都與金融場景非常契合,不失為業(yè)界大模型落地的一種新思路。

      如何評價?

      隨著數(shù)字化轉(zhuǎn)型的不斷深入,大模型為金融行業(yè)帶來的機遇與挑戰(zhàn)并存。

      越來越多的金融機構(gòu)開始探索如何將 AIGC 技術(shù)與實際業(yè)務(wù)相結(jié)合,在提質(zhì)增效的同時控制成本。但總的來說,大模型在金融行業(yè)的應(yīng)用仍處于初步探索階段。

      金證攜手英特爾打造的這套大模型推理方案,可謂是應(yīng)用層、模型層、算力層的深度融合,為業(yè)界樹立了標桿。

      不久前舉辦的金證科技節(jié),就吸引了眾多金融機構(gòu)前來"取經(jīng)"。

      作為連接金融與科技的重要平臺,金證科技節(jié)吸引了眾多來自銀行、證券、保險等領(lǐng)域的金融行業(yè)玩家參與,共同探討 AI 技術(shù)在金融領(lǐng)域的應(yīng)用前景與優(yōu)質(zhì)實踐。

      可以預見,在英特爾的算力加持下,金證將在大模型技術(shù)上不斷突破,助力更多金融機構(gòu)實現(xiàn)數(shù)字化轉(zhuǎn)型,為用戶帶來更智能、高效的服務(wù)體驗。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    [No. S013]
    分享到微信

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。