首頁 > 云計算頻道 > 大模型

“技術故障”背刺巴菲特，金融大模型到底靠不靠譜？

2024年06月29日 11:45:59 來源：CSDN博客

　　一個“技術問題”，導致巴菲特的伯克希爾-哈撒韋公司股價暴跌近100%。

　　想必很多小伙伴已經(jīng)感受過了這則鋪天蓋地的消息，所帶來的億點點震撼。

　　而根據(jù)事后的消息來看，這個大故障是紐交所的合并報價系統(tǒng)(CTA)在更新軟件時出現(xiàn)了問題。

　　許多專家都對此做了分析，有人認為是CTA軟件在進行版本更新時出現(xiàn)了數(shù)據(jù)一致性問題;也有人提出最大的問題應該是出現(xiàn)在了數(shù)據(jù)庫。

　　但總而言之，這并非是紐交所今年來第一次出現(xiàn)的故障，而是眾多里的一個：

　　甚至某開源數(shù)據(jù)庫聯(lián)合創(chuàng)始人Jason直言不諱地表示：

　　>紐交所在CTA軟件上相關的IT水平還不及中國的大型金融機構和互聯(lián)網(wǎng)公司，在中國已經(jīng)很少會發(fā)生這種低級錯誤了。

　　即便如此，這也不禁令人產(chǎn)生更大的顧慮和擔憂——

　　傳統(tǒng)軟件問題尚能引發(fā)如此大的問題，那么站在大模型時代當下，AI+金融，是否又能做到準確可信?

　　正所謂實踐是檢驗真理唯一標準，要回答的這個問題，我們不妨了解一下已經(jīng)在金融領域“上崗”了的AI大模型。

　　大模型上崗金融，都在做什么?

　　誠然AI大模型的發(fā)展已然呈現(xiàn)勢不可擋的趨勢，但在金融領域真正應用的時候，依舊存在一些顯著的困難和挑戰(zhàn)。

　　例如數(shù)據(jù)隱私和安全方面，金融數(shù)據(jù)往往高度敏感，涉及個人和企業(yè)的財務信息，確保數(shù)據(jù)隱私和安全是首要挑戰(zhàn)之一。

　　并且這些數(shù)據(jù)具有多源和異構的特點，需要進行有效的整合和處理，才能確保它們的準確性和完整性。

　　再如模型本身，大模型往往被視為“黑箱”，因為其內(nèi)部決策過程難以解釋;在金融領域，尤其是涉及風險管理和監(jiān)管合規(guī)時，可解釋性和決策透明性是非常重要的。

　　還有在實時性和資源消耗方面，金融市場瞬息萬變，需要實時數(shù)據(jù)處理和決策支持，大模型的推理涉及到大量的矩陣乘法計算，對硬件的矩陣乘法計算能力提出較高要求，計算復雜性可能導致響應時間延遲，不利于實時應用。

　　加之大模型訓練和推理過程需要大量的計算資源和能量消耗，這對企業(yè)的成本和環(huán)保要求提出了挑戰(zhàn)。

　　而成立于1998年的老牌金融科技公司金證，面對上述固有的重重困難，卻有著自己的一套解法。

　　在金證看來，大模型的優(yōu)勢在于文本及非結構化數(shù)據(jù)處理能力、人機交互能力、生成能力和邏輯推理能力較強。

　　而相比小模型而言，大模型也存在明顯的劣勢，例如大模型“幻覺”問題(即大模型答非所問)，大模型的部署算力要求高造成算力資源浪費，部署成本高等問題。

　　因此，金證的解法就是——通過組合式AI，即大模型+小模型+工具，以此來支撐各個業(yè)務場景AI需求。

　　大模型方面，包含金證去年年底推出的K-GPT以及業(yè)內(nèi)眾多頂流的大模型，在特定的金融任務中發(fā)揮大模型的特長。

　　小模型則是指諸如OCR、NLP、人臉識別、文字識別、財務分析等傳統(tǒng)模型，可以細分任務做到快準狠地處理。

　　至于工具，則是指地圖、天氣、CRM、郵件、OA等。

　　一言蔽之，在某個金融領域任務中，這種模式可以讓大模型、小模型和工具做到“專業(yè)的人干專業(yè)事”，尤其能極大地提高效率。

　　值得一提的是，相比于通用大模型，金證的K-GPT在數(shù)據(jù)查詢的準確性方面表現(xiàn)更佳，能夠更好地理解金融術語，提供專業(yè)且數(shù)據(jù)扎實的回復。

　　據(jù)了解，K-GPT 還支持查看引用的知識源，并具備與實時數(shù)據(jù)和模塊化集成的能力，可以調取實時數(shù)據(jù)和組件。

　　依托龐大的金融知識庫，K-GPT專為金融場景服務，其核心優(yōu)勢在于對金融的深入理解、數(shù)據(jù)準確、可驗證性以及支持調用Agent功能。

　　從效果上不難看出，金證已然讓大模型在金融領域中合格地上崗，那么針對成本和資源上的痛點，金證又是如何解決的呢?

　　背后是高帶寬內(nèi)存(HBM)的至強處理器在發(fā)力

　　金證K-GPT方案中，還有一點比較特別：與英特爾合作，采用了基于CPU的大模型推理方案。

　　據(jù)了解，他們主要是看中的是英特爾® 至強® CPU Max 系列處理器。

　　這是英特爾唯一一款基于x86架構并采用高帶寬內(nèi)存(HBM)的CPU系列，采用了片上HBM設計，內(nèi)存帶寬高達4TB/s。和傳統(tǒng)DDR5內(nèi)存相比，HBM具有更多的訪存通道和更長的讀取位寬，理論帶寬可達DDR5的4倍之多。

　　要知道，大模型推理涉及大量的權重數(shù)據(jù)讀取，對硬件平臺的內(nèi)存訪問帶寬提出了很高的要求。

　　至強® CPU Max具有64GB HBM，每個內(nèi)核可以分攤到超過1GB的內(nèi)存，對于包括大模型推理任務在內(nèi)的絕大多數(shù)計算任務，HBM都可以容納全部的權重數(shù)據(jù)。

　　內(nèi)存帶寬還不是金證選擇這款CPU的全部理由。

　　英特爾® 至強® CPU Max系列還內(nèi)置了英特爾® 高級矩陣擴展 (英特爾®️ AMX)引擎，大幅提升了大規(guī)模矩陣乘法運算性能。

　　金證K-GPT基于Transformer架構，其核心特點包括多頭注意力機制和前饋神經(jīng)網(wǎng)絡層，這其中都包含大量矩陣運算，而英特爾® AMX通過1024位TMUL指令和8個獨立的矩陣計算單元，可以每時鐘周期執(zhí)行8次獨立的矩陣乘累加操作，為這些運算提供強大的加速能力。

　　如此一來，大模型推理的效果如何呢?

　　在只用單顆 CPU 的情況下，推理130億參數(shù)大模型，首個詞元生成時間就能壓到1秒左右，模型推理TPS超過10 tokens/s，用戶提問后約2秒內(nèi)就能得到響應。

　　別忘了遇到負載高峰等情況，還可以同時啟用2顆CPU，性能還能提升將近一倍，可以說足以滿足金融場景的大部分應用需求了。