算力不足，小模型成AI模型發(fā)展下個方向？

2024年04月24日 09:22:12 來源：新火種公眾號

　　大模型不是AI的唯一出路，把模型做小也是本事。

　　這段時間，AI模型界是真的熱鬧，新的模型不斷涌現(xiàn)，不管是開源還是閉源，都在刷新成績。就在前幾天，Meta就上演了一出“重奪開源鐵王座”的好戲。發(fā)布了Llama38B和70B兩個版本，在多項指標(biāo)上都超越了此前開源的Grok-1和DBRX，成為了新的開源大模型王者。

　　并且Meta還透露，之后還將推出400B版本的Llama3，它的測試成績可是在很多方面上都追上了OpenAI閉源的GPT-4，讓很多人都直呼，開源版的GPT-4就要來了。盡管在參數(shù)量上來看，相比Llama2，Llama3并沒有特別大的提升，但是在某些表現(xiàn)上，Llama3最小的8B版本都比Llama270B要好�？梢姡Ｐ托阅艿奶嵘⒎侵挥卸褏�(shù)這一種做法。

　　Llama3重回開源之王

　　當(dāng)?shù)貢r間4月18日，“真·OpenAI”——Meta跑出了目前最強的開源大模型Llama3。本次Meta共發(fā)布了兩款開源的Llama38B和Llama370B模型。根據(jù)Meta的說法，這兩個版本的Llama3是目前同體量下，性能最好的開源模型。并且在某些數(shù)據(jù)集上，Llama38B的性能比Llama270B還要強，要知道，這兩者的參數(shù)可是相差了一個數(shù)量級。

　　能夠做到這點，可能是因為Llama3的訓(xùn)練效率要高3倍，它基于超過15T token訓(xùn)練，這比Llama2數(shù)據(jù)集的7倍還多。在MMLU、ARC、DROP等基準(zhǔn)測試中，Llama38B在九項測試中領(lǐng)先于同行，Llama370B也同樣擊敗了Gemini1.5Pro和Claude3Sonnet。

　　盡管在參數(shù)量上并沒有特別大的提升，但毫無疑問，Llama3的性能已經(jīng)得到了很大的進步，可以說是用相近的參數(shù)量獲得了更好的性能，這可能是在算力資源短期內(nèi)無法滿足更大規(guī)模運算的情況下所作出的選擇，但這體現(xiàn)了AI模型的研發(fā)并非只有堆砌參數(shù)這一條“大力出奇跡”的道路。

　　把大模型做小正成業(yè)內(nèi)共識

　　實際上，在Llama3之間的兩位開源王者，Grok-1和DBRX也致力于把模型做小。和以往的大模型，使用一個模型解決一切問題的方式不同，Grok-1和DBRX都采用了MoE架構(gòu)(專家模型架構(gòu))，在面對不同問題的時候，調(diào)用不同的小模型來解決，實現(xiàn)在節(jié)省算力的情況下，保證回答的質(zhì)量。

　　而微軟也在Llama3發(fā)布后沒幾天，就出手截胡，展示了Phi-3系列小模型的技術(shù)報告。在這份報告中，僅3.8B參數(shù)的Phi-3-mini在多項基準(zhǔn)測試中都超過了Llama38B，并且為了方便開源社區(qū)使用，還特意把它設(shè)計成了與Llama系列兼容的結(jié)構(gòu)。更夸張的是，微軟的這個模型，在手機上也能直接跑，經(jīng)4bit量化后的phi-3-mini在iPhone14pro和iPhone15使用的蘋果A16芯片上能夠跑到每秒12token，這也就意味著，現(xiàn)在手機上能本地運行的最佳開源模型，已經(jīng)做到了ChatGPT水平。

　　而除了mini杯外，微軟也一并發(fā)布了小杯和中杯，7B參數(shù)的Phi-3-small和14B參數(shù)的Phi-3-medium。在技術(shù)報告中，微軟也說了，去年研究團隊就發(fā)現(xiàn)，單純堆砌參數(shù)量并非提升模型性能的唯一路徑，反而是精心設(shè)計訓(xùn)練的數(shù)據(jù)，尤其是利用大模型本身去生成合成數(shù)據(jù)，并配合嚴(yán)格過濾的高質(zhì)量數(shù)據(jù)，能夠讓中小模型的能力大幅躍升，所以他們也說，Textbooks are all you need，教科書級別的高質(zhì)量數(shù)據(jù)才是重要的。

　　AI模型發(fā)展正著力于擺脫限

　　自英偉達乘著AI的東風(fēng)，成為行業(yè)內(nèi)說一不二，當(dāng)之無愧的“賣鏟子的人”，各家AI公司都將英偉達的GPU視為“硬通貨”，以致于誰囤有更多的英偉達的GPU，誰的AI實力就強。但英偉達的GPU的交付并未能始終跟上市場的需求。

　　因此，很多AI公司開始另謀出路，要么找其他的GPU生產(chǎn)商，要么決定自己研發(fā)AI芯片。即使你囤夠了英偉達的GPU，也還有其他限制，OpenAI在前段時間就被爆出，因為訓(xùn)練GPT-6，差點把微軟的電網(wǎng)搞癱瘓。馬斯克也曾說過，當(dāng)前限制AI發(fā)展的主要因素是算力資源，但在未來，電力會成為限制AI發(fā)展的另一阻礙。

　　顯然，如果持續(xù)“大力出奇跡”，通過堆砌參數(shù)量來實現(xiàn)AI性能的提升，那么以上這些問題遲早會遇到，但是如果把大模型做小，使用較小的參數(shù)量，實現(xiàn)同樣或者更好的性能，那么將可以顯著減少對算力資源的需求，進而減少對電力資源的消耗，從而讓AI在有限資源的情況下，得到更好的發(fā)展。

　　因此，接下來，誰能在將模型做小的同時，還能實現(xiàn)性能的增長，也是實力的體現(xiàn)。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信