在人工智能技術快速發(fā)展的今天,如何在各種硬件上實現(xiàn)高效的模型推理成為了開發(fā)者們的一項重要挑戰(zhàn)。最近,開發(fā)者 Andrei David 從一臺近二十年的 Xbox360游戲機中找到了靈感,他成功地將 Meta AI 的 Llama LLM 系列中的一款輕量級模型 ——llama2.c 移植到這臺老舊的游戲機上。
David 在社交媒體平臺 X 上分享了他的這一成就,稱他面對的挑戰(zhàn)非常巨大。Xbox360的 PowerPC CPU 采用了 big-endian 架構,這意味著在模型的配置和權重加載時,必須進行大量的 endian 性轉(zhuǎn)換。此外,David 還需要對原始代碼進行深度調(diào)整和優(yōu)化,以使其能夠在這樣一臺老化的硬件上順利運行。
內(nèi)存管理也是他必須解決的一大難題。llama2模型的大小達到60MB,而 Xbox360的內(nèi)存架構為統(tǒng)一內(nèi)存,這就意味著 CPU 和 GPU 需要共享同一塊內(nèi)存。這使得 David 在設計內(nèi)存使用時必須相當謹慎。他認為,盡管 Xbox360的內(nèi)存限制,但在當時其架構卻非常具有前瞻性,預示了現(xiàn)代游戲機和 APU 的標準內(nèi)存管理技術。
經(jīng)過反復編碼和優(yōu)化,David 終于成功地在 Xbox360上運行了 llama2模型,只需一個簡單的提示:“瞌睡喬說”。值得一提的是,llama2模型僅有700行 C 代碼,且沒有外部依賴,這使得它在特定領域的定制化下可以表現(xiàn)出 “令人驚訝” 的強大性能。
對于其他開發(fā)者來說,David 的成功給了他們一個新的方向。有用戶提出,Xbox360的512MB 內(nèi)存或許也能支撐其他小型 LLM 的實現(xiàn),比如 Hugging Face 公司開發(fā)的 smolLM。David 對此表示歡迎,未來我們很可能會看到更多關于 LLM 在 Xbox360上的實驗成果。
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。