正在逐步覆蓋!騰訊提醒勿為實況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團喜歡“追風口”快手電商新增近800個“0元開店”類目,推出多項新商入駐權(quán)益年內(nèi)狂攬五項第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務最后一道防線阿里云盤出“BUG”客服回應:已修復圍剿BBA,比亞迪和騰勢也準備出一份力阿里云服務器操作系統(tǒng)Alibaba Cloud Linux全新升級,核心場景性能提升超20%屏幕面板 10 月出貨,蘋果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋果史上最大:iPhone 16系列電池容量公布后移動互聯(lián)網(wǎng)時代,移動App兼容測試持續(xù)占據(jù)核心地位歐盟警告蘋果:六個月內(nèi)開放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實現(xiàn)營收5970億元,同比增長13.53%傳三星計劃2025年推出卷軸屏手機蘋果新專利探索折疊iPhone未來,任意表面實現(xiàn)觸敏控制蘋果iPhone16/Pro系列手機今日首銷,5999~9999元起各方媒體的聚焦關(guān)注,中南高科實力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 首頁 > 數(shù)據(jù)存儲頻道 > 數(shù)據(jù).存儲頻道 > 半導體

    為大模型定制一顆芯片?

    2024年04月07日 09:53:11   來源:微信公眾號:半導體行業(yè)觀察

      當我們回顧2023年爆火的AI時,有兩位明星獲得了最多的關(guān)注度,一位是開發(fā)了ChatGPT的OpenAI,另一位是為各路AI選手提供雄厚算力的英偉達。

      逢大模型必提OpenAI,逢顯卡必提英偉達,成了過往一年的常態(tài)。

      但這樣的情形必然不會持續(xù)太久,不論是AI大模型還是AI顯卡,都是動輒每年上百億美元乃至于千億美元的市場,大家都不想讓兩家廠商獨吞蛋糕。

      在大模型上,LaMDA 、LLaMA、Gemini等早已虎視眈眈,而在顯卡上,不光有傳統(tǒng)的英特爾與AMD這兩家,還有各類定制與自研芯片涌現(xiàn),OpenAI與英偉達已經(jīng)迎來了各自的競爭對手。

      但更有意思的事情也在發(fā)生,AI的軟件和硬件并非天然對立,如果把大型語言模型和顯卡芯片結(jié)合在一起,會有什么樣的奇妙反應呢?

      為大模型量身打造芯片

      想要訓練一個大模型,代表算力的芯片就是最關(guān)鍵的一環(huán),也是成本最高的一環(huán)。

      這也導致了一個問題,如果AI照著現(xiàn)在這幅樣子發(fā)展下去,那么成本就會越來越高,高到絕大部分公司都難以承受的地步,根據(jù)外媒估計,如今正在開發(fā)的大模型,平均每個需要花費約 10 億美元,而下一代大模型呢,平均每個需要花費 100 億美元來訓練,這個天文數(shù)字,在硅谷買下幾十家有潛力的初創(chuàng)公司都還有得找。

      這也暴露出了目前行業(yè)最常用的英偉達顯卡的弊端,英偉達的GPU并非為了AI而生,它起初是為了處理各種各樣的圖形化計算而生產(chǎn)制造的,整體設計也沒有脫離傳統(tǒng)計算的范疇,面對人工智能蓬勃發(fā)展時,強大的算力有相當一部分被浪費了,也意味著白花花的銀子被浪費了。

      大公司可以一邊著手自研,一邊繼續(xù)購買英偉達的顯卡,但對于中小型公司來說,顯卡成為了他們*的絆腳石,如此一來,AI在某種程度上就成為了一部分公司的專屬。

      不過這種需求已被一部分人所注意到,在美國硅谷,邁克-岡特(Mike Gunter)和雷納-波普(Reiner Pope)這兩位從谷歌出走的工程師,他們成立了一家名為 MatX 的公司,而這家公司的目標,就是設計專門用于LLM(大型語言模型)的,更便宜、更快速、更適合人工智能的芯片。

      在谷歌任職時,Gunter主要負責設計運行人工智能軟件的硬件(包括芯片),Pope則負責編寫人工智能軟件本身,這里不得不提到谷歌此前自研的TPU了,從2014年發(fā)展至今,已經(jīng)更迭了整整五代,但它們和英偉達H100一樣,都不是為了LLM所量身打造的,放在人工智能領域中,顯得過于通用了一些。

      Pope在接受采訪時表示:“我們試圖讓LLM在谷歌運行得更快,并取得了一些進展,但這有點困難,”他說到,“在谷歌內(nèi)部,有很多人希望對芯片進行各種改動,因此很難只專注于 LLM。為此,我們選擇了離開。”

      這兩位創(chuàng)始人都認為,在人工智能時代到來之際,芯片上額外的空間增加了不必要的成本和復雜性,因此需要“一刀切”,去掉所有不必要的部分,只保留必要的部分,MatX公司的做法就是在硅片上設計一個大型處理內(nèi)核,目的只有一個,那就是盡可能快地將數(shù)字相乘——這是 LLM 的核心任務。

      MatX表示,自己的芯片在訓練 LLM 和提供其結(jié)果方面將比英偉達的 GPU 至少好 10 倍。“英偉達有非常強大的產(chǎn)品,顯然是大多數(shù)公司的理想選擇,” Pope說,“但我們認為我們可以做得更好。

      其預測,通過贏得包括OpenAI和Anthropic PBC在內(nèi)的多家主要人工智能企業(yè)的青睞,它的業(yè)務將蒸蒸日上。“這些公司的經(jīng)濟狀況與一般公司完全相反,"Gunter說,"他們把錢都花在了計算上,而不是工資上。如果情況不改變,他們就會沒錢。”

      無獨有偶,隔壁總部位于多倫多的人工智能芯片初創(chuàng)公司 Taalas,同樣立志于改變由英偉達主導的AI世界,公司創(chuàng)始人包括Ljubisa Bajic、Lejla Bajic 和 Drago Ignjatovic,他們均來自傳奇架構(gòu)師Jim Keller所領導的Tenstorrent。

      與前東家Tenstorrent不同的是,Taalas幾位創(chuàng)始人想開發(fā)一種自動流程,能將任何人工智能模型快速轉(zhuǎn)化為定制芯片,其表示,由此產(chǎn)生的硬核模型的效率是軟件模型的 1000 倍。

      “要實現(xiàn)人工智能的商品化,就必須將計算能力和效率提高 1000 倍,而目前的漸進式方法是無法實現(xiàn)這一目標的。我們不應該在通用計算機上模擬智能,而應該直接在芯片中打造智能,在芯片中實現(xiàn)深度學習模型是實現(xiàn)可持續(xù)人工智能的最直接途徑。”Taalas 首席執(zhí)行官Ljubisa Bajic說。

      Taalas認為,公司會解決了當今人工智能硬件的兩大問題,即能效和成本。如果客戶需要在手機里使用特定參數(shù)Llama2模型,而且確定了產(chǎn)品生命周期中的全部需求,那么可能只需要為它提供一款*功耗和*成本的專用芯片,未來的AI在消費者日常生活中的普及程度將像電力一樣無處不在,而Taalas認為自己能夠推動這一切的發(fā)展。

      Taalas表示,它將在2024年第三季度推出*大型語言模型芯片,并計劃在2025年*季度向首批客戶提供芯片。

      目前,這兩家打算顛覆目前AI芯片市場的公司都拿到了一筆數(shù)額不菲的投資,MatX獲得了2500萬美元的融資,而Taalas則獲得了5000萬美元的融資。

      MatX的投資人提到,MatX這樣的公司象征著人工智能世界的一種新趨勢,因為他們正在把一些大公司開發(fā)出來的*的創(chuàng)意(這些公司有點行動太慢、太官僚化)獨立商業(yè)化,硅谷之所以能成為硅谷,正是因為一批又批充滿活力的初創(chuàng)公司,初創(chuàng)公司能改變目前芯片行業(yè)沉悶的情況。

      但問題也隨之而來,設計芯片并不是吃飯喝水那么簡單,設計和制造一款新芯片需要三到五年的時間,中間還不能出現(xiàn)重大失誤,五年前的想法拿到現(xiàn)在來看,不少已然過時,這就要求這些初創(chuàng)公司對未來技術(shù)趨勢有一個更準確的判斷。

      上個月,英偉達已經(jīng)推出了全新的B200芯片,原本可能上百倍的差距,或許已經(jīng)縮小到數(shù)十倍,隨著時間的推移,這部分差距只會越來越小,到了優(yōu)勢不那么明顯的時候,恐怕這些初創(chuàng)公司就很難說服英偉達原來的客戶遷移到新芯片之上了。

      消費端客戶關(guān)心體驗和效果,大模型企業(yè)關(guān)心能效和成本,芯片公司看重技術(shù)與趨勢,這一條鏈路上環(huán)環(huán)相扣,誰能把握技術(shù)趨勢,誰就能真正勝券在握,看明白了這一點,我們或許就能明白為何有MatX和Taalas這樣的公司涌現(xiàn)了。

      英偉達的押注

      比較有意思的是,英偉達雖然坐擁大半個AI芯片市場,但它也有自己的危機意識。此前雖傳出消息,它將為部分廠商提供定制芯片服務,但在CEO黃仁勛的演講中,英偉達再怎么放下身段,也不會完全迎合與滿足客戶需求,與上述的新興芯片公司形成了鮮明反比。

      英偉達的實際護城河是什么?毫無疑問是CUDA,黃仁勛將其視作成功的根本來源,這種生態(tài)絕非一朝一夕能夠建立起來,英偉達想做和要做的,就是把CUDA鋪設到無處不在。

      因此,英偉達開始了自己的押注,根據(jù)金融數(shù)據(jù)公司Dealogic提供的數(shù)據(jù),英偉達在2023年對30多家初創(chuàng)公司進行了投資,數(shù)量是上一年的三倍多。英偉達已發(fā)布的財報顯示,截至今年1月末的上一財季,該公司對其他公司的投資總額約為15.5億美元,遠遠超過一年前的3億美元。

      2023年,英偉達投資了大約11家AI基礎設施提供商,包括數(shù)據(jù)分析公司Databricks Inc.,GPU云提供商CoreWeave Inc.和大語言模型提供商Mistral AI SAS,此外,英偉達還投資了像視頻生成器Twelve Labs Inc.,聊天機器人創(chuàng)建者Cohere Inc.和機器人流程自動化初創(chuàng)公司Adept AI Labs Inc.這樣的生成式AI公司。

      英偉達的投資并不僅限于IT領域,還包括將AI應用于醫(yī)療保健的初創(chuàng)公司,它投資了八家藥物發(fā)現(xiàn)初創(chuàng)公司,包括Generate Biomedicines Inc.和Genesis Therapeutics Inc.,這兩家公司都在使用AI來發(fā)現(xiàn)新藥。

      通過這些投資,英偉達不僅能夠支持和利用這些初創(chuàng)公司在AI領域的創(chuàng)新,把市場蛋糕做大;還能與重要客戶建立緊密聯(lián)系,形成了一個良好的生態(tài)。這種策略可能使英偉達在競爭激烈的市場中獲得優(yōu)勢,因為這些初創(chuàng)公司的成功可能進一步提升對英偉達產(chǎn)品的需求。同時,這也為英偉達提供了一個了解市場動向、技術(shù)創(chuàng)新和客戶需求的窗口。

      值得一提的是,根據(jù)英偉達2023財年的財報,其客戶現(xiàn)可通過云服務,全面接觸英偉達AI的各個層面:AI超級計算機、加速庫軟件以及預訓練的生成式AI模型。用戶可通過瀏覽器,通過英偉達DGX Cloud服務,接入英偉達DGX AI超級計算機。在AI平臺軟件層面,用戶能夠使用英偉達AI企業(yè)版,以訓練和部署大型語言模型或其他AI工作負載。在AI模型即服務層面,英偉達為希望為其業(yè)務定制生成式AI模型和服務的企業(yè)客戶提供NeMo和BioNeMo定制AI模型。

      英偉達可能不會積極地提供定制芯片,但它卻一定會樂于推銷自己的定制生態(tài),即使初期這些AI公司并不能提供什么實質(zhì)性的回報,但它們所代表的未來趨勢,正是英偉達所看重的,這種做法有點像是電腦上的付費軟件,先提供一段時間的免費試用,等到用戶養(yǎng)成使用習慣了,再開啟收費模式。

      而且英偉達這種拋磚引玉的做法不是沒有成功的先例,OpenAI為什么會堅定不移地使用英偉達的芯片來訓練模型,最早可以追溯到免費贈送的DGX-1,一臺超算就撬動了百億美元市場,這筆買賣怎么看這么劃算。

      寫在最后

      事到如今,AI芯片市場似乎已經(jīng)分成了旗幟分明的三派:*派也是*的一派,當然是英偉達,靠著新鮮出爐的B200又能賺得盆滿缽滿,第二派是以博通為代表的定制派,比起英偉達,他們才更像是賣服務的,自己不生產(chǎn)芯片,幫企業(yè)造好芯片。

      但這兩派更多覆蓋的還是那些中大型的巨頭,只有它們才有財力和實力來訓練自己的大模型,一部分初創(chuàng)AI公司實質(zhì)上是被忽略了,即使英偉達豪擲數(shù)十億美元,也只是覆蓋了很小一部分初創(chuàng)公司,且縱使是巨頭,在瘋狂燒錢這件事上也已經(jīng)出現(xiàn)了動搖,新的需求已經(jīng)從幕后走向臺前。

      第三派如今開始嶄露頭角,喊出為每個大模型定制芯片的口號,意圖就是打入英偉達和博通所不能顧及的市場,在AI浪潮中分得一杯羹。

      你認為MatX和Taalas這樣的公司會脫穎而出嗎?

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。