冰雪大世界盛大開(kāi)園,美的空調(diào)橫跨50℃打造“東北夏威夷”臺(tái)灣小土豆勇闖冰雪大世界,美的空調(diào)真暖快車(chē)成為最熱打卡點(diǎn)京東iPhone 16系列年底大放價(jià)!至高補(bǔ)貼1200元價(jià)格低過(guò)11.11新一季圓滿(mǎn)假期結(jié)伴大使出發(fā)在即 LG電子十年相伴助力溫暖傳遞中國(guó)聯(lián)通組織“魅力亞冬,與智慧同行” 主題采訪活動(dòng)“萬(wàn)象分區(qū)”引領(lǐng)電視行業(yè)新潮流,TCL這步棋下得著實(shí)漂亮!百度職業(yè)院校專(zhuān)屬項(xiàng)目“大國(guó)智匠”引領(lǐng)職業(yè)教育新范式百度大模型助力2024年碼蹄杯程序設(shè)計(jì)大賽,全國(guó)高校學(xué)子展現(xiàn)卓越編程實(shí)力碼蹄杯人物特寫(xiě):四位編程少年的追夢(mèng)之旅金倉(cāng)數(shù)據(jù)庫(kù)四項(xiàng)成果入選2024星河案例亞信科技參加2024通信產(chǎn)業(yè)大會(huì) CTO歐陽(yáng)曄博士等做主題演講用專(zhuān)業(yè)贏得信賴(lài) 美好蘊(yùn)育潤(rùn)康引領(lǐng)孕產(chǎn)營(yíng)養(yǎng)新風(fēng)尚解鎖新成就!愛(ài)企查“度秘書(shū)”粉絲突破10萬(wàn)!英特爾終止x86S架構(gòu)計(jì)劃:純64位設(shè)計(jì)再度戛然而止豆包大模型全面升級(jí),相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示申通、圓通、韻達(dá)發(fā)布 11 月簡(jiǎn)報(bào):快遞業(yè)務(wù)量、收入均同比增長(zhǎng),單票收入均下降SensorTower發(fā)11月中國(guó)手游全球收入排行榜 庫(kù)洛入榜“YO!原”千里來(lái)相會(huì) 華為智能生活館·太原茂業(yè)重裝開(kāi)業(yè)微軟承認(rèn)并調(diào)查Microsoft 365 應(yīng)用出現(xiàn)“產(chǎn)品已停用”錯(cuò)誤SK 海力士被曝贏得博通HBM訂單,預(yù)計(jì)明年 1b DRAM 月產(chǎn)能將擴(kuò)大到 16~17 萬(wàn)片
  • 首頁(yè) > 數(shù)據(jù)存儲(chǔ)頻道 > 數(shù)據(jù).存儲(chǔ)頻道 > 半導(dǎo)體

    為大模型定制一顆芯片?

    2024年04月07日 09:53:11   來(lái)源:微信公眾號(hào):半導(dǎo)體行業(yè)觀察

      當(dāng)我們回顧2023年爆火的AI時(shí),有兩位明星獲得了最多的關(guān)注度,一位是開(kāi)發(fā)了ChatGPT的OpenAI,另一位是為各路AI選手提供雄厚算力的英偉達(dá)。

      逢大模型必提OpenAI,逢顯卡必提英偉達(dá),成了過(guò)往一年的常態(tài)。

      但這樣的情形必然不會(huì)持續(xù)太久,不論是AI大模型還是AI顯卡,都是動(dòng)輒每年上百億美元乃至于千億美元的市場(chǎng),大家都不想讓兩家廠商獨(dú)吞蛋糕。

      在大模型上,LaMDA 、LLaMA、Gemini等早已虎視眈眈,而在顯卡上,不光有傳統(tǒng)的英特爾與AMD這兩家,還有各類(lèi)定制與自研芯片涌現(xiàn),OpenAI與英偉達(dá)已經(jīng)迎來(lái)了各自的競(jìng)爭(zhēng)對(duì)手。

      但更有意思的事情也在發(fā)生,AI的軟件和硬件并非天然對(duì)立,如果把大型語(yǔ)言模型和顯卡芯片結(jié)合在一起,會(huì)有什么樣的奇妙反應(yīng)呢?

      為大模型量身打造芯片

      想要訓(xùn)練一個(gè)大模型,代表算力的芯片就是最關(guān)鍵的一環(huán),也是成本最高的一環(huán)。

      這也導(dǎo)致了一個(gè)問(wèn)題,如果AI照著現(xiàn)在這幅樣子發(fā)展下去,那么成本就會(huì)越來(lái)越高,高到絕大部分公司都難以承受的地步,根據(jù)外媒估計(jì),如今正在開(kāi)發(fā)的大模型,平均每個(gè)需要花費(fèi)約 10 億美元,而下一代大模型呢,平均每個(gè)需要花費(fèi) 100 億美元來(lái)訓(xùn)練,這個(gè)天文數(shù)字,在硅谷買(mǎi)下幾十家有潛力的初創(chuàng)公司都還有得找。

      這也暴露出了目前行業(yè)最常用的英偉達(dá)顯卡的弊端,英偉達(dá)的GPU并非為了AI而生,它起初是為了處理各種各樣的圖形化計(jì)算而生產(chǎn)制造的,整體設(shè)計(jì)也沒(méi)有脫離傳統(tǒng)計(jì)算的范疇,面對(duì)人工智能蓬勃發(fā)展時(shí),強(qiáng)大的算力有相當(dāng)一部分被浪費(fèi)了,也意味著白花花的銀子被浪費(fèi)了。

      大公司可以一邊著手自研,一邊繼續(xù)購(gòu)買(mǎi)英偉達(dá)的顯卡,但對(duì)于中小型公司來(lái)說(shuō),顯卡成為了他們*的絆腳石,如此一來(lái),AI在某種程度上就成為了一部分公司的專(zhuān)屬。

      不過(guò)這種需求已被一部分人所注意到,在美國(guó)硅谷,邁克-岡特(Mike Gunter)和雷納-波普(Reiner Pope)這兩位從谷歌出走的工程師,他們成立了一家名為 MatX 的公司,而這家公司的目標(biāo),就是設(shè)計(jì)專(zhuān)門(mén)用于LLM(大型語(yǔ)言模型)的,更便宜、更快速、更適合人工智能的芯片。

      在谷歌任職時(shí),Gunter主要負(fù)責(zé)設(shè)計(jì)運(yùn)行人工智能軟件的硬件(包括芯片),Pope則負(fù)責(zé)編寫(xiě)人工智能軟件本身,這里不得不提到谷歌此前自研的TPU了,從2014年發(fā)展至今,已經(jīng)更迭了整整五代,但它們和英偉達(dá)H100一樣,都不是為了LLM所量身打造的,放在人工智能領(lǐng)域中,顯得過(guò)于通用了一些。

      Pope在接受采訪時(shí)表示:“我們?cè)噲D讓LLM在谷歌運(yùn)行得更快,并取得了一些進(jìn)展,但這有點(diǎn)困難,”他說(shuō)到,“在谷歌內(nèi)部,有很多人希望對(duì)芯片進(jìn)行各種改動(dòng),因此很難只專(zhuān)注于 LLM。為此,我們選擇了離開(kāi)。”

      這兩位創(chuàng)始人都認(rèn)為,在人工智能時(shí)代到來(lái)之際,芯片上額外的空間增加了不必要的成本和復(fù)雜性,因此需要“一刀切”,去掉所有不必要的部分,只保留必要的部分,MatX公司的做法就是在硅片上設(shè)計(jì)一個(gè)大型處理內(nèi)核,目的只有一個(gè),那就是盡可能快地將數(shù)字相乘——這是 LLM 的核心任務(wù)。

      MatX表示,自己的芯片在訓(xùn)練 LLM 和提供其結(jié)果方面將比英偉達(dá)的 GPU 至少好 10 倍。“英偉達(dá)有非常強(qiáng)大的產(chǎn)品,顯然是大多數(shù)公司的理想選擇,” Pope說(shuō),“但我們認(rèn)為我們可以做得更好。

      其預(yù)測(cè),通過(guò)贏得包括OpenAI和Anthropic PBC在內(nèi)的多家主要人工智能企業(yè)的青睞,它的業(yè)務(wù)將蒸蒸日上。“這些公司的經(jīng)濟(jì)狀況與一般公司完全相反,"Gunter說(shuō),"他們把錢(qián)都花在了計(jì)算上,而不是工資上。如果情況不改變,他們就會(huì)沒(méi)錢(qián)。”

      無(wú)獨(dú)有偶,隔壁總部位于多倫多的人工智能芯片初創(chuàng)公司 Taalas,同樣立志于改變由英偉達(dá)主導(dǎo)的AI世界,公司創(chuàng)始人包括Ljubisa Bajic、Lejla Bajic 和 Drago Ignjatovic,他們均來(lái)自傳奇架構(gòu)師Jim Keller所領(lǐng)導(dǎo)的Tenstorrent。

      與前東家Tenstorrent不同的是,Taalas幾位創(chuàng)始人想開(kāi)發(fā)一種自動(dòng)流程,能將任何人工智能模型快速轉(zhuǎn)化為定制芯片,其表示,由此產(chǎn)生的硬核模型的效率是軟件模型的 1000 倍。

      “要實(shí)現(xiàn)人工智能的商品化,就必須將計(jì)算能力和效率提高 1000 倍,而目前的漸進(jìn)式方法是無(wú)法實(shí)現(xiàn)這一目標(biāo)的。我們不應(yīng)該在通用計(jì)算機(jī)上模擬智能,而應(yīng)該直接在芯片中打造智能,在芯片中實(shí)現(xiàn)深度學(xué)習(xí)模型是實(shí)現(xiàn)可持續(xù)人工智能的最直接途徑。”Taalas 首席執(zhí)行官Ljubisa Bajic說(shuō)。

      Taalas認(rèn)為,公司會(huì)解決了當(dāng)今人工智能硬件的兩大問(wèn)題,即能效和成本。如果客戶(hù)需要在手機(jī)里使用特定參數(shù)Llama2模型,而且確定了產(chǎn)品生命周期中的全部需求,那么可能只需要為它提供一款*功耗和*成本的專(zhuān)用芯片,未來(lái)的AI在消費(fèi)者日常生活中的普及程度將像電力一樣無(wú)處不在,而Taalas認(rèn)為自己能夠推動(dòng)這一切的發(fā)展。

      Taalas表示,它將在2024年第三季度推出*大型語(yǔ)言模型芯片,并計(jì)劃在2025年*季度向首批客戶(hù)提供芯片。

      目前,這兩家打算顛覆目前AI芯片市場(chǎng)的公司都拿到了一筆數(shù)額不菲的投資,MatX獲得了2500萬(wàn)美元的融資,而Taalas則獲得了5000萬(wàn)美元的融資。

      MatX的投資人提到,MatX這樣的公司象征著人工智能世界的一種新趨勢(shì),因?yàn)樗麄冋诎岩恍┐蠊鹃_(kāi)發(fā)出來(lái)的*的創(chuàng)意(這些公司有點(diǎn)行動(dòng)太慢、太官僚化)獨(dú)立商業(yè)化,硅谷之所以能成為硅谷,正是因?yàn)橐慌峙錆M(mǎn)活力的初創(chuàng)公司,初創(chuàng)公司能改變目前芯片行業(yè)沉悶的情況。

      但問(wèn)題也隨之而來(lái),設(shè)計(jì)芯片并不是吃飯喝水那么簡(jiǎn)單,設(shè)計(jì)和制造一款新芯片需要三到五年的時(shí)間,中間還不能出現(xiàn)重大失誤,五年前的想法拿到現(xiàn)在來(lái)看,不少已然過(guò)時(shí),這就要求這些初創(chuàng)公司對(duì)未來(lái)技術(shù)趨勢(shì)有一個(gè)更準(zhǔn)確的判斷。

      上個(gè)月,英偉達(dá)已經(jīng)推出了全新的B200芯片,原本可能上百倍的差距,或許已經(jīng)縮小到數(shù)十倍,隨著時(shí)間的推移,這部分差距只會(huì)越來(lái)越小,到了優(yōu)勢(shì)不那么明顯的時(shí)候,恐怕這些初創(chuàng)公司就很難說(shuō)服英偉達(dá)原來(lái)的客戶(hù)遷移到新芯片之上了。

      消費(fèi)端客戶(hù)關(guān)心體驗(yàn)和效果,大模型企業(yè)關(guān)心能效和成本,芯片公司看重技術(shù)與趨勢(shì),這一條鏈路上環(huán)環(huán)相扣,誰(shuí)能把握技術(shù)趨勢(shì),誰(shuí)就能真正勝券在握,看明白了這一點(diǎn),我們或許就能明白為何有MatX和Taalas這樣的公司涌現(xiàn)了。

      英偉達(dá)的押注

      比較有意思的是,英偉達(dá)雖然坐擁大半個(gè)AI芯片市場(chǎng),但它也有自己的危機(jī)意識(shí)。此前雖傳出消息,它將為部分廠商提供定制芯片服務(wù),但在CEO黃仁勛的演講中,英偉達(dá)再怎么放下身段,也不會(huì)完全迎合與滿(mǎn)足客戶(hù)需求,與上述的新興芯片公司形成了鮮明反比。

      英偉達(dá)的實(shí)際護(hù)城河是什么?毫無(wú)疑問(wèn)是CUDA,黃仁勛將其視作成功的根本來(lái)源,這種生態(tài)絕非一朝一夕能夠建立起來(lái),英偉達(dá)想做和要做的,就是把CUDA鋪設(shè)到無(wú)處不在。

      因此,英偉達(dá)開(kāi)始了自己的押注,根據(jù)金融數(shù)據(jù)公司Dealogic提供的數(shù)據(jù),英偉達(dá)在2023年對(duì)30多家初創(chuàng)公司進(jìn)行了投資,數(shù)量是上一年的三倍多。英偉達(dá)已發(fā)布的財(cái)報(bào)顯示,截至今年1月末的上一財(cái)季,該公司對(duì)其他公司的投資總額約為15.5億美元,遠(yuǎn)遠(yuǎn)超過(guò)一年前的3億美元。

      2023年,英偉達(dá)投資了大約11家AI基礎(chǔ)設(shè)施提供商,包括數(shù)據(jù)分析公司Databricks Inc.,GPU云提供商CoreWeave Inc.和大語(yǔ)言模型提供商Mistral AI SAS,此外,英偉達(dá)還投資了像視頻生成器Twelve Labs Inc.,聊天機(jī)器人創(chuàng)建者Cohere Inc.和機(jī)器人流程自動(dòng)化初創(chuàng)公司Adept AI Labs Inc.這樣的生成式AI公司。

      英偉達(dá)的投資并不僅限于IT領(lǐng)域,還包括將AI應(yīng)用于醫(yī)療保健的初創(chuàng)公司,它投資了八家藥物發(fā)現(xiàn)初創(chuàng)公司,包括Generate Biomedicines Inc.和Genesis Therapeutics Inc.,這兩家公司都在使用AI來(lái)發(fā)現(xiàn)新藥。

      通過(guò)這些投資,英偉達(dá)不僅能夠支持和利用這些初創(chuàng)公司在AI領(lǐng)域的創(chuàng)新,把市場(chǎng)蛋糕做大;還能與重要客戶(hù)建立緊密聯(lián)系,形成了一個(gè)良好的生態(tài)。這種策略可能使英偉達(dá)在競(jìng)爭(zhēng)激烈的市場(chǎng)中獲得優(yōu)勢(shì),因?yàn)檫@些初創(chuàng)公司的成功可能進(jìn)一步提升對(duì)英偉達(dá)產(chǎn)品的需求。同時(shí),這也為英偉達(dá)提供了一個(gè)了解市場(chǎng)動(dòng)向、技術(shù)創(chuàng)新和客戶(hù)需求的窗口。

      值得一提的是,根據(jù)英偉達(dá)2023財(cái)年的財(cái)報(bào),其客戶(hù)現(xiàn)可通過(guò)云服務(wù),全面接觸英偉達(dá)AI的各個(gè)層面:AI超級(jí)計(jì)算機(jī)、加速庫(kù)軟件以及預(yù)訓(xùn)練的生成式AI模型。用戶(hù)可通過(guò)瀏覽器,通過(guò)英偉達(dá)DGX Cloud服務(wù),接入英偉達(dá)DGX AI超級(jí)計(jì)算機(jī)。在AI平臺(tái)軟件層面,用戶(hù)能夠使用英偉達(dá)AI企業(yè)版,以訓(xùn)練和部署大型語(yǔ)言模型或其他AI工作負(fù)載。在AI模型即服務(wù)層面,英偉達(dá)為希望為其業(yè)務(wù)定制生成式AI模型和服務(wù)的企業(yè)客戶(hù)提供NeMo和BioNeMo定制AI模型。

      英偉達(dá)可能不會(huì)積極地提供定制芯片,但它卻一定會(huì)樂(lè)于推銷(xiāo)自己的定制生態(tài),即使初期這些AI公司并不能提供什么實(shí)質(zhì)性的回報(bào),但它們所代表的未來(lái)趨勢(shì),正是英偉達(dá)所看重的,這種做法有點(diǎn)像是電腦上的付費(fèi)軟件,先提供一段時(shí)間的免費(fèi)試用,等到用戶(hù)養(yǎng)成使用習(xí)慣了,再開(kāi)啟收費(fèi)模式。

      而且英偉達(dá)這種拋磚引玉的做法不是沒(méi)有成功的先例,OpenAI為什么會(huì)堅(jiān)定不移地使用英偉達(dá)的芯片來(lái)訓(xùn)練模型,最早可以追溯到免費(fèi)贈(zèng)送的DGX-1,一臺(tái)超算就撬動(dòng)了百億美元市場(chǎng),這筆買(mǎi)賣(mài)怎么看這么劃算。

      寫(xiě)在最后

      事到如今,AI芯片市場(chǎng)似乎已經(jīng)分成了旗幟分明的三派:*派也是*的一派,當(dāng)然是英偉達(dá),靠著新鮮出爐的B200又能賺得盆滿(mǎn)缽滿(mǎn),第二派是以博通為代表的定制派,比起英偉達(dá),他們才更像是賣(mài)服務(wù)的,自己不生產(chǎn)芯片,幫企業(yè)造好芯片。

      但這兩派更多覆蓋的還是那些中大型的巨頭,只有它們才有財(cái)力和實(shí)力來(lái)訓(xùn)練自己的大模型,一部分初創(chuàng)AI公司實(shí)質(zhì)上是被忽略了,即使英偉達(dá)豪擲數(shù)十億美元,也只是覆蓋了很小一部分初創(chuàng)公司,且縱使是巨頭,在瘋狂燒錢(qián)這件事上也已經(jīng)出現(xiàn)了動(dòng)搖,新的需求已經(jīng)從幕后走向臺(tái)前。

      第三派如今開(kāi)始嶄露頭角,喊出為每個(gè)大模型定制芯片的口號(hào),意圖就是打入英偉達(dá)和博通所不能顧及的市場(chǎng),在AI浪潮中分得一杯羹。

      你認(rèn)為MatX和Taalas這樣的公司會(huì)脫穎而出嗎?

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類(lèi)目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性?xún)r(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。