亞馬遜已達(dá)成協(xié)議,以8000 萬(wàn)美元現(xiàn)金收購(gòu)芯片制造商和 AI 模型壓縮公司Perceive ,后者是上市公司Xperi位于加州圣何塞的子公司。Perceive 是一家開發(fā)突破性神經(jīng)網(wǎng)絡(luò)推理解決方案的公司,專注于在邊緣設(shè)備上提供大型人工智能模型的技術(shù)。
亞馬遜并未透露對(duì)這項(xiàng)技術(shù)的具體想法。亞馬遜發(fā)言人表示:“我們很高興簽署了收購(gòu) Perceive 的協(xié)議,并引入其才華橫溢的團(tuán)隊(duì),加入我們的努力,為能夠在邊緣運(yùn)行的設(shè)備帶來(lái)大型語(yǔ)言模型和多模式體驗(yàn)。”
Xperi 自今年初以來(lái)一直在為 Perceive 尋找買家。交易完成后,Perceive 的 44 名員工中的大部分預(yù)計(jì)將加入亞馬遜。亞馬遜表示,預(yù)計(jì)該交易不需要監(jiān)管部門批準(zhǔn),并稱這是一次常規(guī)收購(gòu)。
Perceive的芯片介紹
資料顯示,Perceive 由聯(lián)合首席執(zhí)行官 Murali Dharan 和 Steve Teig 領(lǐng)導(dǎo)。該公司的員工遍布全球。該公司將在愛達(dá)荷州運(yùn)營(yíng)一個(gè)實(shí)驗(yàn)室。Teig 在擔(dān)任 Xperi 首席技術(shù)官期間推動(dòng)了 Perceive 的創(chuàng)建,他負(fù)責(zé)監(jiān)督技術(shù)開發(fā),包括核心音頻和成像創(chuàng)新,同時(shí)還領(lǐng)導(dǎo)公司的機(jī)器學(xué)習(xí)團(tuán)隊(duì)。Dharan 之前負(fù)責(zé) Xperi 授權(quán)業(yè)務(wù)的戰(zhàn)略方向、管理和增長(zhǎng),現(xiàn)在負(fù)責(zé)領(lǐng)導(dǎo) Perceive 的業(yè)務(wù)運(yùn)營(yíng),包括銷售、營(yíng)銷、客戶成功和運(yùn)營(yíng)。
Perceive 提供在邊緣設(shè)備上服務(wù)大型AI 模型的產(chǎn)品,窮旗艦產(chǎn)品是 Ergo AI 處理器,它可以在各種環(huán)境中運(yùn)行數(shù)據(jù)中心級(jí)神經(jīng)網(wǎng)絡(luò),即使在電力受限的情況下。
據(jù)介紹,這是一款為邊緣設(shè)備帶來(lái)突破性性能和能效的 AI 處理器。能夠以全幀速率運(yùn)行大型神經(jīng)網(wǎng)絡(luò),并支持各種網(wǎng)絡(luò)架構(gòu)和類型,包括標(biāo)準(zhǔn) CNN、RNN、LSTM 等。Ergo足夠靈活和強(qiáng)大,可以處理大量機(jī)器學(xué)習(xí)任務(wù),從對(duì)象分類和檢測(cè),到圖像分割和姿勢(shì),再到音頻信號(hào)處理和語(yǔ)言。你甚至可以要求它執(zhí)行多任務(wù),因?yàn)镋rgo 可以一次運(yùn)行多個(gè)網(wǎng)絡(luò)。
盡管 Ergo 處理能力強(qiáng)大,但它不需要外部 DRAM,其 7 毫米 x 7 毫米的小封裝使其非常適合用于相機(jī)、筆記本電腦或 AR/VR 眼鏡等緊湊型設(shè)備。
Perceive表示,Ergo 的能效是其他產(chǎn)品的 20 到 100 倍,僅需 9 mW 的計(jì)算能力即可對(duì) 30 fps 的視頻進(jìn)行推理。這意味著您的設(shè)備可以提供*的電池壽命,并產(chǎn)生更少的熱量,從而實(shí)現(xiàn)更小、更多功能的封裝。
在2023年初,Perceive推出了新款Ergo 2 AI 處理器。據(jù)介紹,該芯片可提供更復(fù)雜用例所需的性能,包括需要變壓器模型、更大的神經(jīng)網(wǎng)絡(luò)、同時(shí)運(yùn)行的多個(gè)網(wǎng)絡(luò)和多模態(tài)輸入的用例,同時(shí)保持行業(yè)*的功率效率。
Perceive 創(chuàng)始人兼首席執(zhí)行官史蒂夫·泰格 (Steve Teig) 在闡述了最新 Ergo 芯片的市場(chǎng)機(jī)會(huì)的時(shí)候表示:“借助新的 Ergo 2 處理器,我們擴(kuò)展了為設(shè)備制造商提供打造其最雄心勃勃的產(chǎn)品的途徑的能力,”“這些產(chǎn)品包括用于語(yǔ)言或視覺處理的變換模型、更高幀速率的視頻處理,甚至在單個(gè)應(yīng)用程序中組合多個(gè)大型神經(jīng)網(wǎng)絡(luò)。”
Ergo 2 的運(yùn)行速度比 Perceive 的*代 Ergo 芯片快四倍,處理能力也遠(yuǎn)超為微型 ML 設(shè)計(jì)的典型芯片,F(xiàn)在,產(chǎn)品開發(fā)人員可以利用 YOLOv5、RoBERTa、GAN 和 U-Nets 等先進(jìn)神經(jīng)網(wǎng)絡(luò)快速提供準(zhǔn)確結(jié)果。所有 Ergo 2 處理均在芯片上完成,無(wú)需外部存儲(chǔ)器,從而提高能效、隱私性和安全性。Ergo 2 芯片可實(shí)現(xiàn):
運(yùn)行 MobileNet V2 每秒進(jìn)行 1,106 次推理
運(yùn)行 ResNet-50 時(shí)每秒進(jìn)行 979 次推理
運(yùn)行 YoloV5-S 每秒進(jìn)行 115 次推理
為了提供運(yùn)行這些大型網(wǎng)絡(luò)所需的性能增強(qiáng),Ergo 2 芯片采用流水線架構(gòu)和統(tǒng)一內(nèi)存設(shè)計(jì),從而提高了其靈活性和整體運(yùn)行效率。因此,Ergo 2 可以支持更高分辨率的傳感器和更廣泛的應(yīng)用,包括:
語(yǔ)言處理應(yīng)用,例如語(yǔ)音轉(zhuǎn)文本和句子完成
音頻應(yīng)用,例如聲學(xué)回聲消除和更豐富的音頻事件檢測(cè)
要求苛刻的視頻處理任務(wù),例如視頻超分辨率和姿勢(shì)檢測(cè)。
Ergo 2 處理器尺寸為 7 毫米 x 7 毫米,由 GlobalFoundries 使用 22FDX平臺(tái)制造,無(wú)需外部 DRAM 即可運(yùn)行。其低功耗也意味著它不需要冷卻。該芯片可以同時(shí)運(yùn)行多個(gè)異構(gòu)網(wǎng)絡(luò),為用于安全、訪問控制、熱成像或零售視頻分析的企業(yè)級(jí)攝像機(jī)等設(shè)備提供智能視頻和音頻功能;適用于包括視覺檢查在內(nèi)的工業(yè)用例;或集成到筆記本電腦、平板電腦和高級(jí)可穿戴設(shè)備等消費(fèi)產(chǎn)品中。
AWS的自研芯片歷程
多年來(lái), AWS 一直在為AI 工作負(fù)載和云優(yōu)化構(gòu)建自己的內(nèi)部定制硅片,這主要得益于公司在十多年前收購(gòu)了 Annapurna Labs。這讓AWS 在過去多年里構(gòu)建了自己的 Graviton 處理器、Inferentia 芯片和 Trainium 機(jī)器學(xué)習(xí)處理器,用于在云端訓(xùn)練 AI 模型。
今年,亞馬遜在推動(dòng)人工智能 (AI) 技術(shù)發(fā)展方面邁出了重要一步。
在其年度 AWS re:Invent 大會(huì)上,AWS發(fā)布了兩款新型定制芯片:AWS Trainium2 和 Graviton4。這兩款芯片代表了亞馬遜網(wǎng)絡(luò)服務(wù) (AWS) 為滿足日益增長(zhǎng)的 AI 功能需求而做出的大膽努力,尤其是在市場(chǎng)面臨主要由 Nvidia 生產(chǎn)的高性能圖形處理單元 (GPU) 嚴(yán)重短缺的情況下。
對(duì)增強(qiáng)計(jì)算能力的需求源于生成式人工智能的日益普及,這需要強(qiáng)大的基礎(chǔ)設(shè)施來(lái)訓(xùn)練和部署模型。據(jù)報(bào)道,Nvidia 的 GPU 直到 2024 年都已售罄,包括臺(tái)積電首席執(zhí)行官在內(nèi)的業(yè)內(nèi)消息人士預(yù)測(cè),這種供應(yīng)危機(jī)可能會(huì)持續(xù)到 2025 年?紤]到這一點(diǎn),亞馬遜的新芯片旨在通過提供專門針對(duì)人工智能工作負(fù)載量身定制的替代方案來(lái)減輕對(duì) Nvidia 的依賴。
Trainium2 芯片專為訓(xùn)練大規(guī)模 AI 模型而設(shè)計(jì),性能比上一代芯片高出四倍,能效比上一代芯片高出兩倍。據(jù)亞馬遜稱,這款芯片在多達(dá) 10 萬(wàn)個(gè)單元的云集群中使用時(shí),可處理 65 百億億次浮點(diǎn)運(yùn)算。這一功能可將訓(xùn)練復(fù)雜模型(例如具有數(shù)千億個(gè)參數(shù)的模型)的時(shí)間從數(shù)月縮短至數(shù)周。這些進(jìn)步使 Trainium2 成為 AI 訓(xùn)練基礎(chǔ)設(shè)施領(lǐng)域的領(lǐng)跑者。
Trainium2 芯片因其潛力而受到認(rèn)可,已經(jīng)引起了多家行業(yè)參與者的興趣,其中包括專注于構(gòu)建友好型 AI 模型的公司 Anthropic。聯(lián)合創(chuàng)始人 Tom Brown 強(qiáng)調(diào),Trainium2 將使他們能夠快速擴(kuò)展,處理速度比之前的模型提高四倍。AWS 與 Anthropic 等公司之間的合作表明,利用專有云技術(shù)簡(jiǎn)化 AI 操作的趨勢(shì)日益增長(zhǎng)。
另一方面,Graviton4 芯片是亞馬遜迄今為止最強(qiáng)大、最高效的處理器,專為各種云工作負(fù)載量身定制。與上一代 Graviton3 相比,這款第四代芯片的性能有望提高 30%,內(nèi)核數(shù)量增加 50%,內(nèi)存帶寬增加 75%。這些改進(jìn)使用戶能夠降低運(yùn)營(yíng)成本并提高數(shù)據(jù)處理速度,使其成為運(yùn)行高性能數(shù)據(jù)庫(kù)和密集分析應(yīng)用程序的企業(yè)的理想選擇。
Graviton4 的早期采用者包括 Datadog、Epic Games 和 SAP 等公司。例如,Epic 的首席云工程師 Roman Visintine 就指出,該芯片在延遲敏感型工作負(fù)載方面表現(xiàn)出色,尤其有利于在線游戲體驗(yàn)。在競(jìng)爭(zhēng)激烈的環(huán)境中,快速的數(shù)據(jù)訪問和處理對(duì)于成功至關(guān)重要,這種云服務(wù)優(yōu)化趨勢(shì)至關(guān)重要。
亞馬遜的聲明也凸顯了科技行業(yè)更大的趨勢(shì),即公司越來(lái)越多地投資定制芯片解決方案,以滿足特定的計(jì)算需求,尤其是人工智能和機(jī)器學(xué)習(xí)任務(wù)。通過開發(fā)專有硬件,亞馬遜希望脫穎而出,減少對(duì) Nvidia 和 AMD 等老牌芯片制造商的依賴。
隨著人工智能技術(shù)在各個(gè)領(lǐng)域(從醫(yī)療保健到娛樂)不斷發(fā)展和普及,對(duì)高效、高性能芯片的需求只會(huì)越來(lái)越大。技術(shù)分析師預(yù)計(jì),這些新的亞馬遜芯片的推出不僅將立即滿足當(dāng)前的需求,還將為未來(lái)的人工智能發(fā)展奠定基礎(chǔ)。
令人驚訝的是,這些芯片的推出正值戰(zhàn)略時(shí)刻,因?yàn)槲④浺残剂俗约横槍?duì)人工智能和云服務(wù)的芯片開發(fā)。這在人工智能硬件領(lǐng)域引發(fā)了激烈的競(jìng)爭(zhēng),促使企業(yè)迅速創(chuàng)新和突破界限。
AWS Trainium2 和 Graviton4 芯片預(yù)計(jì)將在不久的將來(lái)向客戶提供,其中 Trainium2 將于明年某個(gè)時(shí)候推出,而 Graviton4 已處于預(yù)覽階段。隨著科技行業(yè)繼續(xù)轉(zhuǎn)向云計(jì)算和人工智能驅(qū)動(dòng)的解決方案,亞馬遜有望在這場(chǎng)數(shù)字化轉(zhuǎn)型中發(fā)揮重要作用。
AI芯片大有可為
AWS頻頻發(fā)力芯片,除了滿足公司業(yè)務(wù)需求以外,也再次證明了AI芯片大有可為,這不但體現(xiàn)在云端,還體現(xiàn)在端側(cè)。
根據(jù) Futurum Intelligence的數(shù)據(jù),到 2023 年,Nvidia 將占據(jù) AI GPU 市場(chǎng) 92% 的份額,并占據(jù)整個(gè)數(shù)據(jù)中心 AI 半導(dǎo)體市場(chǎng) 75% 的份額。在這個(gè)已經(jīng)非常龐大的市場(chǎng)中,這種主導(dǎo)地位仍將繼續(xù),預(yù)計(jì)到 2024 年市場(chǎng)規(guī)模將增長(zhǎng)近一半。
該分析公司估計(jì),數(shù)據(jù)中心人工智能應(yīng)用的處理器和加速器的總市場(chǎng)價(jià)值將達(dá)到 563 億美元,與 2023 年的 377 億美元的年度市場(chǎng)價(jià)值相比增長(zhǎng) 49.3%。市場(chǎng)分析師預(yù)測(cè),未來(lái)五年,該市場(chǎng)的復(fù)合年增長(zhǎng)率將達(dá)到 29.7%,使市場(chǎng)規(guī)模在 2026 年達(dá)到 984 億美元,在 2028 年達(dá)到 1383 億美元。
Futurum 將 AI 數(shù)據(jù)中心處理器市場(chǎng)分為四類:CPU、GPU、專用加速器(稱為 XPU)以及谷歌、AWS 和微軟等公司生產(chǎn)的專有云加速器。
2023 年,CPU 占據(jù) 20.5% 的市場(chǎng),GPU 占據(jù) 73.5% 的市場(chǎng),XPU 和云專有產(chǎn)品各占 3%。
1、2023 年,CPU 占數(shù)據(jù)中心 AI 處理的 20%,并將繼續(xù)發(fā)揮重要作用。Futurum 估計(jì),它們的五年復(fù)合年增長(zhǎng)率將達(dá)到 28%,從 2023 年的 77 億美元增長(zhǎng)到 2028 年的 260 億美元。Futurum 估計(jì),2023 年,Nvidia 的市場(chǎng)份額為 37%,其次是英特爾,占 23%。
2、到 2023 年,GPU 占數(shù)據(jù)中心 AI 應(yīng)用中使用的芯片組的 74%,并將經(jīng)歷 30% 的五年復(fù)合年增長(zhǎng)率,從 2023 年的 280 億美元增長(zhǎng)到 2028 年的 1020 億美元。Futurum 估計(jì) Nvidia 占據(jù)了 AI GPU 市場(chǎng)的 92% 份額。
3、XPU 將經(jīng)歷 31% 的五年復(fù)合年增長(zhǎng)率,從 2023 年的 10 億美元增長(zhǎng)到 2028 年的 37 億美元。
4、公共云 AI 加速器將經(jīng)歷 35% 的五年復(fù)合年增長(zhǎng)率,從 2023 年的 13 億美元增長(zhǎng)到 2028 年的 60 億美元。
如果 AI 處理器和加速器不能在數(shù)據(jù)中心供公眾使用,F(xiàn)uturum 會(huì)將其排除在本研究之外,因此不包括為 Meta、特斯拉和蘋果設(shè)計(jì)并使用的 AI 芯片組。
從地域上看,北美占據(jù)市場(chǎng)主導(dǎo)地位,到 2023 年將占據(jù) 55% 的市場(chǎng)份額。歐洲、中東和非洲 (EMEA) 和亞太地區(qū) (APAC) 緊隨其后,成為重要市場(chǎng),而拉丁美洲 (LATAM) 則代表具有巨大增長(zhǎng)潛力的發(fā)展中地區(qū)。
視覺和音頻分析是 2023 年*的用例。Futurum 預(yù)測(cè) 2028 年的前三大用例將是視覺和音頻分析、模擬和建模以及文本生成、分析和摘要。
具體到邊緣AI方面,據(jù)Omdia的新研究預(yù)測(cè),到 2028 年,邊緣 AI 處理器市場(chǎng)將創(chuàng)造 602 億美元的收入,復(fù)合年增長(zhǎng)率為 11%。
Omdia 最新的邊緣處理器預(yù)測(cè)指出,隨著各行各業(yè)和設(shè)備采用人工智能,對(duì)硬件的需求增加推動(dòng)了收入的增長(zhǎng)。推動(dòng)市場(chǎng)增長(zhǎng)的領(lǐng)域之一是個(gè)人電腦領(lǐng)域,英特爾、AMD 和蘋果等主要供應(yīng)商的產(chǎn)品供應(yīng)量不斷增加。據(jù)報(bào)道,PC 供應(yīng)商正試圖將其設(shè)備中加入 AI 處理器作為“獨(dú)特的賣點(diǎn)”進(jìn)行營(yíng)銷。
除個(gè)人電腦領(lǐng)域外,該報(bào)告還強(qiáng)調(diào)了人工智能處理器在汽車、無(wú)人機(jī)、安全攝像頭和機(jī)器人等領(lǐng)域的快速應(yīng)用。
由此我們可以看到AWS收購(gòu)背后的用心。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。