在德克薩斯州奧斯汀一個沒有標(biāo)記的辦公大樓里,兩個小房間中有幾個亞馬遜員工正在設(shè)計兩種微芯片,用于訓(xùn)練和加速生成式人工智能。這些定制芯片——Inferentia 和 Trainium,為 AWS 客戶提供了一種訓(xùn)練其大型語言模型的替代方案,而這些模型在 GPU 采購上變得越來越困難和昂貴。
亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)首席執(zhí)行官 Adam Selipsky 在六月接受采訪時表示:「全世界都想要更多用于生成式人工智能的芯片,無論是 GPU 還是我們自己設(shè)計的亞馬遜芯片。我認(rèn)為,我們在為客戶提供所需容量方面比任何其他公司都更具優(yōu)勢!
然而,其他公司已經(jīng)更加迅速并投入更多資金來抓住生成式人工智能的商機。當(dāng) OpenAI 于 11 月發(fā)布 ChatGPT 時,微軟因為托管這個病毒式聊天機器人并投資據(jù)報道達 130 億美元而受到廣泛關(guān)注。微軟迅速將生成式人工智能模型加入自己的產(chǎn)品中,并在二月份將其納入必應(yīng)搜索引擎。
同月,谷歌推出了自己的大型語言模型 Bard,并投資了 OpenAI 的競爭對手 Anthropic 3 億美元。
直到四月,亞馬遜才宣布推出自己的大型語言模型家族 Titan,以及一個名為 Bedrock 的服務(wù),幫助開發(fā)人員利用生成式人工智能增強軟件。
「亞馬遜不習(xí)慣追逐市場,亞馬遜習(xí)慣創(chuàng)建市場。我認(rèn)為長時間以來,它們首次發(fā)現(xiàn)自己處于被動地位,并努力追趕進度,」咨詢公司 Gartner 的副總裁分析師 Chirag Dekate 表示。
Meta 最近也發(fā)布了自己的 LLM——Llama 2。這款開源的 ChatGPT 競爭對手現(xiàn)在可以在微軟的 Azure 公共云上進行測試。
芯片作為「真正的差異化」
Dekate 說,從長遠來看,亞馬遜的定制芯片可能在生成式人工智能領(lǐng)域給它帶來優(yōu)勢。
他說:「我認(rèn)為真正的差異化是他們所擁有的技術(shù)能力。你猜怎么著?微軟沒有 Trainium 或 Inferentia。」
AWS 從 2013 年開始悄悄地生產(chǎn)定制芯片,首先推出了一款名為 Nitro 的專用硬件。如今,這是 AWS 體量最大的芯片。亞馬遜告訴 CNBC,每臺 AWS 服務(wù)器至少有一顆 Nitro 芯片,總共使用超過 2000 萬顆。
2015 年,亞馬遜收購了以色列芯片初創(chuàng)公司 Annapurna Labs。然后在 2018 年,亞馬遜推出了基于 Arm 架構(gòu)的服務(wù)器芯片 Graviton,這是與 AMD 和英特爾等巨頭的 x86 CPU 相競爭的一款產(chǎn)品。
「目前 ARM 芯片可能占總服務(wù)器市場總銷售額的個位數(shù)甚至 10%,而且其中一大部分會賣給亞馬遜。所以從 CPU 方面來看,他們做得相當(dāng)不錯,」Bernstein Research 的高級分析師 Stacy Rasgon 說道。
2018 年,亞馬遜推出了面向人工智能的芯片。這是谷歌宣布推出第一款 Tensor 處理器單元(TPU)的兩年后。據(jù)報道,微軟目前正在與 AMD 合作開發(fā)名為 Athena 的人工智能芯片,但尚未正式宣布。
CNBC 參觀了亞馬遜在德克薩斯州奧斯汀的芯片實驗室,那里是 Trainium 和 Inferentia 的開發(fā)和測試地點。產(chǎn)品副總裁 Matt Wood 解釋了這兩款芯片的應(yīng)用。
他說:「機器學(xué)習(xí)可以分為兩個不同的階段。你首先訓(xùn)練機器學(xué)習(xí)模型,然后對這些訓(xùn)練好的模型進行推理!埂赶鄬τ AWS 上訓(xùn)練機器學(xué)習(xí)模型的任何其他方式,Trainium 的性價比提高了約 50%!
Trainium 于 2021 年首次上市,此前在 2019 年發(fā)布的 Inferentia 已經(jīng)進入第二代。Inferentia 使客戶能夠以非常低的成本、高吞吐量、低延遲運行機器學(xué)習(xí)推理!府(dāng)你輸入提示到你的生成式人工智能模型中時,所有的預(yù)測都是在那里處理的,」Wood 說。
然而,就目前而言,英偉達的 GPU 在訓(xùn)練模型方面仍然占主導(dǎo)地位。今年 7 月,AWS 推出了由英偉達 H100s 驅(qū)動的新型人工智能加速硬件。
Rasgon 說:「英偉達芯片擁有一個龐大的軟件生態(tài)系統(tǒng),已經(jīng)建立了超過 15 年的時間,其他公司都沒有。對于目前的人工智能來說,最大的贏家是英偉達。」
然而,AWS 在云計算領(lǐng)域的主導(dǎo)地位是亞馬遜的一個重要優(yōu)勢。
「亞馬遜不需要贏得頭條新聞。亞馬遜已經(jīng)擁有非常強大的云計算用戶群體。他們只需要找出如何讓現(xiàn)有客戶利用生成式人工智能擴展價值創(chuàng)造活動,」Dekate 說。
在選擇用于生成式人工智能的亞馬遜、谷歌和微軟之間,有數(shù)百萬的 AWS 客戶可能會被亞馬遜吸引,因為他們對亞馬遜已經(jīng)很熟悉,正在運行其他應(yīng)用程序并將數(shù)據(jù)存儲在那里。
AWS 是全球最大的云計算提供商,在 2022 年擁有 40% 的市場份額,根據(jù)技術(shù)行業(yè)研究機構(gòu) Gartner 的數(shù)據(jù)。盡管近三個季度的運營收入同比下降,但 AWS 在第二季度的運營利潤中仍占據(jù)了亞馬遜整體 77 億美元運營利潤的 70%。AWS 的運營利潤率歷史上一直遠遠高于谷歌云。
AWS 還擁有日益增長的面向生成式人工智能的開發(fā)者工具組合。
讓我們把時間倒回到 ChatGPT 之前。AWS 數(shù)據(jù)庫、分析和機器學(xué)習(xí)副總裁 Swami Sivasubramanian 說:「這并不是說在那件事發(fā)生后,我們突然匆忙地想出了一個計劃,因為你不可能在那么短的時間內(nèi)設(shè)計出一個芯片,更不可能在 2 到 3 個月的時間內(nèi)構(gòu)建出 Bedrock 服務(wù)。」
Swami Sivasubramanian 說:「Bedrock 讓 AWS 客戶可以訪問由 Anthropic、Stability AI、AI21 Labs 和亞馬遜自己的 Titan 開發(fā)的大型語言模型。我們不相信一個模型就能統(tǒng)治世界,我們希望我們的客戶能從多個供應(yīng)商那里獲得最先進的模型,因為他們要為正確的工作選擇正確的工具。」
亞馬遜最新的人工智能產(chǎn)品之一是 AWS HeAlthScribe,這是一個在七月推出的服務(wù),利用生成式人工智能幫助醫(yī)生起草患者就診總結(jié)。亞馬遜還有一個名為 SageMaker 的機器學(xué)習(xí)中心,提供算法、模型等。
另一個重要工具是編碼輔助工具 CodeWhisperer,亞馬遜表示該工具使開發(fā)人員的任務(wù)平均完成時間提高了 57%。去年,微軟也報道了其編碼輔助工具 GitHub Copilot 帶來的提升生產(chǎn)力的情況。
六月,AWS 宣布成立了一個價值 1 億美元的生成式人工智能創(chuàng)新「中心」。
「我們有很多客戶表示,『我想進行生成式人工智能』,但他們并不清楚這對他們自己的業(yè)務(wù)意味著什么。因此,我們將派遣解決方案架構(gòu)師、工程師、戰(zhàn)略家和數(shù)據(jù)科學(xué)家與他們一對一合作!笰WS 首席執(zhí)行官 Selipsky 說。
盡管迄今為止 AWS 主要專注于工具而不是構(gòu)建與 ChatGPT 競爭的產(chǎn)品,但最近泄露的內(nèi)部電子郵件顯示,亞馬遜首席執(zhí)行官安迪·賈西 (Andy Jassy)直接監(jiān)督著一個新的中央團隊,正在構(gòu)建更廣泛的大規(guī)模語言模型。
在第二季度的盈利電話會議上,賈西表示,AWS 業(yè)務(wù)的「很大一部分」現(xiàn)在由人工智能推動,提供了 20 多個機器學(xué)習(xí)服務(wù)。一些客戶案例包括飛利浦、3M、Old Mutual 和匯豐銀行。
人工智能的爆炸性增長伴隨著許多公司擔(dān)心員工將專有信息放入用于公共大型語言模型的訓(xùn)練數(shù)據(jù)中的一系列安全問題。
「我無法告訴你有多少財富 500 強企業(yè)告訴我他們禁止使用 ChatGPT。因此,我們通過我們對生成式人工智能的方法和我們的 Bedrock 服務(wù)來保障客戶的需求。通過 Bedrock 使用的任何模型都將位于您獨立的虛擬私有云環(huán)境中,并進行加密,同時具備相同的 AWS 訪問控制!筍elipsky 說。
目前,亞馬遜只是在加速推進生成式人工智能,告訴 CNBC 稱,「超過 100,000」個客戶如今正在使用亞馬遜的機器學(xué)習(xí)。盡管這只是 AWS 數(shù)百萬客戶中的一小部分,但分析師表示這種情況可能會發(fā)生改變。
「我們沒有看到企業(yè)說,『哦,等等,微軟在生成式人工智能領(lǐng)域領(lǐng)先,我們就切換基礎(chǔ)設(shè)施策略,將一切遷移到微軟上。』」Dekate 說。「如果您已經(jīng)是亞馬遜的客戶,很有可能會廣泛探索亞馬遜的生態(tài)系統(tǒng)。」
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。