大模型新皇Claude 3即將入駐Amazon Bedrock，公有云成AI創(chuàng)新加速器

2024年03月11日 13:17:14 |小葳 來源：智能進化論AImatters

　　2024年3月4日，Anthropic發(fā)布旗下最新一代大模型Claude 3系列，引發(fā)行業(yè)熱議。

　　在推理、數(shù)學、編碼、多語言理解和視覺方面，Claude 3在多個基準測試上樹立了新的標準，性能超越了包括GPT4在內(nèi)的其他模型，被認為是通用大模型新皇。

　　與此同時，亞馬遜云科技宣布，Claude 3系列將入駐其生成式AI托管服務Amazon Bedrock。亞馬遜云科技的客戶將可以通過Amazon Bedrock訪問Claude 3系列的三個模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。

　　Claude 3對于通用大模型發(fā)展帶來哪些改變?對于更多想要用好大模型的企業(yè)，什么是更好的使用通用大模型的方式?以下是筆者的一些觀察。

　　1 沖破一家獨大，Claude3成通用大模型新“卷王”

　　此次推出的Claude3共有三個模型，性能和價格由低到高為：Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus，也被形象概括為中杯、大杯、超大杯。

　　其中，Claude 3 Haiku 主打快速緊湊，即時的響應能力。Claude 3 Sonnet 在智能和速度之間取得了理想的平衡，特別適合企業(yè)用例。Claude 3 Opus具有深度推理、高級數(shù)學和編碼能力，在高度復雜的任務上具有領先性能。

　　Claude 3的領先之處體現(xiàn)在基準性能、視覺能力、復雜開放性問題處理能力等。

　　基準性能方面，Claude 3在多項AI系統(tǒng)常用評估標準，包括本科級別專業(yè)知識(MMLU)、研究生級別專家推理(GPQA)、基礎數(shù)學(GSM8K)，均取得領先業(yè)界LLM的性能。

　　Claude 3的三個模型均具備視覺功能，可以理解不同格式的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)，包括圖像、圖表、圖表等。比如，官方演示視頻中，Claude 3 Opus可以在幾分鐘內(nèi)分析全球經(jīng)濟、未來美國GDP走勢等。

　　對于下圖這樣的復雜開放式問題， Claude3能夠理解物體的外觀及其與數(shù)學等概念的聯(lián)系。

　　此外，Claude3的三個模型都將至少支持200K token的上下文窗口。在200K token的「大海撈針」(NIAH)測試中，Claude 3 Opus準確率超過99%。Claude 3 Haiku 能夠3秒讀完10k token論文。

　　筆者認為，目前大模型發(fā)展呈現(xiàn)兩條不同的路徑：

　　一條路徑，圍繞如何練好大模型。像OpenAI、Anthropic、Google這樣的科技巨頭，有能力和資源在通用基礎大模型賽道競爭。通用基礎大模型的賽道相對同質(zhì)化，各家都在追求更高更快更強，即更強大更全面的性能。

　　而且通用大模型的競爭態(tài)勢一直是動態(tài)變化的，任何一家的領先都是暫時的，榜單隨時可能被刷新和超越。在這種態(tài)勢下，任何一家獨大，強者恒強未必對行業(yè)、對生態(tài)更好。

　　從這個意義上，Claude3能夠打破OpenAI長期領先的優(yōu)勢，加速通用大模型卷出更高的智能水平。

　　另一條路徑，圍繞如何用好大模型。如何用大模型的能力解決不同行業(yè)不同場景下的專業(yè)問題，才是絕大多數(shù)企業(yè)最關(guān)注的。在這條路徑上，云計算正發(fā)揮著舉足輕重的價值。

　　2 云計算，使用基礎大模型的必經(jīng)之路

　　目前，AI大模型已經(jīng)成為云計算廠商的第二增長曲線，全球頭部云計算廠商都將AI大模型作為下一個十年發(fā)展的必爭之地。

　　如果我們回到企業(yè)需求的視角，企業(yè)使用基礎大模型至少有以下幾個核心訴求：

　　首先，數(shù)據(jù)安全與合規(guī)

　　數(shù)據(jù)安全合規(guī)是企業(yè)使用大模型的首要考量，包括數(shù)據(jù)泄露風險、數(shù)據(jù)濫用風險、模型安全漏洞等等。比如，很多企業(yè)擔心客戶信息、商業(yè)秘密和個人身份信息等敏感數(shù)據(jù)泄露。這些都對提供大模型能力的公有云廠商提出了更高的要求。

　　在如何保障大模型安全使用方面，亞馬遜云科技率先做出了很多探索。比如，Amazon Bedrock 處理的任何客戶內(nèi)容都會被加密，并靜態(tài)存儲在客戶使用的亞馬遜云科技區(qū)域中。客戶可以使用Amazon PrivateLink建立從Amazon Virtual Private Cloud(VPC)到Amazon Bedrock的私有連接，而無需將VPC暴露給互聯(lián)網(wǎng)流量。用戶輸入和模型輸出不會與任何模型提供商共享。Amazon Bedrock還提供全面的監(jiān)控和日志記錄功能。

　　其次，豐富的基礎模型選擇

　　沒有任何一款大模型可以滿足所有需求。

　　企業(yè)在使用大模型時，一定是博采眾長，多款并用的。筆者觀察到，很多企業(yè)在開發(fā)垂直領域的企業(yè)服務大模型時，底層都接入了不止一個頭部大模型。

　　在頭部云廠商中，以亞馬遜云科技為例，豐富的基礎模型選擇也是其在大模型賽道的差異化優(yōu)勢。目前，Amazon Bedrock平臺的大模型提供商擴充至7家，包括AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI。

　　“回顧2021年，當 Anthropic第一次開始在亞馬遜云科技上構(gòu)建時，沒有人能想到Claude系列模型會帶來多大的變革。自Amazon Bedrock于 2023年9月28日全面上線以來的短短幾個月內(nèi)，已有超過10,000名客戶使用它，其中許多客戶正在使用Claude。”亞馬遜云科技數(shù)據(jù)和AI副總裁Swami Sivasubramanian博士表示。

　　目前，已經(jīng)有不少頭部企業(yè)在云上使用Claude創(chuàng)建生成式AI應用。比如，全球領先的生物制藥公司輝瑞正通過Amazon Bedrock使用Claude模型，加速創(chuàng)新癌癥治療方案的研發(fā)。通過運用生成式AI技術(shù)，輝瑞能夠大幅縮短收集相關(guān)數(shù)據(jù)和科學內(nèi)容所需的時間，進而利用這些內(nèi)容分析趨勢、制定腫瘤學目標并進行驗證，從而提高成功概率。

　　第三，易用的AI平臺和工具集

　　云計算廠商并非僅僅提供AI大模型的底層基礎設施和基礎模型接口，更關(guān)鍵是提供系統(tǒng)化的AI平臺和工具集，幫助企業(yè)更好使用大模型進行創(chuàng)新。

　　比如，Amazon Bedrock推出了豐富的AI功能，包括幫助客戶識別、比較模型的模型評估功能、簡化生成式AI應用構(gòu)建并利用專有數(shù)據(jù)提供定制化響應的知識庫功能、模型調(diào)優(yōu)功能、能執(zhí)行多步驟業(yè)務指令的代理功能、實現(xiàn)負責任AI的Guardrails安全功能等。

　　Claude3的出現(xiàn)，讓生成式AI領域再度風起云涌。Claude3不僅刷新了基礎大模型的性能，也打破了長期以來通用大模型領域一家獨大的市場格局。

　　同時，亞馬遜云科技與Anthropic的強強聯(lián)合，不僅能讓更多企業(yè)在云上便捷使用更新更強大的通用大模型，也代表了企業(yè)首選在公有云上使用大模型能力和生成式AI的發(fā)展趨勢。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信