Anthropic大模型實力全面超越GPT-4 亞馬遜云科技露鋒芒

2024年03月05日 14:28:39 來源：TechWeb

　　3月5日消息，OpenAI最強競對Anthropic發(fā)布Claude 3系列模型，已經(jīng)實現(xiàn)了對GPT-4的全面超越。

　　Anthropic是由前OpenAI員工創(chuàng)立的公司，在過去一年獲得了來自亞馬遜40億美元的投資。

　　此次，Anthropic宣布推出Claude 3模型系列，該系列包括三個模型，按能力升序排列依次是：Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。

　　從Anthropic公布的測試數(shù)據(jù)看，其最高能力模型Claude 3 Opus的能力已經(jīng)全面碾壓GPT-4。

　　如Anthropic所說，Claude 3模型將設定新的行業(yè)基準!

　　目前，Claude 3 Opus和Sonnet已可以在Claude.ai和Claude API中使用。Sonnet正在Claude.ai上提供免費體驗，Claude Pro用戶則可以使用Opus。目前，Claude 3 Sonnet已可在159個國家可用，而Claude 3 Haiku很快將會上市。

　　同時，今天起Claude 3 Sonnet也可以通過Amazon Bedrock，以及Google Cloud的Vertex AI Model Garden使用，Opus和Haiku很快就會在這兩個平臺同時推出。

　　如果說微軟通過綁定Open AI的GPT模型，在人工智能領(lǐng)域和亞馬遜、谷歌等大廠的競爭中一騎絕塵，那么，隨著全面碾壓GPT-4的Claude 3 Opus的出現(xiàn)，在這場競爭中亞馬遜也將吹起全面反擊的號角。

　　現(xiàn)在壓力給到微軟和Open AI，在馬斯克的訴訟中，GPT-5何時發(fā)布?而Anthropic和Open AI的那些恩怨情仇還將繼續(xù)上演……

　　Claude 3 Opus模型性能全面超越GPT-4

　　根據(jù)Anthropic公布的技術(shù)文檔，Opus是Claude 3 模型家族中最智能的模型，在人工智能系統(tǒng)的大多數(shù)常見評估基準上都優(yōu)于GPT-4，包括本科生級專家知識(MMLU)、研究生級專家推理(GPQA)、基礎(chǔ)數(shù)學(GSM8K)等。它在復雜任務上表現(xiàn)出接近人類水平的理解力和流利性。

　　Claude 3模型在分析和預測、細致入微的內(nèi)容創(chuàng)建、代碼生成以及西班牙語、日語和法語等非英語語言的對話方面都顯示出更強的能力。

　　總之，就是在各項測試領(lǐng)域，Claude 3 Opus的性能都已超越GPT-4。

　　響應速度方面，據(jù)介紹，Claude 3 Haiku是市場上速度最快、性價比最高的模型。它可以在不到三秒的時間內(nèi)閱讀(約10k token)的包含圖表和圖形信息和數(shù)據(jù)密集的研究論文，并給出分析反饋。

　　Anthropic表示正式發(fā)布后，預計Haiku性能將進一步提高。

　　對于絕大多數(shù)工作負載，Sonnet比Claude 2和Claude 2.1快2倍，智能水平更高。它擅長于要求快速響應的任務，如知識檢索或銷售自動化。Opus提供了與Claude 2和2.1相似的速度，但具有更高的智能水平。

　　Claude 3模型可以處理各種視覺信息數(shù)據(jù)，包括照片、圖片、圖表和技術(shù)圖表。

　　Anthropic稱，一些客戶的知識庫，高達50%是如PDF、流程圖或演示幻燈片以格式存儲的信息。Claude 3 Opus在圖表理解和多步推理上表現(xiàn)優(yōu)秀。

　　以例子來看，通過輸入一張來自皮尤研究中心圖表(如上)“年輕人比長輩更有可能使用互聯(lián)網(wǎng)”，然后詢問“G7國家的年輕人和老年人之間的平均差異百分比是多少?”

　　模型順利理解了G7概念，識別哪些國家是G7，并從輸入的圖表中檢索數(shù)據(jù)并使用這些值進行數(shù)學運算。

　　另外，全新的Claude模型在減少“過度拒絕”，與Claude 2.1相比，Claude 3 Opus模型在具有挑戰(zhàn)性的開放式問題上的準確性提高了兩倍，錯誤答案的水平也有所降低。

　　在長語境理解能力方面，Claude 3系列的3個模型，都至少支持20萬token的上下文窗口，都能處理超過100萬token的輸入。在200Ktoken的NIAH測試(大海撈針測試)中，Claude 3 Opus準確率超過99%。

　　同時，Anthropic透露，計劃在未來幾個月內(nèi)頻繁發(fā)布Claude 3模型系列的更新。