3月5日消息,OpenAI最強競對Anthropic發(fā)布Claude 3系列模型,已經(jīng)實現(xiàn)了對GPT-4的全面超越。
Anthropic是由前OpenAI員工創(chuàng)立的公司,在過去一年獲得了來自亞馬遜40億美元的投資。
此次,Anthropic宣布推出Claude 3模型系列,該系列包括三個模型,按能力升序排列依次是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。
從Anthropic公布的測試數(shù)據(jù)看,其最高能力模型Claude 3 Opus的能力已經(jīng)全面碾壓GPT-4。
如Anthropic所說,Claude 3模型將設定新的行業(yè)基準!
目前,Claude 3 Opus和Sonnet已可以在Claude.ai和Claude API中使用。Sonnet正在Claude.ai上提供免費體驗,Claude Pro用戶則可以使用Opus。目前,Claude 3 Sonnet已可在159個國家可用,而Claude 3 Haiku很快將會上市。
同時,今天起Claude 3 Sonnet也可以通過Amazon Bedrock,以及Google Cloud的Vertex AI Model Garden使用,Opus和Haiku很快就會在這兩個平臺同時推出。
如果說微軟通過綁定Open AI的GPT模型,在人工智能領(lǐng)域和亞馬遜、谷歌等大廠的競爭中一騎絕塵,那么,隨著全面碾壓GPT-4的Claude 3 Opus的出現(xiàn),在這場競爭中亞馬遜也將吹起全面反擊的號角。
現(xiàn)在壓力給到微軟和Open AI,在馬斯克的訴訟中,GPT-5何時發(fā)布?而Anthropic和Open AI的那些恩怨情仇還將繼續(xù)上演……
Claude 3 Opus模型性能全面超越GPT-4
根據(jù)Anthropic公布的技術(shù)文檔,Opus是Claude 3 模型家族中最智能的模型,在人工智能系統(tǒng)的大多數(shù)常見評估基準上都優(yōu)于GPT-4,包括本科生級專家知識(MMLU)、研究生級專家推理(GPQA)、基礎(chǔ)數(shù)學(GSM8K)等。它在復雜任務上表現(xiàn)出接近人類水平的理解力和流利性。
Claude 3模型在分析和預測、細致入微的內(nèi)容創(chuàng)建、代碼生成以及西班牙語、日語和法語等非英語語言的對話方面都顯示出更強的能力。
總之,就是在各項測試領(lǐng)域,Claude 3 Opus的性能都已超越GPT-4。
響應速度方面,據(jù)介紹,Claude 3 Haiku是市場上速度最快、性價比最高的模型。它可以在不到三秒的時間內(nèi)閱讀(約10k token)的包含圖表和圖形信息和數(shù)據(jù)密集的研究論文,并給出分析反饋。
Anthropic表示正式發(fā)布后,預計Haiku性能將進一步提高。
對于絕大多數(shù)工作負載,Sonnet比Claude 2和Claude 2.1快2倍,智能水平更高。它擅長于要求快速響應的任務,如知識檢索或銷售自動化。Opus提供了與Claude 2和2.1相似的速度,但具有更高的智能水平。
Claude 3模型可以處理各種視覺信息數(shù)據(jù),包括照片、圖片、圖表和技術(shù)圖表。
Anthropic稱,一些客戶的知識庫,高達50%是如PDF、流程圖或演示幻燈片以格式存儲的信息。Claude 3 Opus在圖表理解和多步推理上表現(xiàn)優(yōu)秀。
以例子來看,通過輸入一張來自皮尤研究中心圖表(如上)“年輕人比長輩更有可能使用互聯(lián)網(wǎng)”,然后詢問“G7國家的年輕人和老年人之間的平均差異百分比是多少?”
模型順利理解了G7概念,識別哪些國家是G7,并從輸入的圖表中檢索數(shù)據(jù)并使用這些值進行數(shù)學運算。
另外,全新的Claude模型在減少“過度拒絕”,與Claude 2.1相比,Claude 3 Opus模型在具有挑戰(zhàn)性的開放式問題上的準確性提高了兩倍,錯誤答案的水平也有所降低。
在長語境理解能力方面,Claude 3系列的3個模型,都至少支持20萬token的上下文窗口,都能處理超過100萬token的輸入。在200Ktoken的NIAH測試(大海撈針測試)中,Claude 3 Opus準確率超過99%。
同時,Anthropic透露,計劃在未來幾個月內(nèi)頻繁發(fā)布Claude 3模型系列的更新。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。