谷歌的Bard在聊天機器人排名中擊敗了GPT-4

2024年02月01日 14:54:05 來源：站長之家

　　2月1日消息:谷歌的Bard最近通過其Gemini Pro版本在LMSYS聊天機器人榜上超越了OpenAI的GPT-4，標志著聊天機器人領域的一次顯著變革。這款更新使得Bard成為LMSYS榜上第二高分的聊天機器人，逐漸擺脫了OpenAI在聊天機器人領域的主導地位。

　　在LMSYS Chatbot Arena Leaderboard上，Bard成功超越了GPT-4，目前正迅速追趕保持冠軍的GPT-4Turbo。長期以來，GPT-4Turbo和GPT-4一直緊握榜單前兩名，而Bard的崛起得益于其搭載谷歌新的Gemini Pro大型多模態(tài)模型。

　　LMSYS Org創(chuàng)建了Chatbot Arena Leaderboard，該組織是由加州大學伯克利分校與加州大學圣迭戈分校以及卡內(nèi)基梅隆大學合作成立的大型模型系統(tǒng)組織。他們表示，Bard在排行榜上的飆升是一個“顯著的成就”。

　　Chatbot Arena是一個用于大型語言模型的基準平臺，采用“匿名、隨機的眾包方式進行戰(zhàn)斗”。排名基于Elo評分系統(tǒng)，這在國際象棋和其他競技游戲中被廣泛使用。

　　由Gemini Pro驅(qū)動的Bard是該榜上第二個達到1200分以上的模型。Bard的崛起是谷歌更新了支持聊天機器人的基礎模型的結果。去年12月，谷歌推出了Gemini，并為Bard推出了初始版本Gemini Pro，預計將很快發(fā)布更大規(guī)模的版本Gemini Ultra。

　　Bard還成功擊敗了Claude的所有版本，Gemini Pro Dev API版本的排名甚至超過了Anthropic的Claude2.1和GPT3.5Turbo。LMSYS表示:“比賽變得前所未有地激烈!非常期待看到Bard + Gemini Ultra版本的未來。”

　　對于谷歌而言，這次在榜單上的崛起是一個受歡迎的喘息。在經(jīng)歷了起伏不定的開始后，Bard通過定期更新不斷增強，現(xiàn)在已經(jīng)整合到其他谷歌應用程序，如YouTube和Docs中。

　　最近，Reddit用戶告訴谷歌，他們希望Bard更像ChatGPT，谷歌產(chǎn)品經(jīng)理詢問了他們的愿望清單。用戶要求有專門的移動應用程序、自定義指令和圖像生成，其中一些建議已經(jīng)在實施中。

　　OpenAI的GPT-4一直在模型榜單上居高不下，牢牢占據(jù)斯坦福大學HELM Leaderboard的第一名，而GPT-4Turbo則居于第二位。曾經(jīng)為Bard提供動力的PaLM2在HELM排行榜上表現(xiàn)不佳，被來自AI初創(chuàng)公司W(wǎng)riter的Palmyra X V3超越，成為排行榜上最高得分的非OpenAI模型。

　　文章內(nèi)容僅供閱讀，不構成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信