谷歌人工智能聊天機器人Bard在數(shù)學(xué)和編程方面有了顯著改進

2023年06月08日 20:17:32 來源：站長之家

　　谷歌旗下的基于人工智能的聊天機器人 Bard 在執(zhí)行邏輯和推理任務(wù)方面能力逐漸改進。這是根據(jù)谷歌今天發(fā)布的一篇博文所述，該博文表明，通過一種名為「隱式代碼執(zhí)行」的技術(shù)，Bard 在數(shù)學(xué)和編碼等領(lǐng)域有了顯著改進。

　　正如博文所解釋的那樣，Bard 等大型語言模型(LLM)本質(zhì)上是預(yù)測引擎。當(dāng)給出一個提示時，它們通過預(yù)測下一個句子中可能出現(xiàn)的單詞來生成回答。這使得它們在撰寫電子郵件和文章方面非常出色，但在軟件開發(fā)方面卻有些容易出錯。

　　但是，你可能會問，GitHub 的 Copilot 和亞馬遜的 CodeWhisperer 之類的生成代碼模型呢?這些并非通用型。與 Bard 和 ChatGPT 等競爭對手不同，后者使用了來自網(wǎng)絡(luò)、電子書和其他資源的廣泛文本樣本進行訓(xùn)練，Copilot、CodeWhisperer 和類似的生成代碼模型幾乎完全是在代碼樣本上進行訓(xùn)練和調(diào)優(yōu)的。

　　為了解決通用型語言模型在編碼和數(shù)學(xué)方面的不足，谷歌開發(fā)了隱式代碼執(zhí)行，使 Bard 能夠編寫和執(zhí)行自己的代碼。最新版本的 Bard 會識別可能受益于邏輯代碼的提示，并在「幕后」編寫代碼、進行測試，并使用結(jié)果生成看似更準(zhǔn)確的回答。

　　根據(jù)內(nèi)部基準(zhǔn)測試，谷歌表示，與之前版本相比，新版 Bard 對「基于計算的」詞語和數(shù)學(xué)問題的回答提升了 30%。當(dāng)然，我們還需要看這些聲明是否經(jīng)得起外部測試的考驗。

　　「盡管有了這些改進，Bard 并不總能做到完全正確，例如，Bard 可能不會生成幫助回答的代碼，它生成的代碼可能是錯誤的，或者 Bard 可能不會在回答中包含執(zhí)行的代碼，」Bard 產(chǎn)品負(fù)責(zé)人 Jack Krawczyk 和工程副總裁 Amarnag Subramanya 在博文中寫道。「盡管如此，這種改進的能力以結(jié)構(gòu)化、邏輯驅(qū)動的方式回應(yīng)是使 Bard 變得更有幫助的重要一步�！�

　　當(dāng)谷歌今年早些時候推出 Bard 時，與 Bing Chat 和 ChatGPT 等相比，它并沒有表現(xiàn)得那么出色。事實上，推出過程出現(xiàn)了一些問題，谷歌的一則廣告中 Bard 給出了一個錯誤的答案，導(dǎo)致該公司股價短暫地下跌了 8%。

　　為了改善這些問題，谷歌引入了隱式代碼生成等其他改進措施，并增加了對新語言、多模式查詢和圖像生成的支持。然而，要想在該領(lǐng)域與領(lǐng)先的生成式人工智能聊天機器人保持競爭力，谷歌還需要進一步努力。

　　最近，Anthropic 推出了一款具有大幅擴展「上下文窗口」的人工智能聊天機器人模型，使其能夠相對連貫地進行長時間的對話。而開發(fā) ChatGPT 的 OpenAI 公司也開始支持插件，為 ChatGPT 增添外部知識和技能。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信