谷歌旗下的基于人工智能的聊天機器人 Bard 在執(zhí)行邏輯和推理任務(wù)方面能力逐漸改進。這是根據(jù)谷歌今天發(fā)布的一篇博文所述,該博文表明,通過一種名為「隱式代碼執(zhí)行」的技術(shù),Bard 在數(shù)學(xué)和編碼等領(lǐng)域有了顯著改進。
正如博文所解釋的那樣,Bard 等大型語言模型(LLM)本質(zhì)上是預(yù)測引擎。當(dāng)給出一個提示時,它們通過預(yù)測下一個句子中可能出現(xiàn)的單詞來生成回答。這使得它們在撰寫電子郵件和文章方面非常出色,但在軟件開發(fā)方面卻有些容易出錯。
但是,你可能會問,GitHub 的 Copilot 和亞馬遜的 CodeWhisperer 之類的生成代碼模型呢?這些并非通用型。與 Bard 和 ChatGPT 等競爭對手不同,后者使用了來自網(wǎng)絡(luò)、電子書和其他資源的廣泛文本樣本進行訓(xùn)練,Copilot、CodeWhisperer 和類似的生成代碼模型幾乎完全是在代碼樣本上進行訓(xùn)練和調(diào)優(yōu)的。
為了解決通用型語言模型在編碼和數(shù)學(xué)方面的不足,谷歌開發(fā)了隱式代碼執(zhí)行,使 Bard 能夠編寫和執(zhí)行自己的代碼。最新版本的 Bard 會識別可能受益于邏輯代碼的提示,并在「幕后」編寫代碼、進行測試,并使用結(jié)果生成看似更準(zhǔn)確的回答。
根據(jù)內(nèi)部基準(zhǔn)測試,谷歌表示,與之前版本相比,新版 Bard 對「基于計算的」詞語和數(shù)學(xué)問題的回答提升了 30%。當(dāng)然,我們還需要看這些聲明是否經(jīng)得起外部測試的考驗。
「盡管有了這些改進,Bard 并不總能做到完全正確,例如,Bard 可能不會生成幫助回答的代碼,它生成的代碼可能是錯誤的,或者 Bard 可能不會在回答中包含執(zhí)行的代碼,」Bard 產(chǎn)品負(fù)責(zé)人 Jack Krawczyk 和工程副總裁 Amarnag Subramanya 在博文中寫道。「盡管如此,這種改進的能力以結(jié)構(gòu)化、邏輯驅(qū)動的方式回應(yīng)是使 Bard 變得更有幫助的重要一步!
當(dāng)谷歌今年早些時候推出 Bard 時,與 Bing Chat 和 ChatGPT 等相比,它并沒有表現(xiàn)得那么出色。事實上,推出過程出現(xiàn)了一些問題,谷歌的一則廣告中 Bard 給出了一個錯誤的答案,導(dǎo)致該公司股價短暫地下跌了 8%。
為了改善這些問題,谷歌引入了隱式代碼生成等其他改進措施,并增加了對新語言、多模式查詢和圖像生成的支持。然而,要想在該領(lǐng)域與領(lǐng)先的生成式人工智能聊天機器人保持競爭力,谷歌還需要進一步努力。
最近,Anthropic 推出了一款具有大幅擴展「上下文窗口」的人工智能聊天機器人模型,使其能夠相對連貫地進行長時間的對話。而開發(fā) ChatGPT 的 OpenAI 公司也開始支持插件,為 ChatGPT 增添外部知識和技能。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。