• 首頁 > 企業(yè)IT頻道 > 軟件即服務(wù)

    亞馬遜推出“自動推理檢查”工具 對抗AI幻覺

    2024年12月04日 13:28:18   來源:IT之家

      亞馬遜云科技(AWS)發(fā)布了一款新工具,旨在解決 AI 模型產(chǎn)生的幻覺問題。

      在拉斯維加斯舉辦的 re:Invent 2024 大會上,AWS 推出了“自動推理檢查”(Automated Reasoning checks)工具,該工具通過交叉引用客戶提供的信息來驗證模型的響應(yīng)準(zhǔn)確性。

      AWS 宣稱,這是“第一個”也是“唯一”的針對幻覺的防護措施。然而,這種說法可能不夠準(zhǔn)確。微軟今年夏天推出的“校正”功能與“自動推理檢查”幾乎相同,都可以標(biāo)記可能存在事實錯誤的 AI 生成文本。谷歌的 Vertex AI 平臺也提供了一個工具,允許客戶通過使用第三方提供商的數(shù)據(jù)、自己的數(shù)據(jù)集或谷歌搜索來使模型的回答更可靠。

      “自動推理檢查”通過 AWS 的 Bedrock 模型托管服務(wù)(特別是 Guardrails 工具)提供,試圖弄清楚模型是如何得出答案的,并判斷答案是否正確?蛻羯蟼餍畔⒁越⒁环N事實基礎(chǔ),然后“自動推理檢查”創(chuàng)建規(guī)則,這些規(guī)則可以被優(yōu)化并應(yīng)用于模型。

      當(dāng)模型生成回答時,“自動推理檢查”會驗證它們,并在可能出現(xiàn)幻覺時,利用事實基礎(chǔ)得出正確答案。其會將這個答案與可能的錯誤答案一起呈現(xiàn),以便客戶可以看到模型偏離正確答案的程度。

      AWS 表示,普華永道已經(jīng)開始使用“自動推理檢查”為其客戶設(shè)計 AI 助手。AWS 的 AI 和數(shù)據(jù)副總裁 Swami Sivasubramanian 暗示,這種類型的工具正是吸引客戶使用 Bedrock 的原因。

      但據(jù) Techcrunch 報道,一位專家今年夏天稱,試圖消除生成式 AI 的幻覺就像試圖從水中消除氫一樣。AI 模型之所以會產(chǎn)生幻覺,是因為它們實際上并“不知道”任何東西。它們是統(tǒng)計系統(tǒng),通過識別一系列數(shù)據(jù)中的模式,并根據(jù)之前看到的例子預(yù)測下一個數(shù)據(jù)是什么。因此,模型的響應(yīng)不是答案,而是對問題應(yīng)該如何回答的預(yù)測 —— 在一定的誤差范圍內(nèi)。

      AWS 聲稱“自動推理檢查”使用“邏輯準(zhǔn)確”和“可驗證的推理”來得出結(jié)論,但該公司沒有提供任何數(shù)據(jù)來證明該工具的可靠性。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。