一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗東芝全部業(yè)務實現(xiàn)盈利,退市裁員重組后終于賺錢真我14 Pro+開始提上日程:1.5K等深四微曲屏+潛望長焦穩(wěn)了消息稱本田和日產(chǎn)計劃明年6月前敲定合并協(xié)議 2026年8月成立控股公司凱迪拉克最新版OTA開啟推送,新增百度語音大模型和QQ音樂等應用中國聯(lián)通11月5G套餐用戶凈增127.8萬戶5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團隊前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過這道檻!Livekit 開源模型精準識別“你是否說完”!DeepSeek開源大模型開發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復合翼飛行汽車 GOVY AirJet:最高飛行速度可達 250km/h清華大學聯(lián)合騰訊出品!ColorFlow:自動給黑白漫畫上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o3:AI 推理能力的重大突破,得分高達87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動6000億GTV后,抖音計劃偷襲美團大本營AGI Open Network(AON):賦能每個人創(chuàng)建、部署和貨幣化AI Agent
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 科技資訊

    亞馬遜推出“自動推理檢查”工具,對抗 AI 幻覺

    2024年12月04日 10:51:47   來源:IT之家

      亞馬遜云科技(AWS)發(fā)布了一款新工具,旨在解決 AI 模型產(chǎn)生的幻覺問題。

      IT之家注意到,在拉斯維加斯舉辦的 re:Invent 2024 大會上,AWS 推出了“自動推理檢查”(Automated Reasoning checks)工具,該工具通過交叉引用客戶提供的信息來驗證模型的響應準確性。

      AWS 宣稱,這是“第一個”也是“唯一”的針對幻覺的防護措施。然而,這種說法可能不夠準確。微軟今年夏天推出的“校正”功能與“自動推理檢查”幾乎相同,都可以標記可能存在事實錯誤的 AI 生成文本。谷歌的 Vertex AI 平臺也提供了一個工具,允許客戶通過使用第三方提供商的數(shù)據(jù)、自己的數(shù)據(jù)集或谷歌搜索來使模型的回答更可靠。

      “自動推理檢查”通過 AWS 的 Bedrock 模型托管服務(特別是 Guardrails 工具)提供,試圖弄清楚模型是如何得出答案的,并判斷答案是否正確?蛻羯蟼餍畔⒁越⒁环N事實基礎,然后“自動推理檢查”創(chuàng)建規(guī)則,這些規(guī)則可以被優(yōu)化并應用于模型。

      當模型生成回答時,“自動推理檢查”會驗證它們,并在可能出現(xiàn)幻覺時,利用事實基礎得出正確答案。其會將這個答案與可能的錯誤答案一起呈現(xiàn),以便客戶可以看到模型偏離正確答案的程度。

      AWS 表示,普華永道已經(jīng)開始使用“自動推理檢查”為其客戶設計 AI 助手。AWS 的 AI 和數(shù)據(jù)副總裁 Swami Sivasubramanian 暗示,這種類型的工具正是吸引客戶使用 Bedrock 的原因。

      但據(jù) Techcrunch 報道,一位專家今年夏天稱,試圖消除生成式 AI 的幻覺就像試圖從水中消除氫一樣。AI 模型之所以會產(chǎn)生幻覺,是因為它們實際上并“不知道”任何東西。它們是統(tǒng)計系統(tǒng),通過識別一系列數(shù)據(jù)中的模式,并根據(jù)之前看到的例子預測下一個數(shù)據(jù)是什么。因此,模型的響應不是答案,而是對問題應該如何回答的預測 —— 在一定的誤差范圍內(nèi)。

      AWS 聲稱“自動推理檢查”使用“邏輯準確”和“可驗證的推理”來得出結(jié)論,但該公司沒有提供任何數(shù)據(jù)來證明該工具的可靠性。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。