下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風(fēng)機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預(yù)告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預(yù)售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團(tuán)旗下微信社群團(tuán)購業(yè)務(wù)“團(tuán)買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備在海外,要再造一個京東物流?消息稱蘋果正為AirPods開發(fā)多項健康功能,包括心率監(jiān)測和溫度感應(yīng)一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗東芝全部業(yè)務(wù)實現(xiàn)盈利,退市裁員重組后終于賺錢
  • 首頁 > 云計算頻道 > 大模型

    OpenAI公布大模型新訓(xùn)練方法:阻止ChatGPT“一本正經(jīng)地胡說八道”

    2023年06月01日 14:39:36   來源:新浪科技

      北京時間6月1日早間消息,據(jù)報道,當(dāng)?shù)貢r間周三,OpenAI公司通過論文介紹了一種全新的方法,來訓(xùn)練生成式人工智能語言模型。

      OpenAI這一研究成果來得很是時候,最近,隨著生成式人工智能技術(shù)流行,以及美國2024年總統(tǒng)大選初步啟動,人工智能“胡說八道”的問題引發(fā)了史無前例的關(guān)注和討論。

      去年,OpenAI公司推出了人工智能對話撰稿工具ChatGPT,背后依托于GPT3和GPT4語言模型。ChatGPT的優(yōu)秀表現(xiàn)在全世界掀起了生成式人工智能的一股風(fēng)暴,兩個月之內(nèi),相關(guān)服務(wù)的月度活躍用戶超過了一億人,用戶增長速度創(chuàng)造了新的世界紀(jì)錄。

      OpenAI背后的大股東之一是微軟,微軟已經(jīng)累計對該公司投資130億美元。目前,OpenAI的市值大約為290億美元。

      人工智能“胡說八道”,術(shù)語上也被稱為“AI幻覺”。面對用戶的提問,ChatGPT以及谷歌的Bard等工具會杜撰出一些虛假信息,看上去像是權(quán)威正確的答案。

      比如,今年2月谷歌針對Bard工具推出了一個演示視頻,視頻中Bard有關(guān)美國韋伯太空望遠(yuǎn)鏡的描述就存在錯誤。此外,美國紐約的幾位律師最近使用ChatGPT撰寫法律文件,ChatGPT描述了完全虛構(gòu)的案例,這些律師將面臨處罰。

      OpenAI公司的研究人員表示,即使是最先進(jìn)的人工智能模型也會杜撰虛假信息,尤其是在拿不準(zhǔn)的時候,它們往往傾向于編造事實。

      研究人員表示,在要求多步驟推理的領(lǐng)域,人工智能胡編的后果尤為嚴(yán)重,因為一個單一的邏輯錯誤會導(dǎo)致整個解決方案“翻車”。

      OpenAI準(zhǔn)備采用新戰(zhàn)略,防止人工智能胡編。比如在過去,一旦提供一個正確的最終答案,模型會獲得某種鼓勵,但是以后,在每一個單一的邏輯推理環(huán)節(jié)如果表現(xiàn)正確,就將獲得鼓勵反饋。這種模式也被稱之為“過程監(jiān)督”(以往的模式術(shù)語“結(jié)果監(jiān)督”)。

      研究人員表示,“過程監(jiān)督”模式有助于產(chǎn)生更加清晰合理的回答,它將會鼓勵生成式人工智能能夠像人類一樣,在推理思考中做到“環(huán)環(huán)相扣”。

      OpenAI公司“隨機生成數(shù)學(xué)”研究專家卡爾·柯比(Karl Cobbe)表示,發(fā)現(xiàn)并且減少人工智能模型的邏輯錯誤,也就是“AI幻覺”,是構(gòu)建“通用人工智能”的關(guān)鍵一步。另外,“過程監(jiān)督”模式并非OpenAI公司發(fā)明,但是該公司正在加以推廣普及。

      柯比表示,新方法的目的,是解決人工智能胡編問題,從而讓語言模型能夠解決更加復(fù)雜的推理難題。

      這位專家介紹,OpenAI已經(jīng)發(fā)布了一個研究使用的數(shù)據(jù)集,包括80萬條人工標(biāo)簽,可用上述新模式訓(xùn)練語言模型。

      不過,美國電子隱私信息中心的資深律師本·魏特斯(Ben Winters)對這種新的訓(xùn)練模式表示質(zhì)疑,他希望親自查看OpenAI的完整數(shù)據(jù)集,以及相關(guān)的例子。

      魏特斯表示,目前生成式人工智能還處于野蠻生長時代,OpenAI的新模式還無法實質(zhì)性緩解AI胡編亂造錯誤答案的問題。

      這位律師表示,最重要的是,OpenAI是否會將一些研究論文成果部署到實際產(chǎn)品中,如果沒有這樣的計劃,這將會引發(fā)社會質(zhì)疑,即他們到底要向公眾發(fā)布怎樣的最終產(chǎn)品。

      美國布朗大學(xué)的學(xué)者維克塔(Suresh Venkatasubramanian)表示,目前還不清楚OpenAI的研究論文是否經(jīng)過了同行評議,他認(rèn)為這一研究還僅僅停留在“初步觀察”階段。

      維克塔表示,在做出某種確定性結(jié)論之前,研究論文還需要在學(xué)術(shù)圈子內(nèi)進(jìn)行更多傳播。他認(rèn)為,如今,人工智能領(lǐng)域每天都會有很多研究成果,但是“大型語言模型”在工作時存在不穩(wěn)定性,因此在某種條件、背景或者模式下的運行結(jié)果,可能無法應(yīng)用于另外一種條件、背景或模式。

      維克塔認(rèn)為,在人工智能胡編的問題中,包括了語言模型胡編一些他人引言或者參考信息。OpenAI的新論文并沒有證據(jù)能解決這一問題。

      OpenAI專家柯比表示,未來將會在學(xué)術(shù)會議上把論文交給其他人,進(jìn)行同行評議。對于何時將會把研究成果和“過程監(jiān)督”整合到ChatGPT等最終產(chǎn)品中,OpenAI尚未發(fā)表官方評論。

      美國人工智能研究專家薩拉·邁爾斯·韋斯特(Sarah Myers West)表示,人工智能公司開始解決虛假答案問題,這是一個好消息,但OpenAI目前的論文還停留在“公司內(nèi)部研究”的階段,還需要攻克更多難關(guān)。

      韋斯特表示,在論文中,OpenAI發(fā)布一個“人類級反饋”的小規(guī)模數(shù)據(jù)集,但是并沒有訓(xùn)練GPT4模型所用數(shù)據(jù)的更多介紹。雖然生成式人工智能已經(jīng)開始改變普通人的工作生活,但是距離“負(fù)責(zé)任的人工智能應(yīng)用”,還存在相當(dāng)多的技術(shù)挑戰(zhàn)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。