根據(jù)《JMIR 醫(yī)學(xué)教育》雜志上發(fā)表的一項新研究,ChatGPT 對與醫(yī)療保健相關(guān)的問題的回答很難與人類的回答區(qū)分開來。
該研究由紐約大學(xué)的研究人員于今年 1 月進行,旨在評估使用 ChatGPT 或類似的大型語言模型來回答電子健康記錄中提出的一長串問題的可行性。研究得出結(jié)論,使用像 ChatGPT 這樣的大型語言模型可能是簡化醫(yī)療保健提供者與患者溝通的有效方式。
為了進行這項研究,研究團隊從紐約大學(xué)朗格醫(yī)療中心的電子健康記錄中提取了患者的問題。然后,他們將這些問題輸入 ChatGPT,并要求聊天機器人回答的字詞與醫(yī)療保健提供者在電子健康記錄中輸入答案時的字詞大致相同。
接下來,研究人員向近 400 名成年人展示了十組患者問題和回答。他們告知參與者其中五組回答是由人類醫(yī)療保健提供者撰寫的,另外五組回答是由 ChatGPT 生成的。參與者被要求正確識別每個響應(yīng)是由人類還是 ChatGPT 生成的,并獲得經(jīng)濟獎勵。
研究團隊發(fā)現(xiàn),人們準(zhǔn)確區(qū)分聊天機器人和人類生成的答案的能力有限。平均而言,參與者正確辨別回答來源的能力約為 65%。這一結(jié)果與研究參與者的人口統(tǒng)計特征無關(guān)。
研究的作者表示,這項研究證明了 LLMs 在協(xié)助醫(yī)患溝通方面的潛力,尤其是在行政任務(wù)和管理常見慢性疾病方面。
然而,他們指出,還需要進行進一步研究,以探索聊天機器人在承擔(dān)臨床職責(zé)方面的能力。研究團隊還強調(diào),提供者組織在策劃 LLM 生成的建議時要謹(jǐn)慎,以充分考慮這些 AI 模型的限制和潛在偏見。
在進行研究時,研究人員還詢問參與者對聊天機器人在回答不同類型問題上的信任程度,采用了一個從完全不可信任到完全可信任的 5 分制評分標(biāo)準(zhǔn)。他們發(fā)現(xiàn),人們對于關(guān)于保險或預(yù)約安排等后勤問題的信任最高,對于關(guān)于診斷或治療建議的問題,人們對聊天機器人生成的回答的信任最低。
這項紐約大學(xué)的研究并不是今年發(fā)表的唯一一項支持使用 LLMs 回答患者問題的研究。
今年 4 月,《JAMA 內(nèi)科醫(yī)學(xué)》發(fā)表的一項研究表明,LLMs 在減輕醫(yī)生面對的海量電子郵件負擔(dān)方面具有重要潛力。該研究評估了由醫(yī)生和 ChatGPT 提供的兩組對患者咨詢的回答。一組由醫(yī)療保健專業(yè)人員組成的評審團確定,由于 AI 模型的回答更加詳細和富有同理心,ChatGPT 的表現(xiàn)優(yōu)于人類提供者。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。