研究顯示 ChatGPT 提供的醫(yī)療保健回應(yīng)與人類提供的建議幾乎無法區(qū)分

2023年07月19日 14:56:00 來源：站長之家

　　根據(jù)《JMIR 醫(yī)學(xué)教育》雜志上發(fā)表的一項新研究，ChatGPT 對與醫(yī)療保健相關(guān)的問題的回答很難與人類的回答區(qū)分開來。

　　該研究由紐約大學(xué)的研究人員于今年 1 月進行，旨在評估使用 ChatGPT 或類似的大型語言模型來回答電子健康記錄中提出的一長串問題的可行性。研究得出結(jié)論，使用像 ChatGPT 這樣的大型語言模型可能是簡化醫(yī)療保健提供者與患者溝通的有效方式。

　　為了進行這項研究，研究團隊從紐約大學(xué)朗格醫(yī)療中心的電子健康記錄中提取了患者的問題。然后，他們將這些問題輸入 ChatGPT，并要求聊天機器人回答的字詞與醫(yī)療保健提供者在電子健康記錄中輸入答案時的字詞大致相同。

　　接下來，研究人員向近 400 名成年人展示了十組患者問題和回答。他們告知參與者其中五組回答是由人類醫(yī)療保健提供者撰寫的，另外五組回答是由 ChatGPT 生成的。參與者被要求正確識別每個響應(yīng)是由人類還是 ChatGPT 生成的，并獲得經(jīng)濟獎勵。

　　研究團隊發(fā)現(xiàn)，人們準(zhǔn)確區(qū)分聊天機器人和人類生成的答案的能力有限。平均而言，參與者正確辨別回答來源的能力約為 65%。這一結(jié)果與研究參與者的人口統(tǒng)計特征無關(guān)。

　　研究的作者表示，這項研究證明了 LLMs 在協(xié)助醫(yī)患溝通方面的潛力，尤其是在行政任務(wù)和管理常見慢性疾病方面。

　　然而，他們指出，還需要進行進一步研究，以探索聊天機器人在承擔(dān)臨床職責(zé)方面的能力。研究團隊還強調(diào)，提供者組織在策劃 LLM 生成的建議時要謹(jǐn)慎，以充分考慮這些 AI 模型的限制和潛在偏見。

　　在進行研究時，研究人員還詢問參與者對聊天機器人在回答不同類型問題上的信任程度，采用了一個從完全不可信任到完全可信任的 5 分制評分標(biāo)準(zhǔn)。他們發(fā)現(xiàn)，人們對于關(guān)于保險或預(yù)約安排等后勤問題的信任最高，對于關(guān)于診斷或治療建議的問題，人們對聊天機器人生成的回答的信任最低。

　　這項紐約大學(xué)的研究并不是今年發(fā)表的唯一一項支持使用 LLMs 回答患者問題的研究。

　　今年 4 月，《JAMA 內(nèi)科醫(yī)學(xué)》發(fā)表的一項研究表明，LLMs 在減輕醫(yī)生面對的海量電子郵件負擔(dān)方面具有重要潛力。該研究評估了由醫(yī)生和 ChatGPT 提供的兩組對患者咨詢的回答。一組由醫(yī)療保健專業(yè)人員組成的評審團確定，由于 AI 模型的回答更加詳細和富有同理心，ChatGPT 的表現(xiàn)優(yōu)于人類提供者。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信