引言
近日,加州大學(xué)圣地亞哥分校高通研究所的John W.Ayers博士領(lǐng)導(dǎo)的一項(xiàng)新研究發(fā)表在《JAMA Internal Medicine》上,這項(xiàng)研究為人工智能助理在醫(yī)學(xué)中的作用提供了一個(gè)早期的線索。這項(xiàng)研究將醫(yī)生和ChatGPT的回復(fù)進(jìn)行了比較。一個(gè)由持有執(zhí)照的醫(yī)療保健專業(yè)人員組成的小組79%的情況下更傾向于ChatGPT的回復(fù),并認(rèn)為ChatGPT質(zhì)量更高、更具同理心。
1、研究背景
在這項(xiàng)新的研究中,研究團(tuán)隊(duì)著手回答這個(gè)問(wèn)題:ChatGPT能否準(zhǔn)確回答患者向醫(yī)生提出的問(wèn)題?如果是的話,人工智能模型可以集成到衛(wèi)生系統(tǒng)中,以改善醫(yī)生對(duì)患者提出的問(wèn)題的反應(yīng),并減輕醫(yī)生日益增加的負(fù)擔(dān)。“ChatGPT可能能夠通過(guò)醫(yī)學(xué)執(zhí)照考試,”該研究的合著者、醫(yī)學(xué)科學(xué)家、加州大學(xué)圣迭戈醫(yī)學(xué)院教授戴維·史密斯博士說(shuō),“但直接準(zhǔn)確、富有同情心地回答患者問(wèn)題是另一回事。” “新冠疫情加速了虛擬醫(yī)療的普及,”研究合著者Eric Leas博士補(bǔ)充道,“雖然這讓患者更容易獲得護(hù)理,但醫(yī)生們卻被大量尋求醫(yī)療建議的電子患者信息所拖累,降低了醫(yī)療服務(wù)的質(zhì)量。”
2、研究概況
設(shè)計(jì)一項(xiàng)在醫(yī)療保健環(huán)境中測(cè)試ChatGPT的研究 為了獲得不包含可識(shí)別個(gè)人信息的大量多樣的醫(yī)療保健問(wèn)題和醫(yī)生回答樣本,該團(tuán)隊(duì)轉(zhuǎn)向了社交媒體,數(shù)百萬(wàn)患者在社交媒體上公開發(fā)布醫(yī)生回應(yīng)的醫(yī)療問(wèn)題——約有452000名成員發(fā)布醫(yī)療問(wèn)題,并由經(jīng)過(guò)驗(yàn)證的醫(yī)療保健專業(yè)人員提交答案。主持人會(huì)驗(yàn)證醫(yī)療保健專業(yè)人員的資質(zhì),回答會(huì)顯示受訪者的資質(zhì)水平。雖然有些人可能想知道社交媒體上的問(wèn)答交流是否是一個(gè)公平的測(cè)試,但團(tuán)隊(duì)成員指出,這些交流反映了他們的臨床經(jīng)驗(yàn)。
(圖片源自論文)
該團(tuán)隊(duì)從AskDocs中隨機(jī)抽取了195次交流,向ChatGPT提供了同樣的問(wèn)題,并要求其做出回應(yīng)。一個(gè)由三名持照醫(yī)療保健專業(yè)人員組成的小組評(píng)估了每個(gè)問(wèn)題和相應(yīng)的回答,并對(duì)回答是來(lái)自醫(yī)生還是來(lái)自ChatGPT一無(wú)所知。他們比較了基于信息質(zhì)量和同理心的反應(yīng),并指出他們更喜歡哪一種。衛(wèi)生保健專業(yè)評(píng)估小組79%的情況下更喜歡ChatGPT的回答,而不是醫(yī)生的回答。圣地亞哥“人類長(zhǎng)壽”公司的執(zhí)業(yè)護(hù)士、研究合著者杰西卡·凱利說(shuō):“ChatGPT消息的回應(yīng)是細(xì)致入微、準(zhǔn)確的信息,這些信息往往涉及患者問(wèn)題的更多方面,而不是醫(yī)生的回應(yīng)。”。此外,ChatGPT反應(yīng)的質(zhì)量明顯高于醫(yī)生的反應(yīng):ChatGPT的良好或非常良好的反應(yīng)是醫(yī)生的3.6倍(醫(yī)生22.1%對(duì)ChatGPT 78.5%)。反應(yīng)也更具同理心:ChatGPT的同理心或強(qiáng)烈同理心反應(yīng)是醫(yī)生9.8倍(醫(yī)生4.6%對(duì)ChatGPT 45.1%)。
3、研究意義
計(jì)算機(jī)科學(xué)助理教授、研究合著者Adam Poliak博士說(shuō):“雖然我們的研究可能使ChatGPT與醫(yī)生對(duì)立,但最終的解決方案并不是把你的醫(yī)生完全拋棄,相反,醫(yī)生利用ChatGPT是更好和富有同情心的護(hù)理的答案。”這些結(jié)果表明,像ChatGPT這樣的工具可以有效地起草高質(zhì)量、個(gè)性化的醫(yī)療建議,供臨床醫(yī)生審查,在隨機(jī)對(duì)照試驗(yàn)的背景下,將人工智能助手整合到醫(yī)療保健信息中,以判斷人工智能助手的使用如何影響醫(yī)生和患者的結(jié)果。未來(lái)可以利用這些技術(shù)培訓(xùn)醫(yī)生以患者為中心的溝通,縮小不同群體接受的醫(yī)療服務(wù)的差異,建立新的醫(yī)療安全系統(tǒng),并通過(guò)提供更高質(zhì)量和更高效的護(hù)理來(lái)幫助醫(yī)生。
