您的位置:首頁(yè) >要聞 >

國(guó)內(nèi)首次! AI醫(yī)生與真人醫(yī)生一起義診紅星新聞

2023-07-05 16:53:31    來(lái)源:紅星新聞

國(guó)內(nèi)首次! AI醫(yī)生與真人醫(yī)生一起義診


(資料圖)

記者親測(cè)體驗(yàn)問(wèn)診結(jié)果一致性達(dá)96%

AI時(shí)代到來(lái),人工智能可以給我們多少想象空間?是ChatGPT的聊天、協(xié)助辦公功能,還是Midjourney的3D繪畫(huà)效果?

不止這些,AI現(xiàn)在還能當(dāng)醫(yī)生問(wèn)診病例。6月30日,在成都高新海爾森醫(yī)院,舉行了一場(chǎng)“AI醫(yī)生”與真人醫(yī)生的一致性評(píng)測(cè)。當(dāng)天現(xiàn)場(chǎng)來(lái)了120多名患者,以及10名來(lái)自四川大學(xué)華西醫(yī)院的主治醫(yī)生共同參與評(píng)測(cè)研究。據(jù)主辦方工作人員透露,此次“AI醫(yī)生”義診評(píng)測(cè)是國(guó)內(nèi)首次。

1 研發(fā)“AI醫(yī)生”目的是輔助真人問(wèn)診

當(dāng)天,記者在現(xiàn)場(chǎng)看到,從門口的AI醫(yī)生義診報(bào)到處至問(wèn)診室,許多患者正排隊(duì)等待。走進(jìn)問(wèn)診室,現(xiàn)場(chǎng)有7個(gè)科室、8個(gè)問(wèn)診臺(tái),包括兩個(gè)心內(nèi)科、泌尿科、骨科等。每個(gè)問(wèn)診臺(tái)都配備有一名醫(yī)生助理,負(fù)責(zé)將患者的病癥以文字形式傳遞給“AI醫(yī)生”MedGPT,同時(shí)真人醫(yī)生在問(wèn)診系統(tǒng)內(nèi)也會(huì)同步得到患者信息。

此次AI醫(yī)生義診活動(dòng)主辦方醫(yī)聯(lián)的工作人員告訴記者,為了保證MedGPT評(píng)測(cè)結(jié)果的真實(shí)性,真人醫(yī)生并沒(méi)有與患者面對(duì)面進(jìn)行問(wèn)診?!斑@次評(píng)測(cè)絕不是一次AI與真人的PK,開(kāi)發(fā)MedGPT的目的,是希望通過(guò)不斷優(yōu)化,將來(lái)可以將這款‘AI醫(yī)生’應(yīng)用到輔助真人醫(yī)生問(wèn)診中?!痹撁ぷ魅藛T表示,MedGPT主要是解決病患的首診問(wèn)題,比如常見(jiàn)病中的頭疼腦熱等,幫助真人醫(yī)生了解并判斷病患可能得病的范圍。同時(shí),MedGPT可以讓患者更了解自己的病癥及如何在治療期間搭配飲食等。

記者了解到,此次評(píng)測(cè)的同一病例,有MedGPT與真人醫(yī)生分左右兩屏進(jìn)行實(shí)時(shí)對(duì)比。

記者觀察后發(fā)現(xiàn),MedGPT在問(wèn)診時(shí),過(guò)程詳細(xì),將所有可能性一次給出,同時(shí)將多項(xiàng)問(wèn)題顯示在對(duì)話中,通過(guò)患者不斷回答提問(wèn),不斷排除無(wú)關(guān)項(xiàng),得到相對(duì)小范圍的可能結(jié)果。而真人醫(yī)生的問(wèn)診過(guò)程,記者的直觀感受是簡(jiǎn)潔、明了?!罢嫒酸t(yī)生每天接觸大量的病人,會(huì)出現(xiàn)疲倦,且打字不比語(yǔ)言對(duì)話,簡(jiǎn)單的內(nèi)容可以節(jié)約時(shí)間,提高效率?!爆F(xiàn)場(chǎng)工作人員解釋。

2 AI與真人同時(shí)問(wèn)診

義診當(dāng)天,一名58歲的女性患者坐在消化科問(wèn)診臺(tái)前,告訴醫(yī)生助理,自己經(jīng)常有腹脹、打嗝的問(wèn)題。醫(yī)生助理立即通過(guò)文字,將問(wèn)題同時(shí)傳遞給MedGPT和真人醫(yī)生。

不久,MedGPT首先明確該患者癥狀與消化系統(tǒng)相關(guān),并引導(dǎo)患者對(duì)癥狀進(jìn)行描述,比如“腹脹和打嗝是慢慢出現(xiàn)還是突然出現(xiàn)的”“持續(xù)了多久”“有沒(méi)有其他癥狀”等。該患者回答,一年前開(kāi)始有腹痛伴隨腹脹、打嗝,口干口苦等癥狀。

而真人醫(yī)生面對(duì)該癥狀,首先提問(wèn)的是患者的身高、體重、精神狀態(tài)等基礎(chǔ)問(wèn)題。在得到患者答復(fù)后,開(kāi)始提問(wèn)是否有反酸、燒心等感受,同時(shí)還問(wèn)到患者的睡眠、飲食等問(wèn)題。在得到患者回答睡眠差但飲食尚可后,真人醫(yī)生繼續(xù)詢問(wèn)是否有高血壓、糖尿病等。該患者均否認(rèn)。

而MedGPT的回應(yīng)則是進(jìn)一步告知患者,癥狀可能與胃腸道功能紊亂有關(guān),并抓住之前并未掌握的“腹痛”問(wèn)題追問(wèn)“您的腹痛是持續(xù)存在還是陣發(fā)性的”“痛感在哪個(gè)位置”“有無(wú)腹瀉、便秘等癥狀”。

患者回復(fù):“沒(méi)有很痛,主要是腹脹”。接著MedGPT也問(wèn)到是否有泛酸、燒心的感受。得到回答后,MedGPT開(kāi)始詢問(wèn)家族病史與患者本人既往病史、過(guò)敏史,還問(wèn)了患者是否曾做過(guò)手術(shù)?;颊呋貜?fù)曾做過(guò)子宮肌瘤手術(shù),無(wú)過(guò)敏史。同樣,真人醫(yī)生也問(wèn)了類似問(wèn)題。

通過(guò)對(duì)比,記者發(fā)現(xiàn),真人醫(yī)生相較于MedGPT,多了關(guān)于飲食習(xí)慣的問(wèn)題。該患者回復(fù)喜歡吃辛辣食物,燒心的感受在吃辛辣食物后出現(xiàn)。

MedGPT和真人醫(yī)生的檢查建議都包括腹部彩超、胃腸功能檢查、胃鏡檢查。經(jīng)過(guò)查看檢查結(jié)果,真人醫(yī)生判定是脂肪肝,開(kāi)出莫沙必利片并建議患者多運(yùn)動(dòng)。

MedGPT在得到脂肪肝的信息后,沒(méi)有直接給出建議,而是繼續(xù)詢問(wèn)患者身高體重。在算出體重指數(shù)屬正常范圍但接近“過(guò)重”后,建議患者做慢跑、瑜伽等運(yùn)動(dòng)。緊接著又追問(wèn)患者的飲食是否規(guī)律、作息是否規(guī)律。在得到肯定回答后,又建議患者多吃水果蔬菜并多喝水;最終,MedGPT并未給出服藥建議。

3 記者親測(cè):AI醫(yī)生可自動(dòng)識(shí)別錯(cuò)別字

在義診過(guò)程中,陸續(xù)有幾名患者向工作人員表示AI問(wèn)診速度太慢。記者在現(xiàn)場(chǎng)分別觀察并記錄一名泌尿科患者及一名骨科患者的問(wèn)診過(guò)程,時(shí)長(zhǎng)分別是28分鐘與23分鐘。

對(duì)此,工作人員告訴記者,此次義診的過(guò)程首先由患者將癥狀告訴現(xiàn)場(chǎng)醫(yī)生助理,由醫(yī)生助理通過(guò)文字形式同時(shí)轉(zhuǎn)述給MedGPT及真人醫(yī)生,等待兩方的進(jìn)一步回復(fù)后,再將問(wèn)題、檢查方案等內(nèi)容口述轉(zhuǎn)達(dá)給患者,“為了本次測(cè)評(píng)的準(zhǔn)確性,不論‘AI醫(yī)生’或是真人醫(yī)生,均只以文字方式問(wèn)診?!痹摴ぷ魅藛T告訴記者

隨后,記者開(kāi)始親測(cè)MedGPT的問(wèn)診效果,向其咨詢“失眠怎么辦”,MedGPT首先詢問(wèn)了記者出現(xiàn)失眠癥狀多久、頻率、生活工作壓力等。在得到回復(fù)后,MedGPT開(kāi)始細(xì)分詢問(wèn)如是否運(yùn)動(dòng)、有無(wú)其他健康問(wèn)題等。

記者發(fā)現(xiàn),如果MedGPT在提出問(wèn)題后,記者并未回答,則會(huì)反復(fù)提問(wèn)。問(wèn)診過(guò)程中,記者有意將“提醒”錯(cuò)寫為“提行”,MedGPT依然可以識(shí)別記者真實(shí)想表達(dá)的含義,進(jìn)行解答或回復(fù)。同時(shí),記者用口語(yǔ)化近義詞代替原有的書(shū)面詞匯,如“失眠”改為“睡不著”等,MedGPT均能理解。經(jīng)過(guò)7分鐘的問(wèn)診,由于記者的癥狀不算嚴(yán)重,MedGPT建議暫不需用藥,可通過(guò)規(guī)律運(yùn)動(dòng)等方式改善睡眠。

工作人員告訴記者,MedGPT的問(wèn)診過(guò)程是模仿真人的思維結(jié)構(gòu),就像一棵樹(shù),它的可能性很多,通過(guò)患者的反復(fù)提問(wèn)中,排除無(wú)用枝椏后,在重點(diǎn)“枝椏”上進(jìn)一步確定最終的“樹(shù)梢”?!八梢宰R(shí)別文字中的錯(cuò)別字,但對(duì)于‘?huà)鷭人拇ǚ窖曰蚱渌貐^(qū)方言文字,‘AI醫(yī)生’暫無(wú)法識(shí)別”。

4 AI與真人問(wèn)診結(jié)果 一致性達(dá)96%

6月30日晚,來(lái)自北大人民醫(yī)院、中日友好醫(yī)院、友誼醫(yī)院和阜外醫(yī)院的7名專家教授對(duì)其中91份病例進(jìn)行審核,并對(duì)“AI醫(yī)生”MedGPT的問(wèn)診、診斷、治療建議、輔助檢查方案、數(shù)據(jù)分析的準(zhǔn)確性及提供可解釋信息、自然語(yǔ)言問(wèn)診與交互等7個(gè)評(píng)價(jià)維度進(jìn)行打分。

最終,評(píng)測(cè)結(jié)果為:真人醫(yī)生綜合得分7.5分,AI醫(yī)生MedGPT綜合得分7.2分;AI醫(yī)生MedGPT與四川大學(xué)華西醫(yī)院的主治醫(yī)生在比分結(jié)果上的一致性達(dá)到96%。

在當(dāng)晚的線上直播點(diǎn)評(píng)中,北大人民醫(yī)院骨科主任醫(yī)師薛峰表示,自己對(duì)“AI醫(yī)生”問(wèn)診結(jié)果整體感覺(jué)還不錯(cuò)。他和記者有同樣感受,“我感覺(jué)AI醫(yī)生的語(yǔ)言內(nèi)容翔實(shí),真人醫(yī)生看病時(shí)與病人對(duì)話少,給病人的信息少。比如對(duì)于女性患者,AI醫(yī)生會(huì)問(wèn)經(jīng)期、孕期等,真人骨科醫(yī)生則很少問(wèn)。”同時(shí),薛峰也提出,骨科醫(yī)生在問(wèn)診時(shí)最重要的是“查體”,實(shí)際是檢查患者的骨骼問(wèn)題,但AI醫(yī)生MedGPT無(wú)法做到,還是需要借助真人完成。

中日友好醫(yī)院呼吸科主任醫(yī)師劉國(guó)梁表示,“AI醫(yī)生能想到所有的患病可能性和誘因,在藥物過(guò)敏等各個(gè)維度都會(huì)考慮到,這一點(diǎn)有利于幫助真人醫(yī)生自身的知識(shí)結(jié)構(gòu)完善和拓展。但AI醫(yī)生容易出現(xiàn)重復(fù)推薦檢查項(xiàng)目,有一些檢查項(xiàng)目是沒(méi)有必要的?!?/p>

主辦方工作人員告訴記者,目前,MedGPT已經(jīng)可問(wèn)診3000多種常見(jiàn)病癥,今年年底將完成第一階段的測(cè)試,屆時(shí)它的可問(wèn)診病癥數(shù)量將有更大幅度提升。

成都商報(bào)-紅星新聞?dòng)浾?葉燕 實(shí)習(xí)記者 胡謙 攝影報(bào)道

關(guān)鍵詞:

相關(guān)閱讀