國(guó)內(nèi)首次！ AI醫(yī)生與真人醫(yī)生一起義診紅星新聞

2023-07-05 16:53:31 來(lái)源：紅星新聞

國(guó)內(nèi)首次！ AI醫(yī)生與真人醫(yī)生一起義診

(資料圖)

記者親測(cè)體驗(yàn)問(wèn)診結(jié)果一致性達(dá)96%

AI時(shí)代到來(lái)，人工智能可以給我們多少想象空間？是ChatGPT的聊天、協(xié)助辦公功能，還是Midjourney的3D繪畫(huà)效果？

不止這些，AI現(xiàn)在還能當(dāng)醫(yī)生問(wèn)診病例。6月30日，在成都高新海爾森醫(yī)院，舉行了一場(chǎng)“AI醫(yī)生”與真人醫(yī)生的一致性評(píng)測(cè)。當(dāng)天現(xiàn)場(chǎng)來(lái)了120多名患者，以及10名來(lái)自四川大學(xué)華西醫(yī)院的主治醫(yī)生共同參與評(píng)測(cè)研究。據(jù)主辦方工作人員透露，此次“AI醫(yī)生”義診評(píng)測(cè)是國(guó)內(nèi)首次。

1 研發(fā)“AI醫(yī)生”目的是輔助真人問(wèn)診

當(dāng)天，記者在現(xiàn)場(chǎng)看到，從門口的AI醫(yī)生義診報(bào)到處至問(wèn)診室，許多患者正排隊(duì)等待。走進(jìn)問(wèn)診室，現(xiàn)場(chǎng)有7個(gè)科室、8個(gè)問(wèn)診臺(tái)，包括兩個(gè)心內(nèi)科、泌尿科、骨科等。每個(gè)問(wèn)診臺(tái)都配備有一名醫(yī)生助理，負(fù)責(zé)將患者的病癥以文字形式傳遞給“AI醫(yī)生”MedGPT，同時(shí)真人醫(yī)生在問(wèn)診系統(tǒng)內(nèi)也會(huì)同步得到患者信息。

此次AI醫(yī)生義診活動(dòng)主辦方醫(yī)聯(lián)的工作人員告訴記者，為了保證MedGPT評(píng)測(cè)結(jié)果的真實(shí)性，真人醫(yī)生并沒(méi)有與患者面對(duì)面進(jìn)行問(wèn)診?！斑@次評(píng)測(cè)絕不是一次AI與真人的PK，開(kāi)發(fā)MedGPT的目的，是希望通過(guò)不斷優(yōu)化，將來(lái)可以將這款‘AI醫(yī)生’應(yīng)用到輔助真人醫(yī)生問(wèn)診中?！痹撁ぷ魅藛T表示，MedGPT主要是解決病患的首診問(wèn)題，比如常見(jiàn)病中的頭疼腦熱等，幫助真人醫(yī)生了解并判斷病患可能得病的范圍。同時(shí)，MedGPT可以讓患者更了解自己的病癥及如何在治療期間搭配飲食等。

記者了解到，此次評(píng)測(cè)的同一病例，有MedGPT與真人醫(yī)生分左右兩屏進(jìn)行實(shí)時(shí)對(duì)比。

記者觀察后發(fā)現(xiàn)，MedGPT在問(wèn)診時(shí)，過(guò)程詳細(xì)，將所有可能性一次給出，同時(shí)將多項(xiàng)問(wèn)題顯示在對(duì)話中，通過(guò)患者不斷回答提問(wèn)，不斷排除無(wú)關(guān)項(xiàng)，得到相對(duì)小范圍的可能結(jié)果。而真人醫(yī)生的問(wèn)診過(guò)程，記者的直觀感受是簡(jiǎn)潔、明了?！罢嫒酸t(yī)生每天接觸大量的病人，會(huì)出現(xiàn)疲倦，且打字不比語(yǔ)言對(duì)話，簡(jiǎn)單的內(nèi)容可以節(jié)約時(shí)間，提高效率?！爆F(xiàn)場(chǎng)工作人員解釋。

2 AI與真人同時(shí)問(wèn)診

義診當(dāng)天，一名58歲的女性患者坐在消化科問(wèn)診臺(tái)前，告訴醫(yī)生助理，自己經(jīng)常有腹脹、打嗝的問(wèn)題。醫(yī)生助理立即通過(guò)文字，將問(wèn)題同時(shí)傳遞給MedGPT和真人醫(yī)生。

不久，MedGPT首先明確該患者癥狀與消化系統(tǒng)相關(guān)，并引導(dǎo)患者對(duì)癥狀進(jìn)行描述，比如“腹脹和打嗝是慢慢出現(xiàn)還是突然出現(xiàn)的”“持續(xù)了多久”“有沒(méi)有其他癥狀”等。該患者回答，一年前開(kāi)始有腹痛伴隨腹脹、打嗝，口干口苦等癥狀。

而真人醫(yī)生面對(duì)該癥狀，首先提問(wèn)的是患者的身高、體重、精神狀態(tài)等基礎(chǔ)問(wèn)題。在得到患者答復(fù)后，開(kāi)始提問(wèn)是否有反酸、燒心等感受，同時(shí)還問(wèn)到患者的睡眠、飲食等問(wèn)題。在得到患者回答睡眠差但飲食尚可后，真人醫(yī)生繼續(xù)詢問(wèn)是否有高血壓、糖尿病等。該患者均否認(rèn)。

而MedGPT的回應(yīng)則是進(jìn)一步告知患者，癥狀可能與胃腸道功能紊亂有關(guān)，并抓住之前并未掌握的“腹痛”問(wèn)題追問(wèn)“您的腹痛是持續(xù)存在還是陣發(fā)性的”“痛感在哪個(gè)位置”“有無(wú)腹瀉、便秘等癥狀”。

患者回復(fù)：“沒(méi)有很痛，主要是腹脹”。接著MedGPT也問(wèn)到是否有泛酸、燒心的感受。得到回答后，MedGPT開(kāi)始詢問(wèn)家族病史與患者本人既往病史、過(guò)敏史，還問(wèn)了患者是否曾做過(guò)手術(shù)?；颊呋貜?fù)曾做過(guò)子宮肌瘤手術(shù)，無(wú)過(guò)敏史。同樣，真人醫(yī)生也問(wèn)了類似問(wèn)題。

通過(guò)對(duì)比，記者發(fā)現(xiàn)，真人醫(yī)生相較于MedGPT，多了關(guān)于飲食習(xí)慣的問(wèn)題。該患者回復(fù)喜歡吃辛辣食物，燒心的感受在吃辛辣食物后出現(xiàn)。

MedGPT和真人醫(yī)生的檢查建議都包括腹部彩超、胃腸功能檢查、胃鏡檢查。經(jīng)過(guò)查看檢查結(jié)果，真人醫(yī)生判定是脂肪肝，開(kāi)出莫沙必利片并建議患者多運(yùn)動(dòng)。

MedGPT在得到脂肪肝的信息后，沒(méi)有直接給出建議，而是繼續(xù)詢問(wèn)患者身高體重。在算出體重指數(shù)屬正常范圍但接近“過(guò)重”后，建議患者做慢跑、瑜伽等運(yùn)動(dòng)。緊接著又追問(wèn)患者的飲食是否規(guī)律、作息是否規(guī)律。在得到肯定回答后，又建議患者多吃水果蔬菜并多喝水；最終，MedGPT并未給出服藥建議。

3 記者親測(cè)：AI醫(yī)生可自動(dòng)識(shí)別錯(cuò)別字

在義診過(guò)程中，陸續(xù)有幾名患者向工作人員表示AI問(wèn)診速度太慢。記者在現(xiàn)場(chǎng)分別觀察并記錄一名泌尿科患者及一名骨科患者的問(wèn)診過(guò)程，時(shí)長(zhǎng)分別是28分鐘與23分鐘。

對(duì)此，工作人員告訴記者，此次義診的過(guò)程首先由患者將癥狀告訴現(xiàn)場(chǎng)醫(yī)生助理，由醫(yī)生助理通過(guò)文字形式同時(shí)轉(zhuǎn)述給MedGPT及真人醫(yī)生，等待兩方的進(jìn)一步回復(fù)后，再將問(wèn)題、檢查方案等內(nèi)容口述轉(zhuǎn)達(dá)給患者，“為了本次測(cè)評(píng)的準(zhǔn)確性，不論‘AI醫(yī)生’或是真人醫(yī)生，均只以文字方式問(wèn)診?！痹摴ぷ魅藛T告訴記者

隨后，記者開(kāi)始親測(cè)MedGPT的問(wèn)診效果，向其咨詢“失眠怎么辦”，MedGPT首先詢問(wèn)了記者出現(xiàn)失眠癥狀多久、頻率、生活工作壓力等。在得到回復(fù)后，MedGPT開(kāi)始細(xì)分詢問(wèn)如是否運(yùn)動(dòng)、有無(wú)其他健康問(wèn)題等。

記者發(fā)現(xiàn)，如果MedGPT在提出問(wèn)題后，記者并未回答，則會(huì)反復(fù)提問(wèn)。問(wèn)診過(guò)程中，記者有意將“提醒”錯(cuò)寫為“提行”，MedGPT依然可以識(shí)別記者真實(shí)想表達(dá)的含義，進(jìn)行解答或回復(fù)。同時(shí)，記者用口語(yǔ)化近義詞代替原有的書(shū)面詞匯，如“失眠”改為“睡不著”等，MedGPT均能理解。經(jīng)過(guò)7分鐘的問(wèn)診，由于記者的癥狀不算嚴(yán)重，MedGPT建議暫不需用藥，可通過(guò)規(guī)律運(yùn)動(dòng)等方式改善睡眠。

工作人員告訴記者，MedGPT的問(wèn)診過(guò)程是模仿真人的思維結(jié)構(gòu)，就像一棵樹(shù)，它的可能性很多，通過(guò)患者的反復(fù)提問(wèn)中，排除無(wú)用枝椏后，在重點(diǎn)“枝椏”上進(jìn)一步確定最終的“樹(shù)梢”?！八梢宰R(shí)別文字中的錯(cuò)別字，但對(duì)于‘?huà)鷭人拇ǚ窖曰蚱渌貐^(qū)方言文字，‘AI醫(yī)生’暫無(wú)法識(shí)別”。

4 AI與真人問(wèn)診結(jié)果一致性達(dá)96%

6月30日晚，來(lái)自北大人民醫(yī)院、中日友好醫(yī)院、友誼醫(yī)院和阜外醫(yī)院的7名專家教授對(duì)其中91份病例進(jìn)行審核，并對(duì)“AI醫(yī)生”MedGPT的問(wèn)診、診斷、治療建議、輔助檢查方案、數(shù)據(jù)分析的準(zhǔn)確性及提供可解釋信息、自然語(yǔ)言問(wèn)診與交互等7個(gè)評(píng)價(jià)維度進(jìn)行打分。

最終，評(píng)測(cè)結(jié)果為：真人醫(yī)生綜合得分7.5分，AI醫(yī)生MedGPT綜合得分7.2分；AI醫(yī)生MedGPT與四川大學(xué)華西醫(yī)院的主治醫(yī)生在比分結(jié)果上的一致性達(dá)到96%。

在當(dāng)晚的線上直播點(diǎn)評(píng)中，北大人民醫(yī)院骨科主任醫(yī)師薛峰表示，自己對(duì)“AI醫(yī)生”問(wèn)診結(jié)果整體感覺(jué)還不錯(cuò)。他和記者有同樣感受，“我感覺(jué)AI醫(yī)生的語(yǔ)言內(nèi)容翔實(shí)，真人醫(yī)生看病時(shí)與病人對(duì)話少，給病人的信息少。比如對(duì)于女性患者，AI醫(yī)生會(huì)問(wèn)經(jīng)期、孕期等，真人骨科醫(yī)生則很少問(wèn)。”同時(shí)，薛峰也提出，骨科醫(yī)生在問(wèn)診時(shí)最重要的是“查體”，實(shí)際是檢查患者的骨骼問(wèn)題，但AI醫(yī)生MedGPT無(wú)法做到，還是需要借助真人完成。

中日友好醫(yī)院呼吸科主任醫(yī)師劉國(guó)梁表示，“AI醫(yī)生能想到所有的患病可能性和誘因，在藥物過(guò)敏等各個(gè)維度都會(huì)考慮到，這一點(diǎn)有利于幫助真人醫(yī)生自身的知識(shí)結(jié)構(gòu)完善和拓展。但AI醫(yī)生容易出現(xiàn)重復(fù)推薦檢查項(xiàng)目，有一些檢查項(xiàng)目是沒(méi)有必要的?！?/p>

主辦方工作人員告訴記者，目前，MedGPT已經(jīng)可問(wèn)診3000多種常見(jiàn)病癥，今年年底將完成第一階段的測(cè)試，屆時(shí)它的可問(wèn)診病癥數(shù)量將有更大幅度提升。

成都商報(bào)-紅星新聞?dòng)浾?葉燕實(shí)習(xí)記者胡謙攝影報(bào)道

關(guān)鍵詞：