“怪病”纏身 3 年求醫(yī)無果,最終竟然被 ChatGPT 成功診斷!
這是發(fā)生在一名 4 歲男孩身上的真實經(jīng)歷。
某次運動后,他身體開始劇痛。母親前后帶他看了 17 名醫(yī)生,從兒科、骨科到各種專家,先后進(jìn)行了 MRI 等一系列檢查,但沒一個真正找出病因。
他的母親沒抱太大希望地嘗試求助 ChatGPT,后者卻根據(jù)描述和檢查報告,直接給出了正確的建議。
話題一出沖上知乎熱榜,Reddit 熱度也飆升至 2.3k。
有網(wǎng)友表示,GPT 這次真的很讓人激動:
每個醫(yī)生的辦公室都可以配備一個 AI 助手,并將它與自己的診斷結(jié)果進(jìn)行比較。
還有網(wǎng)友 cue 了下谷歌專門訓(xùn)練的輔助醫(yī)療診斷大模型 Med-PaLM,想知道它的診斷結(jié)果如何:
對于大模型而言,這幾乎是個完美的測試任務(wù)。
所以,這具體是怎么一回事?
究竟是什么樣的“怪病”?
故事的主人公名叫 Alex,他的母親 Courtney 一共有兩個孩子。
2020 年的一天,Alex 的保姆告訴 Courtney,Alex 每天都要服用止痛藥,不然就會疼到崩潰。
接著,Alex 又出現(xiàn)了磨牙的癥狀,父母把這兩件事聯(lián)系到了一起,認(rèn)為可能是由換牙或者蛀牙引起的疼痛導(dǎo)致的。
于是母親帶著 Alex 去看了牙醫(yī),Alex 長達(dá)三年的尋醫(yī)之路便正式開始了。
由于牙醫(yī)檢查之后沒有發(fā)現(xiàn)任何問題,但提出鑒于 Alex 正在磨牙,推薦他們?nèi)タ磳I(yè)治療氣道阻塞的正畸醫(yī)生。
正畸醫(yī)生發(fā)現(xiàn),Alex 的上顎太小,導(dǎo)致呼吸困難,于是給 Alex 放置了一個擴(kuò)張器。這種治療方式的確起到了效果,母親一度認(rèn)為 Alex 的病馬上就要痊愈了。
很合理,但現(xiàn)實往往是不講邏輯的。
媽媽很快又發(fā)現(xiàn),只有四歲的 Alex 個子突然不長了。
這一次,媽媽求助的是一名兒科醫(yī)生。
醫(yī)生認(rèn)為 Alex 可能是受到了新冠病毒的影響,但媽媽對這個解釋并不滿意。不過,媽媽還是在 2021 年初帶著 Alex 去復(fù)查了。
醫(yī)生告訴媽媽,Alex 的個子“長高了一點”,但發(fā)現(xiàn) Alex 的左右腳有些不平衡,建議他們選擇物理治療。
這次媽媽倒是相信了醫(yī)生的話,但在物理治療開始之前,Alex 又出現(xiàn)了頭痛的癥狀,而且越來越嚴(yán)重。
物理治療的事只好先擱置一下,母親先帶 Alex 去看神經(jīng) (內(nèi)) 科醫(yī)生,結(jié)論是 Alex 患有偏頭痛。
在和頭痛進(jìn)行抗?fàn)幍耐瑫r,Alex 還被精疲力竭的癥狀困擾著,于是又被帶到了耳鼻喉科醫(yī)生那里檢查是否有鼻竇問題影響睡眠。
經(jīng)歷了這番波折之后,Alex 終于開始接受物理治療,他的物理治療師認(rèn)為,Alex 可能患有一種名為 Chiari 畸形的先天性疾病。
這種先天性疾病會導(dǎo)致頭骨與脊柱相接處的大腦出現(xiàn)異常。
母親開始對此展開研究,帶著 Alex 看了新的兒科醫(yī)生、小兒內(nèi)科醫(yī)生、成人內(nèi)科醫(yī)生和肌肉骨骼醫(yī)生等。
最終 Alex 看過的醫(yī)生多達(dá) 17 位,可以說幾乎踏遍了能想到的所有科室,甚至被送入急診,但依舊沒能檢查出個所以然。
直到 ChatGPT 讓整個事件出現(xiàn)了 180 度大逆轉(zhuǎn)。
抱著試一試的心態(tài),母親注冊了一個 ChatGPT 賬號。
她將 Alex 的癥狀和 MRI 報告中的注釋一并輸入,其中有一個細(xì)節(jié),就是 Alex 無法完成盤腿坐的動作。
ChatGPT 給出了診斷 —— 脊髓栓系綜合征 (TCS)。
當(dāng)然 Courtney 并沒有直接相信,得到答案之后她先是找到了 Facebook 上的一個患兒家長交流群。
結(jié)果看了里面的討論之后,母親覺得這些癥狀和 Alex 真的是太像了。
這一發(fā)現(xiàn)讓幾近熄滅的希望之火重新燃了起來,事后母親回憶說,自己在電腦前坐了一整晚,經(jīng)歷了所有的一切。
帶著這一結(jié)論和 Alex 的 MRI 報告,找到了神經(jīng)外科醫(yī)生。
這次終于是找對人了,神外醫(yī)生看了一眼 MRI 就給出了和 ChatGPT 一樣的結(jié)論,并指出了栓系的具體位置。
再后來的事情就比較順利了。Alex 接受了手術(shù)治療,目前正在進(jìn)行康復(fù)。
那么為什么 Alex 直到看到第 18 個醫(yī)生才最終確診呢?
首先,和 Alex 自身也有一定關(guān)系。
TCS 患者的背部通常會出現(xiàn)裂口,但 Alex 并沒有裂口,這種情況稱為隱式脊髓栓系綜合征 (OTCS)。
雖然 TCS 是罕見病,但在新生兒中的發(fā)病率也并不低,約為 0.005~0.025%,比白血病的發(fā)病率還要高一些。
△ 陳瑩格,米陽.妊娠期多發(fā)性胎兒發(fā)育異常一例 [J]. 臨床醫(yī)學(xué)進(jìn)展,2023, 13 (2)
但 OTCS 就比較罕見了 —— 罕見到發(fā)病率根本沒統(tǒng)計出來。
不過畢竟故事的最后,外科醫(yī)生看到 MRI 圖像之后很快就給出了判斷。
所以,之前沒能確診,或許是因為“找錯了醫(yī)生”:那 17 名醫(yī)生中,的確沒有人從事外科。
當(dāng)然,這也是正常的,畢竟他們都是擅長各自專業(yè)領(lǐng)域的??漆t(yī)生(對應(yīng)全科醫(yī)生),專業(yè)之外的知識難免了解不全面。
但是這也暴露出了一個問題,遇到無法解釋的難題時,這些醫(yī)生都沒有考慮進(jìn)行多學(xué)科會診,是否全面詢問過 Alex 的各項病史也不得而知。
用母親 Courtney 的話說,沒有人愿意解決“更大 (超出自己學(xué)科范圍) 的問題”,沒有人會給出任何關(guān)于診斷結(jié)果的線索。
而 ChatGPT 的知識庫至少在廣度上比細(xì)分領(lǐng)域的專業(yè)人士要豐富的多,更加全面地考慮了 Alex 的情況,最終才給出正確的結(jié)論。
那么這次 ChatGPT 的成功診斷,究竟是誤打誤撞,還是確實已經(jīng)具備診斷能力了?
AI 究竟能不能用于診斷?
事實上,用 ChatGPT 或 GPT-4 來做病情診斷工具,也不是第一次有人這樣做了。
像是 GPT-4 出來后不久,就有人用它成功診斷了自家狗子的一種病例,這段經(jīng)歷一度在網(wǎng)上爆火。
他將狗子從第一次發(fā)病開始的癥狀、治療過程以及每次的血液檢測報告都告訴了 GPT-4:
20 號當(dāng)天高燒 41.5 攝氏度,醫(yī)生根據(jù)驗血結(jié)果診斷為犬巴貝斯蟲?。ǜ窖簷z測結(jié)果),接下來的 3 天接受抗生素治療,24 日當(dāng)天接受抗生素治療,但出現(xiàn)牙齦蒼白(附新的血液檢測結(jié)果)。
GPT-4 很快給出了檢測結(jié)果,并在對話中表明可能是以下兩種原因?qū)е碌模?/p>
1、溶血:由于各種原因造成的紅細(xì)胞破壞,如免疫介導(dǎo)性溶血性貧血(IMHA)、毒素或除巴貝斯蟲病以外的其他感染。
2、失血:內(nèi)部或外部出血,可由創(chuàng)傷、手術(shù)或胃腸道問題 (如潰瘍或寄生蟲) 引起。
最終醫(yī)生診斷結(jié)果顯示,狗子患上的確實是免疫介導(dǎo)性溶血性貧血(IMHA),對癥下藥后狗子得救了。
除此之外,也有網(wǎng)友自述被 ChatGPT(GPT-4)救了一命的經(jīng)歷。
他在去健身房后渾身酸痛,將病癥咨詢 GPT-4 后,得出“橫紋肌溶解癥”的答案,立刻去醫(yī)院并因此撿了一命。
但也有學(xué)術(shù)研究提到,無論是 ChatGPT 還是 GPT-4,都并非一個完全可以依賴的 AI 醫(yī)生。
例如哈佛大學(xué)附屬醫(yī)院布萊根婦女醫(yī)院(BWH)發(fā)表在 JAMA 上的一項研究就顯示,在給出癌癥治療建議時,ChatGPT 只有 62% 的案例是完全正確的。
在其他的案例中,有 34% 的建議至少都包含一個或多個和正確診斷結(jié)果不一致的答案,還有 2% 的案例給出了不可信的診斷結(jié)果。
對此,研究認(rèn)為,還不能完全將診斷交給 ChatGPT 或 GPT-4,畢竟他們在診斷這一過程上依舊無法和專業(yè)的醫(yī)生相比。
(不過有網(wǎng)友指出,ChatGPT 沒診斷成功的原因,可能也和訓(xùn)練數(shù)據(jù)有關(guān),2021 年之后的治療信息不包含其中)
對此,哈佛大學(xué)流行病學(xué)助理教授 Andrew Beam 認(rèn)為,ChatGPT 和 GPT-4 的使用效果應(yīng)該分兩面看待:
一方面,它們要比一些普通的診斷軟件或是谷歌搜索引擎更好用,尤其是 GPT-4 這個版本。
但另一方面,它們目前還不太可能取代具備大量專業(yè)知識的臨床醫(yī)生。畢竟對于 AI 來說,它們確實可能在找不到答案時捏造信息,根據(jù)“幻覺”推測出錯誤結(jié)果。
美國醫(yī)學(xué)會(AMA)的主席 Jesse M. Ehrenfeld 對此表示,即使 AI 能診斷結(jié)果,最終的責(zé)任還是醫(yī)生自己的。
總結(jié)一下上述觀點就是,大伙兒可以用 AI 輔助診斷病情,比搜索引擎好用,但最終還是得去醫(yī)院,找醫(yī)生確診。
那么,如果打算用大模型“問問診”,哪個大模型最好用?
有網(wǎng)友就以自己為病例,測試了各種大語言模型是否具備診斷能力,最終認(rèn)為還是 GPT-4 比較能勝任:
我曾經(jīng)就慢性咳嗽的原因咨詢過幾位醫(yī)生,但最終是在一個油管頻道上得知自己患了 LPR(隱性咽喉返流)。
我用自己的病例測了測大模型,GPT-4 是唯一一個成功診斷的。Claude 2 雖然答案接近,但沒能完全自主診斷出來。
你有嘗試過用 AI 幫助判斷病情嗎?感覺效果如何?
參考鏈接:
[1]https://www.today.com/health/mom-chatgpt-diagnosis-pain-rcna101843
[2]https://www.reddit.com/r/ChatGPT/comments/16gfrwp/a_boy_saw_17_doctors_over_3_years_for_chronic/
[3]https://news.harvard.edu/gazette/story/2023/08/need-cancer-treatment-advice-forget-chatgpt/
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。