首頁 > 智能時代>人工智能

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

量子位 2023/9/17 22:17:21 責(zé)編：遠(yuǎn)洋

評論：

“怪病”纏身 3 年求醫(yī)無果，最終竟然被 ChatGPT 成功診斷！

這是發(fā)生在一名 4 歲男孩身上的真實經(jīng)歷。

某次運動后，他身體開始劇痛。母親前后帶他看了 17 名醫(yī)生，從兒科、骨科到各種專家，先后進(jìn)行了 MRI 等一系列檢查，但沒一個真正找出病因。

他的母親沒抱太大希望地嘗試求助 ChatGPT，后者卻根據(jù)描述和檢查報告，直接給出了正確的建議。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

話題一出沖上知乎熱榜，Reddit 熱度也飆升至 2.3k。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

有網(wǎng)友表示，GPT 這次真的很讓人激動：

每個醫(yī)生的辦公室都可以配備一個 AI 助手，并將它與自己的診斷結(jié)果進(jìn)行比較。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

還有網(wǎng)友 cue 了下谷歌專門訓(xùn)練的輔助醫(yī)療診斷大模型 Med-PaLM，想知道它的診斷結(jié)果如何：

對于大模型而言，這幾乎是個完美的測試任務(wù)。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

所以，這具體是怎么一回事？

究竟是什么樣的“怪病”？

故事的主人公名叫 Alex，他的母親 Courtney 一共有兩個孩子。

2020 年的一天，Alex 的保姆告訴 Courtney，Alex 每天都要服用止痛藥，不然就會疼到崩潰。

接著，Alex 又出現(xiàn)了磨牙的癥狀，父母把這兩件事聯(lián)系到了一起，認(rèn)為可能是由換牙或者蛀牙引起的疼痛導(dǎo)致的。

于是母親帶著 Alex 去看了牙醫(yī)，Alex 長達(dá)三年的尋醫(yī)之路便正式開始了。

由于牙醫(yī)檢查之后沒有發(fā)現(xiàn)任何問題，但提出鑒于 Alex 正在磨牙，推薦他們?nèi)タ磳I(yè)治療氣道阻塞的正畸醫(yī)生。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

正畸醫(yī)生發(fā)現(xiàn)，Alex 的上顎太小，導(dǎo)致呼吸困難，于是給 Alex 放置了一個擴(kuò)張器。這種治療方式的確起到了效果，母親一度認(rèn)為 Alex 的病馬上就要痊愈了。

很合理，但現(xiàn)實往往是不講邏輯的。

媽媽很快又發(fā)現(xiàn)，只有四歲的 Alex 個子突然不長了。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

這一次，媽媽求助的是一名兒科醫(yī)生。

醫(yī)生認(rèn)為 Alex 可能是受到了新冠病毒的影響，但媽媽對這個解釋并不滿意。不過，媽媽還是在 2021 年初帶著 Alex 去復(fù)查了。

醫(yī)生告訴媽媽，Alex 的個子“長高了一點”，但發(fā)現(xiàn) Alex 的左右腳有些不平衡，建議他們選擇物理治療。

這次媽媽倒是相信了醫(yī)生的話，但在物理治療開始之前，Alex 又出現(xiàn)了頭痛的癥狀，而且越來越嚴(yán)重。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

物理治療的事只好先擱置一下，母親先帶 Alex 去看神經(jīng) (內(nèi)) 科醫(yī)生，結(jié)論是 Alex 患有偏頭痛。

在和頭痛進(jìn)行抗?fàn)幍耐瑫r，Alex 還被精疲力竭的癥狀困擾著，于是又被帶到了耳鼻喉科醫(yī)生那里檢查是否有鼻竇問題影響睡眠。

經(jīng)歷了這番波折之后，Alex 終于開始接受物理治療，他的物理治療師認(rèn)為，Alex 可能患有一種名為 Chiari 畸形的先天性疾病。

這種先天性疾病會導(dǎo)致頭骨與脊柱相接處的大腦出現(xiàn)異常。

母親開始對此展開研究，帶著 Alex 看了新的兒科醫(yī)生、小兒內(nèi)科醫(yī)生、成人內(nèi)科醫(yī)生和肌肉骨骼醫(yī)生等。

最終 Alex 看過的醫(yī)生多達(dá) 17 位，可以說幾乎踏遍了能想到的所有科室，甚至被送入急診，但依舊沒能檢查出個所以然。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

直到 ChatGPT 讓整個事件出現(xiàn)了 180 度大逆轉(zhuǎn)。

抱著試一試的心態(tài)，母親注冊了一個 ChatGPT 賬號。

她將 Alex 的癥狀和 MRI 報告中的注釋一并輸入，其中有一個細(xì)節(jié)，就是 Alex 無法完成盤腿坐的動作。

ChatGPT 給出了診斷 —— 脊髓栓系綜合征 (TCS)。

當(dāng)然 Courtney 并沒有直接相信，得到答案之后她先是找到了 Facebook 上的一個患兒家長交流群。

結(jié)果看了里面的討論之后，母親覺得這些癥狀和 Alex 真的是太像了。

這一發(fā)現(xiàn)讓幾近熄滅的希望之火重新燃了起來，事后母親回憶說，自己在電腦前坐了一整晚，經(jīng)歷了所有的一切。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

帶著這一結(jié)論和 Alex 的 MRI 報告，找到了神經(jīng)外科醫(yī)生。

這次終于是找對人了，神外醫(yī)生看了一眼 MRI 就給出了和 ChatGPT 一樣的結(jié)論，并指出了栓系的具體位置。

再后來的事情就比較順利了。Alex 接受了手術(shù)治療，目前正在進(jìn)行康復(fù)。

那么為什么 Alex 直到看到第 18 個醫(yī)生才最終確診呢？

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

首先，和 Alex 自身也有一定關(guān)系。

TCS 患者的背部通常會出現(xiàn)裂口，但 Alex 并沒有裂口，這種情況稱為隱式脊髓栓系綜合征 (OTCS)。

雖然 TCS 是罕見病，但在新生兒中的發(fā)病率也并不低，約為 0.005~0.025%，比白血病的發(fā)病率還要高一些。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

△ 陳瑩格，米陽.妊娠期多發(fā)性胎兒發(fā)育異常一例 [J]. 臨床醫(yī)學(xué)進(jìn)展，2023, 13 (2)

但 OTCS 就比較罕見了 —— 罕見到發(fā)病率根本沒統(tǒng)計出來。

不過畢竟故事的最后，外科醫(yī)生看到 MRI 圖像之后很快就給出了判斷。

所以，之前沒能確診，或許是因為“找錯了醫(yī)生”：那 17 名醫(yī)生中，的確沒有人從事外科。

當(dāng)然，這也是正常的，畢竟他們都是擅長各自專業(yè)領(lǐng)域的?？漆t(yī)生（對應(yīng)全科醫(yī)生），專業(yè)之外的知識難免了解不全面。

但是這也暴露出了一個問題，遇到無法解釋的難題時，這些醫(yī)生都沒有考慮進(jìn)行多學(xué)科會診，是否全面詢問過 Alex 的各項病史也不得而知。

用母親 Courtney 的話說，沒有人愿意解決“更大 (超出自己學(xué)科范圍) 的問題”，沒有人會給出任何關(guān)于診斷結(jié)果的線索。

而 ChatGPT 的知識庫至少在廣度上比細(xì)分領(lǐng)域的專業(yè)人士要豐富的多，更加全面地考慮了 Alex 的情況，最終才給出正確的結(jié)論。

那么這次 ChatGPT 的成功診斷，究竟是誤打誤撞，還是確實已經(jīng)具備診斷能力了？

AI 究竟能不能用于診斷？

事實上，用 ChatGPT 或 GPT-4 來做病情診斷工具，也不是第一次有人這樣做了。

像是 GPT-4 出來后不久，就有人用它成功診斷了自家狗子的一種病例，這段經(jīng)歷一度在網(wǎng)上爆火。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

他將狗子從第一次發(fā)病開始的癥狀、治療過程以及每次的血液檢測報告都告訴了 GPT-4：

20 號當(dāng)天高燒 41.5 攝氏度，醫(yī)生根據(jù)驗血結(jié)果診斷為犬巴貝斯蟲?。ǜ窖簷z測結(jié)果），接下來的 3 天接受抗生素治療，24 日當(dāng)天接受抗生素治療，但出現(xiàn)牙齦蒼白（附新的血液檢測結(jié)果）。

GPT-4 很快給出了檢測結(jié)果，并在對話中表明可能是以下兩種原因?qū)е碌模?/p>

1、溶血：由于各種原因造成的紅細(xì)胞破壞，如免疫介導(dǎo)性溶血性貧血（IMHA）、毒素或除巴貝斯蟲病以外的其他感染。
2、失血：內(nèi)部或外部出血，可由創(chuàng)傷、手術(shù)或胃腸道問題 (如潰瘍或寄生蟲) 引起。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

最終醫(yī)生診斷結(jié)果顯示，狗子患上的確實是免疫介導(dǎo)性溶血性貧血（IMHA），對癥下藥后狗子得救了。

除此之外，也有網(wǎng)友自述被 ChatGPT（GPT-4）救了一命的經(jīng)歷。

他在去健身房后渾身酸痛，將病癥咨詢 GPT-4 后，得出“橫紋肌溶解癥”的答案，立刻去醫(yī)院并因此撿了一命。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

但也有學(xué)術(shù)研究提到，無論是 ChatGPT 還是 GPT-4，都并非一個完全可以依賴的 AI 醫(yī)生。

例如哈佛大學(xué)附屬醫(yī)院布萊根婦女醫(yī)院（BWH）發(fā)表在 JAMA 上的一項研究就顯示，在給出癌癥治療建議時，ChatGPT 只有 62% 的案例是完全正確的。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

在其他的案例中，有 34% 的建議至少都包含一個或多個和正確診斷結(jié)果不一致的答案，還有 2% 的案例給出了不可信的診斷結(jié)果。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

對此，研究認(rèn)為，還不能完全將診斷交給 ChatGPT 或 GPT-4，畢竟他們在診斷這一過程上依舊無法和專業(yè)的醫(yī)生相比。

（不過有網(wǎng)友指出，ChatGPT 沒診斷成功的原因，可能也和訓(xùn)練數(shù)據(jù)有關(guān)，2021 年之后的治療信息不包含其中）

對此，哈佛大學(xué)流行病學(xué)助理教授 Andrew Beam 認(rèn)為，ChatGPT 和 GPT-4 的使用效果應(yīng)該分兩面看待：

一方面，它們要比一些普通的診斷軟件或是谷歌搜索引擎更好用，尤其是 GPT-4 這個版本。
但另一方面，它們目前還不太可能取代具備大量專業(yè)知識的臨床醫(yī)生。畢竟對于 AI 來說，它們確實可能在找不到答案時捏造信息，根據(jù)“幻覺”推測出錯誤結(jié)果。

美國醫(yī)學(xué)會（AMA）的主席 Jesse M. Ehrenfeld 對此表示，即使 AI 能診斷結(jié)果，最終的責(zé)任還是醫(yī)生自己的。

總結(jié)一下上述觀點就是，大伙兒可以用 AI 輔助診斷病情，比搜索引擎好用，但最終還是得去醫(yī)院，找醫(yī)生確診。

那么，如果打算用大模型“問問診”，哪個大模型最好用？

有網(wǎng)友就以自己為病例，測試了各種大語言模型是否具備診斷能力，最終認(rèn)為還是 GPT-4 比較能勝任：

我曾經(jīng)就慢性咳嗽的原因咨詢過幾位醫(yī)生，但最終是在一個油管頻道上得知自己患了 LPR（隱性咽喉返流）。
我用自己的病例測了測大模型，GPT-4 是唯一一個成功診斷的。Claude 2 雖然答案接近，但沒能完全自主診斷出來。

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

你有嘗試過用 AI 幫助判斷病情嗎？感覺效果如何？

參考鏈接：

[1]https://www.today.com/health/mom-chatgpt-diagnosis-pain-rcna101843
[2]https://www.reddit.com/r/ChatGPT/comments/16gfrwp/a_boy_saw_17_doctors_over_3_years_for_chronic/
[3]https://news.harvard.edu/gazette/story/2023/08/need-cancer-treatment-advice-forget-chatgpt/

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

ChatGPT 救命！4 歲男孩 3 年求醫(yī) 17 位專家無果，大模型精準(zhǔn)揪出病因

究竟是什么樣的“怪病”？

AI 究竟能不能用于診斷？

相關(guān)文章

AI 究竟能不能用于診斷？