近日,來自哈佛醫(yī)學院等機構(gòu)的科學家們開發(fā)了一種名為 CHIEF(Clinical Histopathology Imaging Evaluation Foundation,臨床組織病理學成像評估基礎(chǔ))的多功能 AI 癌癥診斷模型,并于 9 月 4 日登上「Nature」。
論文地址:https://www.nature.com/articles/s41586-024-07894-z
值得一提的是,盡管最近出現(xiàn)了其他用于醫(yī)學診斷的病理圖像基礎(chǔ) AI 模型,但 CHIEF 是第一個能夠預(yù)測患者預(yù)后并在多個國際患者群體中驗證的模型。
工作原理
當前,大多數(shù) AI 癌癥診斷系統(tǒng)通常被訓(xùn)練來執(zhí)行特定任務(wù)。例如,檢測癌癥的存在,或分析腫瘤的基因特征,且通常僅適用于少數(shù)幾種癌癥類型。
相比之下,全新的 CHIEF 模型則具有類似于 ChatGPT 的靈活性 —— 不僅能夠執(zhí)行多種任務(wù),而且還能識別不同癌癥類型需要特別關(guān)注的區(qū)域。
通過讀取腫瘤組織的數(shù)字切片,它可以檢測癌細胞并根據(jù)圖像中觀察到的細胞特征分析腫瘤的基因特征。
此外,還可以預(yù)測多種癌癥類型的患者生存率,并精確定位腫瘤周圍組織的特征,即腫瘤微環(huán)境。這些特征與患者對手術(shù)、化療、放療和免疫治療等標準治療的反應(yīng)有關(guān)。
更進一步的,CHIEF 還具有生成新見解的潛力 —— 它發(fā)現(xiàn)了此前未被認為與患者生存相關(guān)的特定腫瘤特征。
研究團隊指出,這些發(fā)現(xiàn)進一步證明了 AI 可以幫助臨床醫(yī)生高效、準確評估癌癥,包括識別可能對標準癌癥療法反應(yīng)不佳的患者。
模型訓(xùn)練與表現(xiàn)
首先,CHIEF 在 1500 萬張未標記的圖像上進行訓(xùn)練,這些圖像被分成多個模型可能需要特別關(guān)注的部分。
然后,CHIEF 在 6 萬張全切片圖像上進行了訓(xùn)練,其中包括肺、乳腺、前列腺、結(jié)腸、胃、食管、腎臟、腦、肝、甲狀腺、胰腺、宮頸、子宮、卵巢、睪丸、皮膚、軟組織、腎上腺和膀胱等組織的全切片圖像。
這種訓(xùn)練方法,使得模型不僅關(guān)注圖像的局部,還能夠結(jié)合整個圖像,將某一局部的特定變化與整體聯(lián)系起來。從而,CHIEF 在進行癌癥分析時能夠考慮更廣泛的背景信息,更全面地解讀圖像,而不是僅僅專注于某個特定區(qū)域。
訓(xùn)練完成后,研究團隊在 19400 多張全切片圖像上測試了 CHIEF 的性能。這 19400 多張全切片圖像來自全球 24 家醫(yī)院和患者群體中收集的 32 個獨立數(shù)據(jù)集。
總體上,CHIEF 在以下任務(wù)中比其他最先進的 AI 方法高出 36%:癌細胞檢測、腫瘤起源識別、預(yù)測患者結(jié)果、以及識別與患者治療反應(yīng)相關(guān)的基因和 DNA 模式。
無論腫瘤細胞是通過活檢還是手術(shù)切除獲得,CHIEF 的表現(xiàn)都同樣出色。無論使用何種技術(shù)對癌細胞樣本進行數(shù)字化處理,它的準確性也同樣高。
研究人員表示,這種適應(yīng)性使 CHIEF 能夠在不同的臨床環(huán)境中使用,而當前大部分 AI 癌癥診斷模型通常只能在通過特定技術(shù)獲取的組織中表現(xiàn)良好。
CHIEF 的 4 種應(yīng)用
癌癥檢測
CHIEF 在癌癥檢測中的準確率達到了近 94%,測試涵蓋了 15 個數(shù)據(jù)集,其中包含 11 種癌癥類型。
在另一個涵蓋 5 個活檢數(shù)據(jù)集的測試中,CHIEF 達到了 96% 的準確率,其中包括食道、胃、結(jié)腸和前列腺在內(nèi)的多種癌癥類型檢測。
當研究人員用數(shù)據(jù)集之外的手術(shù)切除腫瘤切片來測試 CHIEF 時,模型的準確率超過了 90%。
分析腫瘤的基因特征
腫瘤的基因構(gòu)成包含了未來腫瘤發(fā)展和最佳治療方案的關(guān)鍵線索。為了獲取這些信息,腫瘤學家通常會對腫瘤樣本進行 DNA 測序。
但由于將樣本送往專業(yè)的 DNA 測序?qū)嶒炇倚枰欢ǖ某杀竞蜁r間,世界各地普遍沒有進行常規(guī)的詳細的基因組分析。即使是在資源充足的地區(qū),這一過程也可能需要數(shù)周時間。
不過,這是 AI 可以填補的空白。
研究人員稱,對于圖像中特定的基因組異常,識別其細胞模式,可能提供一種快速且經(jīng)濟的替代基因組測序的方案。
CHIEF 在預(yù)測腫瘤的基因變異方面優(yōu)于現(xiàn)有的 AI 方法。這種新的 AI 方法成功識別了與癌癥生長和抑制相關(guān)的多個重要基因特征,并預(yù)測了腫瘤在各種標準癌癥療法過程中的關(guān)鍵基因突變。
CHIEF 還檢測到了特定的 DNA 模式,這些模式與結(jié)腸腫瘤對一種稱為免疫檢查點抑制的免疫療法的反應(yīng)效果相關(guān)。
在觀察全組織圖像時,CHIEF 識別出 54 個常見突變癌癥基因中的突變,總體準確率超過 70%,優(yōu)于當前用于基因組癌癥預(yù)測的最先進 AI 方法。
研究團隊使用 CHIEF 模型來預(yù)測特定基因突變,這些突變與 FDA(美國食品藥品監(jiān)督管理局)批準的靶向治療方法的效果有關(guān)。研究涉及的 18 個基因分布在人體的 15 個不同解剖部位。
CHIEF 在多種癌癥類型中都達到了高準確率。在檢測一種名為彌漫性大 B 細胞淋巴瘤的血液癌癥中的 EZH2 基因突變時,CHIEF 達到了 96% 的準確率;在檢測甲狀腺癌中的 BRAF 基因突變時,CHIEF 的準確率達到了 89%;在檢測頭頸部癌癥中的 NTRK1 基因突變時,準確率為 91%。
預(yù)測患者生存率
基于初次診斷時獲得的腫瘤組織病理圖像,CHIEF 能夠成功預(yù)測患者的生存期。
總體上,CHIEF 預(yù)測高風險和低風險死亡率的能力在來自 17 家不同機構(gòu)的患者樣本中得到了測試和驗證。
在所有研究的癌癥類型和患者群體中,CHIEF 能夠區(qū)分長期生存的患者和短期生存的患者。CHIEF 的表現(xiàn)比其他模型好 8%。
在患有晚期癌癥的患者中,CHIEF 的表現(xiàn)比其他 AI 模型高出 10%。
識別不同癌癥類型需要特別關(guān)注的區(qū)域
該模型在圖像上識別出與腫瘤侵襲性和患者生存率相關(guān)的明顯模式。
為了可視化特定的區(qū)域,CHIEF 在圖像上生成了熱圖。當人類病理學家分析這些由 AI 生成的熱點時,他們發(fā)現(xiàn)了一些反映癌細胞與周圍組織相互作用的有趣信號。
其中一個特征是,在長期生存者的腫瘤區(qū)域中,免疫細胞的數(shù)量比短期生存者更多。Yu 指出,這一發(fā)現(xiàn)有其合理性,因為更多的免疫細胞可能表明免疫系統(tǒng)已被激活來攻擊腫瘤。
在觀察短期生存者的腫瘤時,CHIEF 識別出了一些需要關(guān)注的區(qū)域。這些區(qū)域的特征包括各種細胞成分的異常大小比例、細胞核上更多的非典型特征、細胞之間較弱的連接,以及腫瘤周圍區(qū)域中較少的結(jié)締組織。
這些腫瘤周圍還有更多的死亡細胞。例如,在乳腺腫瘤中,CHIEF 指出組織內(nèi)的壞死(或細胞死亡)是一個需要關(guān)注的區(qū)域。另一方面,生存率較高的乳腺癌患者腫瘤周圍,更有可能保持類似于健康組織的細胞結(jié)構(gòu)。
研究團隊指出,與生存率相關(guān)的視覺特征和需要關(guān)注的區(qū)域因癌癥類型而異。
參考資料:
https://scitechdaily.com/96-accuracy-harvard-scientists-unveil-revolutionary-chatgpt-like-ai-for-cancer-diagnosis/
https://hms.harvard.edu/news/new-artificial-intelligence-tool-cancer
本文來自微信公眾號:微信公眾號(ID:null),作者:靜音,原標題《哈佛推出全新類 ChatGPT 癌癥診斷 AI,登上 Nature!準確率高達 96%》
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。