設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

哥倫比亞大學(xué)研究人員開(kāi)發(fā)新型 AI 模型,可精準(zhǔn)預(yù)測(cè)人體細(xì)胞基因表達(dá)

2025/1/12 18:12:49 來(lái)源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋
感謝IT之家網(wǎng)友 西窗舊事、動(dòng)感超人233 的線索投遞!

IT之家 1 月 12 日消息,哥倫比亞大學(xué)瓦格洛斯醫(yī)學(xué)院的研究團(tuán)隊(duì)開(kāi)發(fā)了一種新型人工智能(AI)模型 ——“通用表達(dá)轉(zhuǎn)換器”(GET),能夠準(zhǔn)確預(yù)測(cè)任何人類細(xì)胞中的基因活性,從而揭示細(xì)胞的內(nèi)部機(jī)制。這一研究成果發(fā)表在最新一期的《自然》雜志上,有望徹底改變科學(xué)家研究癌癥、遺傳疾病等的方式。

該研究的資深作者、系統(tǒng)生物學(xué)教授勞爾?拉巴丹(Raul Rabadan)表示:“可預(yù)測(cè)且通用的計(jì)算模型使我們能夠快速、準(zhǔn)確地揭示生物過(guò)程。這些方法可以有效地進(jìn)行大規(guī)模計(jì)算實(shí)驗(yàn),推動(dòng)并指導(dǎo)傳統(tǒng)實(shí)驗(yàn)方法的發(fā)展?!?/p>

傳統(tǒng)的生物學(xué)研究方法雖然擅長(zhǎng)揭示細(xì)胞如何執(zhí)行其功能或?qū)ν饨绺蓴_作出反應(yīng),但無(wú)法預(yù)測(cè)細(xì)胞的工作機(jī)制或?qū)ψ兓姆磻?yīng),例如致癌突變的影響。拉巴丹指出:“能夠準(zhǔn)確預(yù)測(cè)細(xì)胞活動(dòng)將徹底改變我們對(duì)基本生物過(guò)程的理解,使生物學(xué)從描述看似隨機(jī)過(guò)程的科學(xué)轉(zhuǎn)變?yōu)槟軌蝾A(yù)測(cè)細(xì)胞行為背后系統(tǒng)的科學(xué)。”

近年來(lái),隨著細(xì)胞數(shù)據(jù)的海量積累和 AI 模型的日益強(qiáng)大,生物學(xué)正逐漸向預(yù)測(cè)性科學(xué)轉(zhuǎn)變。2024 年諾貝爾化學(xué)獎(jiǎng)就授予了利用 AI 預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的開(kāi)創(chuàng)性研究。然而,使用 AI 方法預(yù)測(cè)細(xì)胞內(nèi)基因和蛋白質(zhì)的活動(dòng)仍然面臨巨大挑戰(zhàn)。

據(jù)IT之家了解,在這項(xiàng)新研究中,拉巴丹及其團(tuán)隊(duì)嘗試?yán)?AI 預(yù)測(cè)特定細(xì)胞中哪些基因處于活躍狀態(tài)。基因表達(dá)信息可以幫助研究人員確定細(xì)胞的身份及其功能執(zhí)行方式。拉巴丹實(shí)驗(yàn)室的研究生傅曦(Xi Fu,音譯)決定采用一種不同的方法,利用從正常人體組織中獲取的數(shù)百萬(wàn)個(gè)細(xì)胞的基因表達(dá)數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型。模型的輸入包括基因組序列以及顯示基因組哪些部分可訪問(wèn)和表達(dá)的數(shù)據(jù)。

這一方法的整體思路類似于 ChatGPT 等流行的“基礎(chǔ)”模型。這些系統(tǒng)通過(guò)訓(xùn)練數(shù)據(jù)識(shí)別底層規(guī)則(如語(yǔ)言的語(yǔ)法),然后將這些規(guī)則應(yīng)用于新場(chǎng)景。拉巴丹解釋道:“我們的方法完全一致:我們從多種細(xì)胞狀態(tài)中學(xué)習(xí)‘語(yǔ)法’,然后將其應(yīng)用于特定條件 —— 無(wú)論是病變細(xì)胞還是正常細(xì)胞 —— 并嘗試預(yù)測(cè)其行為模式。”

傅曦和拉巴丹隨后與多位合作者共同訓(xùn)練和測(cè)試了這一新模型,其中包括共同第一作者亞歷杭德羅?布恩迪亞(Alejandro Buendia)和卡內(nèi)基梅隆大學(xué)的申通莫(Shentong Mo,音譯)。在超過(guò) 130 萬(wàn)個(gè)人類細(xì)胞數(shù)據(jù)上訓(xùn)練后,該系統(tǒng)能夠準(zhǔn)確預(yù)測(cè)從未見(jiàn)過(guò)的細(xì)胞類型的基因表達(dá),其結(jié)果與實(shí)驗(yàn)數(shù)據(jù)高度吻合。

接下來(lái),研究團(tuán)隊(duì)展示了其 AI 系統(tǒng)在揭示病變細(xì)胞隱藏生物學(xué)機(jī)制方面的強(qiáng)大能力。他們以一種遺傳性兒童白血病為例,利用 AI 預(yù)測(cè)了突變基因如何破壞兩種不同轉(zhuǎn)錄因子之間的相互作用,從而決定白血病細(xì)胞的命運(yùn)。實(shí)驗(yàn)室實(shí)驗(yàn)證實(shí)了 AI 的預(yù)測(cè)。了解這些突變的影響可以揭示驅(qū)動(dòng)這種疾病的特定機(jī)制。

此外,這一新型計(jì)算方法還為研究人員探索基因組“暗物質(zhì)”的作用提供了可能?;蚪M“暗物質(zhì)”是指基因組中不包含已知蛋白質(zhì)編碼基因的絕大部分區(qū)域。拉巴丹指出:“癌癥患者中發(fā)現(xiàn)的大多數(shù)突變都位于基因組的‘暗區(qū)域’,這些突變不影響蛋白質(zhì)功能,因此一直未被充分研究。通過(guò)使用這些模型,我們可以觀察突變并揭示基因組這一部分的功能?!?/p>

目前,拉巴丹正與哥倫比亞大學(xué)及其他機(jī)構(gòu)的研究人員合作,探索從腦癌到血癌等多種癌癥,研究正常細(xì)胞中的調(diào)控“語(yǔ)法”以及細(xì)胞在癌癥發(fā)展過(guò)程中的變化。

這項(xiàng)研究不僅為理解癌癥以外的多種疾病開(kāi)辟了新途徑,還可能為新療法的靶點(diǎn)識(shí)別提供支持。通過(guò)向計(jì)算機(jī)模型輸入新發(fā)現(xiàn)的突變,研究人員可以深入了解這些突變?nèi)绾斡绊懠?xì)胞。

拉巴丹認(rèn)為,這項(xiàng)研究是生物學(xué)領(lǐng)域人工智能應(yīng)用重大趨勢(shì)的一部分:“這是一個(gè)非常激動(dòng)人心的生物學(xué)新時(shí)代,它將生物學(xué)轉(zhuǎn)變?yōu)橐环N預(yù)測(cè)性科學(xué)?!?/p>

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,人工智能細(xì)胞,基因

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知