RNA,或稱核糖核酸,存在于所有活細(xì)胞中。它作為信使,攜帶著DNA(脫氧核糖核酸)的指令,指揮著體內(nèi)各種蛋白質(zhì)的合成過(guò)程。當(dāng)核糖核酸不能正常工作時(shí),它會(huì)嚴(yán)重影響神經(jīng)系統(tǒng)、心血管和肌肉的調(diào)節(jié)過(guò)程,導(dǎo)致腫瘤、胰島素抵抗以及運(yùn)動(dòng)技能障礙等疾病。
對(duì)于人體來(lái)說(shuō),RNA如此重要,這也是為什么來(lái)自弗萊堡大學(xué)計(jì)算機(jī)科學(xué)系(University of Freiburg’s Department of Computer Science)的研究人員們專門開發(fā)了一個(gè)人工智能系統(tǒng),名為L(zhǎng)EARNA。這個(gè)AI系統(tǒng)可以學(xué)習(xí)設(shè)計(jì)用于研究的RNA分子。本周弗萊堡大學(xué)計(jì)算機(jī)科學(xué)系的研究者們將這一研究結(jié)果以論文的形式,刊登在預(yù)印服務(wù)器Arxiv.org之上,該論文的名稱是:學(xué)習(xí)設(shè)計(jì)RNA(Learning to Design RNA)。
研究人員在論文中如是寫道:
設(shè)計(jì)RNA分子最近引起了醫(yī)學(xué)、合成生物學(xué)、生物技術(shù)和生物信息學(xué)領(lǐng)域研究者們的興趣,因?yàn)樵S多功能性RNA分子被證明參與了轉(zhuǎn)錄、表觀遺傳學(xué)和翻譯的調(diào)控過(guò)程。在這里,我們?yōu)镽NA設(shè)計(jì)問(wèn)題提出了一種新的算法思路。
正如這篇論文的作者所解釋的一樣,RNA的功能取決于它的結(jié)構(gòu)特性。因此,對(duì)于研究者來(lái)說(shuō)真正的挑戰(zhàn)是識(shí)別RNA中導(dǎo)致其折疊成特定結(jié)構(gòu)的模式和序列,有時(shí)被稱為RNA反向折疊。
弗萊堡大學(xué)研究人員們給出的方法依賴的是一種深度強(qiáng)化學(xué)習(xí)(RL)算法,這是一種人工智能(AI)訓(xùn)練技術(shù),該技術(shù)使用獎(jiǎng)勵(lì)來(lái)驅(qū)動(dòng)個(gè)體朝著目標(biāo)前進(jìn)。這種算法訓(xùn)練是一個(gè)可以順序預(yù)測(cè)整個(gè)RNA序列的策略網(wǎng)絡(luò),它生成此序列,折疊它,并使用從結(jié)果結(jié)構(gòu)到目標(biāo)結(jié)構(gòu)的距離作為AI代理的信號(hào)。
與此同時(shí),第二個(gè)LEARNA版本,也可以被稱作是Meta-LEARNA,學(xué)習(xí)了許多RNA設(shè)計(jì)問(wèn)題的單一策略,這些問(wèn)題直接適用于新的RNA設(shè)計(jì)。也就是說(shuō),算法能夠?qū)W習(xí)到一個(gè)量身定制的生成模型,通過(guò)選擇放置核苷酸,即RNA和DNA的化學(xué)構(gòu)建塊,的動(dòng)作來(lái)構(gòu)建RNA序列樣本,用于給定的RNA靶結(jié)構(gòu)。
研究人員們?cè)谡撐闹袑懙溃?/p>
據(jù)我們所知,這是結(jié)構(gòu)搜索在RL領(lǐng)域的首次應(yīng)用,也是結(jié)構(gòu)搜索在元學(xué)習(xí)(metalearning)領(lǐng)域的首次應(yīng)用。
在一臺(tái)具有20個(gè)核心處理器的機(jī)器上對(duì)8000種不同RNA目標(biāo)結(jié)構(gòu)進(jìn)行元學(xué)習(xí)一小時(shí)后,Meta-LEARNA成功解決了Eterna100基準(zhǔn)測(cè)試中高達(dá)65%的目標(biāo)結(jié)構(gòu)。Eterna100,對(duì)于不那些熟悉的人來(lái)說(shuō),是由Eterna的成員創(chuàng)建的100個(gè)目標(biāo)結(jié)構(gòu)的集合,這是一個(gè)在線開放實(shí)驗(yàn)室,可以讓用戶創(chuàng)建折疊到特定結(jié)構(gòu)的序列。此外,它只需要90秒即可達(dá)到與之相同效果的任何其他方法,并在三分鐘內(nèi)完成最先進(jìn)性能的篩選。
同時(shí),在另一個(gè)基準(zhǔn)rfam.taneda上,Meta-LEARNA在10秒內(nèi)產(chǎn)生了與最先進(jìn)的方法一樣好的結(jié)果,并且在1分鐘后準(zhǔn)確度超過(guò)了這些方法。這一結(jié)果與谷歌母公司DeepMind今年早些時(shí)候開發(fā)的蛋白質(zhì)折疊AlphaFold系統(tǒng)的結(jié)果非常相似,預(yù)示著RNA生物學(xué)研究工作具有良好的發(fā)展前景。
研究人員們?cè)谡撐闹袑懙溃?/p>
全面的實(shí)證結(jié)果表明,我們的方法在所有基準(zhǔn)上都實(shí)現(xiàn)了最新、最先進(jìn)的性能,同時(shí)在達(dá)到以前的最先進(jìn)性能方面也快了幾個(gè)數(shù)量級(jí)。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。