人類基因組測序迎來新的里程碑!首個完整無間隙人類基因組測序,由近百位科學(xué)家合作完成,填補(bǔ)上最后 8% 的空缺。最新一期 Science 罕見地以特刊形式連發(fā) 6 篇論文,另外兩篇介紹研究方法的論文同日登上 Nature Method。
作者之一、華盛頓大學(xué)教授 Evan Eichler 稱:
我們在生命天書中讀到了前所未有的新章節(jié)。
回看 2003 年,人類基因組計(jì)劃 (Human Genome Project) 首次完成 92% 的人類基因測序,創(chuàng)造了歷史。到如今,新成立的端粒到端粒聯(lián)盟 (T2T Consortium) 填補(bǔ)上最后 8% 的空缺,同時糾正了之前的一些錯誤,也將載入史冊。
△T2T 聯(lián)盟部分成員
新確認(rèn)的 8% DNA 片段里包含重要的免疫反應(yīng)基因,它們幫助人類適應(yīng)和抵御病毒和細(xì)菌感染,在預(yù)測藥物反應(yīng)方面很有價值。
聯(lián)盟發(fā)起人之一、馬里蘭大學(xué)的 Adam Phillippy 認(rèn)為,個人基因組測序在 10 年內(nèi)有望普及,個性化醫(yī)療成本會大幅下降。
另外新發(fā)現(xiàn)的基因中有一些使得人類大腦比其他靈長類動物大腦更大,有助于進(jìn)一步揭開人類進(jìn)化之謎。
攻克最后的 8%
當(dāng)初的人類基因組計(jì)劃由 6 國近 2000 位科學(xué)家耗時 13 年完成,最后遺留的 8% 靠當(dāng)時的測序技術(shù)難以突破。原因有二:
其一,最后的 8% 里有很多片段是重復(fù)的??茖W(xué)家們用拼圖來形容這一困難。如果拼圖里好多小塊很相似就更難找到正確的位置。近幾年發(fā)展出的新測序方法 Oxford Nanopore 和 PacBio HiFi 可以一次處理更長的 DNA 片段,就好像拼圖的塊變大,塊數(shù)變小了。
其二,很難找到只有一套 DNA 的人類細(xì)胞。正常細(xì)胞同時擁有兩套 DNA,分別來自父親和母親,測序時兩組 DNA 混在一起增加了難度。這次的解決辦法是使用一組來自“葡萄胎”的細(xì)胞,這是一種罕見妊娠疾病,使胚胎細(xì)胞異常生長,只保留一套 DNA。
用上新方法,人類 DNA 序列中 30.55 億個堿基對的測序工作終于宣告完工。人類基因組計(jì)劃前負(fù)責(zé)人 Robert Waterston 對新方法評價到:
(人類基因組)不再有任何隱藏的或未知的部分。
全新的人類參考基因組被命名為 T2T-CHM13,今后的個性化基因測序可以此為基準(zhǔn),鎖定病變基因,提前預(yù)防和治療。
這次研究成果幾個月前已發(fā)布在生物預(yù)印本平臺,現(xiàn)在正式見刊 Science。具體到已發(fā)表的內(nèi)容上,還存在一點(diǎn)不足之處:使用的葡萄胎細(xì)胞保留的是 XX 染色體,缺失了 Y 染色體。
不過后來這段時間科學(xué)家們也沒閑著,Y 染色體的測序工作其實(shí)也另外完成了。項(xiàng)目負(fù)責(zé)人 Adam Phillippy 在社交媒體宣布了這一消息,人體 24 條染色體基因測序已全部完成。
最新參考序列 T2T-CHM13 v2.0 的完整數(shù)據(jù)和在線瀏覽器已公開,可供全球研究團(tuán)隊(duì)使用。
而最新包含 Y 染色體測序成果的論文預(yù)印版計(jì)劃在下個月發(fā)布。
論文地址:
https://www.science.org/toc/science/376/6588
CHM13 v2.0 相關(guān)數(shù)據(jù)和工具
https://genomeinformatics.github.io/CHM13v2/
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。