第一個完全完整的人類基因組現已可供所有人使用
我們花了 20 多年的時間,終於擁有了。
2022 年,第一個完整、無間隙的人類基因組被發現,標誌著人類遺傳學的一個重要時刻。 在向公眾發佈時,科學家們描述了對超過 60 億個鹼基對基因組進行測序的艱苦工作,在這項新研究中增加了 2 億個鹼基對。 新的基因組添加了 99 個可能編碼蛋白質的基因和 2000 個以前未知的候選基因。 現在,可以使用了供所有人查看。
許多人會問:“等等,我們不是已經對人類基因組進行了測序嗎?” 在某種程度上,是的——2000 年,人類基因組定序聯盟發布了人類基因組的第一份草稿,這些結果隨後為當今人類遺傳學的幾乎所有方面鋪平了道路。
自 2013 年以來,最新的人類基因組草圖一直被用作參考。 這是因為這些序列是高度重複的,並且包含許多重複的區域——試圖將它們放在正確的位置就像試圖完成拼圖遊戲,其中所有的碎片都是相同的形狀並且正面沒有圖像。 由於大的重複序列的長間隙和代表性不足,使得這種遺傳物質在過去 20 年中一直被排除在外。 科學家必須想出更精確的定序方法來照亮基因組最黑暗的角落。
“我們已經 20 多年未能研究的人類基因組的這些部分對於我們了解基因組如何運作、遺傳疾病以及人類多樣性和進化非常重要,”說加州大學聖克魯斯分校生物分子工程助理教授 Karen Miga科學去年。
與人類基因組定序聯盟非常相似,新的參考基因組(稱為T2T-CHM13)是由Telomere-2-Telomere Consortium 產生的,該聯盟的一組研究人員致力於最終將每條染色體從一個端粒映射到另一個端粒。 T2T-CHM13 現已在UCSC 基因組瀏覽器供每個人享用,稱讚標準人類參考基因組 GRCh38。
如果你不相信,這是紙質形式的 HGSC 參考基因組。 每個數字都是一條染色體,字體是4.5號,幾乎難以辨認。 圖片來源:widdowquinn/Flickr CC BY-NC-SA 2.0
新的參考基因組是使用兩種現代定序技術創建的,稱為牛津奈米孔和PacBio 高傳真音響超長讀定序,大幅增加了可讀取的DNA長度,同時也提高了準確性。 透過這種方式,他們可以對以前透過更基本的技術無法讀取的 DNA 字串進行定序,同時糾正先前參考基因組中存在的一些結構錯誤。
展望未來,該聯盟希望添加更多參考基因組作為人類泛基因組參考聯盟的一部分,以改善人類遺傳學的多樣性,這是目前非常缺乏的。
「我們正在添加第二個完整的基因組,然後還會有更多,」加州大學聖克魯斯分校基因組研究所所長 David Haussler 說。
「下一階段是考慮人類基因組的參考不是單一的基因組序列。 這是一個深刻的轉變,是一個新時代的預兆,在這個新時代中,我們最終將以公正的方式捕捉人類的多樣性。
本文的早期版本是2022 年 3 月。