第一个完整的、没有间隙的人类基因组现在可供科学家和公众查看,这标志着人类遗传学的一个重要时刻。2021 年 6 月,该期刊已发表 6 篇论文科学。他们描述了对超过 60 亿个碱基对基因组进行测序的艰苦工作,这项新研究又增加了 2 亿个碱基对。新基因组现在增加了 99 个可能编码蛋白质的基因和 2,000 个以前未知的候选基因。
很多人会问:“等等,我们不是已经对人类基因组进行测序了吗?”从某种程度上来说,是的——2000 年,人类基因组测序联盟公布了他们的第一张人类基因组草图,这些结果为当今几乎每个人类遗传学方面铺平了道路。
自 2013 年以来,最新的人类基因组草图一直被用作参考。但由于测序技术不切实际,这些草图遗漏了我们 DNA 中最复杂的区域,这些区域约占整个基因组的 8%。这是因为这些序列重复性很高,包含许多重复区域——试图将它们放在正确的位置就像试图完成一个拼图游戏,其中所有碎片都是相同形状,正面没有图像。长间隙和大重复序列的代表性不足使得这种遗传物质在过去 20 年里一直被排除在外。科学家不得不想出更精确的测序方法来照亮基因组最黑暗的角落。
加州大学圣克鲁斯分校生物分子工程学助理教授凯伦·米加 (Karen Miga) 在一篇论文中表示:“这些我们 20 多年来未能研究的人类基因组部分,对于我们了解基因组的工作原理、遗传疾病以及人类多样性和进化至关重要。”陈述。
与人类基因组测序联盟非常相似,新的参考基因组(称为 T2T-CHM13)是由端粒对端粒联盟制作的,该联盟是一群致力于最终将每条染色体从一个端粒映射到另一个端粒的研究人员。T2T-CHM13 现在将在UCSC 基因组浏览器供大家欣赏,补充标准人类参考基因组 GRCh38。
新的参考基因组是使用两种现代测序技术创建的,称为牛津纳米孔和PacBio 高保真音响超长读长测序,大幅增加可读取的 DNA 长度,同时提高准确性。通过这种方式,他们可以对以前无法通过更基本的技术读取的 DNA 串进行测序,同时纠正以前参考基因组中存在的一些结构错误。
展望未来,该联盟希望在人类泛基因组参考联盟中增加更多的参考基因组,以改善人类遗传学的多样性,这是目前人类所严重缺乏的。
加州大学圣克鲁斯分校基因组学研究所所长戴维·豪斯勒在一份声明中表示:“我们正在添加第二个完整的基因组,之后还会有更多的基因组。”陈述。
“下一阶段是考虑人类基因组的参考不再是单一的基因组序列。这是一个深刻的转变,预示着一个新时代的到来,在这个新时代,我们最终将以一种不带偏见的方式捕捉人类的多样性。”