国际基因组学合作组织公布了有史以来第一个人类泛基因组草案,该合作组织将尝试将人类令人难以置信的多样性纳入单一参考基因组中。研究小组希望,通过将世界各地的一系列种族和人群纳入泛基因组,他们可以更准确地代表所有人类和可能困扰他们的疾病,而不是以前使用的小样本。
泛基因组建立在数十年人类基因组工作的基础上,从 2003 年第一个人类参考基因组到第一个2022 年。人类染色体中所有遗传物质的首次表征是现代科学的巨大飞跃——它们使进化研究人员能够将其他动物与人类进行比较,医学研究人员能够将患有疾病的人与参考基因组进行比较以确定潜在的机制,遗传学研究人员在参考文献创建的基础上开发新的基因组。拥有一个用于比较所有新的基因发现的参考至关重要,并且支撑着我们迄今为止在基因理解方面所取得的几乎每一步。
但这些原始参考基因组有一个问题——它们通常是由一小群非常特定的志愿者组成的,并不代表整个人类。创建第一个参考基因组的人类基因组计划希望招募 20 名志愿者来创建他们的序列,但 93% 的序列是从只有11名志愿者其中 70% 源自一个人。这些人仍然匿名,但都是从纽约州布法罗招募的,因此并不能很好地代表世界其他地区。
现在,一切都在改变。全基因组初稿只是国际努力的开始,该努力旨在整合来自尽可能多的不同种族和人群的基因组,包括孤立的社区和团队可以聚集的尽可能多的多样性。这份最初的草案包含了来自世界各地 47 个不同人的 DNA(遗憾的是还没有来自大洋洲的人),但下一阶段有望将这个数字增加到 350 个。这是一项艰巨的任务,需要时间、工作和大量的工作。钱,但这样做将使参考基因组完全适用于世界上比目前更多的地方。
“泛基因组代表全人类的多样性——这就是我们的目标,”华盛顿大学医学院教授、泛基因组联盟成员埃文·艾克勒(Evan Eichler)在新闻发布会上说。
“如果你有一份包含所有常见变异完整信息的参考资料,那么当你分析下一个患者基因组时,不会留下任何序列。目前,当我们绘制患者的序列时,该序列的一部分(有时是重要的一部分)无法绘制。但现在我们有了一个泛基因组框架,本质上的目标是,未来测序的数百万患者的所有变异信息现在都将根据参考进行映射。”
它不仅更加多样化,而且用于创建泛基因组的技术也使人们能够发现数量惊人的新遗传变异。与原始参考基因组 GRCh38 相比,该团队现在增加了 1.19 亿个碱基对和 1,115 个基因重复,提供了更好的人类多样性图景。
艾希勒教授继续说道:“有许多形式的罕见疾病尚未得到解释,因为它们变异的复杂性尚未得到解决。”
“马上,我们构建这些参考[基因组]的机制将从本质上改变罕见疾病或其遗传原因的发现。”
全基因组预计将有助于发现新的致病变异并帮助现有的临床试验,同时该团队将继续添加不同的祖先系。虽然不可能将人类的全部多样性纳入一个参考基因组(每个孩子的出生都会引入大约60-70个新突变他们的父母甚至没有),有可能从全球每个主要人群中获取少量样本——也就是说,前提是他们同意进行测序。