在构成人类基因组的大约 30 亿个碱基对中,只有大约2%编码蛋白质,剩下的 98% 的功能不太明显。
被一些人斥为无用’自从 20 世纪 60 年代首次发现它扰乱了我们的染色体以来,它的起源、影响和在生命进化中的潜在目的就吸引了生物学家的关注。
现在,以色列特拉维夫大学的研究人员对非编码 DNA 持续存在的原因添加了一些重要的见解,这可以帮助我们更好地了解生命世界中丰富多样的基因组大小。
1977年,两位科学家命名为理查德·罗伯茨和菲尔·夏普独立注意到这种 DNA 杂乱的很大一部分不仅分散在我们的基因之间,而且经常在序列中间中断,这一发现后来他们获得了诺贝尔奖。
作为。。而被知道内含子,它们似乎给像我们这样的复杂细胞带来了负担,同时留下了更简单的细胞? 比如细菌? 未受影响。 他们还在将 DNA 转化为物质的过程中添加了大量的劳动力。
每次新鲜生产蛋白质时,这些中断都必须剪下遗传模板,需要将编码指令拼凑在一起,然后才能被解释为蛋白质。 日常比较就必须删除数千个无意义的单词才能阅读一个句子。
这种看似浪费的运营方式却是必要的整个大自然,而那些幸运的细菌和其他原核生物却是例外。
不同物种的内含子数量也存在很大差异。 人类已经有近140,000内含子,周围的老鼠33,000, 常见的果蝇几乎38,000, 酵母 (酿酒酵母) 仅仅第286章,和单细胞真菌脑炎原虫隧道只是15。
为什么进化没有通过自然选择来清理这一混乱局面,使我们成为更高效的有机体?
以及为什么当基因组有一个已知的随着时间的推移,自然倾向于删除而不是添加 DNA,即使经过数百万年的进化,“垃圾DNA”似乎也从未变得更短吗?
“有趣的是,据说发生了相反的情况,因为与原核生物相比,真核生物具有更大的基因组、更长的蛋白质和更大的基因间区域,”这项最新内含子研究背后的科学家写在他们最近发表的报告中。
研究人员提出,删除编码区域周围的任何侵入性 DNA 片段可能会损害动物的生存,因为编码部分也可能同时被剪掉。
研究人员说:“边界附近发生的缺失偶尔会延伸到保守区域,从而受到强烈的纯化选择的影响。”写。
这种“边界诱导选择”,即中性序列位于编码区之间,因此会产生短的非编码 DNA 序列的插入偏向。
从本质上讲,“垃圾DNA”的作用就像突变缓冲液,保护含有编码蛋白质所需的更敏感序列的区域。
研究人员创建了一个数学模型来展示这些动态的作用。
该团队此前曾提出“删除偏差会导致基因组在进化过程中萎缩”。解释。
“即使在强烈的删除偏差下,也会出现长的中性进化序列,这是违反直觉的结果,这是由于对侵入中性序列高度保守边界的删除的拒绝。”
虽然他们的模型为物种内内含子长度的变化提供了合理的解释,但它无法解释为什么物种之间的内含子长度不同。
“一个简单的解释是模型参数本身会演变,”他们写。 “因此,不同的物种具有不同的插入与删除率比率,并且可能在内含子内出现保守区域的倾向也不同。”
知道存在偏差可能有助于解释我们在自然界中看到的内含子的多样性,以及为什么某些生物体看起来更相对于其它的。
这些干扰最初的来源也是一个正在进行的研究领域,具有悠久的历史和过时的基因建议作为来源。
毕竟,它甚至可能不是非编码的,其任务是我们还不知道的功能。 近年来,随着更多可能的功能被发现,包括内含子被转录成RNA链,科学界逐渐不再将所有内含子描述为“垃圾DNA”。监督蛋白质生产。
我们可能认为是垃圾的东西,最终可能会被视为基因宝藏。 这似乎是一种构建有机体的复杂方法,但经过数十亿年的进化,大自然似乎知道自己在做什么。
这篇论文发表于开放生物学。