髓: 人类X染色体承受来自自然选择的更大压力,从而导致较少的遗传多样性。 但是,整个人群中X染色体多样性的差异似乎更多地是人口历史的函数,而不是这些人群中自然选择能力的差异。
在过去的几年中,已经发现,人类X染色体的遗传多样性低于基因组的非性别区域,即常染色体。 为什么? 从表面上看,这似乎是无法解释的,但是从人类基因组结构中衍生出来的一些基本结构性因素却可以展现出来。
首先,在男性中,X染色体是 半合子,使其更易于选择。 一旦您超越了行话,这是相当简单的。 男性只具有在X染色体上表达的基因的一个副本,因为它们具有 只有一个X染色体。 相反,雌性有两个X染色体。 这就是为什么 性相关特质 在人类中男性比例过高。 对于X染色体上的基因,女性可能是许多疾病的携带者,因为它们具有一个基因的两个副本,并且一个副本可能具有功能。 相反,男性仅具有该基因的功能或非功能版本,因为他在X染色体上具有一个拷贝。 这与常染色体上的情况不同,常染色体上的雄性和雌性每个基因都有两个拷贝。
这种结构差异对于在X染色体与常染色体上起作用的选择性动力学很重要。 在常染色体上,隐性性状在适应性方面的成本要比在X染色体上付出的成本低得多,因为在X染色体上,它们通常更容易通过雄性自然选择。 在其余的基因组中,隐性性状仅在它们的两个纯合子以两个拷贝的形式存在时才付出其缺点的代价。 一个简单的准形式示例说明了该过程。
想象一个人口,它的等位基因隐性表达,表达时适应性急剧降低。 假设有问题的等位基因, q,以0.50的比例存在。 所有其他功能性等位基因归类为 p,也为0.50。 在下一代 哈迪-温伯格平衡 这将意味着:75%的个体不会表现出隐性特征,而25%的个体会表现出*。但是,对于所表达的如此有害的等位基因副本,如此暴露于自然选择,就永远存在,还有另一种有害的等位基因副本在杂合子个体中被“掩盖”并具有一个良好的副本,因此逃避了自然选择。 由于自然选择降低了有害等位基因的频率,因此在隐性表达的个体中发现的拷贝越来越少,因此去除等位基因的选择能力将随着其自身频率的降低而降低。 当有害等位基因的频率为〜0.01时,暴露于自然选择的纯合子中仅发现1个拷贝中的大约100个。 以这种方式,甚至有害的等位基因的遗传多样性也可以作为许多低频隐性表达的变体来保存。
X染色体上的情况有所不同。 如果人口仅由女性组成,则上面的模型将成立。 该特征仅在雌性具有两个缺陷基因拷贝的情况下表达。 但是在典型人群中,每三个X染色体中就有一个存在于男性中。 这意味着,如果X上的每个有害等位基因恰好是雄性,则将承担其全部成本,即三分之一的概率。 因此,我计算出,当您遇到有害等位基因在X染色体上占〜1分数的情况时,大约会表达3个拷贝中的0.01个,绝大多数是男性。 就暴露于自然选择的有害等位基因的拷贝而言,这是X与常染色体之间的1倍差异,这都是由于男性的半合子性造成的。
但是选择的效果并不总是负面的,即从种群中纯化不良基因拷贝。 积极力量还可以通过以下方式减少多样性 选择性扫描。 这种情况的发生方式和原因相当简单。 想象一下,您有一个碱基对,而该碱基对偶然地具有一个对单个个体非常有益的突变。 为了使表达简单,可以想象它是显性的,而个体是杂合子。 携带偏爱突变的单身家庭有一个很大的家庭,因为约50%的后代也携带偏爱突变,并且比人口平均水平更适合。 等等。 这个受欢迎的变体可以非常迅速地传播。 乳糖耐量 这是一个很好的具体案例。 当我说最喜欢的变体传播时, 我实际上是在谈论一个人的一个基因拷贝,由于其适应性价值,它的频率开始增加。 但是请记住,单个碱基对嵌入基因组内,并且染色体区域通常从亲代传给后代。 这通常是一揽子交易。 当偏爱的等位基因出现时,它可以“搭便车”不具有选择优势的附近变体,只是它们很幸运地存在于具有非常适应性的等位基因旁边(认为它们是基因的“后代”或随行人员)。 当然 基因重组 随着时间的推移会打破这些关联,但是这个过程需要几代人的时间。 在那之前,您所看到的是特定基因组区段的增殖以及嵌入该特定区域的受惠基因的频率增加。 当具有相关等位基因的整个片段的频率开始增加时,通过直接的逻辑,随着变异被排除在外,总体遗传多样性降低。
然而,进化不仅仅是自然选择。 有两个与选择无关的过程,因为这可能会减少遗传变异。 这两种现象都打开的电机是随机遗传漂移。 随着您增加漂移的能力来使一代代的基因频率波动,您也增加了它的能力,一旦等位基因达到零频率边界条件,它们就会消失,从而使其灭绝。 这就是为什么经历了人口瓶颈的人口如此同质。 漂移通过反复偏爱某些等位基因并消除了其余大部分,将大部分变异从基因库中挤出来。
与这种特定情况相关的动态是男性和女性有效人口规模的差异,以及长期有效人口规模的巨大波动。 为了减少X染色体的多样性,人们必须假定女性有效种群的数量低于男性有效种群的数量。 之所以会影响X相对于常染色体的多样性,是因为 X在女性身上花费其时间的2/3,而常染色体在男性和女性中只花费其时间的1/2。 因此,如果女性的有效种群数量小于男性,那么X染色体受到的冲击力要大于常染色体。 更一般而言,即使假定性别平衡,X染色体的有效种群也较低,因为常染色体的每4个拷贝中就有3个X染色体。 由于有效种群数量的减少,X对瓶颈等更为敏感,其结果之一就是遗传多样性的减少。
在阅读新报告时,请牢记以上所有内容 “自然遗传学 选择和漂移之间的平衡,以减少X染色体和整个种群之间的变异。 第二个事实指的是 与非非洲人相比,非洲人似乎在X染色体上的变异相对减少得更少。 首先,论文的摘要 人口规模全基因组测序中X连锁和常染色体遗传变异的分析:
X染色体与常染色体上的遗传多样性之比对自然选择和人口统计学均敏感。 根据69位女性的全基因组序列,我们报告说,尽管这一比例随着跨人群基因距离的遗传距离而增加,但在欧洲人中,该比率低于西非人,而与基因接近程度无关。 这种相对减少可以用人口历史的差异来最简单地解释,而无需调用自然选择。
这项研究是我提到的研究趋势的一部分 全基因组序列。 请记住,1万个SNP论文中有很多都只关注遗传 变种3亿个碱基对中的多态性。 这些变体特别有用,但它们错过了许多基因组。 此外,在变异的选择上还存在一些统计问题,因为变异通常是针对一个人群,即欧洲人(不同的人群在整个基因组中都有一些不同的变异)。 得出的结论是,现在是时候到了我们可以以最精确,最细粒度的角度查看基因组的时候了,而不是使用近似值,无论是一个基因座还是一百万个SNP。
牢记这一宽泛的思路,如果您对基因组有了解的一件事,那就是其中的许多功能都不起作用。 它没有代码。 基因组的某些区域 基因间基因之间。 自然选择通常针对功能区域,而不是基因间区域。 如果自然选择是影响模式的主要动态因素,那么我们将在基因区和基因间区之间表现出差异,因为选择在前者中比后者在约束变异和增加等位基因频率方面的作用要大得多。
下图有四个面板。 每个面板都有一个x轴,该轴由距基因的距离定义,从左到右随着距离的增加而增加。 因此,最左边的点可以被认为是遗传的,最右边的点可以被认为是基因间的。 左侧面板定义为欧洲人,右侧面板定义为非洲人。 更确切地说,他们展示的是来自36个西非约鲁巴岛和33个欧美女性的全基因组序列的结果。 第一行显示原始数据的变化 努索洛肽多样性 对于常染色体和X,底部一行说明了两个基因组类别的多样性比率(X与常染色体)随距离的变化。
在分子进化遗传学中,通常假设零假设是 中立。 基本上,这意味着选择不是驱动变化的主要作用。 相反,它是诸如突变和漂移之类的随机作用力的函数。 当人们看到偏离中立性时,就会考虑自然选择的影响和适应的可能性。 您会在此处看到自然选择的明确证据。 与常染色体相比,X染色体上的遗传多样性与距基因的距离具有更强的关系。 这很重要,因为当您回想起X染色体时,自然选择就更加残酷地雕刻了它。 先验 理由是,较不利的等位基因将被更有效地修剪,而隐性表达偏爱的等位基因将因其偏爱的性状通常在存在时不表达(因为在杂合子中被抑制)而受到阻碍。 上面的模式与该模型完全一致。
因此,现在我们已经看到,对这些样本进行更紧密的全基因组检查意味着,X染色体与常染色体的多样性差异不仅是中性力的函数,而且可能是自然选择所致。 但是,现象的第二部分是:非非洲人通常更容易产生脱节现象。 如果是这样,这是否意味着非非洲人会受到更自然的选择? 他们探讨这个问题的方式简洁明了:他们将比率的比率作为与基因的距离的函数进行了比较。 我的意思是说,他们研究了X和常染色体之间基因组多样性的比率,然后通过在欧洲人和非洲人之间进行比较,从该值中得出了比率。 与上面的图不同,左图没有显示出作为遗传距离的函数的差异。 这告诉我们什么? 如果欧洲人自然选择比非洲人更有效,那么在遗传区域附近,这两个种群之间的多样性差异应该更大,因为这是人们最能感受到选择力的地方。 相反,您看到的是,尽管X和常染色体基因组之间的差异是真实的,但X和常染色体上非洲人和欧洲人的基因组之间却是一致的。
这表明非洲人和欧洲人之间的差异是由人口统计学驱动的,而不是适应(正选择)或功能约束(负选择或净化选择)驱动的。 随机的进化力看不到基因或基因间区域。 它们是随机的,对功能的导入是盲目的或中立的。 与选择不同,它们的影响将遍及整个基因组,就像我们在这里看到的区域间差异一样。
在这种情况下发生了什么? 回到开始时,有两种特定的可能性:性别偏见的移民和非非洲人的有效人口规模更大的波动。 后一种模式与“非洲以外”的情况完全一致,在这种情况下,非非洲人是从离开非洲的少数祖先人口中衍生出来的。 这是巨大的“走出非洲”瓶颈,这似乎是人类分子进化论者的一致发现。 由于X染色体的有效种群较小,因此可能受到该瓶颈的均质化作用的影响更大。
第一种选择虽然很有趣,但是很有趣。 如果有多个“走出非洲”脉搏,其中不成比例的年轻男性群体呢? 这将使非非洲人在常染色体上的遗传多样性远远超过X染色体,因为雄性每两个常染色体只能携带一个X染色体。 我认为“走出非洲”模式更合理,但我不会立即放弃这种情况。 关于现代人类的起源,我们生活在一个有趣而陌生的时代。
* p2 + 2pq + q2 = 1 = 0.502 + 2(0.50)(0.50)+ 0.502
引文: Gottipati,Srikanth,Arbiza,Leonardo,Siepel,Adam,Clark,Andrew G和Keinan,Alon(2011)。 相对常染色体,X连锁和X / A多样性与距最近基因的遗传距离无关。 自然遗传学: 10.1038 / ng.877