几年前,当我注意到特定的群体基因组估计时,我向一位朋友询问了置信区间,以及对其中的值的信任程度。 他随口提到的一件事是,基于连锁不平衡的时间估计,因为混合通常似乎给出的代数相对较低。 当谈到该领域的非人类生物时,人们并不总是了解人口统计历史,但对于人类我们有更好的记录,而且我也注意到日期似乎非常偏向最近。 部分原因是这些估计通常只对混合物的最后一个脉冲敏感。 但即便如此……
一个新的预印本详细讨论了为什么会发生这种情况, 迁移和选配对混合物连锁不平衡的影响:
医学和群体遗传学中的统计模型通常假设个体在群体中随机分类。 虽然这简化了模型的复杂性,但它与越来越多的人类非随机交配证据相矛盾。 具体来说,已经表明分类交配受基因组祖先的显着影响。 在这项工作中,我们研究了祖先分类交配对混合种群中个体的本地祖先轨迹之间的连锁不平衡的影响。 为了实现这一点,我们开发了 Wright-Fisher 模型的扩展,允许基于祖先的分类交配。 我们表明,祖先分类扰乱了本地祖先连锁不平衡(LAD)的分布和种群中祖先的方差作为混合后世代数的函数。 当方法假设随机交配时,这种分类效应会导致混合种群的人口统计推断错误。 我们在有和没有迁移的分类交配模型下推导出 LAD 的封闭形式公式。 我们观察到 LAD 取决于每一代夫妇的全球血统的相关性、每个祖先种群的迁移率、祖先种群的初始比例以及自混合以来的世代数。 我们还提供了非裔美国人血统分类的第一个证据,并在非裔美国人的模拟和真实混合人口数据中检查了 LAD。 我们发现在随机交配假设下的人口统计推断显着低估了自混合以来的世代数,并且使用 LAD 模式考虑分类交配导致估计更接近历史叙述。
直觉并不难。 在这种情况下,分类交配通常意味着在种群内将存在基因组祖先片段的相关性,这些片段是您正在跟踪以向后推断初始混合的模式。 交配的动态,无论是否随机,都会随着时间的推移影响衰变的形状。 如果由于正分类交配而在个体中看到更密集的局部祖先区域,您可能会将其与最近的混合模型混淆。
这种事情在各种模型中都会出现。 种群内的分类交配可能会导致比您预期的更高的遗传性状跨代传递。 许多基于模型的聚类算法现在在混合物分析中无处不在,它们生成条形图,假设一个人的种群中存在哈迪-温伯格平衡。
重要的东西。
“它与越来越多的人类非随机交配证据相矛盾。”
证据体的大小与此无关。 我们一直都知道,人类的交配是高度非随机的。 我们终于获得了处理更复杂模型的计算和数学能力。
这篇论文是否提供了在合理假设下这种影响有多大的大致估计?