在我 在下面发布, 图西族可能与胡图族在基因上有所不同,有很多 注释。 一些我没有发表是因为他们很粗鲁,尽管他们确实提出了有效的问题。 我将解决这些问题,但让我引述一个 评论:
这是一个有趣的可能性,但是这种混合方式并不能很好地分散非狩猎采集非洲人。 在您先前对东非的分析中,您成功地获得了一个相当准确的“亚非/寿司”和“尼罗河”类群。 您是否可以使用与“亚洲亚洲风味”博客文章中相同的混合设置运行此Tutsi样品,以查看他是否携带重要的Nilotic成分,或主要来自Bantu&Cushitic?
因此,我复制了与我在帖子中所做的相同人群的ADMIXTURE跑步, 亚非风味。 我还缩减了总体集,并使用EIGENSOFT生成了PCA。 在获得这些结果之前,让我解决问题。
1)“ Luhya是适合Hutus的代理吗?”
大概。 原因是 从刚果到南非,讲班图语的人口惊人地相似。 不仅如此,这些人群与在地理上相近的人群也非常有区别,但是在语言上有所不同(例如,Khoe,Sandawe,Masai)。 Luhya并不例外。 我已经运行了 Henn等。 数据集足以说服他们完全正确。 它们几乎是您对肯尼亚班图人的期望。 一种主要元素,将它们与东非-中非起源点联系在一起,并与其他东非元素有一些混合(类似,南非班图族展示了科伊桑混合)。 胡图族也许是奇特的,但我们不知道,我的意思是,他们大多是班图族,带有某种混合物,就像大多数班图族人口一样(在这种情况下,这个图西人似乎是个例外,因为他们大概是班图族人)。 如果您认为Luhya不适合,我邀请您下载HapMap Luhya,并将其与Henn等人合并。 数据集(或HGDP或Behar数据集)。 我认为那应该说服您。
2)“您给X人口的混合百分比很奇怪。”
在技术上比我更能流利纠正我的人, 但我建议您在字面上绝对取绝对百分率时要格外小心。 如果您告诉统计算法将您输入的遗传变异推入一定数量的盒子中,即使必须以各种方式挤压它们,它也会这样做。 换句话说,调整参数是生成大量奇怪的绝对比例的简便方法。 通常,很明显,高度混合的人群正在作为自己独特的群体出现……但这引出了一个问题,即混合何时如此遥远以至于不应该计数? 与其专注于绝对百分比, 看一下个人与人群之间的关系。 这些也可以调整和按摩,但是我的个人经验是它们的挥发性较小。
3)“ Nilotic集群无法很好地映射到Nilotic种群上。”
人们正式或非正式地给人群群加上标签是为了便于记忆。 他们不是要向您传递有关人口深厚历史及其关系的真实具体信息。 另外,当您使用地理或语言术语时,总是会造成很多混乱,因为这些术语与遗传簇之间只有近似的关系。 不要被语义所困扰,您会忘记ADMIXTURE组件是抽象的,可用于抽出遗传变异,而不是完美地映射到一些理想的ur-人口。
现在到我的结果。 我使用了200,000个标记。 我将立陶宛人和白俄罗斯人合并为一个锅,称为“波罗的海”,而叙利亚人和约旦人合并为另一个锅,作为“黎凡特人”。 对于PCA,我关注非洲人口,并使用也门犹太人作为外围人群。 此外, 由于马赛人之间有一些家庭关系,因此结构很明显。 在许多运行中,这是一个问题。 即使除去“问题”个体,其他集群也往往会在马赛人众多的较高K处出现。 在任何情况下,出于这些奔跑的目的,请忽略家庭群体,而将重点放在马赛人中较为典型的个人上。
请记住,图西族是3/4图西族,是1/4胡图族。 它是N =1。努比亚人也是。 您可以在许多非洲之角人口中看到,欧亚大陆与也门而非欧洲人有亲和力。 相比之下,努比亚人确实有一些类似欧洲的成分。 这很可能是由于这样的事实,即黎凡特人本身就拥有这种食物,同时携带这种成分的埃及人也是努比亚人的遗产的一部分。 图西族确实具有西南亚成分,而马赛人似乎缺乏。
为了更好地理解,让我们看一下个人。 图西人是最后的。 一些马赛人的家庭关系也很清楚。 关注更典型的马赛人和图西人:
从单个结果看,似乎可以将图西人与马赛人祖先组成的组合范围放在一起,尽管不是卢希亚人。 为了获得不同的优势,让我们看一些PCA,这些PCA可视化数据集中遗传变异的最大组成部分。
结果不会被剪切和干燥。 我对图西人的遗产中的某些亚非文化元素持怀疑态度,尽管似乎主要的亲缘关系是与马赛人的关系。
请注意: 我将K = 7跑到K –10。我没有显示的常规跑步方式没有什么不同。