一些人问到,什么时候戳破非洲人口结构的意义何在? Tishkoff等。 和 Henn等。 在覆盖范围方面做得很好。 第一的, 最好运行自己的分析,这样您就可以根据自己的喜好进行切片和切块,而不必依赖于其他人提供的受限菜单。 家庭烹饪有其价值。 您可以按照自己的口味调味。 其次,您永远都不知道人们会在您家门口留下什么数据。 我已经收到了三个索马里人的基因型。 没什么奇怪的,比埃塞俄比亚人更令人回味 Behar等。,但仍然很有趣。
此外,您还可以看到ADMIXTURE在某些情况下倾向于得出奇怪的结论。 以下是K = 12运行〜50,000个SNP。 我已经包含在Behar等人的文章中。 以及Henn等人的HGDP人口。 设置,并修剪了许多非洲集团,这些集团在信息方面似乎是多余的。 我还添加了一些具有地理信息的标签。
在下面观察到有一个富拉尼星团。 我认为这几乎是一件神器。 在K = 7时,富拉尼语的多数成分在西非和班图语系中是模态,而少数成分与西非和班图语中的一种模态相同。 莫扎比柏柏尔人 来自阿尔及利亚。 莫扎比人居住在遥远的撒哈拉以北地区,当人们向东前往西亚和地中海东部时,它们的模态成分会下降。 我怀疑在ADMIXTURE中出现的是富兰尼人的古老杂交,也许是他们从这个核心群体的人口膨胀。 我们对富拉尼的史前历史有所了解,并且不希望它们成为如此独特的集群,因此,我自然会跳入这些推论。 但这确实使我重新考虑了ADMIXTURE中“ Sandawe”,“ Mbuti”或“ San”集群的性质。 这些人口与邻国在文化上有着明显的区别,因此可以反省的是,他们是“纯净的”古老底物群体,被班图人的邻居所覆盖和边缘化。 但是由于地理上的孤立,他们的史前史比富拉尼要模糊得多,因此所进行的工作要少得多。 这些“古老的”孤立群体本身可能经历了我们认为与富拉尼一起发生的独特的近期民族发生过程(同样,在比亚卡(Biaka)下方的地块中是纯净的;但是在大多数条形图中,它们都具有较小的元素他们与邻居共享的食物,可能是由于西部P格米人和班图人邻居之间的混合和互动比复活节邻居更多。
好的,现在让我们修剪一些“纯”和无关的人群。 此外,我将删除一些K。 因此,将使用新的基数重新计算比例。 因此,请记住,南非Bantus显示出西非地区较高,部分原因是Khoisan比例被删除,从而夸大了其他所有元素的百分比。
现在,让我们看一下推断总体之间的成对Fst值。 记住这一点 测量可归因于遗传变异的比例 之间 人口差异。 值越大,遗传距离越大。 我会给推断的人口标签,但不要太在意。
估计人群之间的Fst差异: | ||||||||||||
富拉尼 | 圣 | 欧元 | 玛雅 | 尼罗河 | 比亚卡 | W非洲 | 亚洲西南 | 桑达威 | 姆布蒂 | 莫扎比 | 班图 | |
富拉尼 | 0.00 | 0.19 | 0.15 | 0.26 | 0.11 | 0.13 | 0.09 | 0.14 | 0.10 | 0.18 | 0.12 | 0.10 |
圣 | 0.19 | 0.00 | 0.27 | 0.37 | 0.16 | 0.11 | 0.13 | 0.25 | 0.13 | 0.13 | 0.23 | 0.13 |
欧洲 | 0.15 | 0.27 | 0.00 | 0.18 | 0.17 | 0.22 | 0.19 | 0.05 | 0.15 | 0.26 | 0.06 | 0.19 |
玛雅 | 0.26 | 0.37 | 0.18 | 0.00 | 0.27 | 0.31 | 0.28 | 0.19 | 0.25 | 0.36 | 0.20 | 0.28 |
尼罗河 | 0.11 | 0.16 | 0.17 | 0.27 | 0.00 | 0.10 | 0.07 | 0.17 | 0.08 | 0.14 | 0.13 | 0.07 |
比亚卡 | 0.13 | 0.11 | 0.22 | 0.31 | 0.10 | 0.00 | 0.07 | 0.21 | 0.09 | 0.09 | 0.18 | 0.07 |
W非洲 | 0.09 | 0.13 | 0.19 | 0.28 | 0.07 | 0.07 | 0.00 | 0.17 | 0.07 | 0.12 | 0.14 | 0.05 |
亚洲西南 | 0.14 | 0.25 | 0.05 | 0.19 | 0.17 | 0.21 | 0.17 | 0.00 | 0.14 | 0.25 | 0.06 | 0.18 |
桑达威 | 0.10 | 0.13 | 0.15 | 0.25 | 0.08 | 0.09 | 0.07 | 0.14 | 0.00 | 0.13 | 0.12 | 0.07 |
姆布蒂 | 0.18 | 0.13 | 0.26 | 0.36 | 0.14 | 0.09 | 0.12 | 0.25 | 0.13 | 0.00 | 0.22 | 0.12 |
莫扎比 | 0.12 | 0.23 | 0.06 | 0.20 | 0.13 | 0.18 | 0.14 | 0.06 | 0.12 | 0.22 | 0.00 | 0.14 |
班图 | 0.10 | 0.13 | 0.19 | 0.28 | 0.07 | 0.07 | 0.05 | 0.18 | 0.07 | 0.12 | 0.14 | 0.00 |
这是 非非洲群体与非洲群体之间的遗传距离 在条形图上 .
一些一致的趋势:
– Mbuti和Khoisan与非非洲人的距离最大。
–下一个是比亚卡(Biaka)。 同样,这可能是由于Biaka与邻近群体之间的混合,或者是Biaka y格米人与非Khoisan / Mbuti非洲群体之间的紧密联系(参考了最后的共同祖先)。
–班图斯人与西非人的距离大致相等。
–尼罗河星团和非非洲人之间的距离略小。
– 最后,一个 非非洲人与Sandawe群体之间的差异始终较小。
一如既往,我们需要记住,这些人可能不是真正的真正祖先群体。 我毫不犹豫地假设,随着时间的推移,在莫扎比人所属于的西地中海群体与中北部非洲的一些尼罗河种群之间会有一些低水平一致的基因流动。 基因频率的这种平衡自然会降低Fst值。 第二, 相对的 最初,当我查看非洲数据时,Sandawe群集的紧密程度突然跳到我的头上。 奇怪的是,它给我留下了深刻的印象。
这是维基百科的 桑达威:
桑达威(Sandawe)是位于坦桑尼亚中部多多玛(Dodoma)地区科多(Kondoa)区的一个农业族裔。 在2000年,桑达威人口估计为40,000。
桑达威(Sandawe)语言是一种带有喀哒声的音调语言,显然与南部非洲的K族语言有关。 最近的研究表明,hoe族的祖先是牧民,并从东北(也许从现代桑达维地区)迁移到南部非洲。
但是,桑达维(Sandawe)似乎离南非丛林人样本还不算近。 以下是选定的推断祖先非洲群体的Fst关系的多维标度(对x轴的权重更高):
PCA图的一个方面是 时刻 跳出来的是非洲群体和非非洲群体之间的鸿沟,这些鸿沟经常被最近可能混和在一起的人群所覆盖。 一种解释这一现象的假说是,自“非洲以外”事件以来,非洲与世界其他地区之间几乎没有基因交流。 可能是由于生态(撒哈拉沙漠)。 但这是另一个解释: 班图人的扩张消除了中部和东部非洲的大部分遗传变异,这种变异可能部分跨越了非洲与非非洲之间的鸿沟。 考古学和人类学表明,目前在东非大部分地区和南部直至南部的班图族和尼罗河族这两个族群都在过去3,000年的规模上具有侵略性。 因此,像哈德扎(Hadza)和桑达维(Sandawe)这样的团体被认为是较古老的文化和遗传变异的遗物。 这就是为什么一旦您控制了明确的可能掺混物(例如富拉尼)后,桑达威就比其他非洲群体更接近欧亚人的原因。 或者,可能是由于来自欧亚大陆的反向迁移,桑达威本身也经历了更长时间的混合事件。