一些人问到,什么时候戳破非洲人口结构的意义何在? Tishkoff等。 和 Henn等。 在覆盖范围方面做得很好。 第一的, 最好运行自己的分析,这样您就可以根据自己的喜好进行切片和切块,而不必依赖于其他人提供的受限菜单。 家庭烹饪有其价值。 您可以按照自己的口味调味。 其次,您永远都不知道人们会在您家门口留下什么数据。 我已经收到了三个索马里人的基因型。 没什么奇怪的,比埃塞俄比亚人更令人回味 Behar等。,但仍然很有趣。
此外,您还可以看到ADMIXTURE在某些情况下倾向于得出奇怪的结论。 以下是K = 12运行〜50,000个SNP。 我已经包含在Behar等人的文章中。 以及Henn等人的HGDP人口。 设置,并修剪了许多非洲集团,这些集团在信息方面似乎是多余的。 我还添加了一些具有地理信息的标签。
在下面观察到有一个富拉尼星团。 我认为这几乎是一件神器。 在K = 7时,富拉尼语的多数成分在西非和班图语系中是模态,而少数成分与西非和班图语中的一种模态相同。 莫扎比柏柏尔人 来自阿尔及利亚。 莫扎比人居住在遥远的撒哈拉以北地区,当人们向东前往西亚和地中海东部时,它们的模态成分会下降。 我怀疑在ADMIXTURE中出现的是富兰尼人的古老杂交,也许是他们从这个核心群体的人口膨胀。 我们对富拉尼的史前历史有所了解,并且不希望它们成为如此独特的集群,因此,我自然会跳入这些推论。 但这确实使我重新考虑了ADMIXTURE中“ Sandawe”,“ Mbuti”或“ San”集群的性质。 这些人口与邻国在文化上有着明显的区别,因此可以反省的是,他们是“纯净的”古老底物群体,被班图人的邻居所覆盖和边缘化。 但是由于地理上的孤立,他们的史前史比富拉尼要模糊得多,因此所进行的工作要少得多。 这些“古老的”孤立群体本身可能经历了我们认为与富拉尼一起发生的独特的近期民族发生过程(同样,在比亚卡(Biaka)下方的地块中是纯净的;但是在大多数条形图中,它们都具有较小的元素他们与邻居共享的食物,可能是由于西部P格米人和班图人邻居之间的混合和互动比复活节邻居更多。
好的,现在让我们修剪一些“纯”和无关的人群。 此外,我将删除一些K。 因此,将使用新的基数重新计算比例。 因此,请记住,南非Bantus显示出西非地区较高,部分原因是Khoisan比例被删除,从而夸大了其他所有元素的百分比。
现在,让我们看一下推断总体之间的成对Fst值。 记住这一点 测量可归因于遗传变异的比例 之间 人口差异。 值越大,遗传距离越大。 我会给推断的人口标签,但不要太在意。
估计人群之间的Fst差异: | ||||||||||||
富拉尼 | 圣 | 欧元 | 玛雅 | 尼罗河 | 比亚卡 | W非洲 | 亚洲西南 | 桑达威 | 姆布蒂 | 莫扎比 | 班图 | |
富拉尼 | 0.00 | 0.19 | 0.15 | 0.26 | 0.11 | 0.13 | 0.09 | 0.14 | 0.10 | 0.18 | 0.12 | 0.10 |
圣 | 0.19 | 0.00 | 0.27 | 0.37 | 0.16 | 0.11 | 0.13 | 0.25 | 0.13 | 0.13 | 0.23 | 0.13 |
欧洲 | 0.15 | 0.27 | 0.00 | 0.18 | 0.17 | 0.22 | 0.19 | 0.05 | 0.15 | 0.26 | 0.06 | 0.19 |
玛雅 | 0.26 | 0.37 | 0.18 | 0.00 | 0.27 | 0.31 | 0.28 | 0.19 | 0.25 | 0.36 | 0.20 | 0.28 |
尼罗河 | 0.11 | 0.16 | 0.17 | 0.27 | 0.00 | 0.10 | 0.07 | 0.17 | 0.08 | 0.14 | 0.13 | 0.07 |
比亚卡 | 0.13 | 0.11 | 0.22 | 0.31 | 0.10 | 0.00 | 0.07 | 0.21 | 0.09 | 0.09 | 0.18 | 0.07 |
W非洲 | 0.09 | 0.13 | 0.19 | 0.28 | 0.07 | 0.07 | 0.00 | 0.17 | 0.07 | 0.12 | 0.14 | 0.05 |
亚洲西南 | 0.14 | 0.25 | 0.05 | 0.19 | 0.17 | 0.21 | 0.17 | 0.00 | 0.14 | 0.25 | 0.06 | 0.18 |
桑达威 | 0.10 | 0.13 | 0.15 | 0.25 | 0.08 | 0.09 | 0.07 | 0.14 | 0.00 | 0.13 | 0.12 | 0.07 |
姆布蒂 | 0.18 | 0.13 | 0.26 | 0.36 | 0.14 | 0.09 | 0.12 | 0.25 | 0.13 | 0.00 | 0.22 | 0.12 |
莫扎比 | 0.12 | 0.23 | 0.06 | 0.20 | 0.13 | 0.18 | 0.14 | 0.06 | 0.12 | 0.22 | 0.00 | 0.14 |
班图 | 0.10 | 0.13 | 0.19 | 0.28 | 0.07 | 0.07 | 0.05 | 0.18 | 0.07 | 0.12 | 0.14 | 0.00 |
这是 非非洲群体与非洲群体之间的遗传距离 在条形图上 .
一些一致的趋势:
– Mbuti和Khoisan与非非洲人的距离最大。
–下一个是比亚卡(Biaka)。 同样,这可能是由于Biaka与邻近群体之间的混合,或者是Biaka y格米人与非Khoisan / Mbuti非洲群体之间的紧密联系(参考了最后的共同祖先)。
–班图斯人与西非人的距离大致相等。
–尼罗河星团和非非洲人之间的距离略小。
– 最后,一个 非非洲人与Sandawe群体之间的差异始终较小。
一如既往,我们需要记住,这些人可能不是真正的真正祖先群体。 我毫不犹豫地假设,随着时间的推移,在莫扎比人所属于的西地中海群体与中北部非洲的一些尼罗河种群之间会有一些低水平一致的基因流动。 基因频率的这种平衡自然会降低Fst值。 第二, 相对的 最初,当我查看非洲数据时,Sandawe群集的紧密程度突然跳到我的头上。 奇怪的是,它给我留下了深刻的印象。
这是维基百科的 桑达威:
桑达威(Sandawe)是位于坦桑尼亚中部多多玛(Dodoma)地区科多(Kondoa)区的一个农业族裔。 在2000年,桑达威人口估计为40,000。
桑达威(Sandawe)语言是一种带有喀哒声的音调语言,显然与南部非洲的K族语言有关。 最近的研究表明,hoe族的祖先是牧民,并从东北(也许从现代桑达维地区)迁移到南部非洲。
但是,桑达维(Sandawe)似乎离南非丛林人样本还不算近。 以下是选定的推断祖先非洲群体的Fst关系的多维标度(对x轴的权重更高):
PCA图的一个方面是 时刻 跳出来的是非洲群体和非非洲群体之间的鸿沟,这些鸿沟经常被最近可能混和在一起的人群所覆盖。 一种解释这一现象的假说是,自“非洲以外”事件以来,非洲与世界其他地区之间几乎没有基因交流。 可能是由于生态(撒哈拉沙漠)。 但这是另一个解释: 班图人的扩张消除了中部和东部非洲的大部分遗传变异,这种变异可能部分跨越了非洲与非非洲之间的鸿沟。 考古学和人类学表明,目前在东非大部分地区和南部直至南部的班图族和尼罗河族这两个族群都在过去3,000年的规模上具有侵略性。 因此,像哈德扎(Hadza)和桑达维(Sandawe)这样的团体被认为是较古老的文化和遗传变异的遗物。 这就是为什么一旦您控制了明确的可能掺混物(例如富拉尼)后,桑达威就比其他非洲群体更接近欧亚人的原因。 或者,可能是由于来自欧亚大陆的反向迁移,桑达威本身也经历了更长时间的混合事件。
有趣的结果。 尽管如果您在分析中包含 Hadza 和 Khoe(尤其是 Fst)会更好。 顺便说一句,您对说黑人的亚非人(包括闪米特人)的遗传学的总体看法是什么?
有趣的结果。 尽管如果您在分析中包含 Hadza 和 Khoe(尤其是 Fst)会更好。
🙂 所以你和德国人可以进行长时间的讨论吗? 我也有点想知道这样做。
顺便说一句,您对说黑人的亚非人(包括闪米特人)的遗传学的总体看法是什么?
hausa 仅从 yoruba 和 igbo 稍作修改。 这似乎是方言的某种精英传播,富拉尼语的倒置,谁似乎 *更多的* 撒哈拉以南地区比 hausa 还要多,但会说尼日尔-刚果语。 我想我倾向于该组的北非/西亚血统,但此时我的信心非常不稳定。
所以你和德国人可以进行长时间的讨论吗?
为什么不? 😀抛开开玩笑,我对不同的可能性比我可能拥有的要开放得多 似乎 参加我在这个博客上的讨论。
hausa 仅从 yoruba 和 igbo 稍作修改。 这似乎是方言的某种精英传播,富拉尼语的倒置,谁似乎 *更多的* 撒哈拉以南地区比 hausa 还要多,但会说尼日尔-刚果语。 我想我倾向于该组的北非/西亚血统,但此时我的信心非常不稳定。
我的总体印象是,亚非黑人在基因上是非常异质的一群,他们没有统一性(即使没有讲闪米特语的黑人)。
原始帖子中关于 Sandawe 的观察非常有见地,特别是结合最近的观察,即现在在东非发现了最古老的 Y-DNA hg A/hg B 谱系。
* * *
另一个值得做的大图观察是,毫不奇怪,班图人与西非的 Fst 距离 (0.05) 低于遗传距离图中的任何其他距离,并且西非混合物随处可见,即使已知存在班图人血统尽管我们知道非西非人口中西非混合物的唯一来源几乎完全是班图人。
如果将班图和西非成分合并为一个类别,您将剩下三个大致等距的非洲黑人成分——西非、尼罗河和 Sandawe,修剪后的 K 控制图看起来要简单得多。
* * *
富拉尼人是我从经验中预期的非班图尼日尔-刚果语使用者的非典型人口。 这并不奇怪,因为富拉尼语几乎跨越了整个西非边界,在非洲萨赫勒地区的亚非语言或尼罗-撒哈拉语言区和尼日尔-刚果语言区之间,缓冲了西非其他地区与外部人口影响的直接接触来自北方。 用一个粗略的比喻,它们是前门的迎宾垫,可以防止尼日尔 - 刚果家园的其他地方变得泥泞。 解开边界地区人口的人口历史通常比在核心地区更难。
其他人口和地理特征缓冲了大多数非班图尼日尔-刚果语言使用者与东部人口的直接互动。 刚果丛林和班图人口似乎是南方的缓冲地带。
由于他们作为萨赫勒牧民的共同利益,亚非乍得语言民族(例如哈苏阿人)和尼日尔刚果语言民族之间出现了种族认同融合的现代趋势,这导致了更高的混合物比人们可能期望的要好。
* * *
埃塞俄比亚人口中几乎完全没有西非/班图人的成分令人惊讶。 虽然西南亚/莫扎比特的合并份额与我对埃塞俄比亚的预期差不多,但撒哈拉以南非洲的所有贡献都可以归因于尼罗河和桑达威的成分这一事实并非如此。 低分辨率的单亲标记并没有那么明确地排除西非/班图人在埃塞俄比亚的贡献,通常常染色体测量使人口看起来比单亲的更多而不是更少。
没有任何成分可以将说乍得语的民族(例如马达)与广义的西南亚裔/莫扎比特人或尼罗河或西非成分明显区分开来。
这似乎表明西非/尼罗河/西南部亚洲和莫扎比特人的鸿沟可能源于非洲深层的人口结构; 但是亚非语系没有一个单一的连贯的人口结构。 没有统一的单一成分将闪米特语族、柏柏尔语族、乍得语族和库什特语族联合起来,这与科伊桑语族、桑达维语族、尼日尔-刚果语族和尼罗特语族不同,这些语族各有一个清晰可辨的共同基因线,将这些语言的几乎所有使用者统一起来,在至少 K=12 的水平。
回应 onur 的评论没有。 3,遗传学似乎支持亚非语言扩张的理论,其中主要语言亚科(长期以来一直存在争议)之间的联系是文化性的,而不是由母语扩张造成的(尽管在一些亚语族中可以看到母语扩张)。 历史上的闪米特语沙特人、历史上的柏柏尔语莫扎比特人和说马达的乍得语之间几乎没有遗传重叠。
与埃塞俄比亚的埃塞俄比亚-闪族相关的西南亚裔的遗传贡献非常独特,尽管埃塞俄比亚内部的细分似乎表明,除了埃塞俄比亚-闪族的西南亚裔元素之外,在库什特族群中还残留着西南亚裔元素。 因此,埃塞俄比亚和历史上的科普特语系地区一样难以解析。
#4,谢谢你的评论。 我不太了解撒哈拉以南非洲人的民族志,所以我很困惑😉
埃塞俄比亚人口中几乎完全没有西非/班图人的成分令人惊讶。 虽然西南亚/莫扎比特的合并份额与我对埃塞俄比亚的预期大致相同,但撒哈拉以南非洲的所有贡献都可以归因于尼罗河和桑达威部分的事实并非如此。 低分辨率的单亲标记并没有那么明确地排除西非/班图人在埃塞俄比亚的贡献,通常常染色体测量使人口看起来比单亲的更多而不是更少。 “
虽然埃塞俄比亚存在归因于古代西非基因流的 mtDNA 单倍群(例如,mtDNA 单倍群 L2b),但它们足够古老,可以与西非谱系区分开来。 非洲之角缺乏西非/班图常染色体亲和力的原因是来自非洲其他地区的古老混合物已经被 Sandawe/Nilotic 集群充分描述,如果单亲标记是具有更高古代西非贡献的种群值得相信。
另一个原因是,班图人的影响力最近才传到东非其他地区,几乎不存在。 埃塞俄比亚没有任何单亲标记与班图人的扩张有关,与西非有关的 mtDNA 单倍群与班图人无关。 如果我没记错的话,在被抽样的许多埃塞俄比亚人中发现了这一规则的一个例外; 埃塞俄比亚南部各种样本中的 Y-DNA E1b1a 样本。 由于肯尼亚的临近,这些例外会存在于那里也就不足为奇了。
我认为北非/东非/西非肯定有一个通过绿色撒哈拉沙漠建立关系的基因。
也许莫扎比特人真的有点像“北方富拉尼人”。 它们不会作为自己的组成部分出现,因为它们是未混合的,而是因为在它们的混合物中(主要是西亚/埃及人),它们具有其他地方不存在的独特祖先种群(其他北非人和富拉尼人除外)。 我认为这可能是西撒哈拉难民人口。
此外,这个种群,或者作为祖先成分的混合种群,似乎可能在新石器时代早期迁移到伊比利亚,现在是这里的一小部分。 在我的分析中,这汇总为“尼罗河核心”,并且肯定与之相关,但更进一步。
尽管桑达维人的语言很像桑人,但他们在农业方面非常不寻常,也许他们部分来自东南部的绿色撒哈拉人口。
看来撒哈拉大泵不仅是将非洲人与世界其他地区联系起来的重要因素,而且是在非洲本身引发大量人口流动、交流和基因变化的机制。
尽管桑达维人的语言很像桑人,但他们在农业方面非常不寻常,也许他们部分来自东南部的绿色撒哈拉人口。
桑达维人从殖民时代开始定居和采用农业,具体来说是在 19 世纪后期(在此之前他们都是全职狩猎采集者),因此直接或间接受到西方的影响以及他们向农业和定居生活的过渡直到 1970 年代才完成,只是在坦桑尼亚政府强迫他们定居和采用农业的情况下。 尽管如此,他们仍然保留了大部分狩猎采集方式。
http://areainfo.asafas.kyoto-u.ac.jp/english/activities/fsta/17_yatsuka/root.html
''埃塞俄比亚人口中几乎完全没有西非/班图人的成分令人惊讶。 虽然西南亚/莫扎比特的合并份额与我对埃塞俄比亚的预期大致相同,但撒哈拉以南非洲的所有贡献都可以归因于尼罗河和桑达威部分的事实并非如此。 低分辨率的单亲标记并没有那么明确地排除西非/班图人在埃塞俄比亚的贡献,通常常染色体测量使人口看起来比单亲的更多而不是更少。”
大约在公元 1 世纪,班图人的扩张才到达肯尼亚。 那是比较新的。 班图斯河从未深入图尔卡纳湖和塔纳河。 因此,数千年来,非洲之角的人口在地理上与班图斯(Bantus)隔离良好。 与班图扩张相关的单倍群在非洲之角(图尔卡纳湖 - 塔纳河边界以北)也极为罕见。
因此,像 Hadza 和 Sandawe 这样的群体被认为是更古老的文化和遗传变异的遗物。 这可能就是为什么一旦你控制了明确的可能混合物(例如,富拉尼人),桑达维人比其他非洲群体更接近欧亚人。 或者,可能是由于从欧亚大陆回迁,Sandawe 人本身有一个较旧的混合事件......
自然地,与南部(科伊桑)或西部(尼日尔 - 刚果)非洲人相比,东非(如 Sandawe)的土著(前班图)人口在遗传上应该更接近欧亚人,因为我们知道非洲以外的人移民从古老的东非人(L3m 和 L3n)分支出来。
“自然,东非(如 Sandawe)的土著(前班图)人口在基因上应该比南(科伊桑)或西(尼日尔-刚果)非洲人更接近欧亚人,因为我们知道非洲移民从古老的东非人(L3m 和 L3n)分支出来。”
但由于土著南非人很可能来自土著东非人(http://mbe.oxfordjournals.org/content/early/2011/04/04/molbev.msr089.short),后者与欧亚人的接近可能表明移民是进入非洲而不是离开非洲。 欧亚人 > 东非人 (Maasai, Hadza, Sandawe) > 南非人 (San)。
我喜欢东非和中非的新石器时代扩张造成撒哈拉以南人口与世界其他地区人口不连续的观点。
但由于土著南非人很可能来自土著东非人(http://mbe.oxfordjournals.org/content/early/2011/04/04/molbev.msr089.short),后者与欧亚人的接近可能表明移民是进入非洲而不是离开非洲。
不,它没有说明非洲和欧亚大陆之间的迁移方向。 许多非洲以外的支持者长期以来一直认为东非是现代人类的家园,而更多的人认为西非人(包括来自任何地方的班图人)和南非人在基因上与原始欧亚人的距离更远,因此对现代欧亚人来说,比非班图东非人(即使我们排除闪米特人甚至亚非裔人士)是。
BTW,Hadza 的基因位置不清楚,有很多相互矛盾的结果。 他们极小的人口规模和瓶颈使问题更加复杂。
“与非班图东非人相比,西非人(包括来自任何地方的班图人)和南非人在基因上与原始欧亚人以及现代欧亚人的距离更远(即使我们将闪米特人甚至亚非人排除在外)也是如此。”
在南非科伊桑人的情况下,由于比东非人更基础,所以更遥远——这就是非洲以外理论的信条之一。 曾几何时,仅在东非发现的 mtDNA M1 被认为是非非洲大单倍群 M 中的基础分支。然后 M1 被证明是回迁的结果。 现在,至少从 Y-DNA 的角度来看,在科伊桑人中发现的 A 和 B 分支被认为来自东非。 因此,又一次“回迁”到——现在——南非。 我们当然可以将东非视为所有迁徙都发生在不同时间的地方,但是,在不同的人口情景下,非洲不是古老世系的避难所,而是各种世系的汇,而南非是更像是一个汇——距离欧亚大陆更远,因为它比东非更衍生。
我认为我们无法根据现有数据准确确定现代人类起源于非洲的哪个地区,如果他们确实起源于特定地区。 当前的非洲人口并不代表原始的现代人(他们可能生活在非洲和/或附近的某个地方),因为随着时间的推移,非洲的基因也发生了很大变化。
“我认为我们无法根据现有数据准确确定现代人类起源于非洲的哪个地方,如果他们确实起源于特定地区。”
按照同样的逻辑,我们无法确定人类起源于哪个大陆。 如果遗传学是告诉我们人类起源于非洲的工具,那么这个工具应该能够告诉我们他们起源于非洲的哪个部分。 如果减少多样性和连续瓶颈的原则在全球范围内有效,它应该有效在区域尺度上。 也许我们应该承认我们一定来自未知的土地。
按照同样的逻辑,我们无法确定人类起源于哪个大陆。 如果遗传学是告诉我们人类起源于非洲的工具,那么这个工具应该能够告诉我们他们起源于非洲的哪个部分。 如果减少多样性和连续瓶颈的原则在全球范围内有效,它应该有效在区域尺度上。
按照你的逻辑,如果我们能够检测到起源大陆,那么我们同时也应该能够检测到村庄规模的准确起源地理坐标(!),这当然是荒谬的。 所以这完全是一个尺度问题。 随着新数据的积累,我们对现代人类起源问题有了更深入的了解。
但由于土著南非人很可能来自土著东非人(http://mbe.oxfordjournals.org/content/early/2011/04/04/molbev.msr089.short),后者与欧亚人的接近可能表明移民是进入非洲而不是离开非洲。 欧亚人 > 东非人 (Maasai, Hadza, Sandawe) > 南非人 (San)。
南科伊桑人的可用完整基因组序列表明,与欧亚人相比,他们是迄今为止距离最远的非洲人群。 原始 SSA (x S-Khoisan) 和 -OOA 之间的分裂可能发生在原始 S-Khoisan 和原始 SSA (x S-Khoisan)+OOA 之间的分裂之后。
“原始SSA”
SSA 代表什么? 撒哈拉以南非洲? 如果是这样,那么我认为南科伊桑人在与其他撒哈拉以南非洲人分离后发展了他们的特殊性,而撒哈拉以南非洲人又保留了与欧亚人的亲和力。 这就是使科伊桑人与欧亚人处于更远距离的原因。 在过去的 200,000 年中,科伊桑人不太可能保持独立和孤立。 他们在语言、文化和生物学上都是完全现代的。 此外,在最近我和 onur 无限讨论的论文中,Hadza 在欧洲人(托斯卡纳人)的 Fst 中超过了南科伊桑。 因此,这可能会因不同的非洲和非非洲群体而异。
是的,这就是我的意思。 要么是南科伊桑人与古老的南非群体混合,后者不再以未混合的形式存在,增加了他们的遗传差异。
PCA 表明哈扎人在第一维度上比南科伊桑人更接近欧亚人,但 Fst 告诉我们他们并不接近。 然而,Fst 容易出现样本量偏差。 IMO,更好的方法是 ASD。
“要么是南科伊桑人与一个古老的南非群体混合,后者不再以未混合的形式存在,增加了他们的遗传差异。”
是的,这是可能的。
“Fst 容易出现样本量偏差。 IMO,更好的方法是 ASD。”
我很想看看 Fst 和 ASD 在非洲的结果有多么不同,其中包括一个 Hadza 样本。 Fst 与 ASD 距离方法的全局比较也很值得一看。 你有没有想到在非洲或世界上在 ASD 旁边做了 Fst 的论文等? 我所知道的是,小而孤立的人群拥有巨大的 Fst 是很典型的。 Hadza 的 Ne 比南非科伊桑人的 Ne 小得多。
将 Fst 与各种非洲群体的等位基因共享距离 (ASD) 分数进行比较确实会很有趣。 我没有任何来源 atm。 也许这是 Razib 进一步研究的一个想法。 ASD 工具是免费提供的。