如果您还没有阅读我的帖子 “走向亚洲的对立面”,如果您不熟悉东南亚大陆的历史,史前历史和人种志,那么这可能是个不错的时机。 在这篇文章中 我将关注东南亚大陆,以及它在遗传上与印度和中国之间的隐含关系,以及我们可以对人口统计学和历史做出哪些推断。 尽管我将在初步结果中涉及马来半岛,但我已从数据集中删除了印度尼西亚和菲律宾的样本。 这意味着在这篇文章中,我将不谈南洋人的传播。
我向您提出两个试探性问题:
–公元1000年之前东南亚大陆印度文化的传播与印度基因之间的关系是什么?
–公元1000年后东南亚大陆地区的泰族文化传播与泰族基因有什么关系?
上面的两张地图显示了东南亚大陆上的奥亚语和泰语的分布。 请注意,当您将两者合并在一起时,它们会覆盖东南亚大陆东部2/3的大部分地区。 进入中国的北部地区的奥亚洲语的支离破碎的性质,立即向我们暗示,过去该地区很可能会有一个连续的奥亚语言区域。 从the族的历史和神话中 我们知道这群人是在公元1000年左右从中国南部边缘迁徙而来的 当我们注意到中国南方仍然有泰族人时,这是显而易见的,并且从历史上可以证明,泰族人在当今泰国的扩张在一定程度上得到了证明。 在1000年至1500年之间,该民族进行了大规模的民族重组 湄南河流域。 这是人口替代,文化吸收或两者兼而有之吗?
第二,印第安人对东南亚大陆的影响是什么? 确定印度影响力的最简单方法之一是脚本。 缅甸文,泰文和柬埔寨文都源自 Grantha,是一种古老的泰米尔文字(东南亚岛屿的非伊斯兰文字,例如爪哇语和巴厘岛语,也源于南印度的前身)。 印度的宗教影响力也比北方更大,以南方的形式表现出来。 谢维特 印度教和斯里兰卡的上座部佛教。
我查看了三个数据集。 我将他们中的大多数从K = 2分配到K =12。这意味着我将所有个体都放入一个公共池中,并告诉ADMIXTURE程序来估算他们在K人口总数中的比例。 通过这种方式,我们可以大致了解人群之间的关系。 请记住,这些不一定是真实的总体,并且投入池中的变异的性质会极大地影响推断成分的性质。 我没有报告从数据集中提取的清晰,独特和客观的实体。 我们正在寻找取决于输入和参数的模式的人类可理解的解释。 他们在告诉我们一些真实的东西,但这不像测量落球的加速度。 就像描述球相对于一组不同参考对象的位置一样。 有一个具有特定位置的真实球,但是描述会根据您使用的引用而有所不同(例如,在对象A的左侧和对象B的下方,在对象C的右侧以及对象D的上方等)。
这是集合:
1)一个“大”集,其中包括大陆的泛亚人口,HapMap中的美国白人以及一些马来半岛群体。
2)一个“媒介”集,修剪了大多数北亚群体,马来西亚群体和美国白人。 因此主要是东南亚大陆,中国南部和印度。
3)一个“小”集合,该集合除去了许多东南亚人口,但保留了印度人口。 我故意让印度人重载这个场景,以研究在一些东南亚国家中印度人掺混的可能性。
一些注意事项。 泛亚数据集约有56,000个标记。 这是可以忍受的,但不是最佳的。 对于欧洲对印度对东亚对内格里托而言,这绝对足够了。 但对于区域内变化而言,最优值也不少。 因此,将其与一粒盐一起食用。 但是,由于我正在研究印度与东亚地区,因此我对与该数据集相关的发现颇有信心。 其次,白人美国人与泛亚人群的交汇点约为30,000个标记。 对于柬埔寨人来说,只有约22,000。 大约有100位美国白人,但只有11位柬埔寨人。 因此,请谨慎对待柬埔寨的结果。 最后, 请记住,祖先的成分是抽象的,可能暗示稳定和长时间混合的杂种种群是它们自己的独特成分,以及高度近交的分离株。
我将在下面显示三种分析和可视化。
1)ADMIXTURE条形图,显示特定祖先元素的组或个人的祖先比例。
2)跨祖先元素的Fst估计。 这是遗传距离的粗略总结。 我有时还会向您显示二维可视化,但是请记住,这会删除一些关系信息。 表格更准确,但可视化效果更易于阅读。
3)最后,我使用EIGENSOFT运行一些PCA。 这就是说,我采用了数据池,并允许程序提取出变化的独立维度。 我运行它,以便将其拉出前6个尺寸。 东西方始终是最大的倍数。 请记住,图未按比例绘制。
我还应该说,我所展示的K是在报告的种群中自交亚组开始分裂成自己的组成部分之前(在印度人中尤其如此)。
从头开始 我在泛亚数据集中注意到,某些团体,尤其是蒙斯和马来人,似乎显示出印度人的掺入。 我的问题是:这是真正的印度混合物,还是最近的欧洲混合物? 这就是为什么我拥有白人美国人的大型数据集的原因。 结果如下:
因此,孟和马利与西方欧亚元素的混合物似乎不太可能来自欧洲人。 相反,这与印第安人是一致的。 实际上,我非常有信心,它也不是西亚人,马来人也有可能,因为在这个规模上,这一部分往往与欧洲人保持一致。 最后,我要告诉你,孟和马来人的混合物是 相对 甚至。 换句话说,该群体的估计并不会因为一两个高度混杂的印第安人而发生变化,这对于我们来说是一个很好的判断 最近 通婚。 不是闻所未闻的。 马哈蒂尔·穆罕默德(Mahathir Mohamad) 祖父是喀拉拉邦穆斯林。
现在让我们看一下PCA。 我将关注维度1、2和3。请记住,这是遗传变异等级排序的三个最大维度。 在这些图中,一维是迄今为止最大的维数,至少是五分之一。 这是西方对东方的欧亚维度。
我已经强调了重要的部分。 两个笔记。 首先,我认为您确实看到了有关孟&马来人转向印度人而不是欧洲人的建议。 这与ADMIXTURE结果完全吻合。 其次,请注意,“印度新加坡人”的人口是异类的。 它主要是泰米尔人,但样本中显然还有其他印第安人,还有一些具有马来人或中国血统的人。
此外, 请注意,在ADMIXTURE结果中,泰族和壮族之间的相似性较高。 庄 是中国的第二大族裔,据说是泰族移民到东南亚大陆的原始人口。 在我继续之前,您应该对一些较晦涩的群体的位置和民族语言的亲近感有所了解:
地理位置 | 团队 | 语言组 |
泰国北部 | 锡 | 南亚 |
泰国北部 | 拉瓦 | 南亚 |
泰国北部 | 周一 | 南亚 |
泰国北部 | 帕隆 | 南亚 |
泰国北部 | 计画 | 南亚 |
中国南部 | Wa | 南亚 |
泰国北部 | 姚明 | 苗族(Mien) |
华南和泰国北部 | 苗族 | 苗族 |
中国南部 | 庄 | 大 |
泰国北部 | 卡伦 | 藏缅人 |
中国南部 | 吉国 | 藏缅人 |
这里未列出的一个方面是其中一些人口是否归类为“山地部落”。 孟族和赫丁族都是南亚大陆的,但前者在某种程度上类似于东南亚大陆上的希腊人,而后者则是一个部落隔离区,在泰国北部的山丘中得以保留。 希腊人,我的意思是星期一被缅甸的Bamar和泰国的Tai所同化或统治,但在这两种情况下,孟族都被赋予了东南亚印度文化的精髓。 从缅甸南部的伊洛瓦底江下游到泰国的湄南河下游盆地,孟星期一曾一度上升。今天的终点是曼谷。 相比之下,像赫丁(H'tin)和拉瓦(Lawa)这样的团体可能相对不受印度的影响。 苗族是东南亚的相对较新来的人,例如,这解释了他们作为泛灵论者的地位。 最后,您有类似Wa的小组,从技术上讲,它们甚至都不是东南亚的,但 ,那恭喜你, 南亚。 他们应该给我们一种不带印度烙印的南亚文化氛围。
让我们继续第二步,中等数据集。 我要删除白人美国人,马来西亚人和北亚群体。 现在,我包括柬埔寨人。
同样,星期一有印度成分。 柬埔寨人也是如此。 请记住,虽然其他所有人都有56,000个SNP,但柬埔寨人只有22,000个SNP,因此我们需要小心。 尽管您看到HGDP中的这一元素也运行良好。 也就是说,是印度的附属机构。 它在柬埔寨人中分布相对均匀,因此您不能将它归结为几个混血儿。 同样,您会看到壮族和泰族之间的相似之处。 主要区别在于,泰族似乎与各种东南亚群体混在一起。 这是意料之中的。 然而,令我惊讶的是,从这些结果来看,泰族人的扩张似乎在人口上占主导地位,而不仅仅是语言上占主导地位。 即使是曼谷的样本,这一点也很明显。 稍后对此进行更多讨论。
以下是推断的祖先群体之间的遗传距离。 标签给出了模态填充,然后给出了语言族:
吉诺·布尔曼 | 赫廷_奥地利 | 大 | 南亚人 | 帕隆_奥斯特罗 | 苗族 | |
吉诺·布尔曼 | 0 | 0.073 | 0.057 | 0.115 | 0.092 | 0.085 |
赫廷_奥地利 | 0.073 | 0 | 0.03 | 0.088 | 0.065 | 0.06 |
大 | 0.057 | 0.03 | 0 | 0.09 | 0.064 | 0.047 |
南亚人 | 0.115 | 0.088 | 0.09 | 0 | 0.117 | 0.117 |
帕隆_奥斯特罗 | 0.092 | 0.065 | 0.064 | 0.117 | 0 | 0.09 |
苗族 | 0.085 | 0.06 | 0.047 | 0.117 | 0.09 | 0 |
以下是一些可视化效果:
这是PCA:
在此图中,您会看到星期一和柬埔寨人再次向印第安人转移。 另外,请注意壮族和泰族大部分重叠得相当好。 y轴由南亚的山地部落,然后是藏缅部落组成,还有一个间隙,直到您击中Tai集群为止,该集群最终与Hmong合并。 就瑶族在the族和苗族之间而言,这里有合理的语言家庭亲和力。
最后,我们转到以印度为中心的运行。 我现在已经删除了很多东南亚团体。 一些山地部落显然是相对孤立的,因此在PCA上抛出自己的集群或分歧很容易。 这是遗传差异的作用,如果您与基因流相对隔离,则会形成遗传差异。 因为我删除了这么多人口,所以我只剩下三个K,然后才能使Qasi-Family聚类显示为K。 另外,我将向您展示柬埔寨人和孟人的个别柱状图,以说明印度成分不仅是孤立的外加剂实例:
在这种情况下,Fst很简单:
南亚 | 大 | 南亚 | |
南亚 | 0 | 0.028 | 0.084 |
大 | 0.028 | 0 | 0.085 |
南亚 | 0.084 | 0.085 | 0 |
是PCA 真 在这个过程中很有趣。 第一个不太特殊:
好吧,首先,由于这是印度的重点设置,因此您会看到,它超出了标准的东西方尺寸。 您有几个较低阶的维度将印第安人分开! 我以前曾假设,始终在HGDP中始终出现在柬埔寨人中的印度部分是具有深厚远古血统的“祖先南印第安人”的功能。 赖希等。 这个古老的人口可能与东南亚的许多族群有亲缘关系,因此柬埔寨人的残余集群可能已经是该族群深层冰河时期的一部分。 这些结果使我相信,这并不是那么简单的解释。 在此样本中,具有最高ASI的人群是部落人口Bhils。 在其中一个图中,您可以看到Bhils构成了分布的一端,而Gujarat Vaishyas则构成了分布的另一端。 显然,这是祖先北印度-祖先南印度的氏族。 星期一和柬埔寨人与市中心的偏离不大,向我暗示他们不太偏向ASI! 此外,分布的“中心”偏重于种姓南印第安人。 那么这是一个不错的解决方案,因为它与历史早期时期南印度特定影响东南亚的历史证据完全吻合。
这不是灌篮。 自混合以来需要时间的估计。 它应将ANI-ASI混合事件的日期定为最新日期,并且应与维吾尔族人处于同一范围内。 不幸的是,只有56,000个SNP,我不确定这个估计是否可行,但我会仔细研究。 此外,在东南亚,还需要对Y和mtDNA谱系进行更深入的调查。 他们可能表现出性别偏见的迁移。 我确实在寻找西欧亚大陆特有的SLC24A5变种,在南印度,这种变种不低于〜50%,但这不在泛亚SNP数据集中。 它在HGDP中,而11个柬埔寨人中没有一个。 这将倾向于ASI假设,但可以看到,西欧亚变体可能只有大约50%,而柬埔寨人不到南亚的10%,因此不会出现在22个基因中是完全不可信的副本(使用现实的假设,我发现N = 50的柬埔寨人不会找到SLC24A5的西欧亚副本)的概率约为11%)。
在这篇博文中,我没有为太庄关系投入太多的空间,因为在情节中很明显。 泰族显然已经转向了亚洲国家组织,但远没有我预期的那样。 实际上,从字面上理解ADMIXTURE组件,您可能会推断,在星期一和高棉语中掺入的泰语掺混物比其他方法要多! 当您认为泰国的人口几乎是柬埔寨的五倍时,这可能并不完全令人难以置信。 但是我读过的标准模型表明,泰族战士乐队征服了Mon-Khmer indigenes,并吸收了他们的许多高级文化。 就人口统计而言,这些结果很难与之相提并论。
我对发生的事情有一个可能的解释。 在过去的约1,000年之前,泰国大部分地区的人口可能并不太多,低地农业是由精英领导的。 大族可能带来了卓越的农业技术,因此进入了人口迅速向低地边界扩张的阶段,在孟买和高棉统治时期,低地边界是没有平行的。 换句话说,泰族的乐队很小,最初的数量是孟族和高棉族。 但是,通过有利的资源方向和将新的耕地优先分配给族裔群体,小的quickly族人口可能很快就会占领了先前的居民。 这是模型中概述的 伊斯兰教的兴起与孟加拉国的边界。 在其中,作者基本上认为,孟加拉东部人口稀少,直到大规模的穆斯林精英推动了开放农业疆界的项目。 被征召的农民要么是穆斯林,要么是改信伊斯兰教,因为与仍然是印度教徒的西孟加拉邦相比,农民的经济状况较为动荡,文化景观相对不稳定且动荡不安。 在这种模式下,孟加拉东部的伊斯兰化与当地部落的改建没有多大关系,而与孟加拉人的农业殖民地的人口快速增长有关,这是由农业项目,伊斯兰化的殖民地或从少数穆斯林那里获得的殖民地推动的。莫卧儿(Mughal)精英在西部地区进行农民耕作,目的是建立印度教上等种姓被边缘化的地区。 同样,泰族在东南亚的扩张可能已成为事实上的“空”态。 在孟和高棉的高级文化被吸收的时期,泰语在数量上可能是较小的元素。 当前比率是后来的社会和人口统计过程的函数。