Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
孟高棉

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

如果您还没有阅读我的帖子 “走向亚洲的对立面”,如果您不熟悉东南亚大陆的历史,史前历史和人种志,那么这可能是个不错的时机。 在这篇文章中 我将关注东南亚大陆,以及它在遗传上与印度和中国之间的隐含关系,以及我们可以对人口统计学和历史做出哪些推断。 尽管我将在初步结果中涉及马来半岛,但我已从数据集中删除了印度尼西亚和菲律宾的样本。 这意味着在这篇文章中,我将不谈南洋人的传播。

我向您提出两个试探性问题:

–公元1000年之前东南亚大陆印度文化的传播与印度基因之间的关系是什么?

–公元1000年后东南亚大陆地区的泰族文化传播与泰族基因有什么关系?

上面的两张地图显示了东南亚大陆上的奥亚语和泰语的分布。 请注意,当您将两者合并在一起时,它们会覆盖东南亚大陆东部2/3的大部分地区。 进入中国的北部地区的奥亚洲语的支离破碎的性质,立即向我们暗示,过去该地区很可能会有一个连续的奥亚语言区域。 从the族的历史和神话中 我们知道这群人是在公元1000年左右从中国南部边缘迁徙而来的 当我们注意到中国南方仍然有泰族人时,这是显而易见的,并且从历史上可以证明,泰族人在当今泰国的扩张在一定程度上得到了证明。 在1000年至1500年之间,该民族进行了大规模的民族重组 湄南河流域。 这是人口替代,文化吸收或两者兼而有之吗?

第二,印第安人对东南亚大陆的影响是什么? 确定印度影响力的最简单方法之一是脚本。 缅甸文,泰文和柬埔寨文都源自 Grantha,是一种古老的泰米尔文字(东南亚岛屿的非伊斯兰文字,例如爪哇语和巴厘岛语,也源于南印度的前身)。 印度的宗教影响力也比北方更大,以南方的形式表现出来。 谢维特 印度教和斯里兰卡的上座部佛教。


我查看了三个数据集。 我将他们中的大多数从K = 2分配到K =12。这意味着我将所有个体都放入一个公共池中,并告诉ADMIXTURE程序来估算他们在K人口总数中的比例。 通过这种方式,我们可以大致了解人群之间的关系。 请记住,这些不一定是真实的总体,并且投入池中的变异的性质会极大地影响推断成分的性质。 我没有报告从数据集中提取的清晰,独特和客观的实体。 我们正在寻找取决于输入和参数的模式的人类可理解的解释。 他们在告诉我们一些真实的东西,但这不像测量落球的加速度。 就像描述球相对于一组不同参考对象的位置一样。 有一个具有特定位置的真实球,但是描述会根据您使用的引用而有所不同(例如,在对象A的左侧和对象B的下方,在对象C的右侧以及对象D的上方等)。

这是集合:

1)一个“大”集,其中包括大陆的泛亚人口,HapMap中的美国白人以及一些马来半岛群体。

2)一个“媒介”集,修剪了大多数北亚群体,马来西亚群体和美国白人。 因此主要是东南亚大陆,中国南部和印度。

3)一个“小”集合,该集合除去了许多东南亚人口,但保留了印度人口。 我故意让印度人重载这个场景,以研究在一些东南亚国家中印度人掺混的可能性。

一些注意事项。 泛亚数据集约有56,000个标记。 这是可以忍受的,但不是最佳的。 对于欧洲对印度对东亚对内格里托而言,这绝对足够了。 但对于区域内变化而言,最优值也不少。 因此,将其与一粒盐一起食用。 但是,由于我正在研究印度与东亚地区,因此我对与该数据集相关的发现颇有信心。 其次,白人美国人与泛亚人群的交汇点约为30,000个标记。 对于柬埔寨人来说,只有约22,000。 大约有100位美国白人,但只有11位柬埔寨人。 因此,请谨慎对待柬埔寨的结果。 最后, 请记住,祖先的成分是抽象的,可能暗示稳定和长时间混合的杂种种群是它们自己的独特成分,以及高度近交的分离株。

我将在下面显示三种分析和可视化。

1)ADMIXTURE条形图,显示特定祖先元素的组或个人的祖先比例。

2)跨祖先元素的Fst估计。 这是遗传距离的粗略总结。 我有时还会向您显示二维可视化,但是请记住,这会删除一些关系信息。 表格更准确,但可视化效果更易于阅读。

3)最后,我使用EIGENSOFT运行一些PCA。 这就是说,我采用了数据池,并允许程序提取出变化的独立维度。 我运行它,以便将其拉出前6个尺寸。 东西方始终是最大的倍数。 请记住,图未按比例绘制。

我还应该说,我所展示的K是在报告的种群中自交亚组开始分裂成自己的组成部分之前(在印度人中尤其如此)。

从头开始 我在泛亚数据集中注意到,某些团体,尤其是蒙斯和马来人,似乎显示出印度人的掺入。 我的问题是:这是真正的印度混合物,还是最近的欧洲混合物? 这就是为什么我拥有白人美国人的大型数据集的原因。 结果如下:

因此,孟和马利与西方欧亚元素的混合物似乎不太可能来自欧洲人。 相反,这与印第安人是一致的。 实际上,我非常有信心,它也不是西亚人,马来人也有可能,因为在这个规模上,这一部分往往与欧洲人保持一致。 最后,我要告诉你,孟和马来人的混合物是 相对 甚至。 换句话说,该群体的估计并不会因为一两个高度混杂的印第安人而发生变化,这对于我们来说是一个很好的判断 最近 通婚。 不是闻所未闻的。 马哈蒂尔·穆罕默德(Mahathir Mohamad) 祖父是喀拉拉邦穆斯林。

现在让我们看一下PCA。 我将关注维度1、2和3。请记住,这是遗传变异等级排序的三个最大维度。 在这些图中,一维是迄今为止最大的维数,至少是五分之一。 这是西方对东方的欧亚维度。

我已经强调了重要的部分。 两个笔记。 首先,我认为您确实看到了有关孟&马来人转向印度人而不是欧洲人的建议。 这与ADMIXTURE结果完全吻合。 其次,请注意,“印度新加坡人”的人口是异类的。 它主要是泰米尔人,但样本中显然还有其他印第安人,还有一些具有马来人或中国血统的人。

此外, 请注意,在ADMIXTURE结果中,泰族和壮族之间的相似性较高。 是中国的第二大族裔,据说是泰族移民到东南亚大陆的原始人口。 在我继续之前,您应该对一些较晦涩的群体的位置和民族语言的亲近感有所了解:

地理位置 团队 语言组
泰国北部 南亚
泰国北部 拉瓦 南亚
泰国北部 周一 南亚
泰国北部 帕隆 南亚
泰国北部 计画 南亚
中国南部 Wa 南亚
泰国北部 姚明 苗族(Mien)
华南和泰国北部 苗族 苗族
中国南部
泰国北部 卡伦 藏缅人
中国南部 吉国 藏缅人

这里未列出的一个方面是其中一些人口是否归类为“山地部落”。 孟族和赫丁族都是南亚大陆的,但前者在某种程度上类似于东南亚大陆上的希腊人,而后者则是一个部落隔离区,在泰国北部的山丘中得以保留。 希腊人,我的意思是星期一被缅甸的Bamar和泰国的Tai所同化或统治,但在这两种情况下,孟族都被赋予了东南亚印度文化的精髓。 从缅甸南部的伊洛瓦底江下游到泰国的湄南河下游盆地,孟星期一曾一度上升。今天的终点是曼谷。 相比之下,像赫丁(H'tin)和拉瓦(Lawa)这样的团体可能相对不受印度的影响。 苗族是东南亚的相对较新来的人,例如,这解释了他们作为泛灵论者的地位。 最后,您有类似Wa的小组,从技术上讲,它们甚至都不是东南亚的,但 ,那恭喜你, 南亚。 他们应该给我们一种不带印度烙印的南亚文化氛围。

让我们继续第二步,中等数据集。 我要删除白人美国人,马来西亚人和北亚群体。 现在,我包括柬埔寨人。

同样,星期一有印度成分。 柬埔寨人也是如此。 请记住,虽然其他所有人都有56,000个SNP,但柬埔寨人只有22,000个SNP,因此我们需要小心。 尽管您看到HGDP中的这一元素也运行良好。 也就是说,是印度的附属机构。 它在柬埔寨人中分布相对均匀,因此您不能将它归结为几个混血儿。 同样,您会看到壮族和泰族之间的相似之处。 主要区别在于,泰族似乎与各种东南亚群体混在一起。 这是意料之中的。 然而,令我惊讶的是,从这些结果来看,泰族人的扩张似乎在人口上占主导地位,而不仅仅是语言上占主导地位。 即使是曼谷的样本,这一点也很明显。 稍后对此进行更多讨论。

以下是推断的祖先群体之间的遗传距离。 标签给出了模态填充,然后给出了语言族:

吉诺·布尔曼 赫廷_奥地利 南亚人 帕隆_奥斯特罗 苗族
吉诺·布尔曼 0 0.073 0.057 0.115 0.092 0.085
赫廷_奥地利 0.073 0 0.03 0.088 0.065 0.06
0.057 0.03 0 0.09 0.064 0.047
南亚人 0.115 0.088 0.09 0 0.117 0.117
帕隆_奥斯特罗 0.092 0.065 0.064 0.117 0 0.09
苗族 0.085 0.06 0.047 0.117 0.09 0

以下是一些可视化效果:

这是PCA:

在此图中,您会看到星期一和柬埔寨人再次向印第安人转移。 另外,请注意壮族和泰族大部分重叠得相当好。 y轴由南亚的山地部落,然后是藏缅部落组成,还有一个间隙,直到您击中Tai集群为止,该集群最终与Hmong合并。 就瑶族在the族和苗族之间而言,这里有合理的语言家庭亲和力。

最后,我们转到以印度为中心的运行。 我现在已经删除了很多东南亚团体。 一些山地部落显然是相对孤立的,因此在PCA上抛出自己的集群或分歧很容易。 这是遗传差异的作用,如果您与基因流相对隔离,则会形成遗传差异。 因为我删除了这么多人口,所以我只剩下三个K,然后才能使Qasi-Family聚类显示为K。 另外,我将向您展示柬埔寨人和孟人的个别柱状图,以说明印度成分不仅是孤立的外加剂实例:

在这种情况下,Fst很简单:

南亚 南亚
南亚 0 0.028 0.084
0.028 0 0.085
南亚 0.084 0.085 0

是PCA 在这个过程中很有趣。 第一个不太特殊:

好吧,首先,由于这是印度的重点设置,因此您会看到,它超出了标准的东西方尺寸。 您有几个较低阶的维度将印第安人分开! 我以前曾假设,始终在HGDP中始终出现在柬埔寨人中的印度部分是具有深厚远古血统的“祖先南印第安人”的功能。 赖希等。 这个古老的人口可能与东南亚的许多族群有亲缘关系,因此柬埔寨人的残余集群可能已经是该族群深层冰河时期的一部分。 这些结果使我相信,这并不是那么简单的解释。 在此样本中,具有最高ASI的人群是部落人口Bhils。 在其中一个图中,您可以看到Bhils构成了分布的一端,而Gujarat Vaishyas则构成了分布的另一端。 显然,这是祖先北印度-祖先南印度的氏族。 星期一和柬埔寨人与市中心的偏离不大,向我暗示他们不太偏向ASI! 此外,分布的“中心”偏重于种姓南印第安人。 那么这是一个不错的解决方案,因为它与历史早期时期南印度特定影响东南亚的历史证据完全吻合。

这不是灌篮。 自混合以来需要时间的估计。 它应将ANI-ASI混合事件的日期定为最新日期,并且应与维吾尔族人处于同一范围内。 不幸的是,只有56,000个SNP,我不确定这个估计是否可行,但我会仔细研究。 此外,在东南亚,还需要对Y和mtDNA谱系进行更深入的调查。 他们可能表现出性别偏见的迁移。 我确实在寻找西欧亚大陆特有的SLC24A5变种,在南印度,这种变种不低于〜50%,但这不在泛亚SNP数据集中。 它在HGDP中,而11个柬埔寨人中没有一个。 这将倾向于ASI假设,但可以看到,西欧亚变体可能只有大约50%,而柬埔寨人不到南亚的10%,因此不会出现在22个基因中是完全不可信的副本(使用现实的假设,我发现N = 50的柬埔寨人不会找到SLC24A5的西欧亚副本)的概率约为11%)。

在这篇博文中,我没有为太庄关系投入太多的空间,因为在情节中很明显。 泰族显然已经转向了亚洲国家组织,但远没有我预期的那样。 实际上,从字面上理解ADMIXTURE组件,您可能会推断,在星期一和高棉语中掺入的泰语掺混物比其他方法要多! 当您认为泰国的人口几乎是柬埔寨的五倍时,这可能并不完全令人难以置信。 但是我读过的标准模型表明,泰族战士乐队征服了Mon-Khmer indigenes,并吸收了他们的许多高级文化。 就人口统计而言,这些结果很难与之相提并论。

我对发生的事情有一个可能的解释。 在过去的约1,000年之前,泰国大部分地区的人口可能并不太多,低地农业是由精英领导的。 大族可能带来了卓越的农业技术,因此进入了人口迅速向低地边界扩张的阶段,在孟买和高棉统治时期,低地边界是没有平行的。 换句话说,泰族的乐队很小,最初的数量是孟族和高棉族。 但是,通过有利的资源方向和将新的耕地优先分配给族裔群体,小的quickly族人口可能很快就会占领了先前的居民。 这是模型中概述的 伊斯兰教的兴起与孟加拉国的边界。 在其中,作者基本上认为,孟加拉东部人口稀少,直到大规模的穆斯林精英推动了开放农业疆界的项目。 被征召的农民要么是穆斯林,要么是改信伊斯兰教,因为与仍然是印度教徒的西孟加拉邦相比,农民的经济状况较为动荡,文化景观相对不稳定且动荡不安。 在这种模式下,孟加拉东部的伊斯兰化与当地部落的改建没有多大关系,而与孟加拉人的农业殖民地的人口快速增长有关,这是由农业项目,伊斯兰化的殖民地或从少数穆斯林那里获得的殖民地推动的。莫卧儿(Mughal)精英在西部地区进行农民耕作,目的是建立印度教上等种姓被边缘化的地区。 同样,泰族在东南亚的扩张可能已成为事实上的“空”态。 在孟和高棉的高级文化被吸收的时期,泰语在数量上可能是较小的元素。 当前比率是后来的社会和人口统计过程的函数。

 

我目前正在阅读Victor Lieberman的权威 奇怪的平行卷:第2卷。 所以我对来自 BMC遗传学, 孟高棉语族群的遗传结构及其对泰国北部邻近泰族的亲和力,由指向 二烯 今天。 以下是结果和结论:

在种群中观察到很大的遗传变异(mtDNA和Y染色体分别约为80%和90%)。 孟高棉语族群之间的遗传差异比泰语族群高得多,尤其是在父系遗传标记上。 这两个主要的语言群体在遗传上是截然不同的,但仅占总遗传变异的一小部分(1%至2%)。 群体之间的遗传距离与他们的语言差异相关,而地理距离不能解释遗传差异模式。

...

在泰国北部,讲高棉语的人群彼此之间以及与Tai族相比,都表现出遗传差异。 两种语言群体之间不同的漂移效应和婚后居住模式解释了它们内部以及之间的遗传变异模式中很小但很重要的一部分。

在很多情况下,需要综合学者向我指出我之前意识到的事实星座的整体结构。 利伯曼的作品也是如此。 我知道,泰国人民的爆发是在过去的1,000年中发生的,在此之前,该半岛在西方的藏缅语人口和东方的奥亚语之间进行划分(后者在高棉语和英语之间进行划分)越南文)。 此外,据推测,藏缅语言本身在西部地区取代了亚洲亚洲国家(现代缅甸在孟邦的持续存在证明了这一点)。 记录中的内容 音量1 of 奇怪的平行 虽然那是 参与和同化泰国入侵的三个地理区域不同。 在中心,泰国人成功地统治了先前的团体并将他们的身份强加于该地区。 人们常断言,现代柬埔寨作为一个独立国家的存在是法国人从暹罗帝国的扩张野心给予它的保护的作用。 但是在东方,越南人几乎没有受到泰国人流浪的影响。 与中国一样,越南的泰国人被边缘化为“山区部落”。 最终,在西部,在成为缅甸的地区,泰国人没有占领文化制高点。 但是他们也没有像东方那样被绝对边缘化。 相反,the族成为缅甸景观的一部分,并融入了上座部佛教文化,但也是次要的 民族报 到缅甸多数人(以及Karens,Mons等)。

这与遗传学有什么关系? 可能什么都没有,什么都没有,而且所有答案都在两者之间。

东南亚大陆中部的民族语言认同发生了巨大变化,东部地区缺乏民族认同,西方国家处于等位地位,这应该很好地检验这种民族语言认同传播的性质的命题。 它是纯粹的构造,人口统计的替换,还是这两个参数的某种定量组合? 不幸的是 BMC遗传学 本文仅关注Y染色体和mtDNA,即父系和母系。 这些标记物很有用,但我宁愿看一下基因组的总含量。 尽管在泰国北部的一小部分地区,民族的覆盖面令人印象深刻。 空心圆圈代表孟高棉民族,黑暗的泰国民族。 孟-高棉语是假定的土著人,而泰国语是侵入性的。 至少在过去的1,000年中。

下面,我重新编辑了Y和mtDNA多维比例尺图。 Y在左侧,而mtDNA在右侧。 聚类模式显示了跨谱系的关系。 同样,空心标记代表星期一的高棉语群体​​,封闭符号代表泰国语。

由于本文是开放获取的,因此我邀请您阅读他们的解释。 我要说的是,泰国男性血统的聚类非常有趣,并且可以通过一组相关男性入侵该地区并从土著中吸取妻子的模型来很好地解释。。 相比之下,Mon-Khmer Y染色体谱系散布的更多,这可能是由于它们与历史上更远的共同祖先合并在一起的事实。 泰国人口入侵东南亚的人口特征可能是男性军乐队的迁徙。 在这些军人设法推翻先前命令的地区,例如东南亚中部地区,他们可能垄断了妇女的进入渠道,并进入了人口膨胀时期。

幸运的是,我们确实有一些厚标记常染色体数据。 在左侧,我已经编辑了 数字 由HUGO泛亚数据生成。 条形图在K = 14处。我切除了许多无关的种群。 条形图中的颜色对应于与更广泛的语言家族的关联。 所以红色似乎是南亚大陆的,而蓝色是泰国的。 从图中可以看出,华裔泰国人缺少红色的“高棉”成分。 有趣的是,东南亚高地的苗族人在文化上与低地的上座部佛教佛教文化相比处于边缘地位,它显示出与泰国和奥亚大陆群体截然不同的证据。 他们缺乏与岛屿东南亚人,马来人和台湾原住民的亲和力,这些人似乎在更广泛的南方华人中很普遍。 泰国的卡伦(Karen)可能是我们对缅甸的藏缅人最好的代理人,他们是南亚人之后的人,也早于泰国人。 根据这些数据,看起来克伦族人很难与南亚人区分开来,尽管与泰国人截然不同。

泛亚数据集还有很多不足之处。 东西方的覆盖面不多。 我怀疑东南亚会变得有些复杂,而从泰国的语言和基因之间的相关性推断得出的结论只能使我们走到现在为止。 但这是一个开始。 在 奇怪的平行 作者认为,东南亚大陆可以向我们介绍欧亚大陆的一般历史过程。 我希望并怀疑,它可以告诉我们关于其他地区随着时间的推移语言和基因之间相互作用的更一般的信息。

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”