ADMIXTURE与MDS,可视化只是可视化
搜寻文字 区分大小写 确切的词 包括评论
列表 书签
迪内克斯又做了一个 运行他的数据,K = 64。他发布了一个 巨大的情节 具有两个最大的变化维度。他还发布了一份附带的电子表格,其中包含 Dodecad 样本所在的坐标。所以我很快就找到了自己的定位。在此之前,我想我应该重新发布我自己、古吉拉特人单体型图、北坎纳迪样本和 HGDP 维吾尔人之间的比较。这是来自 Dodecad 的 ADMIXTURE 中 K = 10 的情况。
好的,考虑到这一点,这是完整的 MDS,其中包含遗传变异的两个最大组成部分。我添加了大标签。另外,单击图像可查看更大的文件,以便您可以阅读小标签。
让我惊讶的一件事是欧洲人等人口众多的群体紧密聚集。东亚人和约鲁巴人的样本并不能代表他们的宏观区域,所以这是有道理的。但十二祖先计划中有很多西欧亚群体,因此那里的亲和力仍然引人注目。我基本上属于“北坎纳迪”群体,有点偏向维吾尔族。在 Dienekes 帖子主要关注的聚类中,我也属于北卡纳迪聚类。有趣的是,在扎克对南亚数据集的初步运行中,我有 71% 的人支持尼泊尔人,29% 的人支持部分新加坡印度人(我认为其中大多数是泰米尔人)。请注意,维吾尔族距离北坎纳迪很近,尽管事实上维吾尔族在地理上更接近巴基斯坦人口。它只是向您展示当您将大量遗传变异放入锅中,然后关注变异的两个最大组成部分时会发生什么。欧洲和东亚之间的轴线由南亚人跨越。但一些南亚群体,例如北卡纳迪样本,具有血统成分 有些 与西欧亚人相比,他们更像东亚人,因此他们在二维图上更接近东亚人。这就是迪内克斯所说的“南欧亚”元素,它几乎到处都被西欧和东欧亚元素所淹没。
这是该情节南亚地区的特写。你可以看到维吾尔族与北坎纳迪样本有多接近,我与北坎纳迪样本有多接近。但北坎达的两个样本不在 MDS 的簇内。我认为他们是具有很多紫色祖先成分的人,迪内克斯称之为“西亚人”。古吉拉特语和北卡纳迪语群体之间的个体可能是带有轻微橙色“东亚”成分的个体。这让你了解我的情况。如果你把我祖先中的橙色成分去掉,我可能会属于古吉拉特族群。我被“拉”到了北坎纳迪集群,因为我的人口比例与此成正比。 东亚 祖传成分。 MDS 图并没有“错误”,它正确地可视化了数据 我们自己直觉处理信息的能力所施加的限制。 但如果没有 ADMIXTURE 图,您可能会对我的人口分配做出错误的推断。有了这些信息,可能的假设是我来自与东亚群体(例如尼泊尔人、阿萨姆人或孟加拉人)有互动的阈限人群。
请注意: 从样本中删除非洲人,或者可视化不同维度的组合,也肯定会消除这种情况下的混乱。但同样,这些步骤需要人类理解这些技术向您呈现的内容。
(从重新发布 探索/ GNXP 经作者或代表的许可)
关注@razibkhan
拉齐布
非常有趣,因为这符合我的猜测,即北卡纳迪人的神秘部分可能是南岛人——并且取决于人们如何定义南岛人及其扩张——慢船/快船等——他们可以被视为东南亚人+ 大洋洲或至少岛屿东南亚
你不会碰巧知道北卡纳迪样本的详细来源是什么,是吗?
不,但不管它是什么,它只是其他印度样本的一小部分——所以 IMO 一定是由于:
1. 距离隔离——像撒丁岛——这不太可能
2. 宗教/种姓隔离——如亚述
3. 古代基板
4. 印度的外源性——如南岛语混合物
我猜有#1 或#2 的可能性——如果样本全部来自一个孤立的山村或宗教少数群体,但通常在研究不足的地区,样本来自城市,很少来自农村地区。
我知道有几个人做过三维MDS图并且看过一两个。 我很想知道人们如何看待它们的用处。