Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
南亚遗传学

书签 全部切换变革理论添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

棕色 一段时间以来,我一直在研究1000个基因组南亚数据。 这是一个有趣的练习, 因为与其他南亚数据集不同,它是相对通用的,带有最少的种族/种姓标签。 这很重要,因为与1000个基因组所采样的其他人群不同,例如在非洲,欧洲和东亚,南亚数据显示的基因结构超出了他们的民族语言认同。 例如,在1000个基因组中的“泰卢固语”和“泰米尔语”数据都包含明显属于婆罗门的个体。 这是显而易见的,因为这些人位于南亚北部群体的边缘,而不是他们的民族语言同胞。 因此,结合使用Estonion Biocentre数据,HGDP以及一些朋友和我的家人,我对1000个基因组南亚人的划分比原始下载中的划分更为精细。

上面的PCA很难确定,因为我重新标记了太多的组。 但是我已经把谱系文件(删除了我的朋友)放在了新标签上 Dropbox。 我通过“ ANI-ness”将古茹拉提和旁遮普族的人口从数字上移到最低,例如,Gujurati_ANI_1是最高的ANI。 我分别标记了大量的Patel,因为它们很明显(Zack Ajmal发现Harappa项目的Patel恰好位于这群相关个人的中间)。 此外,泰米尔人,泰卢固人和孟加拉国人口中的某些人似乎被定为种姓或达利特人。 我把它们弄坏了。 我还删除了一些离群值(例如,泰卢固语中的一个人可能是种姓,一半是婆罗门,一半是非婆罗门,所以我删除了它们,而孟加拉国的一个人可能是孟加拉婆罗门或类似的东西)。

1000个基因组给我一些惊喜。 从拉合尔采样的“旁遮普语”非常多样。 许多人在HGDP中与Pathans聚在一起(顺便说一下,有两个Pathan聚类,因此我怀疑其中一个是“ Pathanized”,因此我删除了这些聚类)。 但是还有其他人,例如Punjabi_ANI_4,与更一般的南亚人没有什么不同。 我怀疑这些是 穆哈吉尔 或多或少地被种族融合的人(或1000个基因组刚刚将拉合尔的每个人都标记为旁遮普语)。 孟加拉人祖先非常同质。 与泰米尔人或泰卢固语人不同,下层种姓的人没有多少不同,婆罗门也不多(我找到了一个)。 在孟加拉国的样本中,有一些个体非常独特……他们与预定的种姓聚在一起,并且没有太多的东亚血统。 我相信,由于最近的事实,这些人在过去几个世纪中都是来自印度的移民,他们很可能仍是印度教徒,并保持种姓制(他们中的两个人有相邻的身份证,因此可能一起被采样了吗?)。

印度树3 右边是一个代表性的TreeMix(您可以看到其余所有内容 Dropbox)。 孟加拉国预定的种姓个体在印度北部达利特人Chamars旁边的树上。 1000个基因组中的泰卢固语样本与我从爱沙尼亚生物中心数据集获得的Velamas最相似。 Velamas是来自Andhra Pradesh的中间种姓,因此很可能代表了从1000个Genomes Telugus样本中取样的群体。 在大多数运行中,孟加拉国的样本在某种程度上接近Patels或Gujurati_AN_4,但具有丰富的东亚血统。 在我父母的PCA上,他们都是东孟加拉邦东部地区的科米利亚,是孟加拉国抽样调查中最东亚的国家之一。 我还计划了一个朋友,他的家人在西孟加拉邦有着很深的渊源,他们是Kayasthas。 您可以看到他正好在Bangaldeshis和其他南亚人之间。 这表明孟加拉国的东亚集团非常锋利。 它实际上并没有在该地区之外持续存在。 此外,这些数据似乎并未支持在南亚拥有广泛的南亚人血统的想法……只有孟加拉人和布卢索人(都具有东亚血统)已转向东亚人。 ANI-ASI直线对于其他所有人来说确实足够。

近亲1 最后,我想分析南亚样本中的近交。 我使用了plink的纯合功能默认运行。 原始结果在第一个Dropbox链接中。 我邀请您自己检查一下。 在左侧,您会看到整个基因组中以KB单位表示的纯合性总运行。 请注意,古茹拉提派特尔移至右侧,但它们的窗口狭窄。 相反,孟加拉国人在左边,但有一些离群的人。 帕特尔人是印度教的一族,因此很可能有很多中等长度的IBD道。 但是他们之间没有亲密关系的婚姻。 相比之下,孟加拉人似乎根本没有进行过许多内婚制,大概是因为他们是穆斯林,而据我所知,孟加拉国人中的种姓意识很弱(我的姓氏姓氏意识很模糊,但没有人真正在乎),但其中一些人是近亲之间的婚姻。

育种 第二个显示纯合运行的平均长度,因此对最近的近亲繁殖更有益。 您会看到泰米尔人的分布平坦,因为有很多人长期奔波。 表弟婚姻和叔叔侄女婚姻在历史上一直是南印度印度教徒的习俗。 旁遮普样品也具有长期的纯合性。 巴基斯坦的穆斯林与孟加拉的穆斯林之间的差异似乎是,中东表亲婚姻的模式在巴基斯坦人中更为普遍。 我不知道为什么会有这种区别。 而且,与南亚大部分地区的印度教徒不同,班加尔德斯人似乎没有什么群落一级的遗传结构。 的论点 孟加拉国边界上的伊斯兰教伊斯兰的力量在孟加拉国这一地区是由于其在穆斯林时期相对较新的定居和组织,而且它是一个非结构化的边境社会,这些遗传结果似乎得到了大致的支持。

我要注意的最后一件事是,我很感谢爱沙尼亚生物中心发布的原始数据,但是许多样本似乎显示出很少的族裔关联。 我不确定这是标签问题还是其他问题,但是我丢掉了很多人(例如,北方邦婆罗门州的北方邦婆罗门)。 但是对于南亚人来说,在使用该数据集时应保持谨慎,而无需仔细检查(相比之下,非南亚人从来没有从该数据集中引起我这个问题)。

无论如何,请下载 data 并在有用时使用它。 这些ID与您在1000个基因组和HGDP等中可以识别的ID相同。对于K = 4,我也将ADMIXTURE文件放在其中。

 
• 类别: 科学 •标签: 基因, 南亚遗传学 

绘图36
上图是我使用 1000 个基因组数据集生成的。 BEB = 来自达卡的孟加拉国人,STU 是斯里兰卡泰米尔人,ITU 是特莱古斯人,PJL 是来自拉合尔的旁遮普人,GIH 是古吉拉特人(在休斯顿收集)。 这些都是大类。 南印度的人口群体在种姓方面表现出一定的结构; 有一些婆罗门,还有一些达利特人。 对于偏向柬埔寨人的南亚人口来说,孟加拉人有着奇怪的连贯性。 古吉拉特人分为大量帕特尔人和其他不同群体。 令我惊讶的是,旁遮普语样本非常多样化。

NIHMMS137159f3 它在很大程度上概括了 2009 年论文的结果 重建印度人口史。 您在左侧看到的是“ANI-ASI 斜线”。 基本上,南亚人,从普什图人一直到帕尼亚人,都与西亚和欧洲人群存在一定的遗传距离。 第二个因素是一些群体,例如孟加拉人和许多南亚部落,转向了东亚人。 关于南亚民族起源的一个古老假设是,他们是侵入次大陆的“高加索人种”人群的杂种,而次大陆最初居住着“澳大利亚人种”。 Malala_and_Freida_Pinto_meet_the_Youth_For_Change_panel_cropped_frida 尽管这些术语有些陈旧,但总体要点似乎在视觉上很清晰:一些南亚人的外表看起来接近地中海人,而其他人则很难与澳大利亚原住民区分开来(至少表面上如此)。 当然,我们大多数人都处于中间位置。

NIHMMS137159f4 的洞察力 帝国 该群体将使用安达曼岛民作为原始土著人口的代表,并推断上面提到的混合物由非常类似于西欧亚人的人口、祖先北印第安人(ANI)和更接近东欧亚人的土著群体组成,尽管分歧很大,但南印第安人祖先(ASI)。 因此,ANI-ASI 系。 使用最密切相关的群体来推断“幽灵群体”,即使没有“纯”ASI 群体作为他们可以判断的参考,他们也能够推断出混合比例。 像这样的聪明策略很重要,因为用于推断混合事件(或缺乏混合事件)的参考群体会强烈影响结果的性质。 使用简单的 PCA 或基于模型的聚类(如 ADMIXTURE),可以将南印度达利特人和部落人口确定为“最纯粹的”原住民。 ~100%“澳大利亚人”。 其他群体可以被建模为“高加索人种/澳大利亚人种”混合体。 但这种模式并不令人满意,因为即使是低种姓的南印度群体也比你想象的更倾向于西欧亚人。

他们利用称为 F4 比率的统计数据估计,西北印度人口中 ANI 的比例为 65-75%,南印度低种姓人口中的 ANI 比例为 15-30%。 2013年的一篇论文, 印度最近人口混合的遗传证据,试图推断一个混合时期(距今两到四千年),以及一些印欧语族中可能存在的次生脉动。 今天,当你注意到大多数印度群体与科蒂亚斯发现的古代高加索狩猎采集者有着最独特的漂流轨迹时,这是有道理的,但少数人(主要是上层种姓)更接近辛塔什塔草原文化。

我发布这篇文章是因为人们问我有关一篇论文的情况 ArsTechnica, 种姓制度在印度人的基因组中留下了印记。 其实2009年Reich的实验室论文已经得出了这个结论。 那么这篇论文的独特之处在于它的主要发现是什么? 我们将从摘要开始, 印度现存人口历史的基因组重建揭示了五个不同的祖先组成部分和复杂的结构:

印度拥有世界六分之一以上的人口,但在全基因组变异研究中代表性不足。 我们的分析表明,印度大陆人口有四个主要血统,这与之前推断的两个血统相反。 我们还表明,(i)安达曼和尼科巴群岛人口有一个独特的祖先,很可能也是大洋洲人口的祖先,以及(ii)现存的大陆人口无论祖先如何广泛混合,很快被同族通婚所取代,特别是在印欧语系的上层种姓中, 大约70代以前。 这恰逢一些相关社会文化规范的制定和采用的历史时期。

因此,值得发表这篇论文的两个主要结果是,他们假设了四个祖先群体,而不是两个,而且其中一些的混合比 2013 年的论文要晚得多。 我认为第一个结论是错误的,第二个结论则过于有力。

作者非常重视他们拥有新样本这一事实。 而且他们的SNP芯片密度很高。 但我很困惑为什么他们没有整合 1000 个基因组数据。 论文是2015年1000月上旬收到的,我知道当时已经有来自上述所有组的XNUMX个基因组数据了。 他们甚至懒得使用 HapMap GIH 样本,而这个样本肯定就在那里!

2016年01月26日23:29:21的屏幕截图 右图显示了他们结果的关键。 他们使用 ADMIXTURE 将印度数据集的祖先分成四个集群。 通过交叉验证,他们确定 K = 4 是适合其数据的最佳参数。 其中两个群体先前已为人所知:ANI 和 ASI。 但他们还发现,分别存在“南亚祖先”和“藏缅祖先”簇,分别为 AAA 和 ATB。 因为他们没有使用完整的标签,所以可能很难破译,但他们用这个情节来断言 Khatri 种姓的人几乎 100% ANI,而 Paniyas 几乎 100% ASI。 此外,他们还发现了几个几乎 100% AAA 和 100% ATB 的组。

长期读者会看到眼前的问题:你不能像这样使用 ADMIXTURE! 无法保证 100% 的组 x 实际上是在这样的情况下 x 对应于现实中存在的真正离散的祖先群体。 也就是说,这类模型推动一定数量的祖先群体,并迫使个体成为这些群体的组合。 该模型受到您为生成结果而放入其中的数据的限制。 例如,如果我选取维吾尔族和欧洲人,并执行 K = 2,则维吾尔族可能会形成一个集群,而欧洲人可能会形成另一个集群,达到 100% 的水平。 但我们从历史和其他方法论中知道,维吾尔族是一个最近混合的群体(在过去的2,000年之内)。 然而,如果你告诉程序包假设维吾尔人和北欧人的 K = 2,那么它会将这些人分为两个不同的组。 事实上,结果告诉您一些关于数据中个体的相关性的真实且重要的信息……但它不一定告诉你任何关于 真实 人口史.

有相当多的证据表明 南亚 印度的人口不是土著,也不是纯种。 本文的一个主要漏洞是完全没有承认南亚语系在东南亚更为常见,而且它们似乎侵入了印度。 如果是这样,现代南亚民族可以被认为是移民与当地基础的复合体。

ATB 元素仅存在于南亚部落和孟加拉婆罗门中。 这是合理的,因为这两个群体都与东亚群体有联系。 南印度的婆罗门吸收了当地德拉威血统的一小部分,而孟加拉的婆罗门则吸收了藏缅语和南亚语,这在孟加拉本土人中含量较高。

再说一遍,ADMIXTURE 并不一定会给你真正的人口组合! 事实上,人口在某种程度上是一种社会结构,因为它们实际上正在瓦解遗传变异,而遗传变异是特定人口和谱系历史的结果。 这里提供的“ANI”组是一个神器。 卡特里人并不是与祖先 ANI 类似的纯粹人群的代表。 Paniya 并不是 100% ASI,他们只是 最先进的 ASI。 比霍尔人并不是 100% 的南亚人祖先,他们只是最独特的南亚人。 贾马提亚人并非纯种藏缅人; 大多数东北部部落都有一定的 ANI/ASI 混合体。 他们只是最有藏缅血统的人。

他们不应该如此依赖 ADMIXTURE,而还应该利用 D-stats 和 f-stats(对漂移不太敏感)以及 TreeMix。 我认为这很快就会表明其中一些“纯粹”群体是混合的。

其次,还有混合时间的问题。 他们获得的值低于 2013 年的论文。 为什么? 因为他们使用的源群体(可能还有方法)与早期的工作有些不同。 老实说,如果其中一些种群是化合物,那么在混合事件中将它们用作理想化的供体是没有意义的。 在我看来,AAA 区域绝对是人工制品,因为这些区域是先前混合事件的结果。

最后,作者提到了一条走出非洲的“南方路线”,并暗示南亚航线是由此抵达的。 今天最好的研究表明,南亚民族在大约 4,000 年前的农业浪潮中扩张,其起源地位于中国南方的高地。 因此,它们不是原始的。 对南亚语系地图的简单检查就会迫使人们提出迁徙方向的问题。

我本着发表后审查的精神提出这一批评。 也许作者会澄清,因为我真的对他们提供的解释感到困惑。

 
• 类别: 科学 •标签: 南亚遗传学 

在过去的几年里,我一直在不断努力 当代遗传变异的模式可能仅与过去遗传变异的模式紧密相关 (尽管早在2004年,亨利·哈彭丁(Henry Harpending)就曾警告过我)。 学者以此预设为前提的一个主要原因是公理,我们看到的我们周围的大多数变化都是在最后一次冰河期(距今约20万年前)期间结晶的。

在某些情况下可能是正确的,但我怀疑在大多数情况下是正确的。 仅在今天,我才被指出这个问题的经典案例。 一位读者使我想起了今年春季的一篇简短论文,该论文试图确定在安达曼岛民的昂热部落M31a1中占主导地位的mtDNA单倍体的起源。 这是一个有趣的问题,因为一些研究人员过去似乎合理地提出,安达曼群岛的这些土著人民代表了第一波“走出非洲”的后代,他们走上了快速的“流浪汉”之路。 了解他们遗传学的关键可能会为“走出非洲”事件解锁关键。 还是我们想到了。 看来人类进化的过去比我们想象的要复杂得多。

纸在 遗传与基因组学杂志. 线粒体DNA证据支持旧石器时代晚期印第安人原住民安达曼人的东北起源:

鉴于地理位置最接近安达曼群岛,建议将缅甸作为安达曼土著居民的发源地。 但是,由于缺乏该地区的任何遗传信息,这使得无法解决有关安达曼土著人起源于印度大陆还是缅甸的争议。 为了解决这个问题并更好地了解原住民安达曼人的起源,我们从缅甸各地采集的31个线粒体DNA(mtDNA)中筛选了单倍体M31(安达曼特有的血统M1a32从中分支出来)和M846。 结果,鉴定了两个属于单倍型M31的缅甸个体,并对这两个样品的整个mtDNA基因组进行了完全测序,这证明在缅甸观察到的两个M31个体很可能是由于印度东北种群最近的基因流动所致。 由于在缅甸没有观察到单倍体M31或M32的根系,因此缅甸不太可能成为原住民安达曼人的起源地。 为了进一步了解这一独特种群的起源,进行了详细的系统发育和系统地理学分析,方法是包括另外7个新的完整mtDNA基因组和113个M31 mtDNA(精确定位于南亚人群),结果表明,安达曼特有的M31a1实际上可以追溯到印度东北部。 时间估算结果进一步表明,安达曼群岛很可能是印度东北部现代人类通过陆桥将安达曼群岛和缅甸连接在最后冰河最高峰(LGM)之上的,该情景与语言和语言证据相吻合。古气候研究。


从地质学上讲,除非安达曼岛民的祖先具备完备的开放海洋旅行者的经验,否则几乎可以肯定他们是通过缅甸抵达的。 他们所做的推论是基于东南亚大陆在过去10万到20万年的遗传稳定状态中可能存在的错误公理。 。 过去它在遗传上还不稳定 1,000年! 作者自己对结论中发生的事情提供了很好的解释:

总之,通过广泛研究大量缅甸样本,我们的结果未能在缅甸找到任何单倍型M31的根系,因此表明原住民安达曼人不太可能起源于缅甸,地理上最接近安达曼群岛的地区。 尽管如此, 我们仍然不能完全排除缅甸的母系景观很大程度上是由邻近地区的新石器时代移民所塑造的可能性,解决这一问题需要对缅甸人口进行广泛的研究。 重要的是,我们的进一步分析有力地表明,安达曼语的M31a1起源于印度东北部。 因此,看来具有M31a根型的古代人可能是通过陆桥将安达曼群岛和LGM周围的东南亚大陆连接起来的,以安达曼群岛为生。

答对了! 昂热至少似乎已在安达曼群岛居住了约一万年。 因此,在考虑他们的祖先是仅居住在Mynamar还是跨越南中国海直至印度河等问题时,我想对自己的祖先做出过多的推断时要谨慎。 但是,我认为我们可以同意他们是通过Mynamar抵达的,并且曾经居住在缅甸。 mtDNA谱系在相当大的样本中之间的脱节强烈暗示,自从安达曼岛民的祖先与大陆亲戚分道扬Myanmar以来,缅甸的人口结构发生了重大变化。 这是有道理的。 几乎可以肯定,缅甸在过去的某个时候被讲奥亚语的人群所控制。 这些被布尔曼人,卡伦等人的祖先所取代。在某种程度上,甚至这些人也已被新来者(例如Shan邦)流离失所。 但是, 南亚人本身可能来自更远的东部. 如果(并且如果是)一个非常重要的例子是,安达曼岛民的近亲是那些早于南亚国家组织的人口,那么就会出现两种语言上的转变,并可能伴随着重大的基因更新。 实际上,我怀疑过去可能会有更多的过渡。 我怀疑至少在过去的四万年里,狩猎采集者的数量是否像我们有时假定的那样静止不变。

这是单倍频率的表格:

这是M31的分支如何相互关联的:

正如您可能对孤立的岛屿人口所期望的那样,Onge分支与众不同。 使用分子时钟模型,他们提出了一系列的融合,可以追溯到最后一个共同祖先(由上图中的星代表)。 我会引用它们:

先前的工作表明安达曼群岛的“最近定居点”大约在24±9千年前(kya)(Barik等,2008)。 鉴于基于更新的单倍群M31的系统树的时间估计结果,将 M31a世系分化后将发生安达曼群岛(19.82± 10.01 kya)和M31a1发散之前(7.96±3.91 kya) (表2)。 有趣的是,通过研究整个核基因组也获得了相似的结果,其中安达曼原住民被认为起源于南亚次大陆的潜在祖先种群,然后在大陆上与ASI-ANI混合(​​Reich等人。 ,2009)。 值得注意的是,为海军研究办公室准备的Global Ocean Associates的古气候证据和数据表明,东南亚的海平面比今天120 kya之前的今天低约17 m,而安达曼海的大部分海平面为超过今天的100 m,支持了在最后一次冰河期(LGM)(22-18 kya)之前,连接安达曼群岛和东南亚大陆的潜在陆桥的存在([Voris,2000年; [Clark等人,2009年] )。 考虑到单倍体M31内不同子小节的有趣分布模式和时间估计结果,原住民安达曼人的祖先很可能是在LGM被海平面淹没之前通过陆桥到达了LGM附近的安达曼群岛的。 LGM峰值之后的水平。

他们的数字与Reich等人的结果大致一致是正确的。 安达曼岛民与“南印度祖先”的分歧距今已有数万年的历史。 但是,我想知道,如果他们的期望间隔超过10年,它们是否会带来估计的增值。 话虽这么说,但很显然,这个mtDNA估计至少与下限挂钩。 正如文化人类学会告诉我们的那样 安达曼岛民早于农业就从南亚大陆分化出来。 而且,“北印度祖先”的到来。

最后一点, 如果安达曼岛民比现在的南亚大陆人早20万年来到这里,他们就不会对“非洲以外”的人有太多的了解。 他们不是“活着的化石”,坦率地说,他们可能会认为这是愚蠢的。 直到最近,“ Out of Africa”事件在最近的大约50万年前就固定了下来。 即使假设这个日期,安达曼岛民也比其祖先离开非洲的地点更接近现在。 但是现在,人们越来越倾向于接受这样一种可能性,即“非洲以外”事件在任何情况下都不会被如此割断和干dried,它的历史可以追溯到大约100,000年。 如果是这样的话,我们可能只需要承认,如果我们无法掌握古代DNA的样本,那么对古人类学的细致理解将永远难以捉摸。 即使在前农业人口中,人口遗传转换也可能太多,以致于最麻痹的人群不能被巧妙地分开,以至于无法阅读过去的茶叶。

 

扎克·阿杰马尔(Zack Ajmal)现在拥有 Harappa祖先项目的50多名参与者。 这不包括HGDP中的巴基斯坦人口,古吉拉特人的HapMap,SVGP中的印第安人。 尽管如此,所有这些样本仍几乎无法覆盖南亚的广大地区,即印度恒河平原。 这是Zack到目前为止提交的样本的来源:

  • 旁遮普邦:7
  • 伊朗:7
  • 泰米尔语:6
  • 孟加拉:5
  • 安得拉邦:2
  • 比哈尔邦:2
  • 卡纳塔克邦:2
  • 加勒比印第安人:2
  • 克什米尔:2
  • 北方邦:2
  • 斯里兰卡:2
  • 喀拉拉邦:2
  • 伊拉克阿拉伯人:2
  • 英印:1
  • 罗马:1
  • 果阿:1
  • 拉贾斯坦邦:1
  • och路支:1
  • 未知:1
  • 埃及/伊拉克犹太人:1
  • 马哈拉施特拉邦:1

同样, 请注意,印度人口最多的两个州北方邦(约200亿)和比哈尔邦(比哈尔,约100亿)的代表性不足。 尽管如此,该项目已经产生了一些有趣的收益。 在下面,我用个人标签重新编辑了Zack的静态图片(尽管请访问他的网站以获得更动态的内容)。 我用红色指针突出了我自己和我的父母。

左边是我从扎克(Zack)的屋子里拼接出来的一组地块和桌子。 各个 职位。 您需要知道的是,在K = 12时,我使用了Zack给出的各种假定的“祖先种群”标签,这些标签是从他的ADMIXTURE运行中得出的。 到目前为止,我还展示了哈拉帕祖先项目的参与者及其种族标签。 最后,在中间sm一下,您会看到 第一时间 值,由最小的人口差异标准化。 因此,框中的值代表了 行和列中的推断祖先人口 (我也四舍五入,因为我不想给人以过分精确的印象)。 最后一点很重要,它们不在实际人口之间的人口距离度量之间。 相反,它们是跨生成的群体的等位基因频率的距离测度,这些频率来自于您将ADMIXTURE约束的参数,以及您首先放入算法中的遗传变异。

从广义上讲,跳到您身上的第一件事是“巴布亚人”与其他所有人之间的高距离值。 这是有趣的。 实际上,巴布亚人与其他祖先人口之间的遗传距离大于假定的非洲人口与除巴布亚人以外的其他非非洲人之间的遗传距离。 这说明您需要非常谨慎地从这类程序中做出明确的推断。 有趣的是,巴布亚人遗传距离最小的人群是“南亚人”。 这意味着什么? 我认为这有一个简单明了的解释。 我相信,南亚集群是一个混杂的复合体,正如 重建印度历史,并且大洋洲的人口代表了长期居住的南亚群体的相对“纯粹”的东部扩张,这些群体通常被与侵入该地区的其他群体混合而淹没。 这也解释了一个事实,柬埔寨人与各种南亚人口共享了这个巴布亚人的某些组成部分。 最后,我不会做太多事情,但是在ADMIXTURE中,我完成了HGDP数据集中真实的巴布亚人口,分为两个祖先部分,其中从巴基斯坦到柬埔寨的南亚群体仅占一个。 请记住,大洋洲最初是由美拉尼西亚人和澳大利亚人定居的,大约40-50,000年前,看起来像是美拉尼西亚人和澳大利亚原住民 到这个初始时期的日期。 因此,南亚人与巴布亚人之间的联系可能很古老,并且这两个群体在很长一段时间以来一直很独特。

对于到目前为止接受调查的南亚人来说,什么都没有 奇怪。 随着南亚和东亚的发展,南亚元素趋于增加。 这就是您所期望的。 而且,跨越西亚和中亚大部分地区的巴基斯坦/高加索地区是将伊朗样本与南亚样本联系起来的要素。 伊朗人所占的南亚部分很少。 如果南亚元素仅仅是混合人口的结果,并且从中衍生出这一祖先群体之一的“祖先南印度人”通常不在巴基斯坦西部,那么这是有道理的。 正如您所期望的那样,孟加拉语中东亚成分丰富,但在来自南亚北部边缘的许多人中,东亚成分的比例却有所不同。 显然,您越往西走,“东方”元素就越有可能成为土耳其人,而越往东(在某种程度上朝南),则起源越可能在南部。 其他大多数模式都是您所期望的。 最后,我想指出的是,我怀疑Zack是第一个发布某人祖先分数的人。 游泳 使用SNP芯片标记的种姓。

这都是 有关参与的详细信息.

 

上周我宣布了 哈拉帕祖先项目。 现在有自己的 专用网站, http://www.harappadna.org。 此外,它有自己的 往脸书页面。 为了让Zack获得自己的网址,他还需要大约10次“点赞”,所以请喜欢! (如果您是如此处决)最后,从我听到的第一波 23andMe 假期销售结果将于本周上线。 实际上,我购买该套件的亲戚之一正在处理中,所以我知道我们很快就会在系统中有很多新人。

说到人们,最后我听说扎克得到了十几打回应。 这足以开始一轮试运行, 但显然他需要更多人。 更重要的是,这里的目标是获得更好的人口覆盖率。 我们从直觉上也从最新研究中了解到的一件事是,南亚存在着许多由社区构成的区域内人口变异。 换句话说,一个30人的样本中,您来自3个不同社区的10个具有地理和种姓多样性的社区,现在比来自印度哈里亚纳邦的300吉特人有用得多。 为哈里亚纳邦赚取300吉特会很有趣,因为这将为您提供一个了解社区内部差异的窗口,但是您对整个南亚人所做的推论的收益却在不断减少。

如果您知道有人做过23andMe测试,并且有来自南亚,伊朗,缅甸或西藏的杰出血统, 请转发该网址 哈拉帕祖先项目. 如果您是23andMe的成员,并且参与了论坛,那么在此项目上发表评论主题可能会很有用,因为与您共享基因的人们会看到它。

 

价格_图1我已经提出了一些 职位 警告读者要小心,不要将PCA图与真实的遗传变异相混淆。 PCA图只是捕获大型数据集中的变化并提取出独立维的方法。 它擅长检测人口子结构 因为变化的最大组成部分通常会跟踪 人口差异之间,由相关的等位基因频率集组成。 请记住,PCA图通常是由两个最大的变异维度构成的,因此,它们将仅从历史分离和进化事件产生的种群之间的这些相关等位基因频率差异中得出。 观察到非洲裔美国人沿着欧洲人和西非人之间的轴心分布。 因为我们知道这是两个父母家庭,所以这是完全合理的。 人口差异之间的差异(例如, SLC24A5达菲)是可以产生独立尺寸的原材料。 但是,在较小的比例尺上必须谨慎,因为图上元素的分布作为主要成分的函数对输入的生成尺寸的变化很敏感。

我可以举一个具体的例子: 我自己。 我给你看了我的 23andMe血统 昨天画。 我没有向您展示我在HGDP数据集上的立场,因为我已经与其他人共享了基因,并且我不想采取步骤来显示其他人的遗传数据,即使是删除也是如此。 但是,我重新编辑了一些“演示”屏幕截图,并将其放置在情节中的位置,以说明上面我在说什么。 第一个镜头是我在HGDP数据集中遗传变异的第一和第二主要成分的二维图上的位置。


gsa-lillymendel世界毫不奇怪,我在中亚/南亚地区。 但是,您可能会感到惊讶的是,我不在南亚地区,而是在中亚地区。 在中亚地区,有维吾尔族和哈扎拉族。 这是两个杂种种群,是西方和东方欧亚元素的混合体。 维吾尔族人可能是塔里木盆地城市的伊朗人和托卡利人的印度裔欧洲人之间,以及后来的讲土耳其语的定居者之间交融的结果,这些定居者是在第一个维吾尔帝国的扩张和崩溃之后到达的(当前的维吾尔人与古代维吾尔人之间的历史联系充其量是微妙而复杂的)。 哈扎拉人是较新的人口,很可能是13世纪到达的蒙古士兵与Zagros和Khyber Pass之间的土著妇女,波斯人,土耳其人以及各种印度-伊朗族群之间通婚的产物。 具有讽刺意味的是,我位于哈扎拉(Hazara)集群的边缘,因为几乎可以肯定他们的一部分部分是成吉思汗(Naghis Khan)的后裔,而我的姓氏是汗。 但是我知道我的Y染色体谱系是R1a1,在中亚和南欧亚大陆非常普遍,而根本不是蒙古族。

23andmepczoom放大! 现在,我们将输入数据集限制为中亚/南亚组。 首先,看一下卡拉什。 他们很奇怪,这不足为奇,他们是巴基斯坦的一个近亲山区群,他们没有采用伊斯兰教。 巴基斯坦塔利班看起来像 当我们说话时结束他们。 我真的更希望它们只是从此缩放视图的数据集中抛出,因为在这种细粒度的比例上,我认为它们根本没有增加太多。 它们只是长期内婚法可以对您的等位基因频率产生影响的一个例子。 更大的图景是巴基斯坦人口与中亚人口之间的轴心。 观察到我已经换了职位。 考虑到全球范围内的遗传变异,我和中亚人聚在一起,而现在我是南亚人聚类的2/3。 我将告诉您,我现在已经与该次大陆各地的大约50个南亚人共享了“基因”,在23andMe图中,它们几乎完美地覆盖了南亚人。 我将标签放在近似种族语言的位置。 我是一个离群人。 23andMe告诉我,我是43%的“东亚人”。 典型的南亚地区在10%至30%之间。 我的第一个假设是,我有很多 古代南印度,在他们的算法中只是显示为东亚。 考虑到这一点,我尝试与许多南印第安人和东印第安人共享,并发现了两个有趣的观点。 首先,南印度人似乎不高于东亚地区的30-35%。 另一方面,孟加拉人更多是东亚人,孟加拉国的东亚人多于西孟加拉人。 我的孟加拉文样本量很小,因此请谨慎使用。 其次,PCA地块将南印第安人牢牢地置于南亚地区,但孟加拉人却朝着我自己的位置前进。 这再次表明,不同的方法告诉您的内容略有不同。 PCA只是变化的一小部分,但它在人口差异之间提供了非常有用的信息。 孟加拉人和南印度人在祖先绘画中具有相同的“东亚”分数,但在PCA上的立场始终是不同的,孟加拉人更接近东亚人。 另外,我要描述的是这个缩放图中有一个波斯民族,它们位于Balochi附近。 但是在全球范围内,它们处于欧洲集群的边缘。 另一个说明元素的位置对输入数据敏感,这是因为如何生成尺寸。

布莱恩·贝廷格(Blaine Bettinger)启发了我发布这篇文章的他,以他的祖先画作讲了一个故事,这幅画似是而非。 我能说什么首先,我的非洲血统不到1%。 这可能是噪音。 但是,我确实注意到,在与我共享基因且非洲血统少于1%但非0%的那些人中,具有穆斯林名字的南亚人更加丰富。 就像穆斯林南亚人有不平凡的西亚血统一样,我怀疑我们中的许多人通过同样的动力拥有撒哈拉以南非洲血统。 随着穆斯林的到来,撒哈拉以南的非洲士兵在整个南亚都非常重要。 孟加拉国甚至有一段统治时期 阿比西尼亚统治者。 但是对我来说,更大的问题是东亚部分。 这是一个 发表于4年前:

journal.pgen.0020215.g005

该图显示了Fst值,将印度裔美国人与欧洲人和东亚人进行了比较。 Fst测量等位基因频率的总体差异之间的差异,在这种情况下,等位基因为207 插入。 看看孟加拉人。 这些都是 西部 我相信孟加拉人的东亚成分较少,但即使到那里,东亚人的等位基因频率差异也接近欧洲人。 阿萨姆人说的语言与孟加拉语非常接近,他们很相似。 阿萨姆邦由 藏缅人 已有近600年的历史了。 来自孟加拉西南部的Oriya讲者与东亚人相距较远。 随着一路向南,向东,向西和北向,与东亚人的距离增加了。 这并不奇怪,但是很容易确认。 遗传距离随着向南移动而增加,这一事实意味着,对于南亚东北部的东北亚,您需要通过“古代北印度人”和“古代南印度人”的双向混合来使模型复杂化。 与这两个因素相邻的是东亚元素,在尼泊尔的印度-雅利安民​​族中也很明显。

谢赫·哈西娜(Sheikh Hasina),哈利达·齐亚(Khaleda Zia)当然,任何知道孟加拉语的人都不会对他们祖先的东亚成分感到完全惊讶。 左图是过去二十年来一直主导孟加拉国政治的两名女性的头像,Khaleda Zia和Sheik Hasina。 他们都是孟加拉人,但他们看上去确实不一样,而且我知道很多人看起来像彼此(或两者兼而有之)。 我的家人来自孟加拉国最东端的地区之一, 特里普拉邦。 事实上,我已故的外祖母在特里普拉(Tripura)住了一个童年(她年轻时几乎被特里普拉(Tripura)疯狂的大象的马哈拉尼(Maharani)踩死了!)。 小时候,我曾经看过父亲上大学时的黑白照片,我很好奇照片中间是那个看起来亚洲人的年轻人。 原来是我父亲! 有时,我们的期望会影响我们对人的看法。 我从没想过父亲会像亚洲人那样成熟,但其他人却告诉我他确实还在表现这些。

孟加拉人如何成为这种特殊混合物的问题仍然存在。 我认为,最合理的情况可能是将传统的村到村通婚和按距离隔离以及移民主义的某些组成部分综合起来。 Chakma等部落在历史时期已离开缅甸。 这 查克马 孟加拉国的人现在说孟加拉语,而不是他们祖传的汉藏语。 我相信孟加拉人的一个重要部分是祖先,他们是部族人,他们的宗教身份转变为印度教或伊斯兰教的身份(在查马克(Chakma)中是从宗座佛教,在印度教则是万物有灵论)。 加洛斯 在他们基督教化之前)。 但是南亚东部与东南亚大陆相邻,因此有理由认为,随着时间的流逝,持续的基因流动还将把东亚等位基因引入孟加拉语基因库。

图片来源:TopNews.in

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”