Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
印度遗传学

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

ncomms9912-f451IZQjMbVL._SX346_BO1,204,203,200_更新: 这是您必须阅读的帖子, 关于印欧语系早期扩张的说明。 该帖子的日期为XNUMX月中旬,并且在很多方面与我的想法相似。 但是,作者拒绝了两次浪潮模型,因为第一次浪潮具有悠久的历史,并且似乎给出了一种平衡的观点,即农业在南亚的发展中主要是土著,而不是主要是外生事件。 相反,他们表明,南亚有多支印支雅利安人的浪潮,草原文化是平行的,印支-伊朗人则产生了脉搏。 乌尔海默特。 我对基因解释的主要批评是 根据我的理解,LD衰减方法似乎捕获了自混合开始以来的最后一个混合事件和/或低估了时间。 因此,尽管我接受了距今约4,000年的重大混合事件,但下面的我自己的模型表明较旧的事件发生在数千年前。

话虽如此,我在这一点上已经将我的观点更新为相当不确定的。 如果总体上说,一种模型(如博客文章中提出的模型)比下面的模型更接近真相,我不会感到惊讶。 我的推理与论证的细节关系不大,而与权威有更大的关系。

1)撰写上述文章的个人对历史遗传描述结果的掌握程度相当。

2)但是,与我相比,个人对考古学和语言学的理解要高得多。

忽略任何参数的详细信息, 先验 我发现上述个人比我能更好地评估有关南亚考古学的可能性。 阻碍我前进的主要因素是,我现在发现他们的模型比我的模型更可能是关于LD和 滚下 方法。 但是我肯定将不确定性从〜25%增加到〜50%,并且将余额分配给两个模型(或其某些组合)。

结束更新

有时,您会看到碎片,不同的线程中的事物,只是事后看来才成为焦点。 在这篇文章中,我将对从南亚印度河谷遗址的遗骸中得出的结果做出预测,这将证实过去一万年来有两个主要的人口脉动从西北进入次大陆。 与第二波相比,第一波是主导波 基因,开始于 梅赫尔格尔 9,000年前。 它的起源地在西亚的高地,在高加索和肥沃的新月之间。 第二波浪潮虽然在文化上留下了印记,因为它与印度-雅利安人有关,并且很可能最终源自跨伏尔加草原社会。 几乎在每个南亚土著居民群体中都发现了前人的遗传特征,因为他们与与大洋洲和欧亚大陆的远亲息息相关的一个根深蒂固的当地人融合在一起。 简而言之,后者是“南印第安祖先”(ASI),前者是“北印第安祖先”(ANI,请参见 重建印度人口史).

截图-01022016-09:46:36 PM 上图是从 上古旧石器时代的基因组揭示了现代欧亚大陆的深厚根源 (开放获取),发现来自高加索北部地区两个样本的古代DNA代表了人口的代表,这是大约4,500年前席卷北欧的草原人的起源。 它显示了如何最好地将当代人口建模为参考人口之间的混合事件。 您会看到,大多数南亚群体被很好地建模为“高加索猎人-采集者”(CHG)和另一个标为“南亚”的元素之间的混合物,因为它主要限于次大陆。 但是,还有更多! 在辅助材料中,统计数据表明,尽管大多数南亚族群在高质量CHG序列中具有更多的潜在混合体,但Kotias(一个未指定的古吉拉特族和Tiwaris子集)与这些亚种共享更多的漂移。 阿凡纳塞沃 这种文化在5,500到4,500年前的中亚阿尔泰地区蓬勃发展。 我们有足够的古代DNA可以推断出Afanasevo与 亚姆纳文化,他们就在伏尔加河和第聂伯河之间,在最西边。 这 蒂瓦里 是整个印度北部存在的上流社会种姓组织。 卡拉什(Kalash)指出,第二波分量显然是西北地区最强的 与玛尔塔分享如此多的漂泊。 在随后的基因浪潮涌入草原人群,使欧洲农民和猎人与采集者的祖先混种在一起之前,他们的北欧祖先(ANE)的比例比任何当代北欧人都高。 他们对次大陆西北边缘的南亚群的贡献解释了那里存在高比例的ANE的原因。

最后需要提到的是 Z93 R1a1a分支在整个南亚大部分地区都可以找到。 尽管它与较高的种姓和印度-雅利安语的人口相关,但它并不排斥它们。 实际上,在印度南部的原住民部落中,人们发现了相当一部分人,他们在传统上从事原始的砍伐和烧毁农业,并从事广泛的狩猎和采集。 古代DNA来自 斯布鲁纳 欧亚大陆中部地区的文化在埋葬的男性中产生了Z93。 如今,该小圈子在该地区相当罕见,它继承了如今携带R1b的群体,如今在整个西欧占主导地位。 细节待定,但是,我相信这与印度-雅利安人有关,但比印度-雅利安人更为广泛。 超越群体的移民是男性的外来群体,他们融入了土著社会,通常担任主要父系成员的精英职位。 如果少数人的男性后代(而非女性)的生殖适应性存在强烈偏见,那么随着时间的推移,他们的Y染色体可能比其总基因组贡献更为普遍(以说明我的观点)。我在说, 最近的一篇论文 澳大利亚土著居民的研究表明,在过去56年中,有200%的Y染色体从欧洲人渗入!)。

综上所述,这意味着印度次大陆的德拉维语可能是西亚农民带来的(也许证实了与 埃兰?)。 因此,印度河流域文明的语言很可能是德拉维人的一种形式。 要考虑的另一个方面是,没有任何南亚人口缺乏这些西亚农民的基因烙印。 像在欧洲一样,通过西北部进入次大陆的农民人口似乎完全边缘化了大多数猎人,NIHMMS137159f3 收集器组,无论如何在数量上都不那么重要。 但是,为什么所有南亚族群也都具有深深扎根于次大陆的ASI血统? 就像在欧洲一样,次大陆边缘的最初的农民种群与当地的狩猎采集者混合在一起,产生了一个合成种群,随着时间的流逝,它的文化工具包逐渐发展为更适合南亚地区。 一旦发生了重要的文化适应,合成人就经历了大规模的人口扩张阶段,超出了边缘地区的定居区。 西亚 气候参数可用于几乎全部文化移植的初始阶段。 与欧洲一样,不断扩大的南亚农民群体吸收了猎人-采集者的底物,在人口增长的浪潮中积累了越来越多的ASI分数,因此产生了在遗传分析中明显的ANI-ASI谱系。 ASI之所以出现在阿富汗的Pashtuns之类的群体中,可能是由于这样一个事实,即我们现在所说的“南亚人”或“印度人”或“病魔”等综合人口展现出足够的文化霸权和影响力,可以深入到阿富汗。现代阿富汗的高原,并影响了阿富汗的前伊斯兰和东伊朗人民(也请注意,在伊斯兰早期,印第安人在阿富汗城市中作为奴隶非常普遍)。

我现在花时间写这篇文章的原因是 看来印度河谷时期古代南亚基因组的出版迫在眉睫。守护者 在30月XNUMX日, Rakhigarhi:印度小镇可能揭开印度文明的神秘面纱:

一个人脱颖而出:印度文明的人到底是谁? 可能会在几周内做出回应。

“我们的研究无疑将提供答案。 这将是一个重大突破。 我感到非常兴奋,”印度考古学家Vasant Shinde说道,他领导了拉基加里(Rakhigarhi)当前的发掘工作,该发掘工作于1965年被发现。

Shinde的结论将在新的一年中发布。 它们基于源自四个骨架的DNA序列 八个月前发掘了其中的两个人(一个男人,一个女人和一个孩子),并核对了来自次大陆,中亚和伊朗各地成千上万人的DNA数据。

他们看上去有点像最近的美国小姐!

他们看上去有点像最近的美国小姐!

我预测Y染色体单倍群将为H或J2。 两者在印度南部的德拉维语族中都很常见,在西亚的某些地方也可以找到。 我预测这些与Kotias共享基因流的人,以及 不能 与中亚欧亚群体。 我预计这些人不会因ANE祖先而变得丰富。 我预测这些人将在现代印度人口(可能是M)中存在mtDNA谱系。尽管在南亚一个地区发掘,如今乳糖酶的持久性(LP( 常见,没有一个人携带赋予LP的共同衍生的欧亚单倍型。 他们将隔离为的派生变体 SLC24A5. 在PCA地块上,这些人将与非婆罗门上等/中等种姓的南印度人口聚在一起,例如安得拉邦的Reddys。

请注意: 两年多以来,朋友告诉我,人们正在努力对印度河​​谷的个体进行排序和分类。 但是我没有内幕消息。 如果您是媒体领域的人,并且可以尽早获得帮助,请随时向我发送PDF文件,并了解我将遵守禁运规定! (如果您没有将PDF发送给我,我非常有信心,我已经达到了您要维护的主要主题)

 
• 类别: 科学 •标签: 印度, 印度遗传学 

致癌基因

解析2 在下面的评论中,我对印度的帕西人发表了评论。 大约1000年前从伊朗抵达印度,约占南亚地区的25%。 我的意思是说,他们的祖先大约有75%是伊朗人(大概是波斯人),其中有25%来自他们所居住的南亚人口。 但是我对此感到含糊不清,因此我决定检查科学文献。 不幸的是,在前沿基因组学方面,该领域还没有做很多工作。 但是粗略的检查表明,印度妇女已经通过mtDNA大量迁移到了帕西族。 在右图中,您可以看到“ PA”(Parsis)与伊朗群体相比有很多“南亚” mtDNA谱系。 这主要由以下地区的南亚分支机构组成 单倍群。 当查看Parsis携带其mtDNA的单倍型时,它会立即跳出来。 我发现Y染色体上的染色体较少,无论如何,它们在区分南亚人和伊朗人方面的信息较少(这两个区域之间的mtDNA差异要大得多),但我确实发现Parsis可以建模为 100%伊朗人在其父系血统中。 这可能有点夸张,但是作为一个程式化的事实,我认为这已成为问题的核心。

但是真正有用的是常染色体结果。 那些很难找到。 诺亚·罗森伯格(Noah Rosenberg)2006年的论文 印度遗传分化 使用微卫星的确有一个Parsi样本。 如果您看一下结果,Parsi确实看起来像是南亚人,大致相当于Pathans,后者是巴基斯坦的一个伊朗语团体,具有很强的南亚亲和力。 但是样本集并不包括来自伊朗境内的任何伊朗团体,而是来自阿拉伯世界或高加索地区的中东团体。 没有这样的参考人群,很难衡量帕西关联性。

最后的希望是。 原核DNA 多年来一直在收集结果,我希望样本中包含Parsi。 只有一个。 我拿了帕尔西(Parsi),然后将此人与伊朗的各种团体和一些精选的印度团体进行了比较。 以下是混合结果(仅显示相关的祖先簇):

种族 南印度人 俾路支 高加索 欧元 地中海 亚洲西南
库尔德(伊拉克) 0 29 40 4 6 16
伊拉克阿拉伯人 1 11 30 0 5 44
库尔德(伊拉克) 1 26 43 5 5 16
库尔德(伊拉克) 1 28 43 5 5 13
库尔德(伊朗) 1 29 41 7 6 12
土耳其库尔德·扎扎(Kurd Zaza) 2 23 43 6 6 13
伊朗的 2 24 43 5 7 13
库尔德(土耳其文) 2 26 46 6 6 10
伊朗的 2 28 47 7 3 10
伊朗的 2 29 43 3 8 8
伊朗的 2 30 44 4 2 13
伊拉克阿拉伯人 3 20 39 0 10 19
伊拉克库尔德库尔曼吉 4 21 41 4 7 15
来自土耳其的库尔德人 4 24 41 4 8 12
伊朗的 4 26 39 7 7 12
伊拉克库尔德·耶兹迪 4 26 39 4 7 13
伊朗的 4 27 41 5 6 11
伊朗的 4 29 37 4 4 12
伊拉克阿拉伯人 5 19 38 5 7 19
伊拉克库尔德库尔曼吉 5 24 39 4 8 13
伊朗的 5 25 38 5 7 12
库尔德(伊拉克) 5 27 41 5 5 14
伊朗的 6 25 37 6 6 12
库尔德(费利) 6 25 38 3 7 14
伊朗人霍拉萨尼 8 29 35 9 2 11
阿富汗普什图人 14 32 25 12 3 4
普什图(坎大哈) 15 34 25 10 0 5
孟买帕西 16 28 28 5 4 12
阿富汗普什图人 20 36 17 11 0 5
阿富汗普什图人 21 33 17 9 2 2
普什图族 21 35 18 10 0 5
古吉拉特·霍贾(Gujarati Khoja) 28 47 13 7 0 1
古吉拉特人Patel穆斯林 34 32 13 3 3 6
古吉拉特人逊尼·沃拉·苏蒂 35 34 13 5 2 4
古吉拉特甘奇 38 42 5 9 3 0
古吉拉特(Gujarati Vaishnav Vania) 45 36 4 4 1 3
古吉拉特·贾恩(Gujarati Jain) 46 36 6 4 0 0
古吉拉特·瓦尼亚(Gujarati Vaniya) 52 37 2 6 0 1
古吉拉特语 53 43 0 0 2 0
古吉拉特语 56 39 0 0 2 0

关键是要专注于“南印度”血统。 尽管在某些伊朗团体中发现了这一点,但一旦您经过Pathans等团体,它就会迅速消失。 帕西族人中有16%是南印度祖先。 看看这些伊朗人,您可能会说您可能期望从这一人口中获得5%。 问题是印度的人口来源是什么? 这些之间有很多差异。 但是,如果您将南印度裔人口的50%用作南印度人,那么您将得到:

(50%)*(0.25)+(5%)*(0.75)= 16.25%

因此,就帕西西族人而言,至少从这个人那里获得了大约25%的收益,这对于他们选择了多少“本地”南亚血统而言可能是正确的。 由于此时它们在遗传上相当均一,因此N = 1可能足以得出结论。 如果有人发现任何不同,我会很好奇。

 

南亚的大多数人讲两种语言中的一种,即印度-雅利安语和德拉威语。 这两者并不是特别密切相关。 Indo-Aryan 是一种印欧语言,这在大量明显的语言中是显而易见的 同源 与其他印欧方言。 我的英语流利程度最低,仅是印欧语系中最东端的,而英语流利度则是英语中最西端的一种。 伤口, 男子马努沙, 鼻子NAK)。 与我相反,德拉维语是独特的,因为口音和节奏显然是南亚语言,但它们完全不可穿透(尽管从德拉维语到印度-雅利安语有很多借词)。


但是在这篇文章中,我将探讨那些讲印度本土的亚奥古语族(即蒙达族)的人们的遗传关系。 一直以来,传统的问题一直是奥亚语言是否来自印度,还是来自东南亚。 更准确地说,蒙达文化是传入印度还是蒙达文化是印度东部原始的亚洲-亚洲领土的遗迹?

作为背景,我认为让读者了解越南和 Munda 之间的领土很可能在大约 2,000 年前由南亚方言主导,这一点很重要。 缅甸人和泰国人都是从中国南方进入历史时期,推翻了盛行于东南亚低地的孟族或高棉文化。 在缅甸人和泰国人的情况下,新来者将他们的语言强加于土著人口,但大体上从土著人那里吸收了大部分高雅文化元素(例如上座部佛教)。 泰国和缅甸的君主制直接借鉴了高棉和孟的受印度影响的政体。

东南亚地区最近流行的南亚语种广泛分布和种类繁多,表明它们有可能从该地区衍生而来,但这并不是该模式偏爱的确定点。 但是现在还有其他的遗传研究途径。 几年前 纸出来了 据报道,将他们与东南亚联系起来的蒙达人的Y染色体谱系在东南亚更为多样化。 这很重要,因为人口的扩张和迁移往往会通过更大的遗传漂移来使血统趋于同质,而“源”人口更有可能维持多样性。 此外,也有证据表明 雷达 它具有最近在整个东亚出现频率增加的特点。 这似乎使蒙达到达全新世,而不是更新世。 最后,有些男性血统与东南亚有一定的一致性,但是女性血统完全是土著。 这是对移民模型的经典期望,在移民模型中,由于这些群体缺乏妇女和儿童的流动性,他们对男性有强烈的偏见。

我决定使用 爱沙尼亚生物中心数据集,以及HGDP和HapMap。 对于那些对技术细节感到好奇的人,我将爱沙尼亚生物中心标记物套装从约600,000万减少到了130,000万。 我还通过Plink在–geno 0.01和–mind 0.80上放置了样本,以获取高质量的个体和良好的标记覆盖率。 为了明确起见,我重命名并合并了原始数据集中的一些总体(例如Chamars = UP_Dalits)。 我运行了初步的MDS,以确保数据不奇怪,然后将其检出。

所以做我跑的分析 混合树。 我以华裔美国人作为外来人口,并希望进行5次迁移,并且还试图通过查看1,000个SNP的窗口来校正剩余的LD。 您可以在下面查看我的第一幅情节。

我要重点关注的是从柬埔寨人流向蒙达的基因流。 如果Munda入侵南亚,这正是人们所期望的。 更有趣的是,观察到没有基因流 来自南亚群体的缅甸人,尽管他们离南亚更近了! 那时,这可能是在深挖历史的东西。 蒙达族与其他南亚族群较早分离的事实也与“混合”或“结构”柱状图的结果保持一致:蒙达族的南亚血统相对来说是没有融合的。

接下来,我想更多地关注东部人口流动。 因此,我删除了很多使我的基因流动边缘不堪重负的西方群体。

在这种情况下,再次存在来自柬埔寨结的粗糙区域的基因流参数。 也许更奇怪的是,从同一地点进入缅甸人的基因流参数非常强大。 基因 藏缅语和孟语(奥亚语)之间的混合人口。

我当然不准备断言“案件已结案”。 但是似乎我们需要再次将概率转移到侵入性假设上。

图片来源: 维基百科上的数据

 

开普彩色家庭


我有 提到开普彩色 南非之前在此博客上。 从文化上讲,他们在语言上是南非荷兰语,在宗教上是荷兰改革( 可能相关 马来角(Cape Malay)团体是穆斯林,尽管传统上也是南非语(Afrikaans)。 但是从种族上来说,他们是一个非常多样化的群体。 通过这种方式,他们可以比喻为黑人,约占西非的75%和北欧的约25%,祖先所占比例的差异使得约10%的祖先在欧洲约占50%或更多。 海角彩色虽然要复杂得多。 他们的某些血统几乎可以肯定是班图非洲人。 此元素与美国黑人的西非亲和力有关。 而且,它们具有北欧元素,很可能是通过荷兰人,德国人和休格诺特定居者(主要是男性)进入的。 但是Cape Cape Colors也为他们的遗传遗产做出了其他贡献。 首先,他们有科伊桑人的血统,无论是布什曼人还是科伊人。 这在他们的口头记忆中是众所周知的。 好望角的腹地超出了班图(Bantu)农业工具包的生态范围,因此当欧洲人到达时,该地区仍由科伊桑人(Khoisan)统治。 但是,还有其他有关亚洲血统的建议。 马来人角的存在源于荷兰人带来的穆斯林奴隶,他们信奉伊斯兰教,这暗示了与东南亚海洋人口的可能联系。 最后,还有印第安人。 在文化记忆中,这个元素不太容易让人想起。 但是荷兰人从印度以及东南亚带来了许多奴隶。 荷兰第一任州长 开普殖民地的一位祖母曾是印度奴隶,根据各种说法,果阿或孟加拉人( 斯泰伦博斯 以他的名字命名)。 毫无疑问,在荷兰时代,印度奴隶的后代通常更可能被吸收到有色人种的混杂物中,而不是被后来的南非荷兰人吸收。

为什么将海角有色血统的这方面遗忘了? 我认为部分原因是 今天有一个大型的南非印第安人社区,但是那个社区是荷兰时代之后的事,并随英国人一起到达。 当南非人想到印第安人时,他们就会想到这些人。 有趣的是,当新的遗传学研究证实了印度的血统时,我在报告有色文化遗产的这一部分时被印第安人自己“纠正”了好几次。 他们给我的印象是 必须 弄错了,因为没有人熟悉具有印度血统的Cape Colours。 不幸的是,指向PCA和STRUCTURE图并不能消除混乱。

无论如何,多亏了 非洲祖先计划 我现在有三个不相关的有色样本(我有更多,但它们是相关的)。 由于AAP是以非洲为中心的,因此我认为首先将有色样本分开运行是合适的。 这就是我所做的。

首先,方法论。 我拿了古吉拉特人,犹他州的白人,丹佛的中国人和肯尼亚的卢希亚(班图),并将它们与海恩(Henn)等人的布什曼人合并。 粗标记数据集。 我还决定添加来自Behar等人的也门犹太人,主要是为了检查西欧角海角血统确实是北欧人。 我将古吉拉特语样本限制为“ Gujarati_B”中的样本,“ Gujarati_B”是HapMap数据集中的“南亚”群集。 我还减少了许多HapMap人口的数量。 我正在查看洲际差异,因此我假设N约为20就足够了。 将这些数据集与Cape Cape样本合并后,我修剪了所有丢失的SNP。 这给我留下了约230,000个标记。 以我的经验,在假设的亲代群体之间的这种遗传距离水平上,这对于ADMIXTURE来说是一种过大的杀伤力,但是比后悔要安全得多。 我还通过EIGENSOFT运行样本以生成PCA。 还知道我与Henn等人的Sandawe和Hadza进行了一些“试验”。 等,以及来自HapMap的较大样本。 这要么没有增加任何利润,要么只是变得令人困惑(在Cape Coloureds中并没有太多的Sandawe和Hadza超出了班图人必须承担的范围)。

在我将ADMIXTURE最多运行到K = 7之后,很明显,在信息量方面的最佳点是K =6。您可以看到Cape Cape彩色样本具有北欧,Khoisan,Bantu非洲,印度和东亚血统。 在两个有色人种中也有一个也门成分,这是要解释的。 这个成分太高了,无法仅由北欧血统来解释。 阿拉伯穆斯林世界的奴隶可以解释这一点。 另外,将此处使用的印度参考样品修剪得非常均匀。 来自南亚的奴隶几乎可以肯定比古吉拉特邦的人口多样化得多,古吉拉特邦的人口主要是帕特尔人。 最后,有时当您运行ADMIXTURE时,您会发现非典型遗传背景(例如Khoisan + Chinese)的组合可能是可能是伪像的一般成分。 当您有两个通常不一起找到的组件,而一个组件的级别远低于另一个组件时,这往往会成为一个问题。 我已经注意到这一点,特别是对于撒哈拉以南非洲血统和欧亚遗传背景较少的人们而言。 当他们发生的可能性很低时,他们通常是东非,P格米或布什曼 先验。 注意,一些布什曼人也门也门,但除了您所期望的之外,别无其他。 对我来说,这增加了上色中的浅绿色也是Khoisan遗传背景与其他成分之一相对的伪影的可能性。

因此,下面是K = 6的ADMIXTURE图以及信息丰富的PCA。 观察到三个颜色都有ID。

图片来源: 维基共享资源.

 

两年前 重建印度遗传史 改变了我们应该如何看待南亚历史基因组学。 简而言之,印第安人可以被看作是西欧亚人群体“北印第安祖先”(ANI)和另一群体“南印度人祖先”(ASI)的混合体,该群体与西欧和东欧亚人有着远距离的联系。 至少达到一阶近似。 最后的 秋季 我发表在一篇新论文上,该论文调查了印度的以南亚语为母语的民族,并得出结论说,他们是次大陆的外来民族。 这是一个有趣的观点。 南亚的史前治疗经常使用语言术语来表示假定的古代人口。 一种模式是,首先是最古老的亚洲亚洲文化组织Munda。 然后是德拉维人。 最后是印度雅利安人。 这些遗传数据暗示蒙达到达 after 最初的ANI-ASI合成。 印度的蒙达人可以被看作是ANI-ASI,与东亚的欧亚血统相重叠。

扎克·阿杰马尔(Zack Ajmal) K = 11 ADMIXTURE的运行突出了一些其他问题。 他有一套南亚语系的样本,以及许多讲印度-雅利安语和德拉维语的人口。 我现在认为,我们现在可以进一步澄清和完善我们对印度人民的模式。 这里是:

1)ASI,大约10,000年BP

2)ANI从西北进入次大陆,与ASI合成

3)Munda的祖先从东北进入,在其区域内以ANI + ASI进行合成

4)随后的一组与ANI有关的西欧亚大陆,因此我将其称为ANI2,从西北进入,并覆盖ANI + ASI合成。 在次大陆的东北象限,该群体将蒙达人边缘化,他们被同化或逃到了更偏远的地方。 我相信ANI2可能是印欧人,但也可能是德拉维人

5)第二组奥亚人从东北进入,并与AN2 + ANI + ASI合成。 在某些地区,它们被吸收(阿萨姆邦),但在其他地区,它们在文化上占主导地位(梅加拉亚邦)

以下是两个图解,它们说明了我来自哪里。 上面K = 11的“ S Asian”部分似乎重叠,但与ANI不同。 “ Onge”组件与ASI扮演相似的角色。 “ SW Asian”和“ European”元素非常简单。 它们与“ S Asian”(S亚洲人)密切相关,但它们确实与之分开。 他们与遥远的非印度族群的关系以及向西北的倾斜向我暗示了这一因素的最新出现。


两种模式。 对于印度裔欧洲人和德拉威人的南亚群体,您看到的是垂直分布,其与ANI / ASI的组合人口相对应。 但是请注意,亚洲-亚洲人群体的垂直分布。 他们的祖先是东亚欧亚元素,因此无法通过双向混合对它们进行完全建模。 我相信追踪ASI的“昂热”比例高估了南亚地区的ASI,因为在许多东南亚和Dai族群体中,这一比例似乎太高,以至于我无法作为ASI的完美代理。他们。 但是无论如何 请注意,与其他南亚人一样,南亚人似乎主要是ANI / ASI的混合体。 显然有一个离群人口。 我去找他们。

下图显示了AN2之和与稳定混合比例的比率。

我们从认识 重建印度遗传史 南印度部落和达利特人拥有大量西欧ANI。 但是,从基因组博客作者,尤其是Zack的进一步分析中, 我们可以看到,西欧亚血统还有一个组成部分,可能不是ANI,而是过时的。 这些组成部分与西南亚或中亚欧亚大陆具有相似性。 在Zack的K = 11中,它们分别标记为“ SW Asian”和“ European”。这是您注意到的大问题: 此元素增加东南-西北,从低种姓到高种姓。 在许多德拉威人中几乎没有这种情况。 在次大陆的西北部很常见。

再一次,除了一个局外人以外,南亚人联盟几乎完全缺少AN2,就像一些德拉维部落一样。 另一方面,即使是南亚的大多数AN2团体也明显具有一些ASI和ANI。 但是拥有ASI和ANI并不能保证AN2。 在亚洲-亚洲大陆中发现的东亚欧亚大陆似乎总体上被限制在该次大陆的东北部。 最后,我们有一个离群的亚洲亚洲人小组。

这些都是 卡西。 他们不是蒙达人,似乎与其他东欧亚人口有更紧密的关系。 它们也有一个很小但引人注目的AN2组件。 这是怎么回事? 我相信,在携带AN2的人已经将蒙达人边缘化之后,卡西人抵达了印度东北部。 一些卡西族人可能被吸收到了后蒙达语(讲印欧语或德拉维语的农民)中。 但是,一些卡西族人在高地保持了自己的身份,在那里他们还与拥有AN2的后蒙达族通婚。 相比之下,保留其文化身份的蒙达族撤退了。

这是一张供您细读的表格(请记住,推断出ASI):


团队 语言 Status 亚洲人 昂热 E亚洲 亚洲西南 欧元 西伯利亚 ASI
帕尼亚 德拉威 部落 47% 45% 4% 0% 0% 1% 67%
桑塔尔 南亚 部落 40% 45% 13% 0% 0% 0% 67%
邦达 南亚 部落 27% 44% 27% 0% 0% 0% 66%
Ho 南亚 部落 34% 44% 20% 0% 0% 0% 66%
哈里亚 南亚 部落 33% 44% 21% 0% 0% 0% 65%
萨瓦拉 南亚 部落 33% 44% 21% 0% 0% 0% 65%
马瓦西 南亚 部落 38% 44% 16% 0% 0% 1% 65%
g 南亚 部落 26% 43% 28% 0% 0% 0% 65%
阿苏尔 南亚 部落 42% 42% 14% 0% 0% 0% 64%
加达巴 南亚 部落 29% 42% 24% 0% 0% 0% 63%
德拉威 达利特 58% 40% 1% 0% 0% 0% 60%
库伦巴 德拉威 部落 54% 39% 2% 2% 1% 0% 60%
撒哈里亚 印欧 达利特 44% 39% 12% 0% 2% 1% 59%
陈楚 德拉威 部落 53% 39% 3% 0% 2% 1% 59%
马达加 德拉威 达利特 57% 38% 0% 0% 1% 1% 58%
比尔 印欧 部落 56% 37% 0% 1% 3% 1% 57%
北坎纳迪 德拉威 57% 37% 1% 1% 2% 0% 56%
满浪 印欧 L种姓 49% 36% 8% 1% 3% 0% 56%
萨基利 德拉威 达利特 59% 36% 1% 2% 0% 0% 55%
坎萨里 德拉威 L种姓 59% 35% 1% 2% 0% 0% 54%
维西亚 德拉威 中种姓 62% 34% 0% 2% 0% 0% 53%
哈拉基 德拉威 部落 57% 34% 0% 3% 3% 1% 53%
塔鲁 印欧 部落 52% 32% 3% 3% 6% 2% 50%
杜女士 德拉威 U种姓 59% 32% 0% 4% 2% 1% 50%
洛迪 印欧 L种姓 58% 32% 1% 2% 6% 0% 50%
维拉玛 德拉威 U种姓 60% 29% 0% 7% 2% 0% 46%
斯里瓦斯塔瓦 印欧 U种姓 56% 28% 0% 4% 10% 0% 44%
古吉拉特人 印欧 64% 26% 0% 3% 6% 0% 42%
梅格哈瓦尔 印欧 达利特 55% 25% 0% 8% 10% 1% 41%
科钦犹太人 德拉威 50% 24% 1% 16% 7% 0% 39%
Vaish 印欧 U种姓 52% 24% 0% 6% 15% 0% 39%
古吉拉特人b 印欧 56% 22% 0% 7% 13% 0% 36%
卡西 南亚 部落 21% 21% 48% 0% 3% 5% 36%
本尼以色列犹太人 印欧 45% 19% 0% 26% 8% 1% 32%
克什米尔人Pandit 印欧 U种姓 51% 18% 0% 12% 15% 2% 31%
柬埔寨 4% 17% 75% 1% 1% 0% 30%
新加坡马来语 5% 17% 73% 1% 1% 0% 30%
加罗 藏缅人 部落 8% 17% 65% 0% 0% 9% 29%
信德 印欧 52% 13% 0% 16% 13% 1% 25%
帕坦 印欧 部落 48% 11% 1% 17% 19% 2% 21%
布鲁修 隔离 部落 47% 10% 6% 12% 18% 5% 21%
拉hu 藏缅人 0% 10% 86% 0% 0% 3% 20%
通过 藏缅人 0% 8% 91% 0% 0% 0% 18%
o路支 印欧 部落 49% 7% 0% 27% 12% 1% 16%
婆罗辉 德拉威 部落 50% 5% 0% 28% 12% 1% 14%
马克兰尼 印欧 47% 5% 0% 29% 11% 1% 14%

 

扎克·阿杰马尔(Zack Ajmal)现在拥有 Harappa祖先项目的50多名参与者。 这不包括HGDP中的巴基斯坦人口,古吉拉特人的HapMap,SVGP中的印第安人。 尽管如此,所有这些样本仍几乎无法覆盖南亚的广大地区,即印度恒河平原。 这是Zack到目前为止提交的样本的来源:

  • 旁遮普邦:7
  • 伊朗:7
  • 泰米尔语:6
  • 孟加拉:5
  • 安得拉邦:2
  • 比哈尔邦:2
  • 卡纳塔克邦:2
  • 加勒比印第安人:2
  • 克什米尔:2
  • 北方邦:2
  • 斯里兰卡:2
  • 喀拉拉邦:2
  • 伊拉克阿拉伯人:2
  • 英印:1
  • 罗马:1
  • 果阿:1
  • 拉贾斯坦邦:1
  • och路支:1
  • 未知:1
  • 埃及/伊拉克犹太人:1
  • 马哈拉施特拉邦:1

同样, 请注意,印度人口最多的两个州北方邦(约200亿)和比哈尔邦(比哈尔,约100亿)的代表性不足。 尽管如此,该项目已经产生了一些有趣的收益。 在下面,我用个人标签重新编辑了Zack的静态图片(尽管请访问他的网站以获得更动态的内容)。 我用红色指针突出了我自己和我的父母。

左边是我从扎克(Zack)的屋子里拼接出来的一组地块和桌子。 各个 职位。 您需要知道的是,在K = 12时,我使用了Zack给出的各种假定的“祖先种群”标签,这些标签是从他的ADMIXTURE运行中得出的。 到目前为止,我还展示了哈拉帕祖先项目的参与者及其种族标签。 最后,在中间sm一下,您会看到 第一时间 值,由最小的人口差异标准化。 因此,框中的值代表了 行和列中的推断祖先人口 (我也四舍五入,因为我不想给人以过分精确的印象)。 最后一点很重要,它们不在实际人口之间的人口距离度量之间。 相反,它们是跨生成的群体的等位基因频率的距离测度,这些频率来自于您将ADMIXTURE约束的参数,以及您首先放入算法中的遗传变异。

从广义上讲,跳到您身上的第一件事是“巴布亚人”与其他所有人之间的高距离值。 这是有趣的。 实际上,巴布亚人与其他祖先人口之间的遗传距离大于假定的非洲人口与除巴布亚人以外的其他非非洲人之间的遗传距离。 这说明您需要非常谨慎地从这类程序中做出明确的推断。 有趣的是,巴布亚人遗传距离最小的人群是“南亚人”。 这意味着什么? 我认为这有一个简单明了的解释。 我相信,南亚集群是一个混杂的复合体,正如 重建印度历史,并且大洋洲的人口代表了长期居住的南亚群体的相对“纯粹”的东部扩张,这些群体通常被与侵入该地区的其他群体混合而淹没。 这也解释了一个事实,柬埔寨人与各种南亚人口共享了这个巴布亚人的某些组成部分。 最后,我不会做太多事情,但是在ADMIXTURE中,我完成了HGDP数据集中真实的巴布亚人口,分为两个祖先部分,其中从巴基斯坦到柬埔寨的南亚群体仅占一个。 请记住,大洋洲最初是由美拉尼西亚人和澳大利亚人定居的,大约40-50,000年前,看起来像是美拉尼西亚人和澳大利亚原住民 到这个初始时期的日期。 因此,南亚人与巴布亚人之间的联系可能很古老,并且这两个群体在很长一段时间以来一直很独特。

对于到目前为止接受调查的南亚人来说,什么都没有 奇怪。 随着南亚和东亚的发展,南亚元素趋于增加。 这就是您所期望的。 而且,跨越西亚和中亚大部分地区的巴基斯坦/高加索地区是将伊朗样本与南亚样本联系起来的要素。 伊朗人所占的南亚部分很少。 如果南亚元素仅仅是混合人口的结果,并且从中衍生出这一祖先群体之一的“祖先南印度人”通常不在巴基斯坦西部,那么这是有道理的。 正如您所期望的那样,孟加拉语中东亚成分丰富,但在来自南亚北部边缘的许多人中,东亚成分的比例却有所不同。 显然,您越往西走,“东方”元素就越有可能成为土耳其人,而越往东(在某种程度上朝南),则起源越可能在南部。 其他大多数模式都是您所期望的。 最后,我想指出的是,我怀疑Zack是第一个发布某人祖先分数的人。 游泳 使用SNP芯片标记的种姓。

这都是 有关参与的详细信息.

 

上周我宣布了 哈拉帕祖先项目。 现在有自己的 专用网站, http://www.harappadna.org。 此外,它有自己的 往脸书页面。 为了让Zack获得自己的网址,他还需要大约10次“点赞”,所以请喜欢! (如果您是如此处决)最后,从我听到的第一波 23andMe 假期销售结果将于本周上线。 实际上,我购买该套件的亲戚之一正在处理中,所以我知道我们很快就会在系统中有很多新人。

说到人们,最后我听说扎克得到了十几打回应。 这足以开始一轮试运行, 但显然他需要更多人。 更重要的是,这里的目标是获得更好的人口覆盖率。 我们从直觉上也从最新研究中了解到的一件事是,南亚存在着许多由社区构成的区域内人口变异。 换句话说,一个30人的样本中,您来自3个不同社区的10个具有地理和种姓多样性的社区,现在比来自印度哈里亚纳邦的300吉特人有用得多。 为哈里亚纳邦赚取300吉特会很有趣,因为这将为您提供一个了解社区内部差异的窗口,但是您对整个南亚人所做的推论的收益却在不断减少。

如果您知道有人做过23andMe测试,并且有来自南亚,伊朗,缅甸或西藏的杰出血统, 请转发该网址 哈拉帕祖先项目. 如果您是23andMe的成员,并且参与了论坛,那么在此项目上发表评论主题可能会很有用,因为与您共享基因的人们会看到它。

 

价格_图1我已经提出了一些 职位 警告读者要小心,不要将PCA图与真实的遗传变异相混淆。 PCA图只是捕获大型数据集中的变化并提取出独立维的方法。 它擅长检测人口子结构 因为变化的最大组成部分通常会跟踪 人口差异之间,由相关的等位基因频率集组成。 请记住,PCA图通常是由两个最大的变异维度构成的,因此,它们将仅从历史分离和进化事件产生的种群之间的这些相关等位基因频率差异中得出。 观察到非洲裔美国人沿着欧洲人和西非人之间的轴心分布。 因为我们知道这是两个父母家庭,所以这是完全合理的。 人口差异之间的差异(例如, SLC24A5达菲)是可以产生独立尺寸的原材料。 但是,在较小的比例尺上必须谨慎,因为图上元素的分布作为主要成分的函数对输入的生成尺寸的变化很敏感。

我可以举一个具体的例子: 我自己。 我给你看了我的 23andMe血统 昨天画。 我没有向您展示我在HGDP数据集上的立场,因为我已经与其他人共享了基因,并且我不想采取步骤来显示其他人的遗传数据,即使是删除也是如此。 但是,我重新编辑了一些“演示”屏幕截图,并将其放置在情节中的位置,以说明上面我在说什么。 第一个镜头是我在HGDP数据集中遗传变异的第一和第二主要成分的二维图上的位置。


gsa-lillymendel世界毫不奇怪,我在中亚/南亚地区。 但是,您可能会感到惊讶的是,我不在南亚地区,而是在中亚地区。 在中亚地区,有维吾尔族和哈扎拉族。 这是两个杂种种群,是西方和东方欧亚元素的混合体。 维吾尔族人可能是塔里木盆地城市的伊朗人和托卡利人的印度裔欧洲人之间,以及后来的讲土耳其语的定居者之间交融的结果,这些定居者是在第一个维吾尔帝国的扩张和崩溃之后到达的(当前的维吾尔人与古代维吾尔人之间的历史联系充其量是微妙而复杂的)。 哈扎拉人是较新的人口,很可能是13世纪到达的蒙古士兵与Zagros和Khyber Pass之间的土著妇女,波斯人,土耳其人以及各种印度-伊朗族群之间通婚的产物。 具有讽刺意味的是,我位于哈扎拉(Hazara)集群的边缘,因为几乎可以肯定他们的一部分部分是成吉思汗(Naghis Khan)的后裔,而我的姓氏是汗。 但是我知道我的Y染色体谱系是R1a1,在中亚和南欧亚大陆非常普遍,而根本不是蒙古族。

23andmepczoom放大! 现在,我们将输入数据集限制为中亚/南亚组。 首先,看一下卡拉什。 他们很奇怪,这不足为奇,他们是巴基斯坦的一个近亲山区群,他们没有采用伊斯兰教。 巴基斯坦塔利班看起来像 当我们说话时结束他们。 我真的更希望它们只是从此缩放视图的数据集中抛出,因为在这种细粒度的比例上,我认为它们根本没有增加太多。 它们只是长期内婚法可以对您的等位基因频率产生影响的一个例子。 更大的图景是巴基斯坦人口与中亚人口之间的轴心。 观察到我已经换了职位。 考虑到全球范围内的遗传变异,我和中亚人聚在一起,而现在我是南亚人聚类的2/3。 我将告诉您,我现在已经与该次大陆各地的大约50个南亚人共享了“基因”,在23andMe图中,它们几乎完美地覆盖了南亚人。 我将标签放在近似种族语言的位置。 我是一个离群人。 23andMe告诉我,我是43%的“东亚人”。 典型的南亚地区在10%至30%之间。 我的第一个假设是,我有很多 古代南印度,在他们的算法中只是显示为东亚。 考虑到这一点,我尝试与许多南印第安人和东印第安人共享,并发现了两个有趣的观点。 首先,南印度人似乎不高于东亚地区的30-35%。 另一方面,孟加拉人更多是东亚人,孟加拉国的东亚人多于西孟加拉人。 我的孟加拉文样本量很小,因此请谨慎使用。 其次,PCA地块将南印第安人牢牢地置于南亚地区,但孟加拉人却朝着我自己的位置前进。 这再次表明,不同的方法告诉您的内容略有不同。 PCA只是变化的一小部分,但它在人口差异之间提供了非常有用的信息。 孟加拉人和南印度人在祖先绘画中具有相同的“东亚”分数,但在PCA上的立场始终是不同的,孟加拉人更接近东亚人。 另外,我要描述的是这个缩放图中有一个波斯民族,它们位于Balochi附近。 但是在全球范围内,它们处于欧洲集群的边缘。 另一个说明元素的位置对输入数据敏感,这是因为如何生成尺寸。

布莱恩·贝廷格(Blaine Bettinger)启发了我发布这篇文章的他,以他的祖先画作讲了一个故事,这幅画似是而非。 我能说什么首先,我的非洲血统不到1%。 这可能是噪音。 但是,我确实注意到,在与我共享基因且非洲血统少于1%但非0%的那些人中,具有穆斯林名字的南亚人更加丰富。 就像穆斯林南亚人有不平凡的西亚血统一样,我怀疑我们中的许多人通过同样的动力拥有撒哈拉以南非洲血统。 随着穆斯林的到来,撒哈拉以南的非洲士兵在整个南亚都非常重要。 孟加拉国甚至有一段统治时期 阿比西尼亚统治者。 但是对我来说,更大的问题是东亚部分。 这是一个 发表于4年前:

journal.pgen.0020215.g005

该图显示了Fst值,将印度裔美国人与欧洲人和东亚人进行了比较。 Fst测量等位基因频率的总体差异之间的差异,在这种情况下,等位基因为207 插入。 看看孟加拉人。 这些都是 西部 我相信孟加拉人的东亚成分较少,但即使到那里,东亚人的等位基因频率差异也接近欧洲人。 阿萨姆人说的语言与孟加拉语非常接近,他们很相似。 阿萨姆邦由 藏缅人 已有近600年的历史了。 来自孟加拉西南部的Oriya讲者与东亚人相距较远。 随着一路向南,向东,向西和北向,与东亚人的距离增加了。 这并不奇怪,但是很容易确认。 遗传距离随着向南移动而增加,这一事实意味着,对于南亚东北部的东北亚,您需要通过“古代北印度人”和“古代南印度人”的双向混合来使模型复杂化。 与这两个因素相邻的是东亚元素,在尼泊尔的印度-雅利安民​​族中也很明显。

谢赫·哈西娜(Sheikh Hasina),哈利达·齐亚(Khaleda Zia)当然,任何知道孟加拉语的人都不会对他们祖先的东亚成分感到完全惊讶。 左图是过去二十年来一直主导孟加拉国政治的两名女性的头像,Khaleda Zia和Sheik Hasina。 他们都是孟加拉人,但他们看上去确实不一样,而且我知道很多人看起来像彼此(或两者兼而有之)。 我的家人来自孟加拉国最东端的地区之一, 特里普拉邦。 事实上,我已故的外祖母在特里普拉(Tripura)住了一个童年(她年轻时几乎被特里普拉(Tripura)疯狂的大象的马哈拉尼(Maharani)踩死了!)。 小时候,我曾经看过父亲上大学时的黑白照片,我很好奇照片中间是那个看起来亚洲人的年轻人。 原来是我父亲! 有时,我们的期望会影响我们对人的看法。 我从没想过父亲会像亚洲人那样成熟,但其他人却告诉我他确实还在表现这些。

孟加拉人如何成为这种特殊混合物的问题仍然存在。 我认为,最合理的情况可能是将传统的村到村通婚和按距离隔离以及移民主义的某些组成部分综合起来。 Chakma等部落在历史时期已离开缅甸。 这 查克马 孟加拉国的人现在说孟加拉语,而不是他们祖传的汉藏语。 我相信孟加拉人的一个重要部分是祖先,他们是部族人,他们的宗教身份转变为印度教或伊斯兰教的身份(在查马克(Chakma)中是从宗座佛教,在印度教则是万物有灵论)。 加洛斯 在他们基督教化之前)。 但是南亚东部与东南亚大陆相邻,因此有理由认为,随着时间的流逝,持续的基因流动还将把东亚等位基因引入孟加拉语基因库。

图片来源:TopNews.in

 

二烯 有一个 张贴 他着重强调了以下事实: 南亚新陈代谢疾病 有一个数字说明了该地区的人口结构。 考虑结构的重要性对于全基因组关联非常重要,因为如果特征值/疾病频率只是跟踪隐性种群变异,您可能会得到虚假的相关性。 狄尼克斯(Dienekes)说:

两个簇的存在是显而易见的,而它们的解释并不是两个簇中都出现相同颜色的点:将这些个体放置在全局上下文中可能在这里很有用。 顶部群集的情况更清晰,显示了由旁遮普锡克教徒和印度教泰米尔人在任一端锚定的清晰渐变。

同样令人感兴趣的是,左派孤立的穆斯林/基督教徒群体与主流强烈偏离; 这些可能代表着外来因素,不会占印度人口的大部分。

第二个问题很容易解决。 基督徒离群者都以英语为母语。 这向我表明他们是 英印,一个由南亚和欧洲混合血统组成的社区。 南亚穆斯林绝大多数 土著血统。 但是,少数穆斯林精英是西亚人,或者具有丰富的西亚血统,这从他们看上去很白就可以看出。 贝纳齐尔·布托(Benazir Bhutto) 母亲具有库尔德人和波斯族裔背景(她的家人来自伊朗的伊斯法罕)。 我已经编辑了宗教和语言PC图以适合屏幕。

印度1

那么,沿着第二个主要组成部分延伸的集群又发生了什么呢? 第一部分可能只是欧洲/西亚-南亚的变化轴。 但我不知道第二种变化的来源。 请注意,次要群体中没有一个南印度裔群体(泰米尔语)。 剧情使我想起了去年秋天看到的东西。

下面的图S4是从补充 重建印度人口史。 我添加了一些标签。 当遗传变异包括非印第安人群体时,印第安人群体非常紧张。 但是,当您仅将变化限制为欧洲人和南亚人时,会发生一些奇怪的事情:
guj.pdf-页面

古吉拉特语样本来自休斯敦,并且来自HapMap第三阶段。我怀疑古吉拉特语中的次要簇与第一图中的次要簇属于同一类现象。 英裔印度人和西亚穆斯林是欧洲人的粗略代理,并且您有一个预期的欧洲-南亚轴心。 但是您也有这个奇怪的正交分量。 我以为是Reich等人的情节。 纸张是异常的,但是我不确定是否看到第二张纸。

 

研究博客网站 尽管我有一个现实 警告 反对服用 PCA 从字面上看,真相实在是太真实了,没有上漆,也不需要任何解释性的汁液,依靠它们的论文对我几乎具有磁性。 它们转变了您不了解的复杂变化模式 完形 心理学分为二维或至多三维表示,您可以 神交 立即地。 这就是为什么 基因的历史和地理 太全神贯注了。 你 承认 否则无法识别的模式。 但 形成一种 您解释这些模式,那是完全不同的事情。 而且这些模式的产生方式也不容忽视。

价格_图1首先,让我们从一个简单的案例开始。 左侧是具有四个人口的PCA图。 尼日利亚人,东亚人(中国+日本人),欧洲人(来自犹他州的白人),最后是非裔美国人。 x轴是变化的第一个主要成分,y轴是变化的第二个主要成分。 这意味着x轴是遗传数据模式内变异的独立维度,这解释了遗传变异总量中的最大部分。 变化的总和可以分解为一大组独立的维,这些维可以按数量从最大的解释成分到较小的解释成分进行排序。 在人类遗传背景下,第一个主要成分始终将非洲人与非非洲人区分开,第二个主要成分通常映射到从欧洲到新世界的东西轴。 随后的主要成分通常可用于抽出细微的区分或因存在的存在而混淆的关系。 相似但不同的信号 在混合人群中。

该图的解释相当容易。 您会看到,非洲裔美国人沿着尼日利亚人和欧洲人之间的连续体排列,偏向尼日利亚人,有些离群值指向东亚人。 从其他遗传发现中我们知道,约20%的非裔美国人祖先的数量是欧洲人,但是,数量在整个人群中分布不均。 约有10%的非洲裔美国人祖先的欧洲人比例超过50%,而90%的人不到50%的欧洲人。 这样您便拥有了一个反映这种变化的分布。 至于离群值,我将推测并建议这些是某些非裔美国人中美洲原住民血统的迹象。

我在上面介绍的故事可能是对视觉的解释。 因为我们拥有大量的历史数据来证实该叙述的合理性。 遗传变异分析技术的结果与学者长期以来从文本资料中推断出的结果之间的拟合相对容易。 要查看PCA图并生成可信的叙述,而您几乎不需要任何外部支持,就可以很自信地接受这种叙述,这要困难得多。 我提出的正是这种警告 对人类遗传多样性进行更统一的采样:通过高密度基因分型对全球人口进行的调查:

高通量基因分型数据可用于推断人类进化史。 但是,迄今为止抽样的人口分布不均,并且在大规模研究中很少对某些地区(例如,南亚和中亚)进行抽样。 为了更均匀地评估人类遗传变异,我们从以前的研究未涵盖的296个全球人群中抽取了13个人。 通过将这些样本与来自我们实验室的数据集以及HapMap II样本相结合,我们收集了来自250,000个人群的850个个体中的〜40个SNP的最终数据集。 随着采样的更加统一,全球遗传分化(FST)的估计值将从HapMap II样本的〜16%大幅降低至〜11%。 在相同人群中键入的一组拷贝数变异显示出与SNP数据相似的多样性模式,在非洲人群中多样性最高。 这个独特的样本集还允许对人类进化史进行新的推论。 人群中单倍型变异的比较支持单个非洲外迁徙事件,这表明欧亚大陆的始建种群可能相对较大,但一段时间以来与非洲人隔离。 我们还发现中亚(吉尔吉斯斯坦和蒙古布里亚特)与美国的人口之间存在着很大的亲和力,这表明中亚对新世界创始人人口的贡献。

原来的研究 堆图 有北欧人,有来自尼日利亚人的约鲁巴人,还有中国人和日本人。 这三个人口可以告诉我们很多东西,但涵盖的范围有些不足。 这 人均国内生产总值 样品比较好。 但特别是出于政治考虑,无法收集印度样本,因此使用巴基斯坦样本代替了印度样本。 此外,HGDP样本偏向偏远和独特的人口,例如巴基斯坦的卡拉什。 这种遗传特征对于分类非常重要,因为它正在迅速消失。 但是卡拉什人之所以如此独特,是因为他们长期以来一直与世隔绝,因此人们无法像信德教徒那样真正地将其用作巴基斯坦人的代理人。 这 人口 样本似乎很好地补充了HGDP,但我认为它没有被大量使用。 由于HapMap的下一阶段将有更多的人口,因此仅利用三个终端组(在世界岛屿的情况下)出现的一些缺陷很快将不再成为问题。

但是直到那个时候,当出现研究来弥补我们对全球遗传变异的认识上的某些鸿沟时,还是很不错的。 这是一项这样的研究。 我已经对样本有些熟悉了,因为我在分析印度人口时已经看到了它们。 似乎有些偏向南亚和东南亚人口,但是,嘿,这些群体有时也需要拉长稻草。

在我进一步介绍之前,我应该提到他们使用带有成千上万个标记的SNP芯片。 此外,他们研究了副本数量的变化。 基因组中两种相当不同的变异类型,可能是要再次检查结果是否相同。 塑造基因组变异模式的人口历史事件可能会对这两种变异产生类似的大规模影响。 在他们的研究结果中,他们证明或声称如此,因为该论文是手稿,没有附加补充材料。

尽管有一些有趣的细粒度分析,但它们也得出了一些宏观和深层次的推论。 首先,您可能知道一个著名的事实,即15%的基因变异发生在种族之间,而85%的变异发生在种族之间。 那是从 第一时间 统计量,基本上是在两个人群之间的人群方差之间和之内进行划分。 显然,Fst的值因要比较的一组人口而异。 蒙博蒂P格米人和日本人之间的比率远高于中国人和日本人之间的比率。 使用HapMap的Fst为16%。 关于您的期望。 为了使样本大小与HapMap相等,他们从人口集合中按大陆分组的随机集合中随机选择了个体,并计算了Fst。 他们发现价值约为11%。 为什么会有所不同? 因为他们的数据集包括人口 之间 HapMap中的三个群集。

这自然一点也不令人惊讶,但是它确实重申了一个有时会出现的问题:与种族有关的柏拉图主义。 HapMaps中的北欧白人是白人 出类拔萃。 在西欧亚和北非人民的遗传变异中也许更居中的土耳其人(以前被称为“高加索人”)是“少白人”。 同样,尼日利亚人比埃塞俄比亚人更非洲。 中国人和日本人比缅甸人更亚洲。 依此类推。 在对群体差异进行建模时,我认为考虑某些人口种族原型的趋势有些过时。 这将调制输入,从而在某种程度上修改结果。 分析技术可能像石头一样冷,但是它们被有血有肉的人使用。

我认为还需要强调单体型和SNP杂合性,这很有趣,这说明SNP芯片并不完美。 它们是工具,人工工具会受到人类做出的任意选择或工具选择的影响。 让我引用:

我们还比较了每个人群中的SNP和单倍型杂合度值(图2B)。 这两个量通常高度相关,尽管有几个例外:首先,在欧洲和中亚人群中,SNP杂合度高于单倍型杂合度。 这可能反映了SNP确定性的偏见,因为历史上选择了许多这些多态性以最大化欧洲人群的杂合性。 第二,the格米人样本显示出较低的SNP杂合度,尽管单倍型杂合度相对较高。 这种不寻常的模式可能是由于该人群中SNP确定偏倚的影响比其他人群更大。 的确,最近对Khoisan个体(来自非洲的另一个猎人-采集者群体)的研究显示了类似的模式:尽管在全基因组序列数据中SNP杂合度很高(〜60%),但Khoisan个体在SNP微阵列基因型上显示出低杂合性( 〜22%)。 或者,这种差异也可能反映出人口历史的独特属性。

用通俗易懂的英语来说,基因芯片的设计是考虑到欧洲人的,因此他们不一定会吸收非欧洲人群体中的所有变异,这些人相信或没有遗传差异。 这个问题出现了(如上文所述)。 最近的一篇文章 这对一些布什曼人和戴斯蒙德·图图进行了排序。 布什人有很多变异,这是众所周知的,但是他们在欧洲人没有的标记上也有变异,如果欧洲人不这样做,筹码可能不会在该位置寻找多态性。 这种事情可能不会影响广泛的人口关系,但是如果您要放大并进行对精细区分和数量差异敏感的分析,则可能会出现问题。

让我们跳到漂亮的图表。 首先,使用PCA图与来自所有人群的所有个体进行比较:

印度1

请注意,PC 1的变化几乎是PC 2的八倍。这说明了非洲与非非洲之间的差距。 由于他们的数据集在“中级”组中相对较厚,因此您会看到一个频谱。 垂直轴显然大部分是东西向的。 这是从ADMIXTURE程序获得的随附条形图。 K =推测的祖先人口。

印度2

在K = 12的人口众多的情况下,我认为您可以写出一部值得托尔金执导的奇幻小说。 K = 4更现实。 在非洲人口中,您可能会在某些东部地区(似乎是丛林人)看到欧亚混血。 在欧亚大陆本身中,您会看到假定的祖先成分之间的混合渐变,似乎很好地遵循了经度。

由于总样本中的大部分差异是非洲人造成的,因此将其从图片中删除将使我们可以更加关注欧亚群体之间的关系。 因此,这正是他们所做的。 请注意,关注欧亚群体并不意味着简单地放大或放大PCA图的欧亚部分,而是使用先前遗传变异的子集重新生成图。 换句话说,尺寸会有所不同。

第一个图显示了整个欧亚人口。 第二个删除欧洲人和近东人。

印度3

再次注意比例。 绝大多数差异似乎是东西方的。 但是,南北之间存在明显的分歧。 对于南亚人口来说,他们似乎是巴基斯坦人,他们是中等收入的农民(阿林),高种姓的南印第安人和极低种姓或部落的南印第安人。 对于这个印度样本,有一个问题,正是样本问题困扰了 上系列,他们将目光投向了印度社会的最高处和最底层,而忽略了中间处。 据推测,中间基因在遗传学上也将处于中间位置,但是尽管如此,在论文中还是要考虑这一点,以填补其他人的零散性。 相比之下,尼泊尔人的样本在种族上特别多样化,包括占主导地位的印度-雅利安人和西藏-缅甸人 纽瓦.

在第一个面板中,东南亚群体有一些奇怪的模式。 从语言和历史上看,在文化上,泰国和越南人起源于近代中国近代。 这 通过 云南的人与泰国的泰国人和老挝的人是同一民族。 两者都来自云南的移民。 从历史上可以证明,即使有些支离破碎。 越南人的心脏地带在红河谷和北部进入中国南部,仅在过去的1,000年中,它们就沿着海岸向湄公河蔓延。 在此期间,东南亚并非无人居住。 它由高棉帝国控制,后来被不断扩大的泰国和越南政体所消耗。 一些学者认为,法国殖民主义实际上保留了一个独立的高棉国家,否则该国将在泰国和越南之间分裂,就像波兰在德国和俄罗斯之间一样。 因此,高棉人是土著人民,而泰国人和越南人则是侵入性的。

PCA图告诉我们什么? 我不知道越南样品是从哪里收集的。 如果他们来自越南南部,那么他们与中国人的亲密关系向我表明,红河谷地区人口的大量替代或扩张。 相比之下,泰国人与中国人相距较远。 实际上,柬埔寨人更接近中国人! 这里的样本很小,而且集合重叠,因此我不会在其中放置太多库存。 但是,泰国在地理上更接近南亚,因此,通过距离模型进行隔离可以预测这种情况。 似乎泰国人的族裔发生是通过扩大泰国人的身份而发生的,这可能是在高棉人民中发生的。 令人惊讶的是,婆罗洲的土著人伊班人比越南人离柬埔寨人更近。 我们知道,越南海岸和东南亚海域之间有大量移民, 占人 越南中部的一位马来亚人可能是从婆罗洲移居的,并且在越南扩张之前在该国的南部占主导地位。

转到第二个面板,还有更多关于南亚人的话要说。 首先是地理。 两个低种姓阶级实际上是南印度州安达拉邦的达利特人。 达利特人过去被称为流放者,所以他们甚至不是低种姓,而是没有种姓。 上等种姓群体是安达拉邦和泰米尔纳德邦的婆罗门。 最后,伊鲁拉人是来自泰米尔纳德邦的部族。 对我来说,部落样本经常产生奇怪的结果,我怀疑这与人口瓶颈及其人口隔离有关。 人们离开了部落(成为印度教的一部分,或converting依伊斯兰教或基督教),但很少有人加入。 巴基斯坦的样本是Araina,这是一群旁遮普邦的传统农民,有着阿拉伯人的血统(显然是因为他们不与近东人聚在一起而组成)。 我们来比较一下 赖希等。:

印度7

在我看来,他们的意见大致相同(顺便说一句,Reich等人将相同的两个低种姓群体用于安德拉邦(Andhara Pradesh),用于低种姓南印度人)。 尽管南印度婆罗门语讲南印度语言,并且与其他南印度人同居,但他们的遗传传承却有所不同。 同样,部落人民也不同于种姓印度教徒。 赖希等。 假设南亚人可以建模为两个群体的组合,即祖先北印度人ANI和祖先南印度人ASI。 大概前者相对于后者侵入了次大陆。 ANI和ASI的比例似乎在两个明显的维度上变化:地理和种姓。 从西北到东南,ASI的比例似乎在增加。 而且,ANI的比例似乎从部落到低种姓再到上种姓都增加了。 巴基斯坦的样本似乎并非来自精英等级(或似乎不是来自精英等级),但与南印度婆罗门相比,它们对西欧亚人口的亲和力更高。 后者很可能侵入南部,并与当地人口混为一谈。

最后,谈谈尼泊尔样本。 在ANI-ASI混合物的基础上,尼泊尔人的藏族-缅甸人和东亚人的亲和力也各不相同。 如果您遇到了尼泊尔人,这并不奇怪。 阿萨姆人和孟加拉人(在较小程度上)也表现出这种藏缅混合模式。 尼泊尔的婆罗门人像南印度的婆罗门人一样是侵入性的,就像南印度人一样,它们与当地的底栖动物混合在一起。

接下来,让我们转到ADMIXTURE图。

印度6

特定K的选择显然取决于与您所知道的以及您所知道的“相符”的模式。 期望。 有了这种谨慎态度,以红色代表的人口就很容易被认为是随着农业而扩展的中东群体。 这似乎是作者所偏爱的。 棕色人口是模态印度祖先人口,在次大陆之外几乎没有存在(顺便说一下,颜色很好!棕色人是棕色的)。 绿色代表部落群体Irula受到很大的重视。 这让我想起了卡拉什。 我怀疑Irula经历了一些瓶颈或其他特殊事件,并且有一些已经被印度南部的各种低下地位群体所接受。

我不是对建立世界的幻想家,因此,在阅读图表茶叶时,我将以此止步。 但是有一个重要的部分,我跳过了,将回到现在。 这就是深层的时间方面:

OoA瓶颈的一个更可能的解释是,在扩张之前的几万年中,欧亚大陆有相对较大的人口,这些人口与其他现代人口相对孤立。 非洲以外的现代人类的第一个化石证据是在80,000至100,000年前的中东Skhul和Qafzeh,这至少比欧亚散居者早了20,000年。 如果现代人一直留在中东直到扩展到欧亚大陆,那么在欧亚大陆扩张之前,将有足够的时间进行遗传漂移以显着降低杂合性。 这种“中东孤立”假说为欧洲和亚洲人口相对于非洲人口的相对同质性提供了有力的解释(见图3A-B),并得到了最近欧亚大陆时期140,000年前的最大似然估计的支持。西非人口分离。 有趣的是,最近对尼安德特人基因组的研究表明,非非洲人(而非非洲人)与尼安德特人的混合含量相似(1-4%)。 作者认为,在欧亚大陆扩张之前,祖先非非洲人口的尼安德特人之间必然发生了这种混合。 有了化石,考古和遗传学证据,随着可获得全基因组序列数据,中东孤立假说需要进行严格的评估。

像绝大多数基因研究一样,这项工作也支持非洲以外的假设。 非非洲人都是来自特定非洲分支机构的所有分支机构。 或更准确地说,是离开非洲的非洲分支。 从非洲到欧亚大陆,杂合度的减少是一种遗传变异的量度。 此外,在撒哈拉以南的非洲内部,杂合性与地理的关系几乎没有差别,但是在非洲以外,杂合性随与非洲的距离的关系而下降。 一个可行的模型就是从一小批祖先到世界四个角落的辐射,并经历了一系列瓶颈。 或者至少这是基因组数据支持的模型。 但是,杂合性的下降是如此之大,与非洲亲代人口迅速分离将需要极少数的创始人(一代人少于10名)。 因此,为了解释数据,他们在这里暗示原始人口不是那么少,而是与数千年的非洲大人口隔离开来的。 他们认为遗传漂移降低了杂合性,但是如果模型正确,我怀疑它的工作方式是由于气候波动导致的瓶颈席卷了许多遗传变异。 但是在银纹间,孤立的人群可能与尼安德特人杂交。 实际上,也许当他们自己的有效种群极少时,他们从尼安德特人那里挑选了基因。

无论如何,种类繁多的纸张。 他们设法将结果分成两个 other 重磅炸弹 文件。

H T 二烯

Xing J,Watkins WS,Shlien A,Walker E,Huff CD,Witherspoon DJ,Zhang Y,Simonson TS,Weiss RB,Schiffman JD,Malkin D,Woodward SR和Jorde LB(2010)。 争取对人类遗传多样性进行更统一的采样:通过高密度基因分型对全世界人口进行的调查。 基因组学PMID: 20643205

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”