Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
人类遗传变异

书签 全部切换变革理论添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者


mtDNA单倍群G1a2

髓: 在这篇文章中,我考察了23andMe在家族和区域(孟加拉)历史背景下为我的家庭带来的最新结果。 我还利用这些结果为过去一千年来孟加拉东部人的民族志及其与其他南亚和东南亚人口的关系提供了一个框架。

自从我去年23月收到XNUMXandMe结果以来,我一直在博客上写很多。 在 最近的文章 我推断,也许我有一位最近的祖先,他是缅甸人或一些相关群体。 我的理由是,这解释了在HGDP数据集中,染色体片段与中国西南地区人口的匹配升高的模式。 但是现在,除了我们的基因组,我们还有更多的东西要做。 本星期 我从同胞那里获得了第一个V3芯片结果。 最后,昨天我父母的结果出来了。我立即发现有趣的一件事是我父亲的mtDNA单倍群分配, G1a2。 这来自他的祖母,您可以看到它的分布主要在南亚以外。 如果您关心的话,我问我父亲她的背景,并且像我的父系一样,她是“汗”,尽管没有亲戚关系(“汗”只是一种敬意)。 在总体基因组评估之前,我收到了这些结果,因此最初认为这证实了我的直觉,即我父亲最近有一些未知的“东方”血统。 但是事实证明我的直觉是 大概 错误。 实际上,我的父母的“东部”比例大致相同,而我的母亲要多一些! 我的期望是,我的母亲可能是大约25%至30%的“亚洲人”,而父亲可能会超过50%。 事实证明,我的父亲是38%,母亲是40%。


图片来源: f_mafra

以下是23andMe为我的家人(到目前为止)生成的“祖先绘画”。 您看到的是22条非性染色体, 两份 每个,并分配给“亚洲”,“欧洲”和“非洲”血统群体。 产生这些任务的参考人群来自HapMap,来自犹他州的北欧白人,来自北京的中国人,来自东京的日本人和来自尼日利亚的约鲁巴人的北欧样本。 这些类别之一的分配表示的是,基因组的该区域在同一性上最接近该类别。 这并不意味着您最近的血统是欧洲或亚洲(非洲人可能是另一回事,但在23andMe论坛中,对于非洲裔美国人和东非人的结果有很多抱怨。 对于南亚人来说,这一警告尤为重要,因为我们通常发现自己是欧洲的〜75%和亚洲的〜25%。 这意味着尽管我们大多数的遗传亲缘关系都与欧洲人有关,但一小部分人似乎更像亚洲人。 通过23andMe上的“基因共享”,我可以看到亚洲比例从南印度和斯里兰卡的〜35%,到巴基斯坦和旁遮普邦的〜10%不等。 这不是因为南印度人比旁遮普人拥有更多的东亚血统。 相反,南亚基因组在很大程度上可以是 分解成两个祖先元素,其中一个与欧亚大陆东部的种群有较远但较近的亲和力,而另一个与欧亚大陆西部的种群具有近亲。 有些人称之为“古代南印第安人”(ASI)和“古代北印第安人”(ANI)。 ASI祖先在整个南亚人中可能只占不到50%,但似乎比欧洲人略逊一筹。* ASI的比例随着南亚向东和向南移动(以及向下移动向南移动)而增加种姓地位阶梯)。


[zenphotopress相册= 249排序=订单编号= 4]


首先,我想指出,我会不时为家人使用缩写(这适用于以后的帖子)。 我的父亲将是RF,我的母亲将是RM,我的兄弟姐妹将是RS,并用数字来表示哪个兄弟姐妹。 所以目前我们有RS1。 如您所见 完形 感觉我们就像一个家庭一样彼此很像。 我们大约有40%的亚洲人和60%的欧洲人。 碎片的程度表明我们不是最近的混合物。 否则,亚洲和欧洲碎片将聚集在一根或另一根铁线上。 有人建议我母亲的确表现出较少的支离破碎。 可能是这样的假设是,她的祖父据说来自中东的一个家庭,该家庭定居在南亚,先是在德里,然后定居在孟加拉东南部(具体来说是孟加拉国)。 诺哈里)。 由于根据23andMe的算法,他可能几乎没有亚洲血统,因此从他那里继承来的同系物绝大多数是欧洲人,只有一代人会进行重组。

要评估各种假设的合理性以解释结果的模式,您需要所有非基因组信息。 上面是英属印度的地图。 我已经指出了我的家人来自孟加拉的地区。 在我的曾祖父母中,八分之七出生于 库米拉 (实际上,它比目前的孟加拉国行政区划更向达卡东南延伸)。 一位祖父母在科米利亚东南部的诺阿卡利(Noakhali)出生。 1位曾曾祖父母中有4位出生在距小镇8英里内 坚德布尔 (RF的祖父母)。 3个曾祖父母中有4个是在距该村庄5英里内出生的 霍姆纳 (RM的祖父母)。 乌鸦飞过时,这两个位置相距约30英里,不过在更早的时代,这两个位置之间的运输是靠水进行的。 梅格纳 河流,到恒河到达孟加拉国时,实际上比恒河的水量要大得多)。 这个地区以西部为边界 帕德玛河,在Chandpur的宽度缩小到大约2英里(平均深度约1,000英尺)。 东边是印度的 特里普拉邦。 这是地图上定义的相对较疏松的边界,不受地理因素强加。 您可以看到,在某些地区,实际上东部的Bangaldesh-印度边界 二等分稻田.


Tripuri儿童

如今,由于印度教徒从20世纪的东孟加拉邦(后来的东巴基斯坦,现在的孟加拉国)大规模迁移,特里普拉邦已成为孟加拉的多数民族。 但是它的土著人民是 特里普利,其母语显然是部落 藏缅人和物理类型指向它们与北部和东部人口的联系。 同时,约90%的Tripuri是印度教徒,在南亚伊斯兰统治时期, 特里普拉王朝 自命为印度教文明的捍卫者(就像阿萨姆邦的藏缅人阿洪斯所做的那样)。 因此,从语言和基因上讲,特里普拉邦的原住民与恒河平原的印度-雅利安民​​族形成鲜明的对比,孟加拉人是阿萨姆人最东端的代表。 但是,它们也早已成为南亚文化景观的一部分,因此不能再被视为纯粹的侵入性(它们的口述历史表明它们已经到来了。 before 穆斯林)。

最后,关于我的8位曾祖父母的详细背景,其中2位属于可汗阶层。 1个来自印度教家庭 塔库尔 最近recently依伊斯兰教的人。 另一个是姓氏 萨卡。 至少有一部分来自中东移植家庭中的1名。 剩下的4个曾祖父母是孟加拉穆斯林,除了我父母所知道的背景信息外,没有其他特别的背景信息。

我都给你了 因为遗传变异是 非常 以地域为条件 文化参数。 在前现代时期,水障似乎在文化和遗传上将人们分隔开来特别有效(尽管具有讽刺意味的是,水还是任何大宗贸易的先决条件)。 语言也是差异的另一个主要参数。 最后是宗教。 在上一节中,如果300年前我这一代的大多数祖先是印度教徒,我不会感到惊讶。 这显然有一些流动性。 我提供了出生地半径的数据,因为我们知道 欧洲成绩甚至村庄也表现出遗传聚类。 这在我的家庭中得到了缓解,因为就社区而言,父亲的祖父母背景各异,而母亲的祖父母则来自不同的地区,从生物学上说,在很大程度上是不同的族裔。

当我最初看到自己是40%的亚洲人时,我对这个高比例感到惊讶(记住,南亚的平均水平约为25%的亚洲人),但是有两种par昧的解释:a)我有很多ASI, b)我的祖先看上去并不像南亚那样,但确实来自东亚。 为了确定是否是前者,我在23andMe上开始主动与众多南亚人共享基因。 经过数十个人的了解, 我不在正常的变异间隔内。 我比来自南印度或斯里兰卡的人更亚洲。 此外,在HGDP数据集中,即使这些个体在基因上也往往最接近中南/亚洲人。 我最接近东亚人。 此外,在投影到中南/亚洲人的二维PCA上,我肯定不在所有其他南亚人的群体中。 最终,我确实找到了一个打破35%的亚洲魔力壁垒的人……那个人是孟加拉国人,占38%。 而且,像我一样,他在基本的“全球相似性”比赛中与东亚人更加接近。 他还携带了一个 Y染色体谱系 在南亚很少见,在苗族中很常见。 终于,当狄尼克斯(Dienekes)开始他的 Dodecad祖先项目 很明显,我的祖先中约有15%的元素与 不能 南亚,但东亚。 如果除去这一部分,那么我将是大约70%的欧洲人和30%的亚洲人,对于在该次大陆东部或南部有祖先的人来说,这绝对在正常范围内。

如果您已经读到这一点, 您可能想知道我的父亲是38%的亚洲人,母亲是40%的亚洲人,而我是43%的亚洲人。 毕竟,我不应该成为 两者之间? 实际上,在PCA散布图上,我(和我的兄弟姐妹一样)正好在父母之间(由于标志太大,所以看不到后代)。 那么为什么会有所不同呢? 首先,请记住,PCA将您投影到二维轴上,其中x和y代表数据集中方差的两个最大部分。 换句话说,它正在淘汰 子集 基因变异的确在群体差异之间脱颖而出。 这样一来,作为第一代欧亚人的人就可以在这个情节上与父母相距甚远,但在总基因组方面仍然表现出很大的身份认同。 二维图无法捕获很多变化(例如,家族谱系的私人变体)。 祖先绘画的估计是不同的。 他们正在寻找 基因组,并评估每个区域在三个参考人群之间的遗传亲和力。 因此,请重复一遍,您拥有超过50个参考群体与3个群体,并且相对于整个基因组,您占总遗传变异的一小部分。 两种方法都报告了真实有效的结果,但是有些不同。

因此,对于以上差异,我可以想到两种非常简单的方法论解释。 我在V2上,而我的父母和兄弟姐妹在V3上。 我知道这在其他度量方面有所不同。 此外,此算法中显然存在一些“杂音”,即使您考虑了参考人群的k杂性质,也会导致具有非洲或亚洲血统的人是不真实的。 但是,让我们以结果为准。 用祖先画 回想一下欧洲和亚洲的情况 矮胖 整个基因组? 我的两个父母都从父母那里获得了一半的基因组。 我自己的染色体是祖父母的染色体的镶嵌体。 基因组区域之间的某些原始链接由于其在同一链上的物理位置而被打破, 重组 在我祖父母的下游两代人中。 具体而言,减数分裂的两个实例会产生性细胞。 因此,我祖父母中存在的一些等位基因关联在我内部已经转化。 但是,即使没有重组,也很明显,一条同源染色体在欧洲或亚洲可能比总基因组平均值要多。 因为只有其中一个被传递给任何给定的后代,所以从同级到同级会有差异。 遗传学不是一个纯粹的融合过程。 这就是为什么我是43%的亚洲人,而RS1是40%的亚洲人的原因。 我们都从父母的基因中取样,并且在这个过程中会有差异(在染色体水平上,您从每个父母那里获得22个常染色体引物,每个引物都有两个结果)。

一个有趣的含义是,多种族夫妇的孙子在主要种族群体的祖先数量上将表现出差异。 这就是为什么认为通婚会导致生物多样性被洗掉是谬论的原因之一。 而且诸如分类交配的过程甚至可能从最初混合的随机交配种群中提取出“纯”个体。

尽管如此, 我现在相信,由于孟加拉东部的N = 3,所以我在最近的东南亚血统中也不例外,但孟加拉东部是南亚和东南亚之间的基因频率谱系的一部分,因此在很大程度上东方血统。 Zack拥有我父母的数据,因此一旦结果从 行动计划 我相信他会在狄恩凯克斯身上发现与我相同的非南亚血统。 这里的上升趋势仍然很尖锐。 在推断祖先量子算法的比例时,孟加拉国的平均水平可能与缅甸人的平均水平只有10-20%的互换性。 (请记住,缅甸人也可能有一个较小的南亚部分)。 相比之下,孟加拉国的平均水平可能与比哈尔邦居民保持80-90%的互换性(我与之共享的23andMe中SNP总比较中最接近的匹配项是比哈尔邦,而不是其他两个孟加拉国)。 显然,这是 地理南北 缅甸的山脉将其与南亚隔离开来。 相反,有 开阔的平原 从孟加拉国北部到比哈尔邦。 在某种程度上,由于海上旅行的便利,缅甸与南亚半岛之间有着更多的文化亲和力和联系。 患病率 上座部佛教 在缅甸证明了下层社会的联合 伊洛瓦底江 斯里兰卡。


回到孟加拉国。 就宗教人口统计而言,印度次大陆的一个方面是印度伊斯兰教的心脏地带,德里地区,从来没有穆斯林占多数。 相反,在西北和东北边缘(以及其他一些地区,例如喀拉拉邦北部),穆斯林占多数。 伊斯兰教在西北地区的盛行并不令人惊讶,因为该地区与伊斯兰教徒接壤。 达拉伊斯兰教 恰当的。 但是孟加拉呢? 在19世纪后期,英国人感到惊讶的是,在统一的孟加拉国(大致包括印度的西孟加拉邦和孟加拉国),穆斯林占多数。 由于出生率和转换率的差异(如上所述,第二部分包括我的家庭部分),今天活着的孟加拉人中有三分之二是穆斯林,而其余的是印度教徒。 孟加拉国估计是2%的穆斯林,而西孟加拉邦是3%的穆斯林。 即使在几代印度教徒移民之后的今天,孟加拉国内部的一种模式仍然是印度教徒在西方和北部的相对集中度(而且,孟加拉国的印度教徒往往是城市化的)。 孟加拉国“古兰经”带的“带扣”实际上是孟加拉东南边缘的Noakhali区。 我母亲的外公,来自 PIRS 最初定居在德里的穆斯林心脏地带的诺亚里(Noakhali)。 显然,据说在Noakhali甚至印度教徒都知道适当的伊斯兰教形式!**

这种模式的一种解释是,印度教精英的宗教影响力和权力随着距离西孟加拉邦(更接近核心地区)的距离的直接函数而下降。 阿亚瓦拉塔在伊斯兰教兴起之前,传统上一直是印度历代王朝的权力所在地。 此外,孟加拉国是大陆次大陆的最后一个区域,在佛教徒开花期,佛教社会蓬勃发展。 帕拉帝国 大约在公元1000年左右。因此,建议许多孟加拉穆斯林是直接从佛教而不是印度教转变而来的(直到今天,仍有少数少数民族的孟加拉佛教徒,他们的姓氏是“包拉”。这是与后裔的区别)现在讲孟加拉语但仍保留部落身份和Theravada佛教徒的藏缅人)。 另外,可能是在穆斯林到来之前,孟加拉东部地区的泛灵论者居多,就像欧洲殖民大国在亚洲更成功地在边缘化人群中传播其宗教一样(例如,印度东北部和东南亚的部落人民伊斯兰教徒),因此伊斯兰教在印度教种姓制度之外的人中进行购买。

这些模型对我来说具有说服力。 但是,我仍然感到怀疑的是,在孟加拉西部和东部,印度教机构的深度存在如此强烈的脱节。 毕竟,当伊斯兰教在南亚刚刚出现时,东方的Tripura国王就是印度教徒。 如果在核心的印度教文明中处于部落和边缘地位是对伊斯兰教易感的理由之一,那么奇怪的是, 恰恰是现代孟加拉国的许多部落人民 不能 穆斯林。 的确,在南亚东部接近印度裔群体的藏缅人口是印度教徒或佛教徒,而不是穆斯林(腹地的那些人并未融入任何南亚宗教,而是在上个世纪由西方传教士转变为基督教)。

相反,我发现模型支持 伊斯兰兴起与孟加拉国边境,1204-1760年 作为上述假设的补充,甚至替代,在很大程度上是合理的。 此外,它还具有使我到目前为止在这里介绍的遗传数据有意义的作用。 作者认为 孟加拉国东部的孟加拉东部地区,在13世纪穆斯林占领孟加拉之前,人口非常稀少。 在现代时期,印度的孟加拉西部地区往往遇到许多水道濒临灭绝的问题。 但是在一千年前,该地区在沉积方面更为活跃,而孟加拉东部是一个荒野。 几个世纪以来,大河向东转移,由于运输的改善,该地区得以开垦。 此外,穆斯林的到来也导致了新的土地清理和定居技术的传播。 粗略的模型是 就目前的人口密度而言,孟加拉东部实际上是一个相对较新的定居地区。 由于清算和定居活动是由穆斯林精英进行的,因此,定居在这些土地上的许多农民要么是穆斯林,要么更可能是采用了他们地主的宗教。 由于领土的原始性质,这些最初的定居者进入了人口大规模扩张的阶段,到现在孟加拉东部地区(孟加拉国)现在人口密度是西孟加拉邦(西孟加拉邦)的两倍。 这里的关键是,不需要大量的边缘泛灵论者,印度教徒或佛教徒农民大规模地conversion依。 相反,所有需要的只是适度的孟加拉国converted依农民,以成倍的人口增长,直到土地“被填满”。 (有趣的是,人们在美国和韩国人之间都发现了类似的模式。“核心”家园的宗教在宪法上与散居国外的人大不相同)

我认为这有说服力,主要有两个原因。 首先,彼得·贝尔伍德(Peter Bellwood) 第一农 记录尚未参与的人群的困难 集约 从农业转向这种方式。 至少可以追溯到莫卧儿时期,孟加拉是一个人口稠密的土地,仅仅因为总生产力,就可以从中获得大量租金。 如今,一个团结的孟加拉国将有240亿人口,使其成为世界第四人口大国,仅次于美国,仅次于印度尼西亚。 事后看来,我发现孟加拉东部的农民不太可能来自一直在练习的部落人民。 广泛 农业,但是被引进了新技术,比西方人早已习惯于集约化农业的残酷期望殖民化了“空”土地(事实上,孟加拉农民移居阿萨姆邦的部分原因是,尽管那里有土地过剩的感觉,尽管阿萨姆邦拥有30万居民)。 但是,殖民化的最初阶段将只需要相对较少的农民,并且可能表现出一些男性偏见。 因此,这可以解释孟加拉人中东方血统的很大一部分,因为在第一代中,孟加拉农民确实吸收了该地区的土著部落人民,无论该部落是 蒙达·桑塔尔斯(Munda Santhals) 或Tripura的藏缅亲戚。 与藏传缅甸人相比,孟加拉人数量众多,因此在任何模型中似乎都需要大量的基因流,因为这假定了这两组人在很长一段时间内的交流解释了人们发现非基因组的高比例的原因。 -南亚血统。 在 所有 印度只有10万讲藏缅语的人,而印度次大陆仅孟加拉语的240亿。

这在哪里离开我们? 根据我的收集,您可能不会进入第一轮结果 行动计划,但是如果您有23andMe个结果,但尚未将其发送到 扎克,并想进一步了解印度次大陆的历史遗传学, 您仍然可以参与其中! 有了我的父母,扎克现在拥有N = 2的孟加拉国。 希望能得到更多。 我们仍然需要来自印度中北部的样品。 旁遮普语的数量在5到10之间,泰米尔人的数量大约在5。 在不久的将来,我将从其他兄弟姐妹那里获得结果,并且我决定“升级”到V3芯片。 一旦出现,我将分阶段一些结果,并可能开始将自己与兄弟姐妹进行比较,“分阶段”结果,等等。

*美洲原住民是前哥伦布时期美国人的后裔,而南亚人(主要是亚洲人和欧洲少数人)的情况则相反。 这不仅仅是由于最近欧洲掺混物。 确切地说,尽管美洲印第安人与东亚有血缘关系,但这两个族群至少已有一万年的独特历史,而且可能更长。

**另外,有人说Noakhali的人狡猾狡猾,善于遵循 邮件 法律,而不是精神。 我只知道这一点,因为我小时候父亲的一位朋友,也来自孟加拉国,就抱怨说,诺卡里人彼此相识,而诺卡里人非常虔诚(他把妻子放在家里 面纱 当她从孟加拉国抵达时)要求其他人为他购买色情杂志。 他的理由是他不想被看到购买该杂志。 为好穆斯林购买这种物品是一种罪过。 后来,我的父亲和他的朋友(因身价从孟加拉国北部来)感到很同情,这是Noakhali人民的方式,在其中,您必须对自己有一些见识,以免他们为自己的利益谋取某种角度。 虔诚的非购房者以与其他孟加拉国人住在一起时不支付租金或迟交租金而臭名昭著,他始终强调他的宗教虔诚是最后偿还债务的保证。 他最终也发现了当时的移民法中的漏洞,相对容易地获得了绿卡,并且不需要赞助。 美国英语单词可能捕获了来自Noakhali的人如何居住的正确含义。 浮油.

 

后续行动 在下面发布,请参阅约翰·霍克斯(John Hawks), 选择对种群分化的全基因组影响 和p-ter 自然选择和重组。 正如我所说,这是 致密纸,而我并没有涉及很多问题。

 

如果您像我一样,并且正在阅读此博客,那么您很可能像我一样,您会阅读 LL卡瓦利-斯福尔扎人类基因的历史和地理 在 1990 世纪 XNUMX 年代和早期,斯宾塞·威尔斯 (Spencer Wells) 人类的旅程。在过去的 10-15 年里,科学取得了长足的进步,即使是卡瓦利-斯福尔扎的巨著与“后基因组时代”所带来的数据和分析的海啸相比也相形见绌。在那里,甚至线粒体 DNA 和 Y 染色体,研究人员现在正在研究数十万个遗传变异, 单核苷酸多态性,跨基因组。我们正在迅速接近这个时代 全基因组测序,即使我们还没有完全做到这一点。

但技术和计算进步的目的是什么?尽管长期项目是了解人类变异和遗传功能,以便具有生物医学用途,但在短期内,可以提取大量更抽象的群体遗传见解。由于当代基因组学的生物医学焦点,我们采取了某种以人类为中心的观点,这对我来说很好,因为我是一个未重生的物种。地上的鱼、鸟、爬虫可以稍后来。无论如何,现代进化基因组学关注人类的美妙之处在于,古人类学等整个学科可以作为跨学科项目的合作伙伴。

人类就像任何其他有机体一样,受到传统进化遗传动力学的冲击, 、迁移、自然选择以及更具生物物理根源的过程,例如 重组 和突变。每一个过程都会在基因组上留下明显的痕迹。突变补充了漂移和选择常常消除的变异,前者是偶然的,后者则以负选择的形式出现。迁移的目的是通过基因流动实现种群间的同质化,同时通过引入新的变异来实现种群内的多样化。最后,重组打破了 DNA 序列上遗传变异的线性关联,并已被用于 解释性别.


关于 智人 看来我们最近的进化史是由一些重大事件主导的。在过去的十万年里,我们经历了极其迅速的人口扩张,从非洲的一个小创始群体开始,适应性地辐射到除南极洲以外的所有大陆。当时我们是一个基因相对同质的群体,现存的大部分变异仍保留在非洲境内,而非非洲群体的多样性随着远离非洲大陆而逐渐减少。基本上是我们的物种通过一系列创始人事件传播到世界各地的模型。这个简单的模型足以概括概括,但故事的内容还有更多内容。在过去的几年里,一种古老的观点认为,当前的大陆人口是第一批定居者的后裔,即第一批现代人类取代了他们之前的古代人口,但这种观点似乎在所有情况下都不太可能完全正确。这可能是错误的 欧洲 并在一定程度上 印度,没有微不足道的例外。

关于大规模移民可能性的人口历史细节可以说很多,但今天我想重点讨论另一个动态: 自然选择对人类基因组的影响。有些研究人员对选择在塑造我们所看到的变异模式方面的功效非常怀疑,将其限制在少数基因座上,例如赋予乳糖酶持久性或对疟疾具有抵抗力的基因座。 其它 认为选择在塑造基因组方面的力量更为普遍。最后,有一个 中间路径,强调多样化和复杂的投资组合。

一篇新论文通过将相当古老的群体遗传统计与新扩展的数据集和强大的统计技术相结合,探讨了人类基因组选择的程度和性质, 人类群体分化与局部重组率密切相关:

种群之间的等位基因频率差异可以为研究种群结构和识别自然选择目标基因座提供有价值的信息。在这里,我们通过分析两个一致确定的全基因组数据集来研究人类重组率和群体分化之间的关系。我们发现通过洲际评估评估的人口分化 FST与重组率呈负相关, FST 与重组率最低的第十个基因组相比,重组率最高的第十个基因组减少了 10%(P≪10 - 12)。这种模式不能用重组的诱变特性来解释,而必须反映自人类大陆人口分裂以来过去 100,000 万年选择的影响。重组率与重组率之间的相关性 FST 具有质的不同关系 FST 非洲和非非洲人口之间以及 FST 欧洲和东亚人口之间的差异,表明人类历史不同时期的选择水平或类型有所不同。

你知道的 FST,即使你不知道什么 FST 是。您听说过,人类基因的变异 15% 是在种族之间,85% 是在种族内部。这 15% 是一个 FST 0.15。换句话说,FST 是一种群体遗传统计数据,用于划分群体之间和群体内基因的方差。如果您有两个群体,并且在一个基因座上两个等位基因 A 和 B 的等位基因频率均为 0.50,则 FST 自然会是 0,因为群体之间没有差异,您可以互换任一组中的个体以进行比较。相反,如果频率是不相交的,使得一个群体中的所有个体都具有等位基因 A,而另一个群体中的所有个体都具有等位基因 B,那么自然地 FST 将为 1,因为所有方差都存在于总体之间,并且您需要的所有信息都可以在总体子结构中找到。进行分析的绝佳机会!

但这因基因和基因组区域而异。正如您从上面知道的,大多数差异都存在于种族内部,而不是种族之间。但对于基因来说 SLC24A5 几乎所有的差异都发生在欧洲人和非洲人之间,而不是他们内部。同样,该基因的所有差异都存在于欧洲人和东亚人之间。最后,东亚人和非洲人在这个基因上没有差异。为什么?因为看起来这个基因最近在欧亚大陆西部的频率有所增加,以至于一种新的突变取代了非洲和欧亚大陆东部常见的祖先变异。此外,值得注意的是,这种基因变异似乎造成了非洲人和欧洲人肤色差异的 30-40%。重点是 总基因组变异并不总是特定基因进化历史的良好指标。这是一个问题,特别是对于那些我们可能感兴趣的情况。

在上面的论文中,他们发现高重组区域与 FST 在全球范围内。换句话说,基因组区域在 DNA 链上重组的频率更高,因此会打乱遗传变异并分裂 线性关联 显示较低 FST 价值观。减少群体之间的差异。

在他们的第一个图中就很清楚了。在我们开始讨论之前,让我指出他们正在使用 Perlegen 数据集,该数据集分别有两打非裔美国人、中国人和欧洲人,以及 1 万个 SNP。每个面板都有 FST Y 轴上的值和 X 轴上的重组率。

帝国图1

通过检查就很清楚发生了什么。平均下降4% FST 重组率每增加 1 cmM。相关性估计为 FST 每个面板的中位重组率:

A −0.962 (P = 8.9×10−6)
B −0.815 (P = 0.0041)
C −0.931 (P = 0.0001)
D−0.361(P = 0.306)

相关性估计值告诉您一些可以直观看到的信息: 根据您用来计算的人群,关系存在很大差异 FST. 特别是,很多之间的线性关系 FST 重组率实际上是由于非洲与非非洲的差异造成的。这并不完全令人惊讶,非洲人有很多遗传变异。就基因而言,人们可以将非非洲人视为 只是非洲人的一个分支 在许多方面。此外,十年来有暗示性的数据表明,当非洲人离开非洲时,他们面临着新的选择压力,这对于整个欧亚大陆人来说似乎很常见(尽管公平地说,欧亚大陆选择性扫荡的这些特征可能只是人口产生的误报)瓶颈等)。

是的,我将回到遗传变异的选择;两者是相关的,尽管这种关系可能很微妙。那么为什么两者之间呈负相关关系呢? FST 和重组?考虑一个 SNP,即单个 DNA 碱基对,它受到正向选择的影响。它的频率可以迅速增加,以便与人口成比例地从 ~0 到 ~1。公平地说,SNP 并不存在于抽象的宇宙中,它们物理上嵌入 DNA 中,因此两侧有许多其他碱基。如果一个 SNP 受到强大的方向选择,导致其频率上升,那么相邻的碱基也会“搭便车” 的频率也随之增加。换句话说,强大的定向选择可以重新排序整个基因组区域的变异,具体取决于选择的强度。它可以消除通过突变引入的多代变异的噪音分散,并用来自包含所选变异的祖先基因组的长等位基因序列替换它们。随着时间的推移,突变可以掩盖同质化,因为它补充了变异,但还有另一种动力阻碍了遗传一致性的长征:重组。当等位基因块的频率增加时,重组会撕裂等位基因块,重组越多,对局部基因组选择同质化能力的反作用力就越大,因为块被不断地切碎。

现在考虑不同人群中选择的本质。让我们规定东亚人和欧洲人的浅色皮肤是适应;我们 知道它们是由不同的 SNP 赋予的。换句话说,选择对不同的遗传变异进行操作以产生适应(尽管大体上是针对同一组基因)。所以, FST 由于群体之间的差异,色素沉着基因上的频率相对较高,并且这些基因往往被同质化区域包围,因为它们似乎快速扫过高频并沿着许多附近的等位基因拖动。假设自然选择平等重组的这种效应自然会不利于增加 FST 通过沿着瞬时向上分解基因组块来减少被拖拽的连锁等位基因的数量。

类似的效果也发生在背景选择的情况下,背景选择在有害突变周围起作用。当存在负选择的等位基因时,它们的邻居也会受到影响;将其视为一种群体遗传“财产价值”。由于负选择往往会减少有效种群规模,因此在较大的地理范围内,它可能会导致种群数量增加 FST (考虑已经经历瓶颈的孤立种群的遗传独特性)。同样,重组可以减弱有害等位基因对其邻居的影响。作者确实注意到,积极选择和背景选择的特定动态有所不同,后者是迄今为止更温和的事情,是重复的敲击而不是大锤,但他们分析的基因组分辨率使得他们缺乏探索这些差异的能力。

我将让作者描述一下欧洲-中国小组的特点:

…相关性较弱 F欧洲和中国人群之间的 ST 是由极低重组率基因座的分化下降驱动的……这根本不是在非洲和非非洲人群的比较中所看到的……该曲线显示了定性的非单调模式,这促使我们在引导框架内执行二次回归。回归是凹的,包括非常显着的线性项 (P = 3.0×10−4) 以及二次项 (P = 1.8×10−5)。相反,二次回归给出了一个不显着的二次项 F非裔美国人与其他两个人群之间的 ST 甚至稍微凸出。正如预期的那样,对于单个 SNP 分析(不按重组率进行分箱),线性回归对于 F非裔美国人与非非洲人口之间的 ST (P≪10−12)。为了 F然而,中国人和欧洲人之间的ST,线性回归并不显着(P = 0.81),而二次回归则非常显着(P≪10−12)……。

非单调只是表示趋势反转的一种方式。换句话说,线性模型不太适合欧洲人和中国人之间的差异及其与重组率的关系。他们为两者关系的“倒U型”性质提供了两种推测可能性 FST 以及欧洲人和中国人的重组。首先,非非洲群体的有效人口规模较小,背景选择的效率更高。由于随机遗传漂移往往会增加有害等位基因的频率,因此强大的负选择有机会针对基因组的该区域发挥作用。当相邻基因组区域受到影响时,这会导致更多的背景选择。由于人口规模不同,非洲人和非非洲人的积极选择和背景选择之间的平衡是不同的。第二个假设是,两个欧亚族群之间的基因流动允许选择性扫描从一个族群转移到另一个族群。换句话说,如果偏爱的等位基因分布在一个原始群体的所有群体中,则可以减少群体之间的方差(乳糖酶持久性 在欧亚大陆北部的大部分地区可能就是这样的情况)。

有趣的是,他们发现了之间的线性关系 FST 在编码的基因组区域(即,它们具有编码蛋白质的基因),特别是在 X 染色体中,重组更强。第二个与其他对齐 最近的工作 这表明X染色体由于其特殊的表达模式(男性只有一份基因拷贝,而女性由于X染色体失活,每个细胞只表达一份基因拷贝),可能比基因组的其他部分承受更强的选择压力。

最后,他们使用其他数据集复制了他们的结果。我只展示 HapMap3 的图:
journal.pgen.1000886.g004

我显然旋转了这样你就可以以更高分辨率看到标签。以下是人口:

WAF(“西非”)是 YRI(尼日利亚伊巴丹的约鲁巴语)和 LWK(肯尼亚韦布耶的 Luhya)的组合样本

EAS(“东亚”)是 CHB(中国北京的汉族人)、CHD(美国科罗拉多州丹佛市的中国人)和 JPT(日本东京的日语人)的组合样本

EUR(“欧洲”)是 CEU(北欧和西欧血统)和 TSI(意大利托斯卡尼)的组合样本

GIH 是美国德克萨斯州休斯顿古吉拉特印第安人的样本

MKK 是肯尼亚基尼亚瓦马赛人的样本; CHI(中文)是CHB和CHD的组合样本。

他们对这些发现的分析是谨慎的:

一个惊人的结果是,之间的关系 FST 并且重组率更强 FST 密切相关的群体之间,无论是在非洲境内还是境外: FST 西非样本和马赛样本(西非和东非混合血统)之间的差异……每 6 cM/Mb 平均减少 1%……FST 意大利人和西北欧血统的人之间的差异每增加 10 cM/Mb 就会减少 XNUMX%……并且 FST 日本人和中国血统的人之间的关系下降了 4%。..鉴于近代人类历史上每对种群都分裂以来,有效种群规模很大,这些观察结果支持这样一种可能性,即不同种群对之间观察到的不同模式是由于自然选择在环境中更有效地运作所致人口规模较大。 我们观察到与重组率的弱凸关系 FST在二次回归分析中密切相关的人群之间……这与欧洲人和亚洲人之间观察到的结果有趣地相反……另一方面,这些观察结果似乎并不支持以下可能性:不同的模式是由于共享选择性扫描而导致的由于 HapMap 3 密切相关的种群之间的基因流动水平可能高于各大洲之间的基因流动水平,因此不同种群对之间的差异程度不同。这些结果虽然有趣,但由于确定偏差的混杂因素,应谨慎看待。通过分析 1000 个基因组计划的数据,可以进一步测试这些观察结果,其中全基因组测序将为许多 HapMap 3 群体以及其他群体生成基本上不存在确定偏差的数据

选择在人口规模较大时会更加强大的原因是随机遗传漂变的噪音不太可能干扰其确定性过程。此外,人们推测,大群体中现存的遗传变异比小群体中存在的遗传变异更多。尽管这些结果很有趣,但他们似乎并没有太看重这些结果。

最后我来总结一下作者的结论:

总之,我们表明,全基因组人类等位基因频率的分化与兆碱基规模的重组率显着相关,这表明自然选择对过去十万年平均等位基因频率分布产生了深远的影响。虽然这些结果可能反映了搭便车和背景选择的影响,但要理清这两种力量的强度将需要扩展本文中提出的分析。一个重要的方向是使用具有精细空间分辨率的遗传图谱,这可能有助于揭示形成等位基因频率分化的选择系数的详细分布。这些结果可以扩展的第二个方向是比较更多大陆不同血统的人群。这应该有助于探索人类进化不同时期的重组率和种群分化之间的关系,并且应该可以更好地理解人口历史如何塑造自然选择对人类遗传变异模式的影响。

请注意: 我在这次治疗中遗漏了很多东西。它是开放获取的,因此您可以阅读整篇文章!

引文: Keinan A,Reich D,2010 人类群体分化与局部重组率密切相关。 PLoS Genet 6(3):e1000886。 doi:10.1371/journal.pgen.1000886

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”