当您在脑海中概念化在二倍体性生物中生物复制过程中发生的基本动态时,ROH可以告诉您的有关个人(也许是人口)的信息变得更加清晰。 每个人都从每个父母那里获得一半的常染色体基因组。 尽管基因是抽象的,但复杂的因果序列的根部是映射到表型,性状的单个单元,但它们还是嵌入在DNA结构中的物理实体。 这个结构是一个物理序列,在这里您具有相邻的碱基对,它们的簇定义了基因,基因间区域,外显子,内含子,启动子等。换句话说,
分子遗传学。 沿着染色体的基因彼此之间的空间关系允许
连锁映射 几十年前,人们就已经知道DNA的生物物理底物对整个过程至关重要。 因此,等位基因的特定序列可以一起遗传,并形成一个等位基因。
单倍型。 在这些世代中,这些独特的等位基因在单倍型中的关联通过
重组,这是侵蚀染色体序列结构完整性的物理过程。
牢记这些基础,让我们来看一个具体的令人反感的例子。 想象一下,一位父亲浸渍了他的女儿。 为什么对我们如此排斥? 从结果的“基因之眼”的角度来看,父亲正在掩盖性繁殖之美,从而使个体之间的遗传变异得以混合和匹配。 口语上,女儿在基因上将占父亲的50%,女儿的子女和父亲在基因上将占父亲的75%。 从纯基因的角度来看,这可能是有利的,因为父亲越来越接近克隆自己, 但是我们都知道,这些人中“车辆”的故障率很高。 为什么? 近交导致纯合性的相对大量增加,因为通过下降而相同的染色体区段彼此配对。 我们知道,问题在于近交个体中很可能会出现许多讨厌的隐性疾病。
所有人类都携带大量有害等位基因。 其中一些可能会致命。 但是就像没有触发装置的炸弹一样,等位基因的功能性拷贝可以补充并掩盖突变体的种类,我们继续进行下去。 这些突变体中有许多是我们家庭特有的,其中一些甚至对我们自己而言都是私人的, 从头 使得每个人都具有独特遗传岛的突变(至少直到它们繁殖并传递其突变区别为止)。 因此,一个在乱伦行动中将自己的基因混合在一起的人可能会点燃导火索,从而使这些隐藏的恶意突变体将从隐性遗传畸形爆炸而走向成熟的疾病怪兽。
可以记录乱伦的一项统计数据是ROH; 自然地,当最近的IBD染色体片段的长区域彼此相邻时,您将具有很多纯合性,因为配对的等位基因是复制副本。 假设具有许多长ROH的个体可以生存并随着时间的推移繁殖,则这些大量的同质性将通过突变,重组以及近亲繁殖而被抹去。 乱伦仍然可以说是一场健康灾难,但是人们可以想象,随着时间的推移,进化变异的动力遗传引擎可以治愈这种损害。
而且不一定非得如此极端。 父女或兄弟姐妹的乱伦只是一个边界条件。 堂兄的婚姻并没有灾难性的, 英属巴基斯坦人 尽管遗传异常的发生率较高,这是明确的证据。 他们肯定比非巴基斯坦的英国人更适合进化,后者每个家庭最多只能繁殖4个孩子。 这些氏族将表现出更适度的ROH水平,因为 关系系数 表亲之间的亲戚只有1/8,而父母子女或全兄弟姐妹之间的亲戚只有1/2。
左图是2008年的一篇论文 欧洲人的ROH。 特别是这些是Orcadians或部分Orcadians。 您应该在HGDP面板中熟悉的人群。 Orcadians是当地人 奥克尼群岛 就在苏格兰的北海岸。 尽管维京人,苏格兰人和皮克特人的起源有些不同,但由于岛上居民的隔离,他们已经发展出自己的遗传特征。 一个好的经验法则是,任何水域都是偶然基因流动的可怕障碍。 在y轴上,您可以看到给定个体基因组中ROH的总数。 我指着你 方法 如果您对在计算中指定的确切参数感到好奇。 ROH是在基因组窗口范围内评估的,自然可以改变其宽度,以及将特定区域注册为运行或不运行的严格性。 在x轴上是以碱基对表示的总长度。 您会看到ROH数量与序列的总基因组长度之间呈正相关。 由于非奥卡德人血统而在遗传上更加多样化的那些奥卡德人在其基因组中具有最低的纯合性。 那些近亲表亲结婚的产品最多。 但是请注意一个特殊的模式: 有个 曲线趋向于值。 在那些大概有很高的人 近交系数 仅基于ROH总数,ROH的总长度似乎超出了人们的预期。 为什么? 因为它们确实具有非常长的纯合性。 这正是我们从我之前描述的那种过程中所期望的,在这种过程中,长染色体序列被重组分解需要花很多代的时间。
在让您对欧洲纯合性的基因感到兴奋之前,让我们先进行更广泛的了解。 发表以上论文的一些研究人员也得出了一系列调查世界的结果。 纯合子的基因组运行记录种群历史和血缘关系:
人类基因组的特征在于许多纯合基因型的运行,其中从每个亲本继承相同的单倍型。 自从共同祖先以来,每次奔跑的时间部分决定于世代数:表亲婚姻的后代具有长期的纯合性(ROH),而许多较短的道与数十和数百代共同的祖先有关。 人口经历了广泛的人口历史,对血亲持有不同的文化态度。 在全球人口数据集中,通过对长短ROH进行全基因组分析,可以将此处抽样的主要土著人口分为四个主要类别,据推测,这些人口中的大多数具有以下特征:(a)最近的父母亲相关性(南方和西方)亚洲人); (b)数百至数千年前因长期孤立和有限的有效人口规模而产生的共同父母血统(N e),但近亲繁殖很少(大洋洲); (c)古代和近代父母之间的亲戚关系(美国原住民); (d)仅与大陆N相关的共同血统的背景水平 e(主要是城市欧洲人和东亚人;在撒哈拉以南非洲地区的农业工作者中最低),以及偶发的隐性近交个体。 此外,可以沿着代表该人口历史空间的轴定位个人。 因此,长期的纯合性是我们基因组在全球范围内普遍存在且未被重视的特征,它记录了过去的血缘关系和种群隔离,并提供了个人祖先人口史的独特记录。 单独的ROH措施还可以量化由多基因隐性效应引起的疾病风险。
他们的数据集包含HGDP样本人口,因此您自然拥有广泛的地理区域,例如非洲,欧洲,西亚,中亚/南亚,东亚,大洋洲和新世界。 ROH的模式有两个大的动态叠加在一起:“深厚的历史”人口过程,例如瓶颈和人口膨胀,以及我们周围看到的文化人类学模式,例如近亲氏族的表亲婚姻。 要找到前者,您需要仔细检查基因组。 相比之下,后者在基因组学上留下了很明显的体征,以很长的ROH以及隐性疾病簇的形式出现。
第一个数字显示了按人口划分的不同ROH长度的分布:
这是带走的地方:
–大洋洲人的ROH较短,但是随着您增加ROH阈值的长度,他们一点也不例外
–新世界样本的ROH数量无论长度如何都保持不成比例的增长,尽管数量会随着长度阈值的增加而下降。 这是有道理的,人类基因组的长度是有限的,您只能拥有这么多非常长的ROH
–尽管西亚欧亚和中亚/南亚人口在最低类别中并不例外,但他们的ROHs似乎比其他欧亚或非洲人群更长。
–非洲人的ROH最少,尤其是在短期内
在详细评论这些模式之前,让我们快速查看下图。 它只看非洲人,但是 将样本分为猎人和农耕者。
狩猎采集者比农耕者拥有更多,更长的ROH。 为什么? 答案在很大程度上也解释了地理格局: 更大的长期有效人口。 有效人口只是指在遗传上有助于下一代的人口比例。 小有效种群意味着由于样本方差增加而导致大量的遗传漂移,并趋于收敛 血缘。 如果您的部落足够小,您的表弟可能就是您唯一可以结婚的人。 正如我在上面提到的那样,这将产生较长的ROH,因为个体将通过同一祖先的多条血统下降,从而大大增加了自噬的可能性。 相同的过程可以解释为什么相对于除美洲印第安人以外的其他群体,西亚人和中亚/南亚人的长期LOH得以提高。 这是一张地图 康桑网:
许多穆斯林社会实行表亲婚姻,许多穆斯林甚至认为这是 此 伊斯兰习俗(他与许多表亲结婚是他的表弟。奇怪的是,这些穆斯林并没有主张嫁给有钱的老寡妇也是穆斯林的习俗,尽管有些人确实认为嫁给几乎没有青春期的女孩很重要)。 此外,在印度,南部的许多印度教徒群体都进行近亲通婚,包括叔叔侄女通婚。 这一切现在都在发生,因此在许多家庭中会产生长ROH的特征。 最终数字将按选定的人群细分个体,其中y轴是ROH的数量,x轴是ROH的总长度:
人口集代表更广泛的地理集群。 Karitiana来自亚马逊,Maneneka来自塞内加尔,Balochi来自巴基斯坦。 如果您不知道法语和日语的来源,请问您永远不要在此博客上发表评论。 请注意,一些法国人,曼登卡人和日本人偏离了主要人群。 这些是秘密近交的,也许他们的父母是表亲,或者他们的一些祖父母是表亲。 相比之下,Bal路支的ROH长度范围很广; 这是典型的人口,其中很大一部分人是表亲结婚的产物,但很多不是。 个人在父母之间会表现出预期的相关性差异很大的事实,这意味着他们自己的近交系数和基因组相关性(在这种情况下为ROH)也将有很大的差异。 相同的参数在Karitiana, 濒危民族 大概每个人都有一个小的“伙伴市场”。
那巴布亚人呢? 他们的族群很紧密,并且没有像亚马孙部落那样拥有ROH的总长度。 但是请记住,在第一个图中,他们有许多短ROH。 一个合理的解释是,巴布亚人经历了一个古老的瓶颈,并且从那里开始发展。 瓶颈增加了遗传漂移,因此产生了高度常见的单倍型区,这些区合在一起产生纯合。 但是随着时间的流逝,这些区块将通过突变和重组而瓦解。 那么,巴布亚的ROH只是过去人口统计事件的阴影,而Baloch中的ROH就是当前人口统计事件的证据。
当您深入到南亚和中亚群体时,补编中清楚地说明了这两个平衡的现实。 从图中可以清楚地看出,ROH数量始终居高不下的人群是卡拉什(Kalash)。 这是有道理的。 卡拉什(Kalash)是一种遗传隔离株,因为它们传统上是在巴基斯坦偏远的奇特拉尔地区孤立的异教非穆斯林组织。 由于穆斯林无法加入他们的部落一千多年,基因流一直是单向的,因为卡拉什(Kalash)to依伊斯兰教并因此融入了更广阔的巴基斯坦社会。 相比之下,其他巴基斯坦集团的ROH总量差异很大。 样本中总长度和数量中ROH最小的个体是Baloch,Brahui和Makrani,以及在这些统计数据中具有最高值的个体! 尽管卡拉什(Kalash)在人口规模较小的压力下一直持续缓慢地下降,但the路支(Baloch),布拉威(Brahui)和马克拉尼(Makrani)受到近交氏族几代首次表亲婚姻的重击。 这些世代相传的婚姻迅速增加了ROH,因为第一代表亲在遗传上比在人类学上更紧密地联系在一起。
在前基因组时代,近交的计算很简单。 只看血统书。 由此得出近交系数。 关键是要记住,在计算中,祖先的总和之间的关系至关重要。 在美国,表亲之间的婚姻发生在通常与祖父母没有亲属关系的个人之间。 但是在其他社会中,祖父母的一代,也许是曾祖父母的一代,也可能是堂兄。 但家谱有局限性,可能会错过深厚的血统。 左图是我引用的第一篇论文的左图,显示了个人血统的比例关系,该关系在y轴上是通过基因组(ROH)方法计算的,在血统上是相同的,而在x轴上是传统方法的比例(谱系)。 两者之间存在明显的相关性,但观察到对最适合线以上的值略有偏差,并且y值高于x。 基因组学估计捕获了常规谱系范围之外的共同祖先!
这些模式的含义有两个方面:首先,回顾人类历史,其次,展望生物医学。 这里的ROH模式与Out of Africa的连续瓶颈模型大致相符。 来自非洲的人口越多,他们的ROH越短。 非洲人口中,由于长期有效人口规模较大,并且相对不受瓶颈过程的影响,它们所占的比例最少。 短期现象是近亲结婚模式,无论是有意识的和文化规范的(例如在穆斯林世界和南亚的部分地区),还是由于人口限制(如猎人与采集者之间的情况)。 由于在医学遗传学领域内隐性疾病的突出表现,这两个过程在一起是相关的。 很明显,ROH时间过长是近亲繁殖的迹象,因此个人对多种疾病的敏感性更高。 但是作者指出,许多短ROH的总和效应也可能是有问题的,特别是由于这些短基因可能共同构成许多种群基因组中ROH的优势。
到目前为止,我基本上已经提到了人口统计学的历史,以及它是如何通过基本中性和随机的过程塑造基因组的。 近交本身可以看作是超负荷漂移的一种形式,它是繁殖群体的长期有效种群 倒塌 本身。 但是自然选择呢? 我决定仔细研究一下 基因组解压缩 ROH。 他最长的区域之一位于2号染色体上,长度约为2 Mb,从位置134606441延伸到位置136593184。在23andMe中,有一个位置可能被解释为:136325116。 rs4988235 在23andMe数据文件中。 此SNP的变体 追踪欧洲人的乳糖酶持久性。 丹尼尔·麦克阿瑟(Daniel MacArthur)博士具有纯合子形式的乳糖酶持久性基因型。 我们是否在这种长ROH中看到了与乳糖酶持久性相关的长单倍型,由于自然选择,在过去10,000年中其频率迅速上升? 通常,本文中概述的参数可以满足人类历史的广泛需求,但是在图片边缘留有一些有趣的细节。
最后,让我们回到杂合与纯合。 我最近看了纪录片 “混血会更好吗?” 抛开明显的现实,这种程序反映了 时代精神 在那个时代(很明显,即使有相同的证据,维多利亚时代的科学家也可能制作了不同的纪录片),在接近尾声时,人们对人群和个人的ROH进行了比较。 该比较实际上是由研究小组完成的,该小组发表了我刚刚评论过的论文。 如果您跳到电影中只花38分钟,只是看他们会列出结果,但我会告诉您他们发现了什么。 他们比较了两个欧洲男人,一个南印度女人和一个父亲是英国人,母亲是尼日利亚人的男人。 欧洲人的纯合度水平符合预期; 在更高端。 这位南印度妇女的纯合子水平较低。 这是可以预料的,因为印度在泛欧范围内具有相对不同的遗传基因。 最后, 混合种族男性几乎没有纯合性可言。 首席调查员承认,在他测试和分析的5,000个人中,这是最极端的结果,因此他必须重新检查。 为什么? 三个因素:
–母亲是尼日利亚人,这是一个遗传多样性相对较高的人群
–父母之间的遗传距离相当高
–最后,由于该人是非洲人和欧洲人倾向于不同的所有基因座上的第一代杂种,因此他更有可能是杂合子
我让作者有最后的话:
长ROH是我们基因组的一个被忽略的特征,在这里我们证明了它在人类中普遍存在,并且与人口历史很好相关。 但是,从个人的背景来看,ROH只能是部分可预测的(由于继承的随机性)。 考虑到许多复杂疾病特征中存在隐性成分的证据,ROH不仅赋予人们对隐性孟德尔疾病的敏感性,而且还可能是常见复杂疾病未被充分认识的危险因素……它们将允许量化不同隐性遗传变异所产生的风险人口。
引文: Mirna Kirin,Ruth McQuillan,Christopher S.Franklin,Harry Campbell,Paul M.McKeigue和James F.Wilson(2010年)。 纯合子的基因组运行记录了人口历史和血缘关系PLoS ONE: 10.1371 / journal.pone.0013996
图片来源:Allison Stillwell