基因结构的这些细微差别与所讨论特征的可能进化弧线无关。 导致性状或疾病发生频率高的适应模型之一是,新突变迅速“扫视”固定或几乎固定。 换句话说,在正向选择的驱动下,该位点等位基因群体中的频率从约0%转变为约100%。 这种快速
“硬扫” 还会导致与最初偏爱的突变体相邻的基因组区域中相关变体的“搭便车”,从而产生高
连锁不平衡 在基因组中
单倍型 跨基因座的相关等位基因块。 在以下情况下,这样的模型似乎确实可行
一些变体 导致色素沉着的多样性。 但是,在许多变体与性状变异之间的强关联与通过适应性驱动的积极选择的特征之间的这种巧妙的衔接在许多情况下并不容易实现。
关于什么可以驱动特定等位基因的高频率,还有其他的进化可能性。 人口瓶颈和近交可以仅通过偶然机会提高变体的出现频率。 这可能是在特定人群中隐性表达或以准孟德尔形式表达的许多特征和疾病的起源。 现在让我们将这种随机可能性设置在一边。 简单选择基于奇异新突变的正选择模型并不能充分挖掘自然选择的优势。 另一个模型是基于固定遗传变异的“软扫掠”模型。 考虑例如具有0.50的遗传力的性状。 性状值的50%的变异可以用基因的变异来解释。 与特质值相关的选择可以迅速改变特质在人群中的分布,如 育种者方程。 但是在该模型中不需要新的突变,相反,现存等位基因的频率会随时间变化。 实际上,随着比例的变化,将出现曾经很少在同一个人中一起发现的罕见等位基因的新颖组合,从而提供了一代中的平均性状价值的可能性。 t + n代 可能不在特质值范围内 t = 0.
随着时间的流逝,对数量性状的这种选择理论上会耗尽其自身的燃料,遗传变异。 但是通常这在实际中是行不通的,因为这样的性状受新突变的背景水平的影响, 平衡选择。 在中位表型附近稳定选择,以及频率依赖性和变化的环境压力,可能会产生一种情况,在这种情况下,适应永远不会超出瞬态通量而达到新的平衡。 永恒种族的元素是生命的核心 红皇后假说,其中病原体和宿主参与进化战争,宿主免疫反应受到负频率依赖性的影响。 随着等位基因频率的增加,其相对适应性也会下降。 随着频率的降低,其适应性也随之提高。
自然地,这种复杂的进化模型受偶然性的影响,其通用性较弱,只有在简单的硬扫掠模型不再足够时才具有吸引力。 但是,某些性状的遗传结构似乎是高度合理的,这些性状似乎受到了“缺少遗传力”将需要更多巴洛克式的进化模型来解释其最终出现和持久性。 中的新论文 PLoS遗传学 通过查看GWAS中涉及的SNP变异模式来解决这种复杂性。 人均国内生产总值 数据集。 人类基因组多样性项目人群中的全基因组关联研究SNP:选择是否会影响具有特质关联的未关联SNP? 一,摘要:
全基因组关联研究(GWAS)已经确定了2,000多个性状-SNP关联,并且这一数目还在继续增加。 GWAS专注于对人体健康有潜在影响的特征,包括许多免疫,代谢,心血管和行为表型。 鉴于复杂性状的多基因性质,选择可能会通过改变许多相关基因座的等位基因频率而对其产生影响,这一可能性有待实证研究。 在这里,我们使用等位基因频率变化的38种不同测量方法和8个iHS分数来表征1,300个全球分布人群中的53多个GWAS SNP。 我们应用这些相同的技术来评估按性状关联分组的SNP。 我们发现与色素沉着,血压,传染病和自身免疫性疾病特征相关的SNPs组在某些地理位置表现出异常的等位基因频率模式和升高的iHS分数。 我们还发现,在欧亚大陆和东亚,GWAS SNP在等位基因频率变化和iHS方面的得分普遍较高。 总的来说,我们相信我们的结果为选择一些导致多个相关基因座等位基因频率发生变化和/或iHS分数升高的复杂性状提供了证据。 由于GWAS SNP共同表现出较高的等位基因频率测量值和iHS评分,因此对复杂性状的选择可能相当广泛。 我们的发现与这种选择是正面的还是负面的最一致,尽管很难区分两者的相对贡献。 我们的结果还表明,在欧亚样品中鉴定出的性状-SNP关联可能在非洲,大洋洲和美洲不存在,这可能是由于连锁不平衡模式的差异所致。 该观察结果表明,非欧亚和非东亚样本人群应包括在未来的GWAS中
现在作者总结:
自然选择通过改变基因组多态性的等位基因频率来发挥其影响。 与有害性状相关的等位基因频率降低,而与有益性状相关的等位基因变得更常见。 在一个简单的情况下,选择作用于一个单一多态性所控制的性状。 在这种多态性下,等位基因频率的较大变化可以消除种群中的有害表型或修复有益的表型。 然而,许多表型,包括2型糖尿病,克罗恩病和前列腺癌等疾病,以及诸如身高,体重和头发颜色等生理特征,都由多个基因组位点控制。 通过影响单个关联多态性的等位基因频率或通过改变许多关联多态性的等位基因频率,选择可以对此类性状起作用。 为了寻找后者的病例,我们组装了具有共同性状关联的基因组多态性组,并研究了其在全球53个分布人群中的等位基因频率,以寻找地理空间中等位基因行为的共性。 我们发现与血压相关的变异往往与纬度相关,而与艾滋病毒/艾滋病进展相关的变异与经度相关。 我们还发现证据表明,选择可能正在全球范围内发挥作用,以增加等位基因的频率,从而提高自身免疫性疾病的风险。
在本文中,跳到这些方法可能会有用。 尽管我确信作者并没有打算这样做,但有时您会感到仿佛您正在跟随狂欢节招标操纵的大理石。 由于我不熟悉统计的某些术语,因此仅对方法进行简单的提及就不够详细了。 无论如何,这里的关键是他们专注于 与GWAS中的性状差异相关的SNP集,并将其与在53个人口的HGDP数据集中发现的总SNP进行比较。 请注意,并非GWAS中的所有SNP都在HGDP SNP面板中。 但是对于一般性的问题,单核苷酸多态性的交集就足够了。 此外,他们还产生了SNP的另一个子集,这些子集很可能与性状变异有关。 这些是具有相关功能的其他SNP在1 MB以内的SNP,或者是在多个GWAS中发现的SNP。
论文中有四个主要统计数据:Delta,Fst,LLC和iHS。 Fst和iHS很熟悉。 Fst衡量一组人口之间的人口差异之间的程度。 Fst高意味着大量的人口结构,而Fst〜0意味着基本上没有人口结构。 iHS是一项基于基因组连锁不平衡模式检测自然选择可能性的测试。 基本上,对于本文而言,重要的是iHS倾向于擅长检测中等频率的等位基因,而这些频率仍可能通过扫描。 这与较早的EHH测试相反,后者仅检测几乎完成的扫描。 如果作者专注于多基因性状和柔毛扫频,则出现在EHH上的可能性很低,因为这是基于硬扫频,几乎完整的扫频而来的。 LLC根据纬度和经度来衡量性状的遗传变异之间的相关性。 据推测,这对于抽出那些受到生态压力驱动的特征是有用的(一般意义上的一个明显例子是,随着生物体从温暖到寒冷的气候发展,整个分类群的面积/体积比的变化是一致的)。 最后,Delta会测量整个人群中的等位基因频率差异。 Delta的符号仅是所比较的等位基因频率在比较的第一群体或第二群体中是否较高的函数。
在进行比较时,作者并没有简单地以成对的方式对所有53个人群进行比较。 相反,他们经常汇集大陆或区域集团。 左侧是表1的一部分。它显示了用于生成Delta值的总体以及如何将其汇总。 这 HGDP人口 以一种非常直接的方式按区域进行细分。 但也请注意,有些比较是在区域内的人口与生活方式不同的人口之间进行的。 我认为本文中突出显示的比较是为了在这种探索性尝试中最大程度地压缩信息性汁液而进行的。 据我所知,在HGDP数据集中,欧亚人口中没有专职的狩猎采集者,因此无法进行农业学家和狩猎采集者之间的比较。 非洲数据集中有这样的比较。 作者通过将GWAS SNP与HGDP数据集中的随机SNP进行比较来生成p值。 特别是,他们正在寻找HGDP数据集的独特性特征。
这种独特性是可以预期的。 与疾病和值得注意的特征有关的SNP集不可能是整个基因组中SNP的代表性子集。 记住 中性模型 分子进化的意义意味着我们应该期望基因组内的大多数遗传变异将归因于随机力。 图1的面板A显示,实际上,来自GWAS的SNP确实表现出与HGDP面板中的SNP总数不同的模式。 请注意,GWAS SNP的次要等位基因频率(MAF)的分布有些偏向更高的值。 如果GWAS的逻辑是针对“常见变异”的,而这种变异会在人群中足够频繁地产生一种足够强大的效应,以至于研究被赋予样本量,那么偏向于更常见变异(更高的MAF)是可以理解的。
左侧是一些具有低p值的SNP和特征(即,它们偏离了预期,超出了您对随机噪声的预期)。 毫不奇怪,他们发现与色素沉着相关的SNP在所有的种群分化和变异测量中都倾向于强烈显示。 rs28777位于 SLC45A2,这是区分欧洲人与非欧洲人的场所。 rs1834640在 SLC24A5,从而将欧洲人+中东人+中亚/南亚人与其他人群区分开来。 rs12913832是与“蓝眼睛”相关的变体。 也就是说,它是欧洲人的蓝眼睛和非蓝眼睛颜色差异相关的标志之一。
鉴于色素沉着是目前技术已充分阐明的少数几个特征之一,应该预料到,旨在检测种群内和种群内遗传变异的更微妙和彻底的方法应首先偶然发现这些标记。 作者指出,“与SNP相关的SNP和研究组 色素沉着和免疫学特征占我们分析中有意义的大部分。” 长期以来一直在寻找色素沉着和疾病相关基因座周围的选择特征的趋势。
在低p值的模式中从地理上也很明显的一种模式是欧亚群体趋于富集的趋势。 如图2所示。GWAS研究中的大多数SNP均来自欧洲的研究人群。 因此,在评估的SNP集合中可能存在偏差,这对欧洲人和相关人群特别有用。 此外,欧亚人离开祖传非洲环境时可能受到不同的选择压力约150-50,000年BP在任何情况下,出于医学分析的目的,作者的确发现使用东亚人群的SNP产生了一些不同结果要比使用欧洲人群的结果好。 尽管一些研究表明SNP在人群中具有广泛的适用性,但是毫无疑问,非欧洲人群中的许多变异都没有被发现,因为GWAS研究并不特别针对非欧洲人群。 考虑:
…然而,我们的结果表明,GWAS中与色素沉着相关的SNP几乎在欧洲,中东和中亚地区都显示出异常的等位基因频率模式。 这向我们表明,可能存在SNP,可能在除 SLC45A2,IRF4,TYR,SLC24A4,HERC2,MC1R, 和 知识产权协会,与非欧亚人口的色素沉着有关,但尚未被GWAS识别。 需要使用非欧洲受试者进行的针对色素沉着性状的GWAS,以进一步探索这种可能性。
人们发现,在HGDP人群中,有两种主要的特征/疾病类别也有系统地不同:
–与高血压相关的变异似乎随着纬度的降低而降低
–传染性和自身免疫性疾病SNPs得分较高。 具体来说,与欧洲人相关的一些与HIV相关的SNP似乎具有抗药性
第一组特征自然会来自GWAS衍生的SNP,因为如此大量的医学研究已开始识别风险,治疗高血压和其他循环系统疾病。 一致的模式,其中 地理而不是祖先预测变化 是外生选择压力的绝佳证明。 地球的物理性质使得随着哺乳动物从赤道扩散开来,它们的体形将因不同的生态参数集而发生变化。 西伯利亚人口有 适应冷压力,而且在身体形态上似乎存在一致的跨类群转移,以使哺乳动物之间的热辐射最大化或最小化。
在第二种情况下,您对疾病再次产生抵抗力,以及 多效性,因此遗传变化会产生多种下游后果。 通常,这在时间上是同时发生的。 考虑 驯服的银狐。 但是有时您会改变过去,由于不同的选择压力而在后来产生了后续后果。 免疫学反应具有多种用途也就不足为奇了,因此,即使欧洲人没有对艾滋病毒产生抗药性作为普遍的选择压力,类似的压力似乎也导致了具有普遍效用的抗药性反应,并且如今已针对艾滋病毒进行了特定用途。 选择通常可能是一种钝器,将自身置入具有多种后果的相互作用网络中,同时在最大程度地提高本地适应性的过程中同时重塑许多特征。 当您具有以下特质时,这一点最明显 镰状细胞病,这仅仅是因为杂合性的适应性优势如此之大。 但是毫无疑问,当涉及到许多特征时,副产物更加微妙,或者对我们而言似乎是神秘的。 我们仍然不知道为什么 雷达 在东亚人中被驱使的频率更高(较少的体味和浓密的直发似乎是难以置信的选择目标)。
就像自然选择对基因和性状的协方差的影响可能是直率的和粗鲁的一样,自然选择的放松可能会消除令人窒息的恶习。 考虑一下血压的可能性:也许北欧亚人的血压较低的原因是放宽了对与较高值相关的其他相关性状的选择,从而使该特定维度的适应性最大化。 同样,非裔美国人的镰状细胞疾病发生率低于其约80%的西非血统,因为没有消除杂合子的地方性疟疾选择压力,这允许从基因库中清除等位基因。
尽管如此,作者的确得出以下结论:
尽管我们采用了广泛的方法,但我们仅发现了可能是对单一选择压力的多基因反应的几个例子。 我们确实使用了严格的显着性标准,这可能意味着可以在研究组中找到一些其他示例,这些示例并未完全达到我们的显着性标准。 也可能是关于“ GWAS”特征及其潜在遗传的某些东西破坏了我们的方法。
他们对为何无法成功提出了一些建议:
– GWAS变体不是变体的主要来源。 可能是拷贝数变体,罕见的大效应变体(“合成”)
–上位性。 基因-基因相互作用,将掩盖或混淆变体和性状之间的线性关联
–选择对GWAS SNP的影响小,或者平衡或否定选择
他们完成:
总而言之,我们检查了1,336个CEPH-HGDP人群中的53个与性状相关的SNP,以寻找具有异常等位基因频率模式和iHS分数升高的单个SNP和SNP组。 我们与一个相关的SNP或研究组一起确定了13个不同的性状,这些性状在至少一项Δ,Fst,LLC或iHS量度中得分显着提高,占所分析特征总数的一小部分。 我们认为,有限的阳性结果可能是由于我们严格的意义标准或性状本身的遗传结构特征所致。 具体来说,尽管积极研究的领域很少见,但稀有变异,上位性和多效性在人类复杂性状中的作用仍未得到很好的理解。 我们的措施对于检测所有作用于GWAS性状的选择类型也不是最佳的。 据推测,复杂性状的潜在变异主要受到负选择或平衡选择的影响,这可能不会为我们的测量方法带来极端价值,特别是如果这些力在人群中相对统一或作用于基因组中的许多区域时。
如果对多基因性状的选择性压力如此普遍,那么基因组学家可能会不屑一顾。 定量遗传学导论。 这些是特征和进化过程,缺乏明显的区别。 在许多方面,对正选择和强力推销建模都类似于均衡的经济学。 当涉及到受许多基因影响的连续性和定量性状时,必须提出一种不同的思维方式。 暂时不再成为停滞之间的标点,而是事物本身。 有例如 HLA 在黑猩猩中发现的人类基因,因为宿主和病原体之间永恒的种族关系的性质意味着所有旧的花样都至少在低频时得以保留。 人类在智力,身高以及各种其他责任和特征方面的变化,可能一直伴随着我们,并受到众多选择压力的不断冲击。 问题是,我们的原始统计方法是否能掌握这个分散但功能强大的网络?
引文: Casto AM和Feldman MW(2011)。 人类基因组多样性项目人群中的全基因组关联研究SNP:选择是否会影响具有特质关联的未关联SNP? PLoS遗传学: 10.1371 / journal.pgen.1001266