Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
人均国内生产总值

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

几周前,人们在争论基于模型的聚类程序包的实用性,该程序包会生成直观的条形图,从而分解个人和人口百分比。 要了解这些软件包的基本基础,我将带您参考原始 Pritchard等。 纸。 您可能已经知道,软件包的主要参数之一就是K值,它是指将被视为遗传变异组成部分的种群数量。 一个关键点是,使用这些软件包的人员正在迫使该版本适应特定的模型。 您可以拿冰岛人的数据作为例子,找到K =100。这将产生结果,但是我怀疑您会直觉这在拟合现实方面确实不是最佳模型。 同样,您可以对北欧人,西非人和东亚人进行抽样,并将K设置为2。这将使欧亚人与非洲人分开,因为这是自然的系统发育亲和力。 但是K = 3可能更适合该数据。 我的意思是说北欧人和东亚人不是,也没有去过 长时间,随机交配种群。 K = 3反映了这一现实。

到目前为止,这很直观。 有没有正式的方法来检查这一点? 是的。 各种。 结构输出每个K的对数似然度。混合会给您交叉验证错误。 要全面了解Admixture如何估算交叉验证错误,请参见 亚历山大等。 思考如何解释这些价值的一种直观方法是 它们使您了解要从数据集中挤出太多K的位置。 Admixture的交叉验证值有一个简单的解释,请寻找图上的最低点。

回到HGDP数据集,我想知道K的规模在哪里。 望着 人口 我假设大于5,但可能小于20。这个范围很广,可以告诉您我的直觉并不好(一些不同的人群很难合并到汇总的数据集中,因为时间不多了因为存在分歧,或者他们不是真正的基因分离群体)。


我做的第一件事是在质量方面准备HGDP数据 砰砰。 我筛选出次要等位基因频率大于0.05的SNP,以获得可能在种群间规模上具有参考价值的变体。 然后,我删除了超过1%的个体中缺失的SNP。 最后,我还对LD修剪了SNP(基本上是对标记进行了细化,以使我摆脱了由于它们靠近其他SNP而没有添加更多信息的变体)。 此外,我还删除了与数据集中的其他人非常相关的个人。 这产生了1,024个个体和116,840个SNP的数据集。

然后,我运行了Admixture 20次,并从K = 2到K = 20进行了默认的五重交叉验证。这是一个散点图的结果:

错误大

您看不到某些点,因为在较低的K处,误差的变化很小。 显然,几个K不能准确地捕获HGDP数据集中的变化。 换句话说,HGDP数据集中没有四个不同的随机交配种群(K = 4)。

这是放大图。

错误缩放

这些结果清楚地表明,在区间K = 11至K = 16处存在一个“谷”,交叉验证误差的平均值在K = 16时最低。不仅K = 16的交叉验证误差最低,而且在以下范围内K = 4时,交叉验证误差的变化也最小。 这并不意味着有16个自然种群最能定义世界的遗传变异。 为什么不是这样,我将带您到Daniel Falush的帖子 我们从Rosenberg等人那里学到了什么。 实际上是2002年?,突出显示了基于结构的模型的聚类的其他一些主要依赖性。

但是,一个补充点是 数据中K的数量为 不能 任意和主观的。 那是因为人类遗传变异在许多形式的虚拟化和推断中始终展现出地理结构。 我还想补充一点,第二点是,新一代的人口结构推断方法论指出了以下可能性: 人类遗传变异并没有通过沿梯度梯度的距离动态隔离而出现。

附录: 我正在合并我的20个跑步,从K = 16开始。但这需要时间。 我还使用不同的数据集运行K = 2到K = 20,该数据集扩展到HGDP之外,具有20个重复项。

 
• 类别: 科学 •标签: 基因组学, 人均国内生产总值, 种族, 结构 

早在1990年代,围绕 人类基因组多样性计划。 实际上有整个 专为 社会学 该项目。 尽管在某些细节上批评该项目的人可能有观点,但他们停止在该领域进行科学调查的总体目标总体上还是失败了。 几年前,一支来自芝加哥大学的团队甚至 产生了一个网络浏览器 因此您可以自己浏览数据。 据我所知,这并未导致针对土著人民的大规模灭绝种族行为; seem,人类似乎不需要任何科学依据。

但是,如果我是“左撇子是种族主义者”,我想我可能会断言,用来为HGDP公共数据集生成600,000个标记的筹码是种族主义的! 我不是这些类型中的一种,所以我真正关心的是 确定性偏见。 据我所知,今天有许多SNP芯片正在寻找变体 在欧洲人中最常见。 这是因为如此多的医学遗传学研究人群属于欧洲血统。 这不是一个总的交易破坏者,许多欧洲差异对理解世界范围的差异模式很有用。 但最终它不是最佳的。


今天,我们在改变这一点上迈出了重要一步。 尼克·帕特森 送我一个很好的头脑,跟着大卫·赖希(David Reich)的一个项目 实验室。 该小组利用不同人群,其他灵长类动物和古人类的完整基因组,与Affymetrix合作,制作了一个小组,该小组针对那些对人口统计学和适应性历史感兴趣的人的关注进行了微调。 。

你可以找到 文件在这里ftp://ftp.cephb.fr/hgdp_supp10/。 特别要看 技术文件。 当我有时间的时候,我会玩这个的,放心。

最后,尼克添加了一个重要的警告:

我们希望这个数组以及我们产生的HGDP数据将成为进行人口遗传研究的主要资源。 数据无疑是复杂的(13种不同的确定方案(!)),用户应阅读技术文档,尤其是简短的自述文件。 特别要注意的是,古代DNA等位基因的质量不高(尤其是尼安德特人),分析中存在众多潜在陷阱

 

我已经指出过几次,在显示遗传变异的二维图中,您必须要小心的一件事是,投影数据的维度通常是由数据本身生成的。 因此,添加更多数据可以更改先前数据点的空间关系。 另外,在 23andMe的全球相似性高级情节 被投射 从生成的尺寸 人均国内生产总值 数据集。 有一些实际的原因。 首先,每次有人添加到数据集中时,重新计算方差分量的计算量很大。 其次,这并不是说任何给定个人的种族身份都得到了验证。 如果外星人寄出了工具包并伪装了,您会怎么做 “法语” 作为他们的祖先?

所以,在回复 此评论: “让我重新表述:当您切换到全球情节时,有什么区别吗? 我想可能不会,否则您会提到它。” 实际上,两者之间存在细微的差异。 在右下方,您会看到一个“世界观”,我的位置被标记为绿色,而在左侧,则是HGDP数据集中中亚/南亚的“放大”。


由于情节的“生意”,很难看到区别。 但是,当我不与他人“共享”基因时,您会看到:

1)中亚哈扎拉/维吾尔族集群与由巴基斯坦集团组成的南亚集群之间有一定的差距。

2)在中亚/南亚变焦镜头中,我处于两个星团之间的距离,大约是从南亚星团到中亚星团的1/3距离(下一个最接近的人朝那个方向移动, 家庭成员是孟加拉人)。

3)相反,在世界范围内,我处于中亚集群的边缘,朝着南亚集群的边缘发展,但与它之间肯定有一段空白。

您会看到两个图之间的一些广义差异。 中亚/南亚的观点具有主要的线性集群,卡拉什(Kalash)是一个独特的群体。 在世界范围内,事实并非如此,相反,您有一群巴基斯坦人,其中有非平凡的非洲掺混物朝那个方向移动(主要是Makrani,但HGDP数据集中的一个信德人似乎是布朗托人!)。 由于南亚地区的非洲差异不大,除了杂乱无章的个人自然会带到餐桌上之外,它并没有摇摇晃晃地成为两个最高维度之一。 那我怎么了我没有很好的假设,但我怀疑我可能 东南亚血统 在世界范围内,我进一步向亚洲集群转移。 在世界范围内,有些人的国民生产总值与缅甸人关系密切(例如纳西族),而在中亚/南亚地区则自然而然。 当您将祖先分解为“欧洲”和“亚洲”部分时,哈扎拉/维吾尔族集群是可以的替代品(两者都是杂种,“欧洲”和“亚洲”祖先的比例大致相等),但这实际上是一个近似值。 这两个群体的亚洲血统更为“北方”,而我的血统更为“南方”。 由于它们包含在中亚/南亚群中,所以欧亚大陆的东西向维度是由更多的东亚北部人口构成的,这可能低估了我的东亚元素。

尽管我与谁共享基因,但实际上有一个比我更好的例子。 这个人是波斯人。 请注意,在世界范围内,它们似乎处于欧洲集群的边缘,正朝着中亚/南亚集团迈进。 但是,当您执行中亚/南亚缩放视图时,它们就在该集群中! 请注意非常不同的位置。 缩放视图中的“邻居”与世界视图中的“邻居”完全不同:

我之所以说为什么我在世界视图中更“亚洲化”,是因为世界视图中有我更接近的亚洲群体,但在我的缩放视图中却没有这些亚洲群体。 这个波斯人似乎正在发生一个极端得多的情况,他的家人来自伊朗北部,在他的一个宗族上有俄罗斯血统的口述历史。

这就是为什么我假设任何指向论文和情节并声称“这证明X”的读者在认知上都受到挑战的原因。 PCA中的模式不一定是任意的。 但是,确实需要谨慎地解释它们。 一组结果并不能确定辩论中的任何给定立场,至少在您到达荒谬的边界条件之前(在某些方面,我认为很多遗传数据可视化就像我对回归的思考一样。这就是人们的看法。使用/解释有问题的方法,而不是方法本身)。

最后,对您来说,将南亚人投影到绘制尺寸的图块上似乎并不荒谬吗? 边缘人口! 想象一下,如果您愿意的话,可以将欧洲人投影到仅由Finnic和Slavic群体的差异生成的地块上。 这是一个很好的类比。 HGDP数据集中的巴基斯坦组为 不能 南亚遗传变异的好代表,因为它们已转移到分布的边缘。 这是原因 哈拉帕祖先项目 非常需要(为什么您只得到v3成绩,并且是伊朗人,藏人,缅甸人或南亚人,则应该 发送给。 以及第2版的用户!)。

 

在这个领域中,我进行了密切追踪的两个主要研究途径是全基因组关联研究(全球风电系统),试图在性状/疾病与特定的遗传标记之间建立联系,并查询可塑造人类基因组变异结构的进化参数。 通常与特定的性状/疾病有特定的关系。 所谓的演化参数,是指随机的和确定性的力。 突变,迁移,随机漂移和自然选择。 这两个角度显然是相连的。 两者都关注与更广泛的进化原理相关的现象: 终极存在理由,复制。 随机力(例如随机遗传漂移)反映了繁殖过程中一代又一代基因采样的误差,而通过自然选择进行适应是生殖适应性随遗传性状的变化而变化的结果。 这两种力量都与GWAS(和 连锁映射).

由于GWAS在确定特定疾病的致病遗传因素方面具有相关性,因此经常出现在新闻中。 例如, 精神分裂症。 但是它们在非疾病环境中也很有用。 人类 色素沉着 由于最近的许多关联研究,该字符的遗传结构得到了很好的阐明。 这 常见疾病-常见变异 在色素沉着方面取得了令人瞩目的成果; 看来 一些常见的变体 负责该特征的大部分变化。 但这是例外,而不是规则。

GWAS的承诺与具体的有形结果之间存在这种脱节的原因是: 许多重要的性状/疾病可能是多基因的和定量的。 这意味着表型的变化受许多基因之间的变化控制,并且变化本身表现出逐渐的连续性(可以将其建模为值的正态分布的连续性)。 GWAS检测跨基因和较小边际效应特征的相关变异的能力明显受到限制。 相比之下,似乎大约有六个基因可以解释色素沉着的群体差异之间的大多数。 一 SNP 能够解决欧洲人和非洲人之间阴影差异的25-40%。 该SNP在欧洲人中固定,在非洲人和东亚人中几乎不存在,并且在祖先和派生变体中隔离开来,例如南亚人和非裔美国人。 相反,尽管诸如 精神分裂症高度 基本上是遗传性的,该性状在群体水平上的许多变异可以通过基因变异来解释。 在任何给定位置的效应大小可能很小,或者可以通过较大的低频效应变异之和来累积变异。 换句话说,许多效果不大的常见变体,或众多独特的 大效果的稀有变体.


研究博客网站 基因结构的这些细微差别与所讨论特征的可能进化弧线无关。 导致性状或疾病发生频率高的适应模型之一是,新突变迅速“扫视”固定或几乎固定。 换句话说,在正向选择的驱动下,该位点等位基因群体中的频率从约0%转变为约100%。 这种快速 “硬扫” 还会导致与最初偏爱的突变体相邻的基因组区域中相关变体的“搭便车”,从而产生高 连锁不平衡 在基因组中 单倍型 跨基因座的相关等位基因块。 在以下情况下,这样的模型似乎确实可行 一些变体 导致色素沉着的多样性。 但是,在许多变体与性状变异之间的强关联与通过适应性驱动的积极选择的特征之间的这种巧妙的衔接在许多情况下并不容易实现。

关于什么可以驱动特定等位基因的高频率,还有其他的进化可能性。 人口瓶颈和近交可以仅通过偶然机会提高变体的出现频率。 这可能是在特定人群中隐性表达或以准孟德尔形式表达的许多特征和疾病的起源。 现在让我们将这种随机可能性设置在一边。 简单选择基于奇异新突变的正选择模型并不能充分挖掘自然选择的优势。 另一个模型是基于固定遗传变异的“软扫掠”模型。 考虑例如具有0.50的遗传力的性状。 性状值的50%的变异可以用基因的变异来解释。 与特质值相关的选择可以迅速改变特质在人群中的分布,如 育种者方程。 但是在该模型中不需要新的突变,相反,现存等位基因的频率会随时间变化。 实际上,随着比例的变化,将出现曾经很少在同一个人中一起发现的罕见等位基因的新颖组合,从而提供了一代中的平均性状价值的可能性。 t + n代 可能不在特质值范围内 t = 0.

随着时间的流逝,对数量性状的这种选择理论上会耗尽其自身的燃料,遗传变异。 但是通常这在实际中是行不通的,因为这样的性状受新突变的背景水平的影响, 平衡选择。 在中位表型附近稳定选择,以及频率依赖性和变化的环境压力,可能会产生一种情况,在这种情况下,适应永远不会超出瞬态通量而达到新的平衡。 永恒种族的元素是生命的核心 红皇后假说,其中病原体和宿主参与进化战争,宿主免疫反应受到负频率依赖性的影响。 随着等位基因频率的增加,其相对适应性也会下降。 随着频率的降低,其适应性也随之提高。

自然地,这种复杂的进化模型受偶然性的影响,其通用性较弱,只有在简单的硬扫掠模型不再足够时才具有吸引力。 但是,某些性状的遗传结构似乎是高度合理的,这些性状似乎受到了“缺少遗传力”将需要更多巴洛克式的进化模型来解释其最终出现和持久性。 中的新论文 PLoS遗传学 通过查看GWAS中涉及的SNP变异模式来解决这种复杂性。 人均国内生产总值 数据集。 人类基因组多样性项目人群中的全基因组关联研究SNP:选择是否会影响具有特质关联的未关联SNP? 一,摘要:

全基因组关联研究(GWAS)已经确定了2,000多个性状-SNP关联,并且这一数目还在继续增加。 GWAS专注于对人体健康有潜在影响的特征,包括许多免疫,代谢,心血管和行为表型。 鉴于复杂性状的多基因性质,选择可能会通过改变许多相关基因座的等位基因频率而对其产生影响,这一可能性有待实证研究。 在这里,我们使用等位基因频率变化的38种不同测量方法和8个iHS分数来表征1,300个全球分布人群中的53多个GWAS SNP。 我们应用这些相同的技术来评估按性状关联分组的SNP。 我们发现与色素沉着,血压,传染病和自身免疫性疾病特征相关的SNPs组在某些地理位置表现出异常的等位基因频率模式和升高的iHS分数。 我们还发现,在欧亚大陆和东亚,GWAS SNP在等位基因频率变化和iHS方面的得分普遍较高。 总的来说,我们相信我们的结果为选择一些导致多个相关基因座等位基因频率发生变化和/或iHS分数升高的复杂性状提供了证据。 由于GWAS SNP共同表现出较高的等位基因频率测量值和iHS评分,因此对复杂性状的选择可能相当广泛。 我们的发现与这种选择是正面的还是负面的最一致,尽管很难区分两者的相对贡献。 我们的结果还表明,在欧亚样品中鉴定出的性状-SNP关联可能在非洲,大洋洲和美洲不存在,这可能是由于连锁不平衡模式的差异所致。 该观察结果表明,非欧亚和非东亚样本人群应包括在未来的GWAS中

现在作者总结:

自然选择通过改变基因组多态性的等位基因频率来发挥其影响。 与有害性状相关的等位基因频率降低,而与有益性状相关的等位基因变得更常见。 在一个简单的情况下,选择作用于一个单一多态性所控制的性状。 在这种多态性下,等位基因频率的较大变化可以消除种群中的有害表型或修复有益的表型。 然而,许多表型,包括2型糖尿病,克罗恩病和前列腺癌等疾病,以及诸如身高,体重和头发颜色等生理特征,都由多个基因组位点控制。 通过影响单个关联多态性的等位基因频率或通过改变许多关联多态性的等位基因频率,选择可以对此类性状起作用。 为了寻找后者的病例,我们组装了具有共同性状关联的基因组多态性组,并研究了其在全球53个分布人群中的等位基因频率,以寻找地理空间中等位基因行为的共性。 我们发现与血压相关的变异往往与纬度相关,而与艾滋病毒/艾滋病进展相关的变异与经度相关。 我们还发现证据表明,选择可能正在全球范围内发挥作用,以增加等位基因的频率,从而提高自身免疫性疾病的风险。

在本文中,跳到这些方法可能会有用。 尽管我确信作者并没有打算这样做,但有时您会感到仿佛您正在跟随狂欢节招标操纵的大理石。 由于我不熟悉统计的某些术语,因此仅对方法进行简单的提及就不够详细了。 无论如何,这里的关键是他们专注于 与GWAS中的性状差异相关的SNP集,并将其与在53个人口的HGDP数据集中发现的总SNP进行比较。 请注意,并非GWAS中的所有SNP都在HGDP SNP面板中。 但是对于一般性的问题,单核苷酸多态性的交集就足够了。 此外,他们还产生了SNP的另一个子集,这些子集很可能与性状变异有关。 这些是具有相关功能的其他SNP在1 MB以内的SNP,或者是在多个GWAS中发现的SNP。

论文中有四个主要统计数据:Delta,Fst,LLC和iHS。 Fst和iHS很熟悉。 Fst衡量一组人口之间的人口差异之间的程度。 Fst高意味着大量的人口结构,而Fst〜0意味着基本上没有人口结构。 iHS是一项基于基因组连锁不平衡模式检测自然选择可能性的测试。 基本上,对于本文而言,重要的是iHS倾向于擅长检测中等频率的等位基因,而这些频率仍可能通过扫描。 这与较早的EHH测试相反,后者仅检测几乎完成的扫描。 如果作者专注于多基因性状和柔毛扫频,则出现在EHH上的可能性很低,因为这是基于硬扫频,几乎完整的扫频而来的。 LLC根据纬度和经度来衡量性状的遗传变异之间的相关性。 据推测,这对于抽出那些受到生态压力驱动的特征是有用的(一般意义上的一个明显例子是,随着生物体从温暖到寒冷的气候发展,整个分类群的面积/体积比的变化是一致的)。 最后,Delta会测量整个人群中的等位基因频率差异。 Delta的符号仅是所比较的等位基因频率在比较的第一群体或第二群体中是否较高的函数。

在进行比较时,作者并没有简单地以成对的方式对所有53个人群进行比较。 相反,他们经常汇集大陆或区域集团。 左侧是表1的一部分。它显示了用于生成Delta值的总体以及如何将其汇总。 这 HGDP人口 以一种非常直接的方式按区域进行细分。 但也请注意,有些比较是在区域内的人口与生活方式不同的人口之间进行的。 我认为本文中突出显示的比较是为了在这种探索性尝试中最大程度地压缩信息性汁液而进行的。 据我所知,在HGDP数据集中,欧亚人口中没有专职的狩猎采集者,因此无法进行农业学家和狩猎采集者之间的比较。 非洲数据集中有这样的比较。 作者通过将GWAS SNP与HGDP数据集中的随机SNP进行比较来生成p值。 特别是,他们正在寻找HGDP数据集的独特性特征。

这种独特性是可以预期的。 与疾病和值得注意的特征有关的SNP集不可能是整个基因组中SNP的代表性子集。 记住 中性模型 分子进化的意义意味着我们应该期望基因组内的大多数遗传变异将归因于随机力。 图1的面板A显示,实际上,来自GWAS的SNP确实表现出与HGDP面板中的SNP总数不同的模式。 请注意,GWAS SNP的次要等位基因频率(MAF)的分布有些偏向更高的值。 如果GWAS的逻辑是针对“常见变异”的,而这种变异会在人群中足够频繁地产生一种足够强大的效应,以至于研究被赋予样本量,那么偏向于更常见变异(更高的MAF)是可以理解的。

左侧是一些具有低p值的SNP和特征(即,它们偏离了预期,超出了您对随机噪声的预期)。 毫不奇怪,他们发现与色素沉着相关的SNP在所有的种群分化和变异测量中都倾向于强烈显示。 rs28777位于 SLC45A2,这是区分欧洲人与非欧洲人的场所。 rs1834640在 SLC24A5,从而将欧洲人+中东人+中亚/南亚人与其他人群区分开来。 rs12913832是与“蓝眼睛”相关的变体。 也就是说,它是欧洲人的蓝眼睛和非蓝眼睛颜色差异相关的标志之一。

鉴于色素沉着是目前技术已充分阐明的少数几个特征之一,应该预料到,旨在检测种群内和种群内遗传变异的更微妙和彻底的方法应首先偶然发现这些标记。 作者指出,“与SNP相关的SNP和研究组 色素沉着和免疫学特征占我们分析中有意义的大部分。” 长期以来一直在寻找色素沉着和疾病相关基因座周围的选择特征的趋势。

在低p值的模式中从地理上也很明显的一种模式是欧亚群体趋于富集的趋势。 如图2所示。GWAS研究中的大多数SNP均来自欧洲的研究人群。 因此,在评估的SNP集合中可能存在偏差,这对欧洲人和相关人群特别有用。 此外,欧亚人离开祖传非洲环境时可能受到不同的选择压力约150-50,000年BP在任何情况下,出于医学分析的目的,作者的确发现使用东亚人群的SNP产生了一些不同结果要比使用欧洲人群的结果好。 尽管一些研究表明SNP在人群中具有广泛的适用性,但是毫无疑问,非欧洲人群中的许多变异都没有被发现,因为GWAS研究并不特别针对非欧洲人群。 考虑:

…然而,我们的结果表明,GWAS中与色素沉着相关的SNP几乎在欧洲,中东和中亚地区都显示出异常的等位基因频率模式。 这向我们表明,可能存在SNP,可能在除 SLC45A2,IRF4,TYR,SLC24A4,HERC2,MC1R,知识产权协会,与非欧亚人口的色素沉着有关,但尚未被GWAS识别。 需要使用非欧洲受试者进行的针对色素沉着性状的GWAS,以进一步探索这种可能性。

人们发现,在HGDP人群中,有两种主要的特征/疾病类别也有系统地不同:

–与高血压相关的变异似乎随着纬度的降低而降低

–传染性和自身免疫性疾病SNPs得分较高。 具体来说,与欧洲人相关的一些与HIV相关的SNP似乎具有抗药性

第一组特征自然会来自GWAS衍生的SNP,因为如此大量的医学研究已开始识别风险,治疗高血压和其他循环系统疾病。 一致的模式,其中 地理而不是祖先预测变化 是外生选择压力的绝佳证明。 地球的物理性质使得随着哺乳动物从赤道扩散开来,它们的体形将因不同的生态参数集而发生变化。 西伯利亚人口有 适应冷压力,而且在身体形态上似乎存在一致的跨类群转移,以使哺乳动物之间的热辐射最大化或最小化。

在第二种情况下,您对疾病再次产生抵抗力,以及 多效性,因此遗传变化会产生多种下游后果。 通常,这在时间上是同时发生的。 考虑 驯服的银狐。 但是有时您会改变过去,由于不同的选择压力而在后来产生了后续后果。 免疫学反应具有多种用途也就不足为奇了,因此,即使欧洲人没有对艾滋病毒产生抗药性作为普遍的选择压力,类似的压力似乎也导致了具有普遍效用的抗药性反应,并且如今已针对艾滋病毒进行了特定用途。 选择通常可能是一种钝器,将自身置入具有多种后果的相互作用网络中,同时在最大程度地提高本地适应性的过程中同时重塑许多特征。 当您具有以下特质时,这一点最明显 镰状细胞病,这仅仅是因为杂合性的适应性优势如此之大。 但是毫无疑问,当涉及到许多特征时,副产物更加微妙,或者对我们而言似乎是神秘的。 我们仍然不知道为什么 雷达 在东亚人中被驱使的频率更高(较少的体味和浓密的直发似乎是难以置信的选择目标)。

就像自然选择对基因和性状的协方差的影响可能是直率的和粗鲁的一样,自然选择的放松可能会消除令人窒息的恶习。 考虑一下血压的可能性:也许北欧亚人的血压较低的原因是放宽了对与较高值相关的其他相关性状的选择,从而使该特定维度的适应性最大化。 同样,非裔美国人的镰状细胞疾病发生率低于其约80%的西非血统,因为没有消除杂合子的地方性疟疾选择压力,这允许从基因库中清除等位基因。

尽管如此,作者的确得出以下结论:

尽管我们采用了广泛的方法,但我们仅发现了可能是对单一选择压力的多基因反应的几个例子。 我们确实使用了严格的显着性标准,这可能意味着可以在研究组中找到一些其他示例,这些示例并未完全达到我们的显着性标准。 也可能是关于“ GWAS”特征及其潜在遗传的某些东西破坏了我们的方法。

他们对为何无法成功提出了一些建议:
– GWAS变体不是变体的主要来源。 可能是拷贝数变体,罕见的大效应变体(“合成”)

–上位性。 基因-基因相互作用,将掩盖或混淆变体和性状之间的线性关联

–选择对GWAS SNP的影响小,或者平衡或否定选择

他们完成:

总而言之,我们检查了1,336个CEPH-HGDP人群中的53个与性状相关的SNP,以寻找具有异常等位基因频率模式和iHS分数升高的单个SNP和SNP组。 我们与一个相关的SNP或研究组一起确定了13个不同的性状,这些性状在至少一项Δ,Fst,LLC或iHS量度中得分显着提高,占所分析特征总数的一小部分。 我们认为,有限的阳性结果可能是由于我们严格的意义标准或性状本身的遗传结构特征所致。 具体来说,尽管积极研究的领域很少见,但稀有变异,上位性和多效性在人类复杂性状中的作用仍未得到很好的理解。 我们的措施对于检测所有作用于GWAS性状的选择类型也不是最佳的。 据推测,复杂性状的潜在变异主要受到负选择或平衡选择的影响,这可能不会为我们的测量方法带来极端价值,特别是如果这些力在人群中相对统一或作用于基因组中的许多区域时。

如果对多基因性状的选择性压力如此普遍,那么基因组学家可能会不屑一顾。 定量遗传学导论。 这些是特征和进化过程,缺乏明显的区别。 在许多方面,对正选择和强力推销建模都类似于均衡的经济学。 当涉及到受许多基因影响的连续性和定量性状时,必须提出一种不同的思维方式。 暂时不再成为停滞之间的标点,而是事物本身。 有例如 HLA 在黑猩猩中发现的人类基因,因为宿主和病原体之间永恒的种族关系的性质意味着所有旧的花样都至少在低频时得以保留。 人类在智力,身高以及各种其他责任和特征方面的变化,可能一直伴随着我们,并受到众多选择压力的不断冲击。 问题是,我们的原始统计方法是否能掌握这个分散但功能强大的网络?

引文: Casto AM和Feldman MW(2011)。 人类基因组多样性项目人群中的全基因组关联研究SNP:选择是否会影响具有特质关联的未关联SNP? PLoS遗传学: 10.1371 / journal.pgen.1001266

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”