二烯 和 麻菊 最近指着一篇论文, 来自基于SNP扫描和重测序的测试中与人类肤色变化有关的基因中阳性选择的对比信号在 研究遗传学。 肤色是一个有趣的特征,因为它是过去10年来人类基因组学中的重大“胜利”之一。 现在,我们在很大程度上可以确定地了解遗传结构和基因座,这些基因和基因座是造成人类色素沉着的大多数人口变化之间的原因。 这与2000年的情况形成鲜明对比。然而,这一结果是可预见的。 这就是我说的 5年前:
大约两个月前,我发布了一个条目,其中假设有6个基因座和两个等位基因(打开和关闭),我绘制了一个非常简单的肤色模型。 评论中提到“ 5个基因座”是因为皮肤颜色是一种定量特征。 据我所知,该假设来自在线的Russ Lande于1981年发表的一篇论文。 实际上,该论文只是借鉴了1964年以来的较早工作,其主要重点是估计异种种群之间杂交的基因座数量(使用近交系是Sewall Wright的开创性方法)。 但是,事实证明,卡瓦利-斯福尔扎(Cavalli-Sforza)和博德默(Bodmer)讨论了《人类遗传学》中的较早著作,我也有这本书。 今天,基因组学正在探索控制肤色的基因座的细节, 但是我们还有很长的路要走, 因此,我将重现Bodmer&Cavalli-Sforza的一些数据和结论,以便使其在线……。
我在嘲笑“我们还有很长的路要走”这一部分。 在这种情况下,很长的路要走几年,因为我认为自2008年以来,人类色素沉着遗传学并没有发生太大的实质性变化。 所有低垂的果实都被采摘了。 看起来,在任何两个不同的洲际人口中,您都可以将大部分方差分配给少于六个的基因座。 遗传学家能够基于谱系分析推断出这是几十年前的事情,这仅是因为这些事实首先是大的影响数量性状基因座(即,大多数变异仅是由少数基因引起的)这一事实。 *如果该性状具有极强的多基因性,那么他们只能以任何可信度或精确度说出,负责任的基因数量非常多。
但是,确定该性状的遗传结构是一回事,而对其自然历史进行合理的表征则是另一回事。 长话短说,基于短单倍型的测试旨在寻找基因组区域之间标记的相关性,这往往表明许多色素沉着基因座最近都经历了自然选择。 更有趣的是,似乎可能解释东亚和西亚欧亚人皮肤浅色的候选基因似乎有些不同,这意味着等位基因频率的变化推迟了这两个种群的分离。 几年前,有报道称该基因似乎与西欧亚大陆的大量色素沉着有关,这引起了轰动。 SLC24A5在最近的6,000年内才开始扫描到更高的频率。 但是我通过小道消息听说,这可能被低估了很多,您可能正在看一万多年前开始的横扫。**
上面论文中的结果为在色素沉着位点自然选择的积极结果提供了一些冷水。 为什么这很重要? 因为 先验 有明显的原因为什么这些基因可能会自然选择。 相反,在关于适应的功能原理的事实假设之后,必须伴随许多结果。 问题就变成了:如果您不相信在自适应原理和遗传结构清晰的特征上结果是一致的,那么什么时候可以相信这些检验? 我认为上面的论文中有资格的踢球者正在讨论中:
我们在这里观察到的LRH(长距离单倍型)与基于序列的测试之间差异的第五个,也是最有可能的原因可能是所使用的进化模型的不同基础假设 每个统计信息的定义(即瞬时选择性扫描与不完全选择性扫描),以及每种类型的测试可以恢复偏离中立性的进化时间尺度……在这种情况下,我们的结果可能表明色素沉着的选择非常新基因,可以通过基于单倍型而不是基于序列的测试来恢复。
换句话说,作者们自己认为,我完全有可能在这些测试组中看到的结果之间不一致的可能原因是,它们对不同的自适应动力学表现出不同的敏感度。 这是基于单倍型测试首先流行的原因之一,因为它们可以修复诸如 田岛的D 可能会错过。 因此,在这一点上,我认为我们仍然可以肯定地说,即使这些基因没有在所有测试中脱颖而出,似乎也很可能在这些基因上进行自然选择。
注释: 任何虚假陈述此材料的评论将导致禁止发布而不会发出警告。 因此,您可能应该坚持使用直接引号来代替对您认为是我用自己的语言表达的意图的重新表述。 例如,如果您以“所以您想说的是……。”开头,那么您很可能会被禁止。 我在帖子中说了我想说或想说的话。 时期.
*根据父母中存在的变异,我可以并且已经构成了我即将到来的孩子的表型结果分布的足够少的SNP,而这两个父母都已经进行了基因分型。
**我和我的父母一样,在这个基因座上的“欧洲”等位基因是纯合子。 我怀疑这种变体是通过“北印度祖先”到达印度次大陆的。
那篇论文完全没有能力找到这些基因座最近选择的证据。 他们对每个样本大约 6 人进行了 25 kb 的测序。 为了计算效率,论文中的统计测试仅考虑了10个序列。 (!)
如果我们将过去 20,000 年视为这些基因座最有可能受到正选择的时间,则最多可提供 1000 代时间。 假设每代每个位点的突变率为 1.4e-8,我们预计为 6e3*1e3*2e-8 = 0.08 年来在 6 kb 序列上给定谱系中的 20,000 个突变。 如果选择在一万年内展开,那么每个谱系大约有 10,000 个突变。
如果大部分采样序列可以追溯到过去 20,000 年中某个祖先的恒星系统发育,则可能会违反中立性测试。 为了可靠地检测这种模式,我们需要相当高的突变密度或非常大的样本。
抱歉忘记编辑方程式,6e3*1e3*1.4e-8=0.08。
“我即将出生的孩子”
我不知道你之前是否已经在博客上透露过这一点,但无论如何恭喜你。
是的,恭喜。
这是一篇文章的想法:为什么我们会对或不会对新生儿的基因组进行测序。 就我个人而言,如果我的答案是否定的,我特别有可能发表这样的文章,因为我不想走蔡美儿和布莱恩·卡普兰让他们的孩子在公共道路上成长的道路。
终于从 PGP1000 拿到了我的样品收集瓶! 如果我真的得到测序,我将有一个在线项目来完成它。
为什么我们会对或不会对新生儿的基因组进行测序。 就我个人而言,如果我的答案是否定的,我特别有可能发表这样的文章,因为我不想走蔡美儿和布莱恩·卡普兰让他们的孩子在公共道路上成长的道路。
史蒂夫,你能说更多吗? 我计划对她进行基因分型。