多年来,我一直在提到 20 世纪早期的孟德尔主义者(原遗传学家)和生物统计学家(古典达尔文主义者)之间的冲突。 仿佛在一个 黑格尔辩证法 这种自我的冲突最终导致了成为群体遗传学的综合。 历史进程在 Will Provine 的著作中得到了精美的概述 理论群体遗传学的起源,但当时它在 RA Fisher 1918 年的论文中取得了成果 孟德尔遗传假设的亲戚之间的相关性. 有人可能会争辩说,虽然本出版物结束了明确的辩论和分歧,但现实情况是差异仍在继续,而不是因为 根本 差异,但务实的差异。 经典群体遗传学家专注于单个或两个基因座模型来发展他们对进化过程轨迹的直觉。 数量遗传学家改进了对连续性状的推断统计技术,这些连续性状的遗传性状已得到证实,但其具体的因果遗传元素仍然是个谜。
在前基因组时代,情况可能没有什么不同。 没有“大数据”和“大金属”(即计算),数量遗传学丰富但杂乱无章的实证工作与种群遗传学的优雅和分析景观被方法论的鸿沟隔开。 自下而上建立的多基因模型对于进化遗传学家来说根本不可行。 如果没有基因组学,对于数量遗传学家来说,确定多基因性状中的因果位点的可能性是不可能的,也不是必需的。 但在费舍尔的开创性论文将这两个领域的理论公理融合在一起一个世纪之后,情况正在发生变化。
而这不是一件小事, 因为适应性进化发生在受多基因常设变异影响的连续性状上。 数量性状的细微遗传差异几乎肯定有遗传基础,但是当这种变异分布在成百上千个基因座上时,现实必须保持抽象。 人们可以对进化过程的广泛流程做出有根据的断言,但无法获得它如何进行的具体细节。 这些数量特征值得注意。 2 型糖尿病和精神分裂症等疾病似乎具有可遗传的成分,但它们可能的进化起源充其量是模糊的。
随着大型数据集的出现,理论家们现在开始振作起来,并试图结束费舍尔打开的那本书。 结束于 霍尔丹的筛子 他们发布了一个带有有趣标题的预印本, 多基因局部适应的群体遗传特征. 这些主张似乎以谦虚为特征:
对多基因表型选择的适应是通过许多位点的细微等位基因频率变化发生的。 当前的群体基因组技术不能很好地识别此类信号。 在过去的十年中,全基因组关联研究 (GWAS) 开始出现有关多基因性状特定位点的详细知识。 在这里,我们将 GWAS 的这些知识与强大的种群遗传模型相结合,以识别经过局部适应的特征。 使用 GWAS 数据,我们将多个群体中给定表型的平均加性遗传值估计为等位基因频率的简单加权总和。 我们模拟了中性下种群之间 GWAS 基因座的预期分化,以开发具有任意种群结构的任意数量种群的简单选择测试。 为了找到对特定环境变量在局部适应中的作用的支持,我们测试了与估计遗传值的相关性。 我们还开发了一个局部适应的一般测试,以确定估计的遗传值在人群中的过度分散。 该测试是基于 GWAS 预测的 QST/FST 比较的自然概括。 最后,我们制定了一个框架来识别导致过度分散信号的个体种群或种群组。 这些测试比它们的单基因座等价物具有更大的功效,因为它们寻找相似效应等位基因之间的正协方差。 我们使用 GWAS 数据将我们的测试应用于人类基因组多样性面板数据集,用于六种不同的性状。 该分析揭示了一些局部适应的假定信号,我们讨论了这些结果的生物学解释和警告。
如何? 对于这个博客的大多数读者来说,数学可能会有点粗糙,但勇敢的人应该只是 去预印本. 我要说的是,论文中概述的方法似乎试图解释多基因性状所受的各种多价力。 分散的弱选择自然是微妙的,很容易被掩盖和混淆。 必须做的是将基因组内的模式与人们可能从系统发育和地理预测的中性预期进行比较。 正确很容易,但在前计算机时代完全不可行。 我将提供的主要实证结果 是他们发现很少有证据表明选择位点与 2 型糖尿病有关。 这不是命题的决定性因素,但它确实让人相信“节俭基因”的想法似乎相当空想。
最终模型构建的任务是乏味的,并且会是迭代的。 但是,21 世纪初出现了与 20 世纪初相同的理论复兴和改革。 只有美好的事物才能到来......
引文: 多基因局部适应的群体遗传特征.