尽管进化论的最初数学理论家,特别是RA Fisher和Sewall Wright,对进化论的形成至关重要。
现代新达尔文主义综合,他们的正式框架并非没有来自主流内部的批评者。
恩斯特·迈尔(Ernst W. Mayr) 著名的拒绝
“豆子袋遗传学” 英国的RA Fisher和JBS Haldane专门提出了一种观点,即可以用独立于性状的单个遗传元件构建进化模型。 作为生态学家和博物学家,梅尔(Mayr)认为,该框架缺乏生物学在现实世界中表现出来的必不可少的整体或整体方面。 毕竟,选择完全取决于整个生物体的适应性。 自这些辩论以来,我们已经走了很长一段路。 早期争议的问题之一是,由于实验和观察进化生物学的原始性质,它们没有得到足够的经验证据支持。 分子生物学改变了这一点,现在基因组学的兴起也改变了游戏规则。 基因组学从根本上体现了进化变化的具体体现,即生物基因组的结构和变异。
一份新的论文 PNAS 是新旧事物的完美“融合”, 多效性的基因组模式和复杂性的演变:
多效性是指影响多种不同表型特征的单一突变或基因现象,在生物学的许多领域都具有广泛的意义。 由于其多方面的重要性,尽管几乎没有经验基础,但对多效性也进行了广泛的建模。 分析大量酵母,线虫和小鼠突变体的表型,我们在此描述多效性的基因组模式。 我们表明,对于大多数基因来说,由于缺失基因而导致的性状变化很小,而基因与性状之间的关系具有高度的模块化性。 基因对性状的表型作用的标准化大小与不同基因的可变SD近似正态分布,这令人惊讶地观察到,影响更多性状的基因具有较大的每性状作用。 这种缩放特性以非线性的方式抵消了多效性相关的适应率降低(即“复杂性成本”),从而为中等复杂性而不是低复杂性的生物体提供了最高的适应率。 有趣的是,观察到的缩放指数落在使最佳复杂度最大化的狭窄范围内。 总的来说,全基因组的多效性低,高模块化和更高的性状效应的全基因组观察需要对多效性理论模型进行重大修订,这表明多效性不仅允许而且促进了复杂性的发展。
本文的基本目的是测试进化遗传学的较旧理论模型及其与之的关系和依赖性。 多效性 针对新的基因组数据集。 在 自然选择的遗传理论 RA Fisher提出了一个模型,其中所有突变都会影响每个性状,并且突变的影响大小显示出 均匀分布。 费舍尔(Fisher)追随,进化遗传学家H. Allen Orr十年前发表了一篇论文, 适应和复杂性的代价,它认为“……适应率的下降速度至少与n-1一样快,其中n是组成生物体的独立特征或维数。” 这就是“复杂性的代价”,这是本文的核心内容。 PNAS.
为了凭经验探索这些问题,作者查看了五个数据集:
–酵母形态多效性,是基于对单倍体野生型细胞和279个单倍体突变株中每种缺乏不同非必需基因的4,718种形态特征的测量(这也产生了定量测量)
–酵母环境多效性,是基于22种不同环境中相同集合的酵母突变体相对于野生型的增长率
–酵母生理多效性,是基于综合酵母基因组数据库(CYGD)中记录的120种文献记载的基因生理功能
–线虫的多效性,基于44个早期胚胎发生性状的表型 秀丽隐杆线虫 用全基因组RNA介导的干扰治疗
–小鼠多效性,基于在小鼠基因组信息学(MGI)中记录的基因敲除小鼠中308形态和生理特征的表型
第一个图显示了调查结果。 您会在每个数据集中看到受给定基因突变影响的性状的平均值和中位数,以及效应的分布。 立即得出两个结论:1)大多数基因仅与少数几个性状有关,2)很少基因与许多性状有关系。 您还可以看到多效性影响的基因百分比很小。 这似乎立即可以简化表格,简化了一个突变体变体在复杂生物的整个性状中产生变化的假设。 另外,效果似乎没有显示出均匀的分布。 相反,它们偏向于最小或琐碎多效性的基因。 从文字:
我们在全基因组范围内的结果呼应了最近从鱼类和小鼠定量性状基因座(QTL)研究中进行的小规模观察……以及从蛋白质序列进化中得出的推论……并揭示了真核生物低多效性的一般模式,这与某些常见现象形成了鲜明的对比。在理论上使用过的模型……假定普遍的多效性(即每个基因都会影响每个性状)
那么,如果理论模型是错误的,那是正确的? 在本文中,作者认为,多效性似乎具有模块化的结构。 就是说,突变倾向于对相关性状集产生影响,而不是对性状的随机分布产生影响。 当我们考虑突变的适应性含义时,这一点很重要,因为如果影响不是模块化的,而是随机分布,则推定为 遗传相关 这更有可能在特征值的方向变化上起到抑制作用。
图2显示了其数据集中的高度模块化:
既然我们已经确定了突变倾向于具有聚集效应,那么它们的分布又如何呢? 费舍尔的原始模型假定分布均匀。 第一个数据集是面包酵母的形态特征,具有定量指标。 他们使用279个形态特征的结果,拒绝了均匀分布的假设。 实际上分布更接近 正常,具有集中趋势和关于模式的差异。 其次,他们发现效果大小的标准偏差也相差很大。 许多统计模型都假设不变的标准偏差,所以这不是最初的假设就不足为奇了,但是我怀疑许多人会惊讶地发现该假设无效。 问题是:这有关系吗?
是的。 在所探索的参数空间内,可以计算出距离,我们可以使用该距离来测量突变的影响。 面板C至F示出了距离作为多效作用的函数。 左面板是 欧氏距离 而右边的面板是 曼哈顿距离。 前两个面板显示了从其数据集生成的参数值的结果。 后两个面板使用随机生成的假设正态分布的效果大小。 最后两个面板使用随机产生的效果大小,并假设一个恒定的标准偏差(与标准偏差的经验分布相反)。
要将这些经验结果与理论模型联系起来:有一些特殊的缩放参数,早期模型的值 假定,但现在可以根据实际数据集进行计算。 事实证明,经验缩放参数值与假定参数值有很大不同,并且这改变了一个从理论模型生成的推论。 根据经验计算得出的值b = 0.612,它是等式右侧的指数,该指数在参数空间内生成距离。 根据文本:“不变的总效应模型……假设总效应大小恒定(b = 0,而欧几里得叠加模型……假设每个受影响性状的恒定效应大小(b = 0.5)。” 请注意每个值的口头含义,而不是看数字值。 他们在经验数据中发现,每个受影响的性状都有不同的效应大小。 在本文中,作者发现影响更多性状的基因在每个性状上的影响更大,这似乎是b> 0.5的事实的结果。 具有效果大小的正态分布和效果大小的标准偏差的方差。
所有这些都使我们回到了一个大问题:是否存在复杂性的代价?将真实参数代入由Fisher提出并由H. Allen Orr等人扩展的理论框架中, 他们发现复杂性的代价消失了。 突变不会影响所有特征,因此,更复杂的生物不会受到多效性突变的不成比例的影响。 不仅如此,由于相似性状更可能在适应性中受到类似的影响,多效性的模块性可能会降低由于突变引起的相反适应性隐含的风险。 上图中总结了这些见解:
真正要关注的是面板A。如您所见 当涉及到适应率时,复杂性是一个甜蜜的地方。 相反,较早的模型并没有随着复杂性而单调降低适应率,而是一直增加到等值,然后再降低。 至少在经验验证的缩放指数范围内。 这很重要,因为 我们看到我们周围都有复杂的生物。 当理论与观察性现实不一致时,我们不得不怀疑理论的用途是什么(这里是在看你的经济学家!)。 通过将经验结果重新插入理论中,我们现在有了一个更丰富,更强大的模型。 我将让作者完成:
首先,多效性通常很低,这意味着像哺乳动物这样复杂的生物体中的突变通常不会同时影响许多特征。 其次,高模块化降低了随机突变有害的可能性,因为该突变很可能会影响同一方向上的一组相关性状,而不是随机方向上的一组不相关性状……这两个特性大大降低了突变的有效复杂性有机体。 第三,当在较复杂的生物体中发生的有益突变比在较不复杂的生物体中发生有益的突变时,更多的多效性突变(即,b> 0.5)的更大的性状效应量会导致更高的固定概率和更大的适应性增益。 这些作用抵消了更复杂生物体中有益突变的较低频率……导致具有最高适应性的有效复杂性处于中等水平。 他们一起解释了为什么尽管复杂性付出了代价,复杂的生物仍可能进化。 由于多效性的缩放性质,有效复杂度为中等水平的生物比有效复杂度为低水平的生物具有更高的适应率,因此,多效性可能促进了复杂性的发展。 根据经验观察到的缩放指数b的有趣发现是否落在提供最大最佳复杂度的狭窄范围内,是自然选择进化性的结果还是其他进化过程的副产物……需要进一步的探索。
引文: Wang Z,Liao BY,&Zhang J(2010)。 多效性的基因组模式和复杂性的演变。 美国国家科学院院刊PMID: 20876104
图片提供:Moussa Direct Ltd., http://evolutionarysystemsbiology.org