Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
进化基因组学

书签 全部切换变革理论添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

基本社会进化遗传学 1970年代初期,著名的进化遗传学家Richard C. Lewontin 人口遗传学“就像一台复杂而精致的机器,旨在处理没有人能成功开采的原材料。” 通过这种方式,Lewontin的意思是在1930年代 费舍尔, 塞沃尔·赖特(Sewall Wright)JBS Haldane 建立了该领域的理论基础,发现人口变异以检验其假设的技术相当薄弱(自然,这引起了许多争议,请参见 理论群体遗传学的起源)。 遗传学家正在使用经典方法,利用显着的表型作为潜在遗传标记的代理,并利用新型突变体在遗传图谱中与已知位置共同追踪性状的追踪模式。 那时,研究人员甚至还不清楚孟德尔遗传粒子的潜在生化结构,即我们所说的DNA。 那是在1960年代问世的。 但是,在1970年代初期,编写上述文章时,我们并不是在谈论DNA测序。 相反,这是 同工酶 Lewontin促成的一个时代 1966年。他在这段话中表达了时代的激动:

情况突然改变了。 母矿被挖掘出来,大量的事实被倒入这台理论机器的漏斗中。 从另一端开始,什么也没发出。 并不是说机器不能运转,因为即使没有震耳欲聋,也可以清楚地听到齿轮发生很大的碰撞,但是它却不能以某种方式将制成的大量原材料转变为成品。”

尽管上面表达了悲观情绪,但分子进化的出现激起了人们的争论。 中立理论。 一代多年前,进化遗传学家正努力应对海量数据的涌现,而海量数据正面临着20世纪初构建的理论框架。 今天,我们生活在“后基因组”时代,现在我们从 整个基因组。 细节可能有所不同,但由于新颖的结果符合旧的范式,Lewontin在1970年代的观察仍然成立。 上个月 PNAS 布赖恩·查尔斯沃思(Brian Charlesworth)发表了一篇论文,使人想到了这一点, 体质自然变化的原因:来自对健身的研究证据 果蝇 人群。 您可能知道查尔斯沃思(Charlesworth)是该书的合著者 进化遗传学的要素,是我向所有人强烈推荐的文字百科全书。 在本文中,这两个指南都是针对我们中那些不专心的人的回顾 果蝇 查尔斯沃思(Charlesworth)指出,遗传学以及在补品中发现的衍生品提炼物, 从群体基因组学推论有害等位基因的典型选择系数与从定量遗传学推论得出的典型选择系数之间存在矛盾。 人口基因组学是一个新领域,涉及在合理数量的个体中对许多标记物(通常是整个基因组)进行精确测序。 定量遗传学是一个更为经典的框架,它利用统计方法来解释实验室人群中性状的变异。

220px-果蝇_repleta_lateral 果蝇在孟德尔遗传学中具有传说中的作用。 在很大程度上研究果蝇 is 孟德尔遗传学的早期历史(请参阅 蝇王:果蝇遗传学和实验生活)。 因此,在这一领域中存在大量的研究是很自然的,并且如果没有某种程度的怀疑,就不能接受通过诸如基因组学之类的新方法获得的新结果。 查尔斯沃思(Charlesworth)指出,通过基因组方法发现的突变的极小的适应性效应偏向于单核苷酸变体(SNV)。 点突变。 相比之下,定量遗传学研究所隐含的较大效应突变似乎很罕见,因此在种群基因组样本量中如此缺失,这是由于转座因子(TEs)散布在整个基因组中,并可能破坏了功能。 与较早的理论模型一致, 适应度的大多数变化是由于少数突变引起的。 据推测,随着基因组方法变得更好(例如,更长的阅读时间以捕获重复元素和更大的样本量),它们将收敛于较早建立的定量遗传方法。 本文中的两个有趣的其他结果是,大部分差异是由于 平衡选择。 由于理论上的原因,平衡选择不能在整个基因组中普遍存在(适应性变化太大会导致每一代的巨大死亡率),但是根据Charlesworth的说法,在种群内的大部分变异中,平衡选择是可以维持的。 另一个有趣的动态是,由于我们的有效种群规模较小,种群基因组方法似乎在捕获适应性效应在人类中的分布方面似乎更好。 您可以出于技术原因阅读该论文,但是这里的关键是要记住 必须从模型生物推断时要小心。 这些模型是不完美的,我们始终需要永不超越我们的概括能力。

随着基因组学在人口遗传学中变得越来越普遍,这种分析将更加普遍。 而不是“一周内的基因组”论文,我们将转向实际尝试解决序列数据具体告诉我们有关谱系的问题,以及从进化结果中可以得出的结论。 一些生物具有悠久的科学研究历史,因此种群基因组学将成为补充和补充。 在其他情况下,尽管有机体没有如此丰富的文学和科学文化,这里强调的陷阱可能使我们警惕基因组方法的不足。

引文: 查尔斯沃思,布莱恩。 “健身自然变化的原因:果蝇种群研究的证据。” 美国国家科学院院刊(2015):201423275。

 

北极熊

何时,如何以及为什么,生命之树的不同世系发生分歧,长期以来一直是进化科学的重点。 现在,必须要补充的一点是,似乎很多故事还与 纠葛 早已分开的分支。 古生物学研究了宏观进化的模式,并试图从描述转变为形式模型,以支持自然历史的长期发展。 系统发育学以细致入微的方式画出了树枝,并试图从多样化的形状和脉动中推断出模式。 人口遗传学集中在微观进化参数上,这些参数决定了特定谱系的遗传构成的通量。 漂移,变异和选择。 现在您有了新的领域,例如人口 基因组学,它将21世纪的技术与20世纪学科的问题和理论机制相融合(在这种情况下,是人口遗传学,就像系统遗传学是系统遗传学的扩展)。

Liu,Shiping,等。 “人口基因组学揭示了北极熊的最新物种和快速进化适应性。” 细胞157.4(2014):785-794。

Liu,Shiping,等。 “人口基因组学揭示了北极熊的最新物种和快速进化适应。” 细胞157.4(2014):785-794。

由于NIH等组织的货币投资(除其他因素外),-组学革命已经席卷全球 智人 第一的。 但是它正在发展,这很重要, 因为进化科学真的不能仅仅将其自身局限于人类领域。 最终的问题,例如为什么有这么多物种,实际上需要调查那里的世界变化的本质。 尽管如此,目前大多数的后人类工作似乎发生在经典的“模型生物”(如果蝇)或超凡魅力的生物中,尤其是大型哺乳动物。 中的新论文 手机在所有期刊中,属于第二类, 种群基因组学揭示了北极熊的近代物种和快速进化适应。 从标题可以推断出 北极熊和棕熊的系统发育史,以及两个不同谱系之间的进化遗传功能差异。 如您所见,他们的抽样范围仅限于特定人群,鉴于有限的测序资源,这是合理的。 他们有10只棕熊和79只北极熊,它们中的很多都有很好的遮盖力(约30倍非典型)。 这些推论必定是从这些人群中得出的,尽管它们在文本中承认您只能在有限的地理范围内走得那么远。


他们使用多种方法(IBS短文和“∂”)发现了大约500,000年前的北极熊和棕熊(或至少样本中的熊)分为两个种群。 更准确地说是479-343,000年前。 这与化石证据重叠。 它转化为大约20,000代前的祖先人口之间的分离。 作者指出:

……北极熊的独特适应可能不到20,500代就进化了; 对于大型哺乳动物来说,这确实是例外。 在这段有限的时间内,北极熊变得独特地适应了北极海冰上的生物,使它们能够生活在世界上最恶劣的气候和最恶劣的环境中。

在我看来这有点夸张。 实际上,尼安德特人与现代人的分歧仅是过去一代人的一半,而且有人可以说我们的两个血统也相当分歧。 话虽这么说,北极熊和棕熊之间显然存在巨大的可见差异和生理差异。 他们在模型中包括了过去有效人口下降的估计数,这大概是由于更新世冰川的紧急情况造成的。 利用已知的古生物学结果,他们暗示,北极熊血统的出现和衍生是在与棕熊祖先分离的一段时间内发生的。 换句话说,异源物种。 与早期工作相一致,他们还报告了两个血统之间长期基因流动的证据,特别是从北极熊到棕熊的基因流动。 这似乎是一个古老而连续的事件,近来已减弱(它们未检测到表明最近掺混的长单倍型)。

再次提醒您注意,因为此处的样本在地理位置上受到限制。 但是,使用诸如D统计之类的措施来推断人群之间的混合模式,似乎确实发现,关于有效人群减少的初步结论暗示了从小规模的初始创始人群体扩展到现存的世系。 一个人想知道这是否与大型哺乳动物的共同性,而大型哺乳动物是由于反复的冰川事件而形成的。 显然,我在这里包括人类,但对于人类,我们有很多证据表明,事实上,由于古老的DNA,已经有很多替代品。

他们在论文中报告的证据也许更具有说服力,即北极熊从其祖先的特定功能区域显示出许多进化变化。 北极熊是高度食肉动物,与棕熊表现出许多形态和代谢差异。 简而言之,就好像棕熊被摄入了高脂肪的饮食一样。 指示北极熊选择特征的功能区域在棕熊中没有相应的命中率,这不足为奇。 它们适应了不同的条件。 此外,据推测,北极熊的许多此类变化对人类都是有害的。 快速发展通常是通过破坏事物来实现的。 功能丧失。 所以不足为奇。 问题是北极熊如何运作? 另外,我想知道棕熊本身是否以我们尚不了解的方式衍生(这里的样本偏向北极熊)。 尽管棕熊是通才,但我认为棕熊可能更接近祖先形态。

他们得出了有趣的结论:

……以前从未报道过这种对饮食中脂肪和胆固醇水平长期升高的剧烈遗传反应。 在我们寻找人类心血管疾病的潜在遗传原因时,它肯定会鼓励超越标准模型生物。

就像悉尼布伦纳(Sydney Brenner)所说的那样,我们已经了解(或不了解)有关小鼠疾病的知识。

引文: Liu,Shiping,等。 “人口基因组学揭示了北极熊的最新物种和快速进化适应。” 细胞157.4(2014):785-794。

 
• 类别: 科学 •标签: 进化基因组学, 北极熊, 人口基因组学 
引用:Freedman,Adam H.等人。 “基因组测序突出了狗的动态早期历史。” PLoS遗传学10.1(2014):e1004016。

引文: Freedman,Adam H.等人。 “基因组测序突出了狗的动态早期历史。” PLoS遗传学10.1(2014):e1004016。

我们通过强大的基因组技术在表面下抓取的次数越多,就越能发现我们对自然历史的了解更加混乱。 一旦搞清楚了,我们将获得准确的复杂性,但是现在在许多领域,这种清晰度还很少。 事实是,新发现或推论并不意味着 当旧的空间不足时,空间中有足够的点来构建新的解释性星座。 由于现代基因组学对生物医学的关注,人们对人类的关注不成比例,但是随着时间的流逝,很明显,这种关注将扩展到整个生命树上,并且光线将逐渐取代暂时的雾气。 首先是对人类特别感兴趣的生物和/或 模型生物 (后者是有助于阐明一般生物学现象以及大量研究人员的研究对象的物种)。 家犬具有两类优势。

220px-本尼-巴森吉

红巴辛吉

关于我们“最好的朋友”起源的理论很多。 一种思想流派(尽管不一定占主导地位)是,狗是相对较新的人类义务人类,它是新石器时代革命工具包的一部分。 公平地说,这一观点被许多研究人员以常识为由拒绝了,即狗是在10,000-15,000年前与美洲印第安人一起到达的。 这些显然是新石器时代之前的狩猎和采集人群。 但是有一些 基因组研究 这确实表明,即使有早期的驯化事件,现代的家犬血统也可以追溯到大约一万年前的中东。 基因组学的最新著作似乎相当有力地证明了这一假设。 这些研究人员表明,与多态性子集(数万或数十万个碱基对的数量级)相反,如何仔细,彻底地查看整个基因组(数十亿个碱基对)生物可以产生更深的历史洞察力。

《 PLOS GENETICS》上的一篇新论文, 基因组测序突出了狗的动态早期历史,已经有一段时间作为预印本了,但回顾一下我们现在知道和不知道的重点似乎很有用。 如上图所示,家犬经修订的自然历史的关键要素必须包括该物种的系统发生起源中的最低程度的复杂性。 关于狗的起源的最简单的故事的讽刺漫画是它是一只被驯服的狼。 高度起源于祖先状态(许多特征已从最后一个拥有狼的祖先转变而来),但仍然是狼。 这个想法需要更新,因为上面的论文强调了 现存的狼不是狗衍生自的更新世狼种群的完美代表。 对于一些古老的DNA,这已经很清楚了,但要查看来自欧亚大陆不同地区的三只狼的完整基因组,西非的Basenji和澳大利亚的野狗(连同拳击手作为参考家犬基因组,以及金杰克作为外群),一个主要发现似乎是现代犬是从狼群中衍生出来的,而狼群并未在上述采样中体现出来。 这很重要,因为许多关于狗的推论都是通过简单地假设现代狼是这两个血统的最后共同祖先的适当代理而得出的。

这种替代似乎比我们想象的要不稳定,这在我们认为理所当然的遗传多样性和瓶颈结果中尤为明显。 如果说现代狼是狗衍生自祖先种群的标准,那么瓶颈是相对较轻的瓶颈之一,大小下降了几倍(狼种类更多,但差别不大)。 但是以上作者通过查看这些狼的整个基因组的遗传多样性模式发现,从克罗地亚,以色列和中国采样的这三只狼也都显示出种群瓶颈的迹象。 这使结果更有意义,看起来现代狗谱系似乎经历了一个数量级(16倍)的种群瓶颈。 使用不同方法的时间肯定也早于新石器时代革命大约10,000年前,因此与考古证据一致。 在与农民建立联系之前,狼首先是猎人与采集者的同伴。 狗是否可能适应 淀粉饮食 发生在最初的瓶颈和该世系的祖先与现代狼的祖先分离后发生的(现代狼似乎具有足够的变异性,使其在任何情况下都属于该特征的祖先范围)。 此外,还有诸如Dingo之类的犬种,它们对淀粉饮食没有任何适应性,这具有历史意义,因为它们直到最近才与农业人口并存。

我确实要注意,基因组学并不能改变一切。 确实有许多关于经典遗传技术,比较解剖学和古生物学的广泛概述。 例如,家犬似乎确实形成了单系谱系。 这个简单的意思是,全世界的家犬似乎共享一小部分共同的祖先,而不是从不同的狼血统收敛的形态进化的实例。 然而,更令人惊讶的是,这些结果暗示与狼互惠。 这意味着家犬不是特定现代狼种群的专门分支,而是现代狼的姐妹血统。 尽管通常说狗只是被驯服的狼,但人们很可能会说狼是野狗(是的,我同意这只狗可能是更多的衍生动物,但我认为我们不能用现代的狼代替古老的狼,并称其为好)。 两者都是在更新世繁荣的犬科祖先的子集。 对特定血统的混合测试表明,狗的起源似乎暗示了当地狼血统的基因流动。 由于先前的遗传亲和力或多样性可能是由于基因流动而不是后裔的模式造成的,这将使试图确定特定驯化或适应区的尝试感到困惑(较早的尝试断言,来自中东或中国的家犬可能是前提是错误的假设,以及比整个基因组密度低的标记集的局限性)。

这项研究的主要缺点显然是样本量有限。 它在论文中得到了自由承认,这就是为什么作者还试图从地理和文化上都具有丰富知识的人群中选择个体(例如,野狗在狼的范围之外,并且不与古代农业人群共存) )。 我对狼样品具有代表性表示怀疑,而不是对选择三个犬种(巴辛吉,丁戈和拳击手参考)的看法表示怀疑。 我们比对狼了解更多关于狗的遗传学和历史的知识,而对于后者而言,似乎比前者更令人惊讶的松散末端。 但是,如果我必须打赌,我会说作者是正确的,他们的推论将会成立(相互的专论,狼的瓶颈等)。 但是,毫无疑问,随着样本数量的增加,此模型将增加很多细节,并且分析中包括了古老的DNA。 尽管最近的研究似乎很清楚地表明,在狗的情况下,驯化是后来的更新世(而不是全新世)的作用, 确切 哪里,何时,是谁的细节仍然很笨拙.

但是上面的标题强调了最终的总体情况: 说完之后,更新世将看起来像一个陌生的国家。 许多要进行深度测序(高覆盖率)和大样本量的生物首先是哺乳动物 古生代 由更新世塑造的起源。 长期以来,这个地质时期对人类的重要性一直是学术界关注的话题,但是基因组学及其对自然历史怪癖的启示可能会强调冰河世纪对许多熟悉的自然历史的生态重塑作用和超凡魅力的物种。 这就是基因组学将为大范围进化生态学打开大门的地方。

引文: Freedman,Adam H.等人。 ”基因组测序突出了狗的动态早期历史。” PLoS遗传学10.1(2014):e1004016。

相关新闻: 请看一个 Haldane的《 Sieve》中一位作者的帖子.

 

生命之树

贯穿生命之树的进化过程受到不同动力的影响,这些动力可以塑造和影响个人,种群和整个生态系统的结构和特征。 例如,假设 发展史人口遗传 夏威夷群岛特有生物的特征。 因为夏威夷群岛是一个孤立的群岛 预期该地区的血统将是 与迁移参数或不同群体之间的基因流动参数所决定的情况相比,情况可能要好得多。 此外,推测这些流行的夏威夷血统在过去的某个遥远地点发生了“奠基”事件,因此另一个预期是,大多数人口将表现出经历过一次血吸虫病的证据。 遗传瓶颈,其中的力量 随机漂移 几代人急剧增加。 我们目前在一个个体,一个人口或一组人口中看到的各种特征或状态,是漫长的历史过程,一系列精确事件的结果。 为了正确地理解进化,我们应该尝试推断出塑造生命树的这些不同的动态参数的性质和大小。

信用: 拟真

对于许多人而言,进化过程的形象使人想到宏观上的某些事物。 地球上的千变万化的生命性质的变化也许写得很大,例如在大卫·阿滕伯勒(David Attenborough)雄伟的纪录片中描绘了千百万年来,跨越了不同的地质尺度。 但是,就像在特定的DNA分子中一样,也可以在具体的水平上将这种现象减少到更细的颗粒。 或者,将其转换为代数可操纵的更抽象的渲染,例如几代人的等位基因频率轨迹。 这两种减少都强调了自然历史的遗传方面。

信用: Johnuniq

显然,进化过程不是 只是 从根本上说,遗传因素是不断变化的,但是从生物学的角度来说,基因对于现象至关重要。 因此,有理由认为,如果我们观察基因组中的变异模式,我们将能够以某种深层的方式推断出地球生命的进化方式,并得出关于生物进化本质的更一般的结论。。 这些不是小事。 生物学哲学通常被讽刺为进化哲学也就不足为奇了。 有人可能会质疑这种特征,但不能否认有些人会认为进化过程以某种方式使我们能够理解存在的本质,而不是仅仅了解我们是如何形成的(创造论者将进化描述为一种宗教般的邪教,赋予了一些元科学和哲学(作为知识潜台词)的总体风味)。

费舍尔

但是,从完成这种近乎形而上学的一般性转变为完成更多的动态科学之后,由于基因组革命,今天我们面临着序列数据激增的问题。 这对我们对进化的理解有什么关系? 进化遗传学家的许多原始论据,例如 费舍尔塞沃尔·赖特(Sewall Wright) 根据一些基因的遗传模式进行推断,这些基因很容易被它们的识别 表型标记。 但是,更可能发生争议的框架是推论 纯粹是理论上的,以最小程度的经验混乱进行干预。 相比之下,今天我们生活在一个这样的时代,如果您没有一个很好地组装的生物基因组(大约数十亿个哺乳动物碱基对),那么有人可能会怜悯您,因此必须使用SNP标记 几千个数据 每个人!

这些新数据首先来自人类,这是因为 生物医学科学,激发了 方法开发 利用现在被发现的遗传变异的丰富性。 考虑 台积电,这使人们可以通过调查单个个体内的杂合性模式来从一个基因组进行人口历史人口统计学推断。 上周我 审查了预印本 这说明了广泛的数据分析在着色和完善以前的结果方面的强大功能,从表面上看似乎很简单。 重新制定的公式使得自然选择成为过去约100,000年人类进化中普遍存在的参数的可能性。 作者比较了不同类别碱基的变异(同义与非同义)跨基因组,以强化旧的直觉并提取新的见解。

引文: Voight,Benjamin F.等人。 “人类基因组中最近的阳性选择图。” PLoS生物学4.3(2006):e72。

查看同义词与非同义词之间的区别 换人 是一个 久经考验 技术和良好的血统书,但是最近 单倍型 基于的方法 检测自然选择 由于出现了 全基因组密集标记集。 这些允许推断跨相邻基因组区段的标志物的相关模式。 这种趋向单倍型方法的趋势自然触发了它们的对立面,并且在一定程度上可以从两篇论文中看到合成的结果,Grossman等人, 多种信号的组合区分正选择区域的因果变量识别大规模基因组数据中的最新适应性。 这些是对先前工作的改进,已经进行了重新评估 开始发生 大量的基因组方法用于检测人群中普遍存在的选择之后,在文献中有许多报道。 更具体地说,较新的技术集中在最近的选择性事件上,这些事件使基因组中的长基因块留在了同质的种群中。 由于正向选择导致因果标记的频率迅速增加,因此它们沿着区域中的侧翼区域拖动 扫描 事件。 在最初的选择事件后的许多世代中,这些侧翼区域将产生 连锁不平衡作为 重组 只能缓慢地分解各个基因座之间的关联。 但是这些方法的主要缺点是选择不是唯一导致长单倍型和连锁不平衡的动态现象。 更具体地说,人口统计的随机性,通俗地说是人口历史的变迁,也可以产生长而均匀的标记块。 像这样的统计量产生的初始候选区域 卫生系统 被特定人群历史的影响所饱和。

CMS,首次亮相 Grossman等。 2010年,是在保留基于单倍型方法的功能的同时纠正此错误的尝试。 基因组内的自然选择在操作上留下了更多的证据,而不仅仅是长的染色体型块和连锁不平衡。 选定的等位基因之间的群体差异通常比基因组的平均区域更大(即更高)。 F st)。 此外,高频率隔离在一个人群中的新衍生等位基因通常是近期适应的一个标志性标记,例如 从头 特定位置的突变被证明是有益的。 通过结合检验跨基因座(即基于单倍型的方法),基因座内和跨群体的变异模式的测试(F st 基于CMS的方法),而CMS通过使用多种工具进行交叉检查将一些精确的狭窄候选者归零。 除了误报外,依靠单个粗略测试的另一个主要问题是它们通常会突出显示较大的 地区 作为自然选择的目标。 当您拥有数十个潜在的基因和数百万个碱基时,这并不一定需要进行简单的随访。

第二篇论文, Grossman等。 2013年,它不是全基因组变异图,而是全基因组变异扫描图,旨在选择选择目标进行更详细的分析。 人类数据集不足为奇 与突出的物理特征(例如身高和色素沉着,新陈代谢和免疫反应)有关的基因座在候选列表中很高。 不管是假阳性的真正问题,似乎人类的近代进化(坦率地说,进化更普遍)似乎都固守了这些特征,这并非双关语。 我确实想知道有时这是否仅仅是我们人类注意到外部表型以及疾病相关标记(例如,代谢性疾病和免疫性疾病)这一事实的特征。 第二篇论文中的主要关注点之一是,没有表型的选择签名通常没有效用,但表型可能缺乏效用,因为人类对所关注的性状视而不见。 我仍然对围绕选择的确切目标的解释持怀疑态度。 雷达 座位 在东亚人是。

的两个等位基因 SLC24A5, 引文: 诺顿,希瑟L.,等。 “在欧洲人和东亚人中,浅色皮肤的融合进化的遗传证据。” 分子生物学与进化24.3(2007):710-722。

Grossman等人的CMS比较有趣的结果之一。 2013年是与麻风病抗药性最强关联的位点 SLC24A5。 该基因座中的等位基因在欧洲人和撒哈拉以南非洲人之间的频率几乎不相交。 我的意思是,几乎所有非洲人都有一个基地,而几乎所有欧洲人都关心另一个基地。 在欧洲人中发现的等位基因在西亚占主导地位,并以高达约50%的频率出现在南,东,斯里兰卡。 这是一个基因 著名 与人类和斑马鱼的肤色较浅有关。 然而,仍然有一个谜团,即它以极高的频率出现在偏南的地方,对于皮肤浅色的人来说,这当然不是必要条件。 在撒哈拉以南非洲常见的祖传变体中,东亚人几乎是固定的。 可能的解释是,由于最近针对特定疾病的选择力非常强,这些类型的显着表型基因座已经重塑。 如果这是正确的,那么我们发现在人类中显着的表型特征可能就是 多效的 选择性扫除的副作用依赖于抗病性。

我不是在这里提议 基因组学可以解决和解释进化。 继承人 of GG辛普森 可能对此有话要说。 相反,我建议 在我们的一生中,遗传难题永远不会缺少任何程度的数据。 我的直觉是,当我们在成千上万的生物体上拥有成千上万个高质量的完整基因组时,许多进化遗传问题都会解决。 化石在不久的将来不会有意外的收获,因此,人类学将不得不继续在相对受数据限制的环境中进行。 对于那些在进化遗传学和基因组学领域工作的人来说,责任在于人类的创造力,分析能力和精明。 认真思考棘手的问题,而不是花大量时间在长凳上以收集更多数据。

 

层和层……。

还有 事实 进化。 然后有一个长期的争论 形成一种 它进行。 前者是一个已解决的问题,只剩下很少的智力。 后者是进化遗传学和进化生物学的重点。 辩论是一个古老的辩论,其历史可以追溯到19世纪,那时您遇到了像阿尔弗雷德·拉塞尔·华莱士(Alfred Russel Wallace)这样的拱门选择主义者(请参见 一切的理由)几乎与整个学术世界格格不入(例如,托马斯·亨利·赫克瑟利(Thomas Henry Huxely),“达尔文的斗牛犬”,不足以相信自然选择的力量是进化变化的推动力)。 在20世纪初进化生物学和遗传学融合之后,这一古老的分歧为更多的争议性问题埋下了种子。 它们的范围从 赖特·费舍的争议 进化遗传学的早期 中立主义者与选择主义者的辩论 1970年代(在某些情况下留下了不好的感觉)。 在斯蒂芬·杰伊·古尔德(Stephen Jay Gould)的作品中可以找到关于选择权而非随机偶然性的辩论含义的动画片视图。 进化论的结构)和理查德·道金斯(Richard Dawkins)(请参阅 祖先的故事): 进化是否会由于偶然事件而导致无限创意的分类,还是会朝着有限的理想化形式集发展,这些形式会填充可能的参数空间?*


但是,最终这些10,000英尺的辩论更多的是哲学问题,而不是科学问题。 至少在消除科学问题的争议之前,会出现平衡共识。 这只能通过出版物的积累来实现,其结果在时间上是可靠的,并且足以说服反对者。 这就是为什么Enard等人的预印本, 人类进化过程中普遍存在的积极选择的全基因组信号,引起了我的注意。 随着基因组学的兴起,人们首先被列为分析对象,因为通常可以从该物种中找到最好的数据,因此在此就不足为奇了。 相当, 鉴于过去十年对该主题的来回探索,本文的重要之处是什么?**

通过对人类基因组变异模式的更深入,更微妙的观察,该小组推断出 在过去约100,000年中,通过经典的积极选择进行适应已成为人类基因组的普遍特征。 这并不是一个简单的推断,因为在过去的十年中,随着全基因组数据集的到来,用于推断选择的群体遗传统计数据引起了很大争议(尤其是误报)。 事实上,有一个小组认为,基因组内更突出的选择力是“背景选择”,指的是由于纯化大量有害突变和邻近的链接位点而对遗传变异造成的限制。

的总和 Enard等。 就该方法而言,可能看起来很深奥,甚至不透明。 但是每个元素实际上都非常简单明了。 主要要点是 基因组内许多选择的测试都集中在非同义和同义突变变体之间的差异上。 前者是指基因组中导致氨基酸状态改变的碱基位置,而后者是指那些不同碱基仍可产生相同氨基酸的氨基酸位置(请参见第三个位置)。 在这些位置上,特定基态的取代,跨谱系的取代之间的比率是在分子水平上选择驱动的适应性的粗略度量。 同义位置的变化受否定选择的约束要少得多,而由于通过新表型增加适应性而导致的正选被认为仅是通过非同义变化发生的。 什么Enard等。 指出的是 人类基因组在特征分布上是异质的,如果不考虑其他混淆变量,而将注意力集中在此类类别上的成对差异上,可能会掩盖尝试中的动态变化。 特别是,他们认为,在同义突变替代的可能性更高的地区(即,它们在功能上受到更多限制,因此非同义变体将受到不利影响),背景选择往往会更强,这一事实掩盖了积极的选择性扫除的证据。 这导致非同义替换区域周围的中性多样性升高,而同义替换的区域受到强烈限制。 一旦校正了背景选择的威力,作者就证明了人类基因组中新的适应性变体的扫描,而这些变体以前是隐藏的。

1000个基因组数据集有两个有趣的经验发现。 首先,作者发现,积极选择倾向于 根据监管要素运作 而不是编码顺序更改。 您可能知道这是 辩论 目前在分子进化生物学领域。 第二,撒哈拉以南非洲人中没有积极选择的证据,或者该人群的背景选择更少。 我自己的直觉是,正是前者,随着环境条件的变化,整个欧亚大陆以及新世界和大洋洲的人口脉动自然导致了当地的适应。 尽管非洲的病原环境可能特别适合人源素免疫系统,因此与非非洲人相比,这种新突变给新突变带来了更高的成本。 因此,我不会立即放弃第二个想法。

关于选择力的争论将在哪里结束,这是任何人的猜测。 我也不在乎。 相反,重要的是获取工作动态的更细粒度的地图,以便我们可以更清晰地感知现实。 必须对从人推算时保持谨慎(例如,作者指出, 果蝇 基因组的编码序列成比例地丰富)。 但是由于基因组数据的不断涌现而产生的人类结果将为其他生物的可能性提供有用的概述。

引文: 人类进化过程中普遍存在的积极选择的全基因组信号

*卡通资格是由于我知道选择也是随机的。

** Voight,Benjamin F.等人。 “人类基因组中最近的阳性选择图。” PLoS生物学4.3(2006):e72。, Sabeti,Pardis C.,等。 “从单倍型结构检测人类基因组中最近的阳性选择。” 自然419.6909(2002):832-837。, Wang,Eric T.,等。 “最近推断出的达尔文人对智人的选择的全球格局。” 美国国家科学院院刊103.1(2006):135-140。, Williamson,Scott H.等人。 “定位人类基因组中最近的适应性进化。” 《公共科学图书馆·遗传学》 3.6(2007):e90。, 霍克斯,约翰等。 “人类适应性进化的最新进展。” 美国国家科学院院刊104.52(2007):20753-20758。, Pickrell,Joseph K.等人。 “全球人口样本中最近积极选择的信号。” 基因组研究19.5(2009):826-837。, Hernandez,Ryan D.等人。 “经典的选择性扫掠在最近的人类进化中是罕见的。” 科学331.6019(2011):920-924。

 
中央教条

中央教条

在生物物理规模上理解遗传学的基本方面之一是表征一系列过程,这些过程跨越碱基对的原始序列信息(例如AGCGGTCGCAAG…。)和各种大分子(编织在一起以创建序列集)之间的鸿沟。组织,并促进生理过程,从而产生生物体。 这组现象被最简洁地封装在经常被破坏的状态中 分子生物学中心教条。 简而言之,DNA序列的信息是 转录翻译 变成蛋白质。 尽管为了获得更高的准确性和精确度,必须始终添加以下现象的警告: 拼接。 过程范围的巴洛克式特征使得分子遗传学已成为一个庞大的事业,在很大程度上取代了经典的孟德尔遗传学。

从进化的角度来看,一个关键的结构细节是 氨基酸 蛋白质的基本组成部分通常由 核苷酸三联体,或 密码子。 例如,氨基酸甘氨酸是“四倍简并”,GG AGG GGG CGG U (对于RNA Uracil,U,是DNA,T中的胸腺嘧啶的替代物),都对其进行编码。 请注意,更改固定在密码子的第三个位置。 改变第一个或第二个位置将改变氨基酸终产物,并可能干扰最终蛋白质的功能(或也许 在某些情况下完全干扰转录)。 这些是 代名词 替换,因为它们不会改变序列的功能导入,与 非同义的 位置(可能会取消或更改功能)。 在进化的背景下,人们可能会认为这些同义替代是“沉默的”。 因为自然选择取决于遗传变量的变化 ,并且同义替换大概不会改变表型,通常假设在这些基础上的进化变化是选择性的 中性。 相反,非同义的更改可能有害或有益(前者比后者更可能,因为打破或有复杂性比创建新的或有复杂性要容易)。 因此,跨谱系的非同义和同义碱基上的遗传变化比率是常见的 可能选择的量度 在一个基因上。

在这一点上,我已经从最肤浅的角度勾勒出了一组命题,这些命题涵盖了DNA生化力学的具体物理领域以及抽象的正式进化遗传模型,该模型概述了等位基因频率在时间和空间上的轨迹。 但是,命题总是嵌入公理中,而这些公理可能并不总是字面真实的。。 例如,某些氨基酸在氨基酸产量方面名义上等价的密码子受到青睐 偏见 源自各种效率 平移机械 的细胞。 在时尚之后,这也是自然的选择,但它并不通过生命过程中某个阶段的个体有机体的适应性以直接的方式体现出来。 在某些情况下,同义突变会发生变化 监管途径 显着地等等。 尽管所有这些与理想的偏离都可能是大多数研究人员接受的,但对于同义突变的中性框架的实用性允许事先假设它们不受选择。

A 新文 in 公共科学遗传学, 在同义站点中进行强纯化选择 黑腹果蝇着重强调了许多公义位置在中的可能性,从而着眼于该公理的鲁棒性。 果蝇 受制于 强烈 净化选择。 即,推定的沉默转变产生明显的功能差异,这导致生物体的适应性大大降低,从而从多态性库中去除了突变等位基因。 注意这里的关键限定词是 强大。 诸如突变偏倚和调节差异之类的动态变化意味着,许多人甚至在同义的位点上都会承认选择的弱小而温和。 这些作者主张一些更为激进的观点。

图1C

坦率地说,该论文内容丰富,内容丰富,从统计遗传学到发育生物学的学科广度令人印象深刻。 但是核心结果可以归结为原始计数 单核苷酸多态性。 特别是他们比较了 内含子像同义位点一样,也被认为是中性的,因为它们不是产生蛋白质的最终RNA转录本的一部分,以此作为检查其感兴趣位点的参考。 尽管您可以在这篇文章顶部的面板中观察到一些微妙之处,但这似乎与4D(四倍简并)站点中的中立性有些偏离。 在上面的第二个面板中更清楚。 同义位点的遗传变异似乎比应有的少。 这是一种提纯选择的方法,它可以连续地从种群中去除低频有害突变。 但是为什么呢 强烈 选择? 作者强调的问题是,先前研究的数据集根本不够密集和丰富,无法区分强纯化选择和弱纯化选择,因为在较粗略的分析范围内,效果会非常相似。 相反,在这里,作者使用了100多个果蝇品系,并装配了近1万个4D SNP。 通过对种群进行如此深入的采样,他们甚至能够探测到很小的差异,因为强选择在清除非常低频率的等位基因方面会明显更有​​效(考虑到在较小的样本中,很可能会遗漏低N变异体)。

成为论文 公共科学遗传学 它免费提供给所有人阅读,因此我将为您节省所有细节,包括如何校正GC含量的偏差,可能的选择性扫描以使来自侧面区域的信号失真等。他们能够使用重采样技术来确认尽管将数据划分为多个类别确实使我有些担心,但它们的推理的鲁棒性还是有一点。 此外,还提到了使用“简约性”,这有点令人担忧,特别是由于作者甚至承认这可能会得出错误的结论这一事实。 但是,即使细节中有许多令人生畏的运动部件,总体效果还是相当可观的。 我还应该提到,他们探讨了密码子偏倚可能在产生这种模式中可能发挥的作用,而且似乎不太可能(特别是因为纯化选择似乎会影响最佳和非最佳密码子)。 而且,还有一些相当奇怪的结果,例如他们发现纯化选择是 较弱 X染色体上的染色体比常染色体上的染色体(与我的相反,我认为是他们的期望)。

本文的“后端”有所不同,因为它分析了感兴趣的基因组区域(4D位点)的功能和发育方面。 他们报告说,例如,净化选择是在整个保护区进行的 果蝇 物种。 不奇怪。 但是,在整个血统中的站点上似乎也存在大量的取代和变化,这有待纯化血统。 这暗示着获得突变的功能,可以区分 果蝇 物种。 最后,关于基因表达的时间分布的广泛模式也涉及到4D位点,这些位点是高度保守的。 由于我对开发生物学并不精通,因此我会将其留给其他人使用,尽管结果对我来说是不透明的,但这似乎是暗示性的。

一篇论文并没有推翻40年的分子进化过程。 即使验证中立理论的一些主要假设和结果是错误的,也不会否定中立作为无效假设的效用。 但是,如果将同义位点作为中立性的基准,并且一直受到严格的纯化选择,那么这的确意味着我们对影响遗传进化史的力量平衡的理解。 果蝇 可能是完全错误的。 关于预选赛 果蝇 我认为这是有道理的,因为从我之前回忆的结果来看,该模型有机体普遍存在选择现象,而这可能并不适用于所有分类单元。 作者对结果的一般性进行了论证,他们也许是正确的,但我认为人们应该对这种说法更为谨慎。 这确实告诉我们的是 现代基因组学和数据的扩展并不能以更精细的规模揭示自然,但实际上可能是在抽烟长期隐藏在平原地区的结构和模式。

引文: Lawrie DS,Messer PW,Hershberg R和Petrov DA(2013) 黑腹果蝇。 PLoS Genet 9(5):e1003527。 doi:10.1371 / journal.pgen.1003527

 

信用: 艾尔格迪斯

马是一匹美丽的动物。*这不是一件小事,但从历史上看,这具有重要意义。 显然,在我们心目中,作为战争工具的马匹的兴起是最主要的,但从平淡无奇的层面上讲,马匹的崛起 彻底改变了许多社会 通过它们对农业生产力的影响。 狗可能是人类最好的朋友,但是马可以说是人类最有用的朋友。 或者至少是。 对现代人来说,马的至关重要性可能已经消失了,但是直到汽车兴起,马匹在许多大城市中无处不在(当您 观看早期电影)。 如今,人们认为马是一种奢侈的玩物(“ ergo”一词, “马国”),但是在马力鼎盛的世界中,他们曾担任过拖拉机,坦克,汽车和电报的角色。

这些仅仅是马基因组学对那些不愿继承庄园的人产生好奇心的原因。 马是其中的一部分 我们的 历史,作为一种大型魅力哺乳动物,对该血统的起源特别感兴趣。 这是 部分 的原因是 自然 很重要 使用早期中更新世马的基因组序列重新校准马属进化。 但这不是本文值得关注的唯一原因。 它将古代DNA测序的时间范围从当前的约50,000年扩展到目前的约500,000年,幅度提高了一个数量级。 显然,这是一个巨大的飞跃,尽管从加拿大育空地区的遗体中检索到这些DNA也就不足为奇了。 通常是哺乳动物古老的DNA突破,包括化石的破坏, 预言史前分析 我们自己的血统。 但是我不确定在这里是否一定会发生这种情况(请注意,在未来几年中将会有很多关于较新年份的古代人类DNA出版物), 智人 只有我们特定的血统 智人。***尽管如此,该出版物无疑巩固了系统发育学的新纪元,在该纪元中,可以对树木的推论进行校准,并对照迄今仅存在的长期灭绝的节点和分支进行检查。

那么他们在本文中发现了什么值得注意的东西? 首先,我们必须注意,它们在古代样本中的覆盖率不是很高。 每个站点大约只有一个。 这意味着系统中将会有很多噪音,但是随着它们具有的标记数量的增加,这对种群历史的系统发育推断来说并不是一个大问题。 当作者专注于功能区域以及古代样本和现代血统之间可能存在的差异时,它的确使我更加担忧。

无论如何,从上面的树中可以看到, 普热瓦尔斯基的马 是所有现代家庭马血统的外包。 结果并不是那么新颖,因为家养的马可能来自西欧亚草原,而普氏原羚的马则分布在蒙古各地。 也许更令人惊讶 在后者的基因组中没有发现家养马和普氏原羚的混合。 作者使用育空地区的样本作为校正,估计家马与蒙古野生血统之间的分歧发生在距今约40,000年的广泛种群规模上。 信封计算的一些快速反馈告诉我,这相当于约150,000万人类年的世代时间校正,与布什人与其他人口的分离范围相同。 此外,我可能会提到普氏原羚和家养马之间存在核型差异(尽管它们是可育的),并且在行为上也存在明显差异。 后者是可以预料的,因为马已经在一系列表型上进行了非常有力的选择(有多少动物习惯性地让另一只动物 他们?),两性之间的生殖价值偏斜(即,一只公马叫) 许多 后代)推动动力。 最后,作者指出,尽管繁殖瓶颈约为15个,但Przewalski's_horse的马具有相对较高的遗传多样性(现在有1,000多个)。 实际上,原始的育种程序有意识地跨越了无关的个体,因此这是对期望的确认。 再次,这说明了 人口普查规模的瓶颈不必是灾难性的.

我将使用古老的育空地区样本作为一个整体,对家养马匹中可能发生的选择事件进行广泛的讨论,因为看来普热瓦尔斯基的绰绰有余。 相反,这里有趣的结果是作者将马的出现时期推迟到了约4万年,而不是约2万年。 暗示马的突变率可能与人的突变率不同。 如您所知,实际上关于人类的本质存在争议 变异率和各种时钟估计的可行性。 对于古生物学钉,育空地区的样本显然可以作为校准的极佳数据点。 没有深入了解技术的事实,它是如此古老,而不是 相对于马的起源而言,这个年龄远未达到假定的年龄,这意味着我非常有信心,这里的结果将经受住时间的考验。

我对评论提取和测序这种降解的DNA的技术巫术毫无用处。 但是,这方面的许多工作对我来说确实令人印象深刻。 当您认为不到一代人对一个人进行测序被认为是一项艰巨的任务时,他们设法从超过500,000年历史的DNA中获得了如此多的信息,这一事实令人难以置信。

引文: 使用早期中更新世马的基因组序列重新校准马属进化

*而且,坦率地说,有些愚蠢。 我十几岁的时候就在ule子农场工作,与易怒而狡猾的驴子相比,马匹的沉闷和静止本质总是形成了鲜明的对比。

**我可以说是因为人们可以证明牛或猪等作为家畜具有更大的效用。 但是尽管如此,各方都可以争论不休。

***我知道那是过时的 H. 智人 例如尼安德特人(Neandertals)是北方的亚种,但实际上,它们的分布远比我们自己最早的分布更受限制 前辈.

 
• 类别: 科学 •标签: 进化基因组学, 基因组学 

有一篇很棒的论文 手机 马上, 通过选择的EDAR变体的表达对小鼠最近的人类进化进行建模。 它综合了基因组学,计算模型以及鼠标模型的有效执行,以探索人类的非病理性表型变异。 可能是由于本文的最后一个因素推动了人类进化基因组学的发展,找到了解决这一问题的方法。 手机 (当然还有“影响因素”)。

这里的重点是 雷达,您可能以前听说过的轨迹。 通过摆弄EDAR轨迹,研究人员有了 较早创建 “亚洲老鼠。” 更具体地,表现出一组表型的小鼠被称为能够将东亚人与其他人群区分开,特别是在头发形态和皮肤腺体发育方面。 更普遍地,EDAR牵涉到 外胚层组织的发育。 这是一个非常广泛的领域,因此修饰此基因座会导致许多表型变化也就不足为奇了。 上图说明了在HGDP人口中在东亚人中发现的突变的现代分布。

需要注意的一件事是,派生于东亚形式的EDAR出现在美洲印第安人人群中,这些人与东亚人在距今10,000年前(距今15至20,000年)之间的确存在分歧。 在西欧亚大陆中,您可以找到派生的东亚EDAR变体的两个种群是Hazaras和维吾尔族,这两种种群可能都是最近在东西欧亚种群之间混和的产物。 在美拉尼西亚,EDAR频率与南极混合气体相关。 在地图上没有,但也没有人知道,南亚的蒙达(奥亚)部落的人口也很低, 但不平凡,东亚EDAR的频率。 在这种情况下,它们在没有最近东亚混和物的南亚族群中是例外的。 这使人们相信蒙达族是从东南亚入侵的一部分南亚奥秘人民的后裔,那里存在着大多数南亚奥林匹亚语。

但是让我惊讶的一件事是,欧洲人口中甚至在俄罗斯人中都没有东亚EDAR。 我对这个结果感到有些困惑,因为在过去的10,000年中,西伯利亚人与欧洲人的混合生活成为了可能, 正如一些研究人员所引述的 (这不是一个晦涩的结果,它会反复出现在TreeMix中)。 第二个图显示了在过去30,000年中东亚EDAR单倍型从中推断出的区域。 作者利用数百万个带有大量参数的正向模拟对EDAR的扩展进行建模,以使其适合所实现的分布模式(有关参数,请参见此处的补充资料)。 长话短说,他们推断在目前之前约有30,000年存在一个突变,并且在选择系数的驱动下它以大约0.10的数量激增了频率(相对适应度提高10%,非常强大!)。 这是选择性扫描的最末端,可能与表征其特征的单倍型相同 SLC24A5LCT (该块较短,但由于时间深度较深而有意义)。 再次,我感到困惑的是,为什么在美洲印第安人或蒙达族中发现的这种古老等位基因在具有推定的东亚欧亚混合体的欧洲人中却不存在。 整体不适合我。 我的一个或多个假设有一个弱点。

然后是关于鼠标模型的部分。 对我来说,这方面很巧妙,尽管我不能特别评估它的技术性。 小鼠模型较早用于测试突变对EDAR的影响的条件是拷贝数发生粗略变化,从而导致蛋白质的剂量发生大量变化。 在那种情况下,表型结果是相当极端的。 在这里,他们使用“敲门”模型,在其中重新创建了特定的EDAR点突变。 他们没有发现极端的表型,而是发现老鼠的性状范围更加正常,尽管它们的头发形态变化与人类发生的变化非常吻合。 此外,外分泌腺的数量也有所变化,衍生的东亚EDAR携带者的内分泌腺数量更多(具有累加效应)。 最后,他们注意到乳腺垫面积和分支有差异。 这些都不是令人惊讶的,EDAR是一个重要的调节基因,可以塑造生物体的外围和外部。

为了仔细检查人类在小鼠模型中的相关性,他们在一大批汉族人群中进行了全基因组关联。 特定性状的相关性在他们期望的方向上。 那些具有东亚EDAR变体的人的头发更浓密,铲形门齿,外分泌腺密度更高。 可能需要注意的是,汉族人群中衍生变异的频率很高,以至于他们没有足够的纯合祖先基因型来进行统计,因此他们的比较涉及杂合子与衍生突变体以及祖先状态的副本。 。 就像欧洲人中的SLC24A5一样,在这里很难找到具有非欧洲模式变体的双重副本的具有欧洲传统的个人。

让我们回顾一下他们在这项研究中所做的所有令人敬畏的事情。 他们深入研究了EDAR周围地区的进化基因组学,认为该单倍型是在大约30,000年前的祖先变体中经过硬选择扫描而频率升高的。 并且在选择系数方面具有明显优势。 这可能是过去50,000年非非洲人基因组中自然选择的最大影响指标之一。 其次,他们使用人性化的小鼠模型来探索与东亚人这种突变变化相关的表型范围。 因此,您在一个基因座上具有很强的选择系数,并且具有与该基因座的变化相关的一系列性状。 第三,尽管该领域已有研究(即复制),但他们确认了人类特征与突变之间的相关性。 这都是一门伟大的科学,它显示了小组之间协作的力量。

本文的许多优雅之处和影响力也适用于讨论部分, 但坦率地说,这是我开始崩溃的地方。 您可以在其中了解到 纽约时报 片, 与35,000年历史的突变有关的东亚体质特征。 这里的标题指出了从这一研究领域中得出的合理重要的推论, 人类的许多显着身体特征似乎是由于在几个基因座上发生了强烈的选择事件。 除了EDAR,我还在考虑色素沉着基因座,例如SLC24A5。 如果上山褶皱有类似的东西,我也不会感到惊讶。 如果它是可见的,并且定义了种群之间的差异,那么它通常在基因组上并不琐碎。 在这种差异下通常会有一个故事。

在人类自然历史的广阔范围内,对我而言出现的问题是 我们有特质,我们有选择的基因,但是我们有很弱的故事来解释自然选择的机制和背景。 在这里,与乳糖酶持久性和疟疾抵抗力有关的基因座形成了鲜明的对比。 在这些情况下,选择的因果机制似乎相对清楚。 批评进化论的心理学家不会指责“只是这样”的讲故事领域,但是在进化基因组学的知识上更加隔离的领域也出现了同样的问题(部分原因是该领域非常新,并且在数学和计算上也很抽象)。 为了说明我在说什么,我将引用以上论文的讨论内容:

高密度的外分泌腺是关键的人类激素适应性,能够在剧烈的活动(例如长距离行走和奔跑)中进行有效的蒸发蒸腾(Carrier等,1984; Bramble和Lieberman,2004)。 370A携带者的内分泌腺密度的增加可能在温暖和潮湿的季节有利于东亚的狩猎采集者,这会阻碍蒸发蒸腾。

地质记录表明,中国在40,000至32,000年前是相对温暖和潮湿的,但在32,000至15,000年前,气候变得凉爽干燥,然后在全新世爆发之前又变暖了(Wang等,2001; Yuan等)。等(2004)。 然而,在整个这段时间里,由于夏季和冬季季风的贡献不同,中国可能仍处于相对潮湿的状态。

高湿度,特别是在夏天,可能为个体提供了季节选择性的优势,使其能够更好地激活更多的内分泌腺,从而更有效地出汗(Kuno,1956年)。 为了探索这一假设,需要更精确地选择何时何地等位基因(也许使用古老的DNA来源)以及更详细的考古和气候数据。

适应气候总是一个不错的选择。 这个假设的问题是 该等位基因分布的现代梯度与人们对热和湿度的适应性恰好相反。 另外,这种适应方式没有成本吗? 在最初的向上扫描之后,高频率发现了衍生的EDAR突变体的种群经历了令人难以置信的最后一次冰川最大值的寒冷,而像雅库特这样的群体如今已经适应了寒冷。 不仅如此,从北极到热带地区的美洲印第安人都展现出一种适应寒冷的身体形态,这是贝伦吉亚长期逗留的历史后果。

当然,作者并没有这么简单,而且有些脱节的讨论暗示了这样一个事实,即EDAR具有许多表型效应,并且可能受到多种积极的选择压力。 从表面上看,这似乎是合理的,但这种机制的复杂性似乎不适合于该基因座周围的选择信号如此干净,清晰的事实。 似乎这不是一个容易解开的故事,并且在本文中有很多关于这一事实的隐式承认。 但是在正文末尾添加了以下内容:

值得注意的是,由370A等位基因引起的大部分不可见的结构变化可能会赋予功能优势,例如外分泌腺数目增加,直接与视觉上明显的特征相关,例如 头发的表型和乳房的大小。 这创造了这样的条件,在这种条件下,伴侣的偏爱可能会迅速演变并加强更直接的竞争优势。 因此,随着时间的推移,由单一多效性突变引起的多种性状上累积的选择性作用力可能会推动370A的上升和扩散。

一个简单的结论是,最初的气候适应可能已经让位于文化/性选择适应,而西方前东亚经典(黑色和有光泽的)以及偏爱小乳房。 这个方面在 纽约时报 当然。 我会再次引用:

但是西雅图华盛顿大学的遗传学家约书亚·阿基(Joshua Akey)说,他认为该基因在东亚人群中传播的更可能原因是性选择。 粗大的头发和小的乳房是可见的性信号,如果携带者生下更多的孩子,如果男性愿意的话,这种信号很快就会变得越来越普遍。 阿基博士说,具有明显特征的基因,例如欧洲人的蓝眼睛和金发,具有很强的选择信号,而且与汗腺相比,EDAR的可见性效应更可能是自然选择的驱动力。

此处的段落含糊不清,因为该文章的作者Nick Wade不使用引号,而且我不知道什么是Akey,以及Wade对Akey的理解是什么。 例如,出于生殖偏斜的理论原因(几个男人可以生很多孩子),一般来说,性别选择通常是由女性偏爱男性表型驱动的。 我认为Akey知道这一点,所以我怀疑那部分是Wade的光泽(尽管考虑到偏爱较小的乳房的提议,这是一个合理的水平)。 我想到的主要问题是,著名的人口遗传学家,例如约书亚·阿基(Joshua Akey),实际上如何认真地选择性别作为推动人口变异和选择的力量。 似乎很多时候,性选择被呈现为 前机械世界 这种现象可以挽救我们对特定特质起源的困惑。 但是,我们对性选择可能性的评估大概必须以先前的期望为前提,而这种期望是由人们可以从文献中得出的各种力量之间的平衡得出的,在这里,我对当前性选择文献的了解还很薄弱。 也许我的怀疑是建立在我的无知之上,而提出这一解释的种群遗传学家对文献的状况更加了解。

所有这些使我回到了嘲讽的标题。 上周,当这篇论文首次成为新闻时,我正在与一位日本血统的朋友共进晚餐(他在日本上过小学)。 我问他空白,“你喜欢小乳房吗?” 他最初的回答是“ WTF!?!” 拉齐卜,”但作为老鼠遗传学家,在向他概述了上述结果后,他理解了我的问题的主旨。 从与许多东亚裔美国男性的私人交流中,我不相信在这部分人口中,绝大多数人都偏爱小乳房。 但是这里的关键是 美国人。 这些是沉浸在美国文化中的人。 毫无疑问,东亚的规范有所不同。 我们在美国媒体中看到的名人东亚女性的典型视觉表现形式是,与西方女性名人(例如巩俐,韩国流行歌手的新作)相比,她们的继发性特征更苗条,更轻描淡写。 ,甚至考虑到后者的整形手术)。 毫无疑问,部分原因是整个人群的正常变化范围有所不同,部分原因可能是审美偏好的本质。

但是,根深蒂固的心理原因驱使性选择的可能性(据我所知,华南和西伯利亚没有一种文化)使我们回到有关更新世思想的旧观念。 并且,这使我们回到了进化心理学领域,这个领域既是对进化科学在理解人性方面的效用的怀疑论者的怀疑者,也是对进化生物学的严格实践者的鞭策者。 然而,这里并不是进化心理学家,而是我经常在媒体上援引性别选择的,经常被肋骨缠住的统计遗传学家。。 但是我们是否知道这是性选择,还是我们最好的猜测? 因为最好的猜测常常是错误的(尽管最好的猜测比最坏的猜测更可能是正确的!)。

在过去的十年中,进化基因组学已经走了很长一段路。 例如,我们知道遗传结构以及许多性状的自然历史某些方面。 但是,仍然存在缺点。 乳糖酶的持久性是规则的例外。 就象为什么人类色素沉着这样简单的表型,在过去的10年中为什么它一直是欧亚大陆的重复选择目标也无可争议的答案。 通常,正确的答案就是我们只是不知道。

引文: http://dx.doi.org/10.1016/j.cell.2013.01.016

 

大多数读者都知道我参加过ASHG2012。我将把这篇文章分成两半。 首先,会议的一般性。 其次是特定的海报等

通用性:

生命技术/离子激流 显然雇用了d-bag bros在会议上代表他们。 海报的人很好,但是那些负责 离子洪流巴士 如果他们认为这很有趣/可笑/等等,那就是总的困境。 人力资源敏锐度并不总是反映技术上的突破,但是我敢肯定,如果他们认为聘请认为d-bags有趣的人来疏远某人的选择,那么他们(HR)认为这是明智的选择ASHG的会议参加者。 Affy&Illumina!

–说到测序,有一些年轻的公司试图推广技术,以解决缺乏长期阅读的问题。 我充满希望,但是在2000年代后期太平洋生物科学公司惨败之后,我认为对任何一家特定公司寄予希望是没有意义的。

–我走进了海报大厅,阅读了标题,并至少浏览了所有3,000多个海报的摘要。 基因组学无处不在就不足为奇了。 但是,也许会有一个适度的惊喜是,大型外显子组对于以医学为导向的人而言正变得如此。

–在谈到医疗/临床人士时,我注意到他们在介绍中使用了“高加索' 很多。 这在流行一代中并不明显。 它显示了官僚命名法在现代医学中的影响,因为他们倾向于使用有些荒谬的美国人口普查局类别。

– Twitter是 相当大的一笔。 有很多有趣的环节,我发现自己不断检查自己的供稿中是否存在 #ASHG2012 井号。 这也是弄清楚在同一次会议上还有谁的一种简便方法(例如,就我而言,经常 卢克·乔斯汀(Luke Jostins)).

–如果您可以在会议上跟踪智能手机的移动方式,那么看到一个由个人组成的网络将很有趣。 例如,进化论和种群基因组学海报被更多直接的信息学(例如,用于清理原始序列数据的软件)所束缚,从中流血了。 但是在进化和种群基因组学部分的旁边(我说基因组学而不是遗传学,因为后者完全被前者所涵盖),您有某种类型的小儿疾病遗传学过道。 当我错误地继续前进时,我并不是唯一一个害怕的人(即,您从对埃塞俄比亚人口结构的深入讨论,到关于常染色体显性遗传性疾病新生儿可能死亡的具体讨论) ,上面说的是新生儿的照片!)。

–显然哪些会议更具跨学科性:只需注意演讲者之间的“搅动”即可。 人们在逐个发言者之间切换会话,因此,如果不喜欢他们的话,他们会选择退出。

–每个演讲的问题数量似乎随之而来 幂律。 许多很多的谈话必须让主持人问一个令牌问题。 但是有几个小组让人们赶到麦克风,主持人不得不将它们拒之门外(这在我身上发生了两次,尽管我习惯于坐在过道的中间,这样人们就不会超越我,这使我处于不利地位)。

23andMe 据推测,最迟在今年年底之前,将会有新的祖先画作,还有更多的人口。 当我看到它时,我会相信的,但是告诉我这件事的人似乎完全是真诚的,我充满希望。

–在某些晚上,我喝了相当多的酒,并且从很多我不记得的人那里得到了很多名片。 但是似乎正在出现的一件事是中介和b2b服务的激增。 由于选择的多样性,有理由认为,有些公司正陷入混乱之中,并试图通过在交易结束时使两方相匹配来获利。 我一个人 do 回忆起迈克尔·赫尔岑(Michael Heltzen)的 蓝色SEQ,他将其称为“测序的Hotels.com”。

–总体而言,这是一场物流方面的良好会议。 明年我一定会去波士顿!

–关于古人参掺和物和选择的很多东西。 很多。

–朋友不要让朋友使用 结构体 他们什么时候可以使用 混合物。 似乎大多数人都选择了后者,速度很快。 但是少数小组仍在使用前者。 而且不应该这样,因为它们的老化和复制参数设置得很低(我使用 结构体 微卫星),这样一来就不会花费一千年的时间进行收敛。 如果您要这样做,为什么首先要考虑贝叶斯系统进化学的作用呢?

–卢克·乔斯汀斯(Luke Jostins)建议,我在现实生活中的表情与头部镜头不同。 我怀疑卢克在这方面的认知能力较低。 一个受人尊敬的实验室里非常醉酒的人决定在聚会后的昏暗的日子里大喊我的名字,*所以我看起来没什么不同(而且好像并没有很多棕色的家伙在附近走来走去。这些东西)。

康拉德·卡切斯基(Konrad Karczewski) 给了我一个“释放数据”按钮,但是当我问人们是否要发布其数据集时,结果却参差不齐。 一些演示者愿意通过电子邮件将数据发送给我,但是由于我没有刷新徽章,所以我很好奇他们为什么愿意提供这种方法,而不是将其发布给数以百万计的 other 陌生人!

细节:

本节将主要讨论进化论和种群基因组学类别的演讲和海报。 我可以对这些谈话发表评论,因为我去过他们,而对海报则因为我多次看过它们。 要注意的一件事是,许多海报和一些演讲是在已经在发行(预印本或已经出版)的纸上进行的。 我不会涉及太多。 我已经审查/链接到大多数。

–从去年春天开始参与胎儿全基因组测序的一个人说,这里的主要成本将是测序。 他还充满信心,他们可以将测序工作从18周前移到更远的位置(例如,在样品收集和分析周转方面)。

–关于结构变体等的讨论很多,但是对于高通量测序方法,我们仍然没有。 实际上,我参加了CNV演讲,主持人介绍了一些RFLP结果! 他指出,现实情况是,出于临床目的,高通量不足以区分3对4对5拷贝的可行性或准确性。

–我没有太多的CNV内容,这些内容会重复CNV的SNP结果。 例如,用CNV概括了地理精细结构的海报。 这对于第一家酒吧来说还可以,但是一遍又一遍地做似乎是没有必要的。

–西蒙·格雷维尔(Simon Gravel)有一些很棒的东西 软件.

卢卡·帕加尼(Luca Pagani) 对...有信心 滚下的埃塞俄比亚掺和量估算值。 他现在正在迁移到埃塞俄比亚的整个基因组,并计划对该问题进行后续跟踪(他自己的方法与 滚下).

–将东北非洲人口与南部非洲的Khoisan联系起来的传闻论文(即,我已经听过几年的论文)最终将很快出版。 至少那是我被告知的……正如我所指出的,这个结果已经存在很长时间了,但是还没有人发表。 基本上,这个小组有一些来自肯尼亚的库希族语样本,看起来像是埃塞俄比亚人对安达曼岛民的类比(或尽可能接近)。

–我们很快就会在Afrikaner基因组学上看到一些东西。 没有明确告诉我,但这很明显。

——由数百家创建、维护和提供物联网(IoT)全球开放标准的公司所组成的 尼尔森集团 仍在进行高海拔适应他们没有看到硬扫。 当然,我没有得到这些是否是旧变体的确认,但是看起来许多初级的东西似乎没有能力检测第一组中的任何东西。 和往常一样,他们要有所作为。

–谈到尼尔森集团, 梅利莎·威尔逊·塞雷斯(Melissa Wilson Sayres) 对Y染色体谱系进行选择纯化的工作对我来说很有说服力。 基本上,有效的种群差异(例如,一夫多妻制)无法解释Y谱系的较低多样性(他们进行了模拟)。 幸运的是,对于系统学家而言,这不会影响Y树的效用(积极选择会,但是这并不是她在说的)。 无论是不是赛勒斯的谈话,我都有些困惑,但是这些结果可能解释了mtDNA与Y谱系之间的融合不一致(前者具有更深的融合)。

–另外,来自的艾米·戈德堡(Amy Goldberg) 诺亚·罗森伯格(Noah Rosenberg)的实验室提供了一些理论研究成果,这些研究表明复杂的人口统计历史会影响差异,而不是您可以推断出给定性别的平均有效人口规模。 当我看着艾米的海报时,迈克尔·哈默(Michael Hammer)实验室的某人开始问我是否喜欢他们的研究,我说可以(我写了博客),但她的理论结果也解释了我会从中看到的一些奇怪的东西。他们的实验室。

– Sriram Sankararaman在现代人类血统中张贴了有关尼安德特人掺和物的海报。 在粗略的大纲中,Reich实验室和Wall实验室似乎是一致的(以及其他人,例如Slatkin实验室的Melinda Yang)。 我们正在看到一种新的正统/范式的融合。 他们似乎大致同意 格雷厄姆·库普的猜想.

–关于东亚遗传学的东西很多,但没有什么太前沿了。 我有点失望。 一项大规模的Y和mtDNA研究确实表明在藏族高地发生了两次混合浪潮, 先验 对我来说似乎很合理。 但是我的经验法则不能打赌仍然持怀疑态度的尼尔森集团。 另一篇论文提出了缅甸人中单倍型M的深厚血统。 这很有趣,因为缅甸人在文化上可能具有一定的侵扰性,取代了星期一的人口。

–来自不列颠群岛人民的家伙出席了会议。 两点。 首先,大约40%的英格兰血统似乎是盎格鲁-撒克逊人。 其次,他们的聚类方法似乎在“凯尔特边缘地区”和苏格兰发现了更多的“微型种群”。 为什么? 我的直觉是盎格鲁-撒克逊人的扩张不是扩散过程。 相反,亨斯主义者和霍萨人的部落可能与东安吉利安海岸的当地布莱顿尼克人凯尔特人混为一谈,并迅速扩张。 以后有很大的可能性被同化(有迹象表明,阿尔弗雷德大帝的血统是被吸收到盎格鲁-撒克逊人权力结构中的布莱索尼克贵族),但是一个巨大的盎格鲁-撒克逊人/英格兰固有群体的出现是很明显的在显示的图中。 我能想到的与该论据的主要对立是,按距离隔离基因流在英格兰的地形中非常有效,而在更为崎border的边疆地区却不那么有效。

–说到远距离隔离,爱沙尼亚的遗传学家向我宣称,爱沙尼亚人和芬兰人之间的区别可能与最初的芬兰人从东部到来以及随后的分离有关。 爱沙尼亚人与拉脱维亚人进行基因交流时,他们与芬兰人分道扬across,在瑞典人到来之前,他们更加孤立。

–有一个海报(没有与主持人交谈)对一个或两个南印度人进行了全基因组分析,并指出有证据表明这些人是所有其他非非洲人的基础。 这是重申非洲古老的“南方路线”的可能性的另一种尝试。 我没有被说服,因为他们的方法没有太多细节(他们指出了多样性的估计,但是现在还不够)。

–另一个印度团体证实了很多东西 扎克 已经找到了,但补充了很多低种姓/部落的样本,这是大多数人所缺乏的。 他们断言(正确) 南亚各地的人口/种姓之间存在遗传距离,这类似于洲际差异。

–我对空间和遗传变异数据的综合感到兴奋……但是我开始意识到这是有局限性的,因为我们无法将遗传变异表示形式转移到tesseract上(因为我们无法可视化tesseracts)。 简而言之,二维或三维表示法会删除细粒度的重要信息。 现在,我们正在关注更细粒度的内容。

–显然墨西哥人和智利人高估了他们的欧洲血统。 主持人发现,他们智利人的血统中有40-45%是美洲印第安人。 我问采样问题,他们承认这可能是个问题。 他们的其他结果也是如此。 我们在这里需要更粗的数据集。 基本上,如果它是一个不同的国家/地区,就不能在该国家/地区标记饼图。

–有一幅关于将巴西人OCA2-HERC2与头发,眼睛和皮肤颜色相关联的海报。 OCA2-HERC2与肤色之间的联系不混和,欧洲人对此比较混杂,但似乎在这一人群中出现。 假设分层不是问题(我相信他们是从基因组角度看的),似乎只有当您具有特定的色素沉着基因结构时,才会对皮肤产生影响。 这是统计问题,而不是生物学问题。

–说到颜料,马克·史瑞佛(Mark Shriver)的海报将感知的,表观的和基因组的种族联系在一起。 感知意味着您如何被他人感知。 表观者正在获取身体特征并对其进行定量平均(面部特征,肤色等)。 而基因组祖先就是您所了解的。 估计祖先量子。 令人惊讶的是,人们似乎从明显的物理特征中低估了非洲的祖先(从表象到基因组祖先的分散性来看)。 这违背了民间智慧,后者认为“非洲特色占主导地位”。

–大量纠正Fst天真用法的文献。 价格实验室的一名海报建议使用似然比,如果可能的话,使用哈德森的Fst。 这以各种形式多次出现。 Fst不会死,但是会重生!

–看到一个海报,声称表亲首次婚姻使后代的期望值降低了3厘米! (这不在“进化论”和“流行基因组学”部分中,我可能应该花更多的时间研究复杂的特性等,但是您只能做很多事情)

–更多证据表明有许多人迁移到新大陆。 许多新世界基因组学。 我没有与这些主持人交谈,因为他们总是很忙。

– Spencer Wells告诉我,他们最终将很快使用Geno 2.0的结果发表论文。 他们确实有很好的人口覆盖率,尽管我希望他们可以将条形图旋转90度。 我看不懂标签。

最后, 有很多软件和很多方法。 这是我认为在未来十年内它将被一些大型公司淘汰的事情之一。 目前,实验室正在抽出软件来推断血统,相位数据等,并发挥其优势。 这一切都很好,但是在某些时候,重点将放在生物学上,而软件将是它的翅膀下的风。 我正在尝试腾出时间来使用某些软件,尽管其中许多软件尚未在线(演示者始终保证会很快上线,但是我知道这是怎么回事。)。

* 这是 不能 令人愉快的经历。

 

髓: 自然选择的遗传成分具有不同的风味。 这些成分中的一些比其他成分更难以捉摸。 这使得“阅读标签”成为一项不平凡的活动。

正如您可能知道的那样,当您查看给定生物的基因组变异模式时,您可以从这些模式的性质做出各种推断。 但是这些推论的力量取决于真实的人口统计学和进化史的细节,以及对正在测试的模型所做的假设。 当深入研究种群基因组学领域时,某些概念和模型可能看起来很深刻,但现实情况是,这些细节是构建进化的基础。 中的新论文 PLoS遗传学 也许看起来过于深奥和理论化,但它说明了塑造给定种群进化轨迹的非常重要的过程。 这篇论文的标题是 区分常规变化和持续变化 德诺 突变。 这是作者摘要:

已经投入了大量的努力来检测处于自然选择下的基因,并且在先前的研究中已经鉴定出数百种这样的基因。 在这里,我们提出了一种通过推论参数(例如选择系数和选择的变体出现的时间)来扩展这些研究的方法。 特别感兴趣的是问题的选择压力是否已经存在当所选择的变体首先引入的群体。 在这种情况下,变体将在其起源于种群之后立即被选择,我们称此过程为从 从头 突变。 我们将其与站立变化的选择进行对比,站立变化的选择要早于选择压力。 我们提出了一种方法来区分这两种情况,测试其准确性,并将其应用于七个人类基因。 我们发现三个基因ADH1B,EDAR和LCT大概是从头突变选择的,而另外两个基因ASPM和PSCA则是我们从常规变异中推断正在选择的基因。

他们所指的动态似乎是对检测难题的重塑。 硬扫与软扫。 在前一种情况下,您有一个新的突变,因此其频率为〜1 /(2N)。 它很快就受到自然选择的影响(尽管随机过程在低频中占主导地位,所以灭绝的可能性很高),而适应性驱动等位基因趋向固定(或几乎趋向固定)。 在后一种情况下,您存在大量现存的遗传变异,存在于许多不同的等位基因变异中。 一种新颖的选择压力重塑了频率格局,但您不能将遗传转移归因于仅一个等位基因。 前者比后者更容易建模和检测也就不足为奇了。 2000年代的大部分进化基因组学都集中在 从头 突变,因为它们是低垂的果实。 这些方法具有检测它们的合理能力(以及许多误报!)。 但是最近,许多人怀疑硬扫并非全部,而且许多进化遗传过程的特征可能是硬扫,软扫(来自固定变异),各种形式的杂种。 否定选择,更不用说在 平衡选择.

论文的许多细节似乎过于技术性和不透明(公平地说,在这里我要说的是,这些数字有些难以解密,尽管该主题并不是为了使人清楚起见),但是主要的发现是简单明了,如图4所示(我已经添加了标签):

– y轴表示选择阶段初始开始时所选等位基因的频率

– x轴频率表示总体比例选择系数: α= 4 Ns。 回想起那个 N 是人口规模,并且 s 是标准选择系数,用于衡量个体/基因与总体中位数之间的相对适应性差异。 选择系数为0.10(适应度提高10%)很强。 0.01(1%)之一是适中的。

上面的结果是通过使用与种群遗传模型相关的特定参数进行的模拟以及输出统计信息(例如,iHS,EHH,Tajima的D)得出的,这些结果表明,在以下情况下,更容易区分选择形式:

–对于常规变体,选择开始时,所选变体以较高的初始频率出现。 这与 从头 突变,其频率从定义上讲非常低。 请记住,后一种情况实际上是前一种情况的子集。 如果站立变化模型具有频率变化的参数,则该比例收敛于1 /(2 N)你刚得到 从头 情景。

–选择事件越强,检测和正确分配站立变化的能力就越大。 初次脸红时这很简单。 主要例外似乎在面板e中,当初始等位基因频率较低时,当自适应阶段启动时,选择强度的增加会降低区分模型的能力。 我假设在这里您很难区分这两种模型,因为 从头 和站立变化正在收敛。 请注意,从 从头 当最终频率(或您尝试检测的频率)较低时发生突变。 为什么? 可能是因为随着突变修复,您正在删除许多变异基因组信息,因此您需要推断选定变异的轨迹(对于iHS而言确实如此)。

所有这些似乎都是抽象的。 但是,您需要做的是使它们具有某种意义,就是以时间和具体的方式可视化进化动力学的轨迹。 例如,一个 从头 随着时间的推移,驱动适应的突变将迅速在人群中扩大。 由于这种现象,将发生搭便车事件,其中偏爱的等位基因的侧翼区域的频率也会升高。 这会在基因组中产生一个扩展的同质性区域,其频率与 单倍型。 由于基因重组破坏了偶然在原始突变体上一起发现的标记物的物理关联,因此这种均质性块最终消失了。 这就是为什么检测这些事件的能力会随着时间而下降的原因。 扰动减弱,基因组恢复平衡。 相反,针对站立变化的选择更加复杂,因此更加难以检测,因为它不会像通常那样产生清晰和明显的信号。 您可能有许多等位基因分散在基因组的广泛区域中,这些频率可以通过适应性压力使其频率升高。 这会在变体中产生大规模的作用转移,但并不需要在整个基因组中产生宽而独特的均质块。 相反,您有更多的等位基因,需要较少的个人选择。 尽管与 从头 突变的情况下,其幅度将在基因组的任何给定区域急剧减弱。

尽管这里的概念和方法问题本身都很有趣(例如,您可以相信近似贝叶斯计算框架来生成可提供有用结果的模拟吗?),但也有一些对真实人类基因的分析。 这些不是革命性的,它们是以前已分析过的基因座。 但是在某些时候需要根据实际情况来判断方法,这是一种尝试。 下表显示了其结果。

其中一些基因应该是您熟悉的。 如果不是,请参见功能列。 我想提一提 雷达 一直 与东亚人的头发厚度有关。 这个基因最有趣的方面是它可以转 老鼠变成亚洲人,至少以他们的头发形式。 显然,他们关注的是单一人群。 他们在方法中指出,更多的人口会在其模拟中引入人口统计学的复杂性,而且似乎他们已经突破了您可能希望在实验室例行运行的计算的现实边界。 但是,这种简化可能解释了与 抗利尿激素1B,也已在西亚发现(放弃了在东亚进行一次全面扫除的直接模式)。 那么一个重要的问题可能是这些方法的人口敏感性。 一个人可以想象到,在种群A中很容易辨别一个基因的选择,但在种群B中却很难辨别。一个种群可能会因站立变异而转变为另一种表型,而另一种群则受到了从 从头 突变。 细节在于这里。 可能没有一种叙述可以统治一切。

本文最重要的结果是对合理的参数空间的探索,在该参数空间上,可以有效地推断出有效的选择品种(或缺乏选择的品种)。 在不久的将来,计算能力和大量经验数据集将使之成为现实,因此利用现成的技术以盲目方式生成大量结果将极有诱惑力。 但是没有技巧和人为判断的技术会导致混乱和虚假。 了解可能会出现大量误报或较低的统计功效的情况很有用, 先验。 这样一来,事实发生后您就可以节省很多时间。

至于软扫还是硬扫。 这不仅仅是一个与种群遗传学家和基因组学家有关的问题和相关性问题。 适应的性质是整个进化生物学中极为重要的问题。 这两种现象之间的平衡对于表征演化的模式和速度很重要。 实际上,该比率可能会随着生命树的变化而变化,因此进化可能会根据分类群而以略有不同的规则进行操作。

引文: Peter BM,Huerta-Sanchez E,Nielsen R(2012)区分站立变异和De Novo变异的选择性扫描。 PLoS Genet 8(10):e1003011。 doi:10.1371 / journal.pgen.1003011

 

一位朋友向我指点了 注释部分 在这篇文章中 自然, 重建隐藏种族的基因组。 问题是 自然 最初表示 泰诺,波多黎各的原住民已经灭绝。 结果引发了愤怒的评论,其中之一是研究人员Carlos Bustamante, 觉得他不得不讲话。 终于 自然 更新了他们的文字:

更正:本文最初指出,塔伊诺(Taíno)已灭绝,这是不正确的。 大自然对所造成的罪行表示歉意,并更正了案文,以更好地说明所描述的研究项目。

这里的 今日Taino上的Wikipedia:

传统团体,如波里肯的JatibonicuTaíno部落民族,波多黎各(1970),安的列斯群岛的Taíno民族(1993),Taíno人民联合会(1998)和El Pueblo Guatu Ma-Cu A Boriken波多黎各( (2000年)成立,以培养塔诺文化。 但是,关于这些遗产群体是否准确地代表了塔诺文化,这是有争议的,因为一些塔诺族群体已经“采用”了其他本土传统(主要是北美印第安人)。 泰诺(Taino)文化的许多方面已不复存在,或与加勒比海群岛上的西班牙人和非洲文化融合在一起。 自称是波多黎各,伊斯帕尼奥拉和东古巴诸岛上的血统的人们试图与他们的历史身份保持某种形式的文化联系。 多米尼加共和国的教育家安东尼奥·德·莫亚(Antonio de Moya)在1993年写道:“(印度)种族灭绝是我们历史上的重要谎言……在与欧洲接触500年后,多米尼加人塔诺斯人仍然活着。”

Taino活动家现在用来增强兴趣和身份的一种方式是创建两个独特的脚本。 这些脚本用于写西班牙语,而不是哥伦布前世代祖先保留的语言。 Guaka-kú组织在自己的成员中教书并使用他们的剧本,但是LGTK(LigaGuakíaTaína-ké)已在中小学生中推广了他们的剧本,以增强他们对Taino身份的兴趣。

不可否认,在加勒比海地区发现的美洲印第安人血统很可能是来自前哥伦布时期的人口。 可能有些文化形式表现出连续性。 但是现代Taino似乎是 从一个具有印第安人自我认同感的文化环境中重新沉淀 民政事务总署 灭绝。 类推, 阿根廷人 在整个人口范围内,美洲裔的比例与波多黎各人差不多。 实际上,在阿根廷人中,超过90%的美洲印第安人独特血统都没有在具有自我认同的美洲印第安人中找到(他们仍然以少数民族的形式存在,尤其是在南部)。 但据我所知,由于各种文化原因,没有任何理由使阿根廷的自我观念从成为欧洲定居者国家转变为混血儿国家,更不用说宣布自己为美洲印第安人的个人了。

与在这种情况下打开的可能性相比, 原住民基因组学 看起来很切&干。 我想如果有人决定“收回”他们的尼安德特人的遗产,我们会大笑,但是有大量的古人类学学术著作可供这些人用来重建他们的尼安德特人身份。 听起来可能很可笑,但是在这个世界上,发生了很多您没想到的事情。

 

髓: 人类X染色体承受来自自然选择的更大压力,从而导致较少的遗传多样性。 但是,整个人群中X染色体多样性的差异似乎更多地是人口历史的函数,而不是这些人群中自然选择能力的差异。

在过去的几年中,已经发现,人类X染色体的遗传多样性低于基因组的非性别区域,即常染色体。 为什么? 从表面上看,这似乎是无法解释的,但是从人类基因组结构中衍生出来的一些基本结构性因素却可以展现出来。

首先,在男性中,X染色体是 半合子,使其更易于选择。 一旦您超越了行话,这是相当简单的。 男性只具有在X染色体上表达的基因的一个副本,因为它们具有 只有一个X染色体。 相反,雌性有两个X染色体。 这就是为什么 性相关特质 在人类中男性比例过高。 对于X染色体上的基因,女性可能是许多疾病的携带者,因为它们具有一个基因的两个副本,并且一个副本可能具有功能。 相反,男性仅具有该基因的功能或非功能版本,因为他在X染色体上具有一个拷贝。 这与常染色体上的情况不同,常染色体上的雄性和雌性每个基因都有两个拷贝。

这种结构差异对于在X染色体与常染色体上起作用的选择性动力学很重要。 在常染色体上,隐性性状在适应性方面的成本要比在X染色体上付出的成本低得多,因为在X染色体上,它们通常更容易通过雄性自然选择。 在其余的基因组中,隐性性状仅在它们的两个纯合子以两个拷贝的形式存在时才付出其缺点的代价。 一个简单的准形式示例说明了该过程。

想象一个人口,它的等位基因隐性表达,表达时适应性急剧降低。 假设有问题的等位基因, q,以0.50的比例存在。 所有其他功能性等位基因归类为 p,也为0.50。 在下一代 哈迪-温伯格平衡 这将意味着:75%的个体不会表现出隐性特征,而25%的个体会表现出*。但是,对于所表达的如此有害的等位基因副本,如此暴露于自然选择,就永远存在,还有另一种有害的等位基因副本在杂合子个体中被“掩盖”并具有一个良好的副本,因此逃避了自然选择。 由于自然选择降低了有害等位基因的频率,因此在隐性表达的个体中发现的拷贝越来越少,因此去除等位基因的选择能力将随着其自身频率的降低而降低。 当有害等位基因的频率为〜0.01时,暴露于自然选择的纯合子中仅发现1个拷贝中的大约100个。 以这种方式,甚至有害的等位基因的遗传多样性也可以作为许多低频隐性表达的变体来保存。

X染色体上的情况有所不同。 如果人口仅由女性组成,则上面的模型将成立。 该特征仅在雌性具有两个缺陷基因拷贝的情况下表达。 但是在典型人群中,每三个X染色体中就有一个存在于男性中。 这意味着,如果X上的每个有害等位基因恰好是雄性,则将承担其全部成本,即三分之一的概率。 因此,我计算出,当您遇到有害等位基因在X染色体上占〜1分数的情况时,大约会表达3个拷贝中的0.01个,绝大多数是男性。 就暴露于自然选择的有害等位基因的拷贝而言,这是X与常染色体之间的1倍差异,这都是由于男性的半合子性造成的。

但是选择的效果并不总是负面的,即从种群中纯化不良基因拷贝。 积极力量还可以通过以下方式减少多样性 选择性扫描。 这种情况的发生方式和原因相当简单。 想象一下,您有一个碱基对,而该碱基对偶然地具有一个对单个个体非常有益的突变。 为了使表达简单,可以想象它是显性的,而个体是杂合子。 携带偏爱突变的单身家庭有一个很大的家庭,因为约50%的后代也携带偏爱突变,并且比人口平均水平更适合。 等等。 这个受欢迎的变体可以非常迅速地传播。 乳糖耐量 这是一个很好的具体案例。 当我说最喜欢的变体传播时, 我实际上是在谈论一个人的一个基因拷贝,由于其适应性价值,它的频率开始增加。 但是请记住,单个碱基对嵌入基因组内,并且染色体区域通常从亲代传给后代。 这通常是一揽子交易。 当偏爱的等位基因出现时,它可以“搭便车”不具有选择优势的附近变体,只是它们很幸运地存在于具有非常适应性的等位基因旁边(认为它们是基因的“后代”或随行人员)。 当然 基因重组 随着时间的推移会打破这些关联,但是这个过程需要几代人的时间。 在那之前,您所看到的是特定基因组区段的增殖以及嵌入该特定区域的受惠基因的频率增加。 当具有相关等位基因的整个片段的频率开始增加时,通过直接的逻辑,随着变异被排除在外,总体遗传多样性降低。

然而,进化不仅仅是自然选择。 有两个与选择无关的过程,因为这可能会减少遗传变异。 这两种现象都打开的电机是随机遗传漂移。 随着您增加漂移的能力来使一代代的基因频率波动,您也增加了它的能力,一旦等位基因达到零频率边界条件,它们就会消失,从而使其灭绝。 这就是为什么经历了人口瓶颈的人口如此同质。 漂移通过反复偏爱某些等位基因并消除了其余大部分,将大部分变异从基因库中挤出来。

与这种特定情况相关的动态是男性和女性有效人口规模的差异,以及长期有效人口规模的巨大波动。 为了减少X染色体的多样性,人们必须假定女性有效种群的数量低于男性有效种群的数量。 之所以会影响X相对于常染色体的多样性,是因为 X在女性身上花费其时间的2/3,而常染色体在男性和女性中只花费其时间的1/2。 因此,如果女性的有效种群数量小于男性,那么X染色体受到的冲击力要大于常染色体。 更一般而言,即使假定性别平衡,X染色体的有效种群也较低,因为常染色体的每4个拷贝中就有3个X染色体。 由于有效种群数量的减少,X对瓶颈等更为敏感,其结果之一就是遗传多样性的减少。

在阅读新报告时,请牢记以上所有内容 “自然遗传学 选择和漂移之间的平衡,以减少X染色体和整个种群之间的变异。 第二个事实指的是 与非非洲人相比,非洲人似乎在X染色体上的变异相对减少得更少。 首先,论文的摘要 人口规模全基因组测序中X连锁和常染色体遗传变异的分析:

X染色体与常染色体上的遗传多样性之比对自然选择和人口统计学均敏感。 根据69位女性的全基因组序列,我们报告说,尽管这一比例随着跨人群基因距离的遗传距离而增加,但在欧洲人中,该比率低于西非人,而与基因接近程度无关。 这种相对减少可以用人口历史的差异来最简单地解释,而无需调用自然选择。

这项研究是我提到的研究趋势的一部分 全基因组序列。 请记住,1万个SNP论文中有很多都只关注遗传 变种3亿个碱基对中的多态性。 这些变体特别有用,但它们错过了许多基因组。 此外,在变异的选择上还存在一些统计问题,因为变异通常是针对一个人群,即欧洲人(不同的人群在整个基因组中都有一些不同的变异)。 得出的结论是,现在是时候到了我们可以以最精确,最细粒度的角度查看基因组的时候了,而不是使用近似值,无论是一个基因座还是一百万个SNP。

牢记这一宽泛的思路,如果您对基因组有了解的一件事,那就是其中的许多功能都不起作用。 它没有代码。 基因组的某些区域 基因间基因之间。 自然选择通常针对功能区域,而不是基因间区域。 如果自然选择是影响模式的主要动态因素,那么我们将在基因区和基因间区之间表现出差异,因为选择在前者中比后者在约束变异和增加等位基因频率方面的作用要大得多。

下图有四个面板。 每个面板都有一个x轴,该轴由距基因的距离定义,从左到右随着距离的增加而增加。 因此,最左边的点可以被认为是遗传的,最右边的点可以被认为是基因间的。 左侧面板定义为欧洲人,右侧面板定义为非洲人。 更确切地说,他们展示的是来自36个西非约鲁巴岛和33个欧美女性的全基因组序列的结果。 第一行显示原始数据的变化 努索洛肽多样性 对于常染色体和X,底部一行说明了两个基因组类别的多样性比率(X与常染色体)随距离的变化。

在分子进化遗传学中,通常假设零假设是 中立。 基本上,这意味着选择不是驱动变化的主要作用。 相反,它是诸如突变和漂移之类的随机作用力的函数。 当人们看到偏离中立性时,就会考虑自然选择的影响和适应的可能性。 您会在此处看到自然选择的明确证据。 与常染色体相比,X染色体上的遗传多样性与距基因的距离具有更强的关系。 这很重要,因为当您回想起X染色体时,自然选择就更加残酷地雕刻了它。 先验 理由是,较不利的等位基因将被更有效地修剪,而隐性表达偏爱的等位基因将因其偏爱的性状通常在存在时不表达(因为在杂合子中被抑制)而受到阻碍。 上面的模式与该模型完全一致。

因此,现在我们已经看到,对这些样本进行更紧密的全基因组检查意味着,X染色体与常染色体的多样性差异不仅是中性力的函数,而且可能是自然选择所致。 但是,现象的第二部分是:非非洲人通常更容易产生脱节现象。 如果是这样,这是否意味着非非洲人会受到更自然的选择? 他们探讨这个问题的方式简洁明了:他们将比率的比率作为与基因的距离的函数进行了比较。 我的意思是说,他们研究了X和常染色体之间基因组多样性的比率,然后通过在欧洲人和非洲人之间进行比较,从该值中得出了比率。 与上面的图不同,左图没有显示出作为遗传距离的函数的差异。 这告诉我们什么? 如果欧洲人自然​​选择比非洲人更有效,那么在遗传区域附近,这两个种群之间的多样性差异应该更大,因为这是人们最能感受到选择力的地方。 相反,您看到的是,尽管X和常染色体基因组之间的差异是真实的,但X和常染色体上非洲人和欧洲人的基因组之间却是一致的。

这表明非洲人和欧洲人之间的差异是由人口统计学驱动的,而不是适应(正选择)或功能约束(负选择或净化选择)驱动的。 随机的进化力看不到基因或基因间区域。 它们是随机的,对功能的导入是盲目的或中立的。 与选择不同,它们的影响将遍及整个基因组,就像我们在这里看到的区域间差异一样。

在这种情况下发生了什么? 回到开始时,有两种特定的可能性:性别偏见的移民和非非洲人的有效人口规模更大的波动。 后一种模式与“非洲以外”的情况完全一致,在这种情况下,非非洲人是从离开非洲的少数祖先人口中衍生出来的。 这是巨大的“走出非洲”瓶颈,这似乎是人类分子进化论者的一致发现。 由于X染色体的有效种群较小,因此可能受到该瓶颈的均质化作用的影响更大。

第一种选择虽然很有趣,但是很有趣。 如果有多个“走出非洲”脉搏,其中不成比例的年轻男性群体呢? 这将使非非洲人在常染色体上的遗传多样性远远超过X染色体,因为雄性每两个常染色体只能携带一个X染色体。 我认为“走出非洲”模式更合理,但我不会立即放弃这种情况。 关于现代人类的起源,我们生活在一个有趣而陌生的时代。

* p2 + 2pq + q2 = 1 = 0.502 + 2(0.50)(0.50)+ 0.502

引文: Gottipati,Srikanth,Arbiza,Leonardo,Siepel,Adam,Clark,Andrew G和Keinan,Alon(2011)。 相对常染色体,X连锁和X / A多样性与距最近基因的遗传距离无关。 自然遗传学: 10.1038 / ng.877

 


图片来源

髓: 在这篇文章中,我回顾了一篇涵盖人类分娩进化维度的论文。 具体来说,是我们物种特有的特征和倾向,可能构成这些特征和倾向的基因,以及它们与更广泛的公共卫生注意事项之间的关系。

人类的婴儿很特别。 与蜥蜴或蛇等生物的后代不同,人类婴儿极为无助,并表现出令人难以置信的数量 新时代 关于成年人。 所有哺乳动物在某种程度上都是如此,但是显然,新生小马驹与新生小马之间仍然存在差异。 有人认为,与人类婴儿最接近的类似物是我们最亲戚的“大猿”。 当然是年轻的 黑猩猩 展现出吸引成年人的“可爱”相同元素。 这里的程度还是有差异的。 一位有疏液的朋友观察到,人类婴儿类似于“幼虫”。 人类新生儿这种相对欠发达的最终原因和最接近的原因通常归因于我们庞大的大脑,这些大脑与女性盆腔开放的限制因素背道而驰。 如果人类婴儿通过延长妊娠而发育更长的时间,那么其母亲在分娩期间的死亡率将会上升。 因此,自然选择的方向可能是:缩短妊娠时间。 您可能会说,从某种角度来说,人类新生儿是子宫外胎儿。

研究博客网站 一份新的论文 PLoS遗传学 试图确定哪些特定的基因组区域可能与这种加速的人类妊娠钟有关。 进化基因组学方法来鉴定涉及人类出生时间的基因:

胎儿成熟度与出生时间的协调对于哺乳动物的繁殖至关重要 。 在人类中,早产是具有深远的全球健康意义的疾病。 由于人类与通常研究的模型生物之间生理机制的差异,导致人类分娩的信号仍然难以捉摸。 由于与其他灵长类动物相比,人头大小相对较大,并且产道横截面面积较窄,因此我们推测参与分娩的基因将沿人类和/或更高的灵长类动物系统世系显示出加速的进化,从而缩短了妊娠时间并促进了分娩较小的胎儿更容易通过产道。 此外,我们测试了此类加速基因中的当前变异是否会导致早产风险。 异体缩放胎龄的证据表明,相对于其他灵长类动物,人类的妊娠已缩短。 与我们的假设一致,许多涉及生殖的基因在其编码或相邻非编码区显示出人类加速作用。 我们在8,400个芬兰早产儿和150个对照母亲中筛选了165个人类加速基因中的> 163个SNP,用于与早产相关。 在这个队列中,最重要的关联是 FSHR,而8个最重要的SNP中有10个在该基因中。 有关SNPs连锁不平衡区的进一步证据 FSHR,rs11686474,rs11680730,rs12473870和rs1247381在非裔美国人中发现。 通过考虑人类的加速作用,我们确定了一个可能与早产有关的新基因, FSHR。 我们预计其他人类加速基因将类似地与早产风险相关,并阐明人类分娩的基本途径。

这项研究的实际意义似乎很明确。 大量的怀孕以 早产,并且在分配有限的医疗资源时,识别“处于风险中”的基因组概况可能是非常重要的信息。 此外,如果明确定义了增加早产风险并与减少妊娠时间相关的基因组区域,那么人们可能会进一步探索功能途径,甚至在将来的设计治疗中也可能如此。

以下是论文的第一张图。 我添加了一些标签:

总的来说,结果是这样的:

–人类拥有比高灵长类动物更大的大脑来控制身体大小,灵长类动物的大脑比哺乳动物整体上更大

–人类和灵长类动物出生时的大脑大小相同

–与灵长类和其他哺乳动物相比,人类出生时的大脑长于妊娠

–与其他哺乳动物(包括人类)相比,高等灵长类动物的出生时妊娠时间更长。

第二个数字 在灵长类动物的系统发育树上显示了这种模式。 您会看到人类分支是特殊的。 当您有一些字符混淆了系统发育的期望值时,需要进行一些调查。 在自然选择正在起作用的情况下,这可能是宗谱的特征与祖先形式的典型特征有所不同的情况。 他们有 衍生 进化枝具有独特的特征,这对现代逻辑非常重要 系统的.

可以将人类的孕期长度定性为与其他灵长类动物相关的衍生特征,其他灵长类动物相对于其他哺乳动物世系表现出延迟。 那时您可能会争辩说,人类是“堕落的后遗症”,但是鉴于人类发展的其他方面,例如我们的长寿,我认为这太客气了。 相反,也有只有这么多自由度自然选择似乎有当谈到在基因型和表型状态的矩阵平衡反对健身压力。 用通俗易懂的英语来说,在运动中严重的功能性问题使该方向的改变不可行之前,人类女性骨盆的宽度只能增加很多。 尽管事实上大脑是一个代谢昂贵的器官,但我们的人类素谱系却 倾向于更大的颅骨容量 随着时间的推移。 因此,一旦达到了对女性女性骨盆宽度的负适应性回归点,就必须改变我们物种生殖弧的发育。 如果由于生物力学而阻止骨盆变宽,并且成年大大脑是对人类具有高健身价值的必要条件,那么必须加快分娩的时机,以便新生儿可以退出,而颅骨的周长可以控制。 。

为了探索这种衍生特征的可能的基因组基础,本文的作者集中于 “人类加速地区” (HAR)。 这些是基因组区域,显示出人类进化快于其近乎生物分类学关系的证据。 这暗示了积极的方向选择,尽管在此必须注意误报。 由于这些基因座表现出人类与黑猩猩之间的强烈隔离,因此通常将它们定位为“使我们成为人类的基因”。 尽管媒体大肆宣传,但关注这些地区似乎仍是一条充实的途径,可以借此充实人类独特特征的本质,例如语言,两足动物或我们的大脑。

在本文中,他们确定了非编码以及对HAR进行编码。 您可能非常了解有关此主题的辩论。 简而言之,人们强烈怀疑基因组的某些非编码区可能调节编码区,因此即使在间接作用下也具有非常重要的功能。 功能上的重要性暗示着它们是自然选择的目标,既是保留基因组序列的负约束压力,又是将导致碱基对水平替代的正向选择。 在获得HARs中的一组基因后,他们将范围缩小到已知在可能与妊娠期长度相关的途径中具有重要功能的基因。

最终,作者集中于非编码区中的一组标记,这些标记定义了连锁不平衡中的基因组块。 这只是具有一组相关变体的基因组区域,可能暗示自然选择或种群大小的快速波动,从一个祖先的拷贝改变了该片段在种群中的比例。 该块在 FSH受体基因。 它的全称是促卵泡激素受体。 调节生殖重要的激素显然是一种重要的方法,通过这种方法,人们可以以某种方式调整在任何给定的妊娠点改变出生概率的途径。 他们对该基因的第一个研究人群是Finns,他们在基因上是同质的,并且由于环境噪声的最小化,大概可以使妊娠期的遗传力最大化。 有趣的是,他们注意到 FSH受体 “在约鲁班人口中携带具有极高iHS值的SNP,反映出单倍型纯合性的延长,并表明最近进行了选择性扫描。” 重要的是要记住,iHS价值来自的研究小组 已经走了回去 有信心提供任何特定的iHS值。

但是,如果 FSH受体 在芬兰人和约鲁巴语中被指定为妊娠期长度,为什么? 作者关注的其他测试在几百万年的进化时间中比较了人类和非人类(相对于大多数HAR来衡量HHS发生率的情况),iHS统计数据尤其对相对较近期的选择性事件敏感。碱基对替换)。 我只能说,由于转向农业,芬兰人和约鲁巴人都经历了相对较新的人口膨胀。 在广泛的进化框架中,一旦全基因组测序成为普遍现象 可能需要比较人口统计学历史截然不同的人群,并查看妊娠相关基因是否存在遗传变异。 如果上述针对约鲁巴岛的iHS统计数据为 不能 如果是假阳性,那么我可以预见,在所有事情都得到控制的情况下,布希曼人将不会表现出大肆扫荡,早产率会降低。 实际上,可以预见到,经历过新石器时代过渡的人口,因此以高生育率和高死亡率策略不断推向马尔萨斯陷阱,比那些没有经历过这种人口统计学变化的群体,其早产率更高。

最后,这些与医学相关的生物学研究在全民医疗保健时代显然很重要。 如果人群间风险敏感性之间存在差异,那么在评估影响健康结果的环境和遗传变量之间的平衡时,至关重要的是要知道这一点。 只要我们对此类差异的根本原因的遗传学和基因组学理解是临时的和暂定的,人口水平评估就可能至关重要。 凡事都等于个人风险评估是可取的,但我们并非生活在世界上最好的境地。

我不知道作者是否找到了可用于生物医学研究的标记物。 但是我认为它们的方法是一个有用的框架。 可以这么说:“您可以使用的进化”。

引文: Plunkett J,Doniger S,Orabona G,Morgan T,Haataja R等人。 (2011)。 确定人类出生时间PLoS遗传基因的进化基因组方法: 10.1371 / journal.pgen.1001365

 


信用:卡尔·马格纳卡(Karl Magnacca)

髓: 在这篇文章中,我将回顾一些自然选择模式的发现。 果蝇 果蝇基因组。 我将它们与人类基因组学中非常相似的发现联系起来,尽管方向相反。 在审查过程中也重点介绍了不同形式的自然选择及其对基因组结构的影响。 特别地,探讨了经典进化遗传模型的假设如何偏向于检测基因组水平适应性的具体方法。 最后,我尝试将这些细节放在更广泛的框架中,以便更好地从“全局”理解进化过程。

几天前,我给帖子加了标题 “人的进化不是卡通”。 我之所以这样称呼它,是因为随着方法的完善和我们数据集的增强,似乎以前保存的人类进化模型以及进化对我们基因组的影响也在不断完善。 进化遗传学在其最优雅的备用上可以简化为几个通用参数。 漂移,选择,迁移等。外来现象(如人口普查规模的变化或环境变化)与这些参数具有直接的关系。 但是,在某种程度上,最广泛的真理几乎是微不足道的。 归根结底 这些一般性断言告诉我们什么? 我们还不知道。 我们正处在过渡时期,尽管不是麻烦。

研究博客网站 回到动画片,从1970年左右开始,围绕着确定性适应力和随机中性作用在进化过程中的作用展开了一系列辩论。 您可能已经听说过诸如“适应主义者”,“超达尔文主义者”和“急速进化”之类的词。 所有这些都非常有趣,而且当然已经成熟了,吸引了公众,但最终,科学论述的那个阶段似乎已经超出了重点。 从理论时代到经验时代太少之间的过渡,到现在的经验时代到来了。 时间,当理论太少时。 生物学是一门很偶然的学科,也许选择权或中立力量的相关性问题会大​​大小小地出现。 依赖的 在问题要解决的生命之树的特定尖端上。 进化也许不是一个统一的神谕,而是一个共鸣,我们必须以此为自己的精神理智构建和谐的交响曲。 大自然是一个,我们从大自然的整体中剔除出来的关节是为了我们自己的利益。

分子进化的时代,通过同工酶的研究而迎来 在1960s中只是基因组学时代的序言。 如果斯蒂芬·杰伊·古尔德(Stephen Jay Gould)和理查德·道金斯(Richard Dawkins)如今处于鼎盛时期,我想知道,就他们的口头流利程度而言,就手头问题的复杂性而言,制定一个精简的手段以串动一个知识分子的反对者,是否会过于复杂。 复杂性并不能为诚实的嘲弄和倒钩提供饲料。 您也很容易因数据丛书中措辞的笨拙而给自己造成伤害,这四面八方。

无论如何,我都可以在此博客上关注人类基因组学,但很显然,宇宙中还有其他生物。 由于出于生物医学应用的原因而获得科学资助的性质,人类现在已经脱颖而出,但是在调查整个分类学领域中仍然有用。 碰巧的是 PLos遗传学我上周注意到,它是对最近的人类选择性扫描工作的完美补充。 普遍的适应性蛋白质进化在氨基酸取代周围的多样性模式中明显。 果蝇模拟:

In 果蝇,许多证据表明,对基因组的有益替代可能很普遍。 但是,所有人都受到混淆因素的困扰,因此,对证据的解释,尤其是关于有益替代的比率和强度的结论,仍然是暂定的。 在这里,我们使用全基因组多态性数据 D. 模拟物 并对其近亲的基因组进行测序,以构建对正选择作用的易于解释的特征:氨基酸置换周围平均中性多样性的形状。 正如在经常性选择性扫描中所预期的那样,我们发现氨基酸周围的多样性水平处于低谷,但同义取代周围却没有,这是在替代模型下无法预期的独特模式。 这种表征比以前的方法更为丰富,以前的方法依靠有限的数据摘要(例如,散点图的斜率),并以直接的方式与基础选择参数相关,从而使我们能够更普遍地推断出其流行程度和强度适应。 具体来说,我们为整个曲线的形状开发了一个基于聚结的模型,并使用它来以最大似然来推断自适应参数。 我们的推断表明,约13%的氨基酸取代会引起选择性扫描。 有趣的是,它揭示了两类有益的注视:一小部分(约占3%)似乎具有较大的选择性效应并占了多样性降低的大部分,而其余的10%似乎具有很弱的选择性效应。 。 因此,这些估计值有助于调和先前公布的选择强度估计值之间的明显矛盾。 更广泛地讲,我们的发现提供了明确的证据来证明在 果蝇 并说明如何利用快速积累的全基因组数据解决有关适应遗传基础的持久性问题。

图1C示出了顶线。 如您所见,非同义替换存在一个“低谷”。 非同义只是意味着在 密码子 更改编码的氨基酸。 相反,同义更改不是。 但是,替代不仅是突变体变体。 而是对人口水平从一个等位基因转移到另一个等位基因的评估。 中立理论 认为大多数替代不是由自然选择驱动的,而是随机游走的过程。 因此,大多数进化变化都不是适应性的。 在这种随机变化的背景下检查选择能力的简单方法是测量 非同义和同义基数。 但是,在比较密切相关的物种时,这种事情更合适。 在关于人类选择性扫除的论文中,这显然没有发生,他们正在寻找 一种。 相反,作者着眼于减少可能是自然选择目标的跨地区变异。 减少的发生是因为当一个特定的等位基因成为强阳性选择的目标时,它会在“搭便车”过程中沿着相邻的连接区域拉动。 重组对此不利,导致随着时间的流逝衰减 连锁不平衡 在选择之后会突飞猛进。

但是,这些概念基于变体出现的简单模型,并且选择针对或不针对这些变体的方式。 人们想象一种新的突变体,它是在祖先的遗传背景下出现的。 在单基因模型中,固定的可能性(即达到〜100%并在种群中替代)为1 / N(二倍体为2N)。 用简单的英语来说,突变体的固定概率与有效种群大小成反比。 相反,被选择性偏爱的突变体固定的概率与其选择系数成正比,选择系数简单地以与总体平均值之比来衡量其适合度。 中性变体的固定是随机游动,固定之前的时间与人口规模成正比。 相反,选择性偏爱的变体可以相当快地席卷固定。 非常保守的人可以推断出北欧人对乳糖耐受性的固定是由于其突变引起的。 LCT 基因花费了大约7,000年的时间,或不到300代。 由于这种快速的重组,在祖先突变的遗传背景上“砍掉”变体的物理联系所需要的休闲时间要少得多。 难怪 LCT 基因座是欧洲基因组中最长的“单倍型基因组”之一; 关联标记序列。

但是,让我们稍微修改一下思维模型。 成像遗传变异体已经以低频低频率徘徊了很长一段时间。 由于重组的影响,可能有许多拷贝的突变体,与不同的遗传变异有关。 例如,我们可以想象一个隐性有害的等位基因,由于缺乏选择的功效而在低频中持续存在(大多数等位基因是在具有正常适应性的杂合子个体中发现的)。 许多变体都有多种作用。 想象一下,该等位基因具有显性的表型效应,从中性变为 非常 有选择地受到青睐。 现在您遇到的情况是,在适应过程中基因组区域的频率会被向上拖动,但是会有很多区域 s,而不仅仅是一个。 具体而言,如果选择性事件仅在原始突变体之后的几代发生,那么就产生同质性而言,对局部基因组的影响将比如果事件在原始突变体之后的数十代中发生要强得多,因为原始遗传背景将具有被重组,因此失去了其独特的连贯性。

这是从“常规变化”中自然选择的一种形式。 在背景噪音中漂浮的是旧突变体,而不是新突变体。 在上面的论文中,作者发现了相当数量的常规选择性扫描,但是,他们认为一些研究人员发现自然选择下的基因组比例更高。 果蝇 可能是由于以下事实:某些方法会涵盖整个选择范围,而另一些方法则侧重于更易于处理的“卡通”模型。

在可以建模为经典选择性哭泣的选择中,作者还发现了“幂律”效应。 有一些强力选择的命中和许多无力选择的争夺相结合。 根据理论,这并非完全出乎意料。 一些适合全基因组关联的人类特征,例如色素沉着,可能属于这一类别。 大多数性状变异是由于少数几个影响较大的基因所致,但有大量基因座占少数变异的平衡。 毫无疑问,随着自然选择的动力学变化,进化时间也同样如此。

但是,我们也不应迷失在基因组树中,看不到森林。 进化过程不仅受到分子尺度参数(例如重组和突变率)的影响,而且还受到生物体和种群尺度参数的影响。 一个人认为果蝇承受着不同的压力,并且与人类有着不同的历史,就像两者都来自人类一样。 音韵的 两栖动物。 人类的人口普查规模巨大,人口众多,而且在过去的10,000年来,我们的生活方式已经发生了巨大的变化。 但是作为陆生哺乳动物,我们可能会比某些物种(例如范围广泛的鸟类)表现出更多的种群亚结构。 此外,由于长期的有效种群较低,我们只能处理这么多的基因变异。 如此细微的细节扭曲了对优雅的尝试,但必须牢记这些细节。

作者总结:

总之,我们的发现建立了一个独特的,全基因组的适应性特征 D. 模拟物,表明许多氨基酸取代是有益的,并且受两类选择性作用的驱动。 通过更丰富的多样性模式摘要来避免 先验 在选择量表时,这些结论为以前的推论的结果提供了连贯的解释。 现在,看看其他地方是否也出现了类似的发现将会很有趣。 果蝇 物种,它们的重组率,有效种群数量和生态状况各不相同。

我不会仅限于此 果蝇。 由于不同的果蝇种类具有不同的分布,自然历史以及共同的祖先特征和基因,因此它们是进化的极佳实验室。 但是最终,我们将开始将目光扫过生命树上所有众多的分支。 很快。

引文: Sattath S,Elyashiv E,Kolodny O,Rinott Y和Sella G(2011)。 广泛的适应性蛋白质进化在果蝇simulans PLoS遗传学周围的氨基酸取代周围的多样性模式中很明显: 10.1371 / journal.pgen.100130

 


研究博客网站 上面的图表会让您感到奇怪吗? 这表明人口的平均适应度随着有害突变率的增加而降低(许多突变有害而不是有利的突变)……但是,尽管(或可能是由于某种原因,)人口的适应性还是会反弹。有害的突变! 在我看来,这似乎是双刃剑世界进化的例证。 越差越好! 越多越少! 有害有利吗? 经过 定义 有害不利,因此必须备份并检查自己的房屋。

然而,这似乎只是一份新论文中的内容 PLoS ONE的 正在报告。 清除自体受精下的有害突变:随着突变率的增加,健身中的悖论性恢复 秀丽隐杆线虫:

在高突变率下,补偿性突变可能会更频繁,并且可以减轻由于有害突变通过上位性相互作用与有害突变的积累而导致的一部分适应性丧失。 由于受精和有害突变之间的连锁不平衡保留了它们的上位相互作用,自我受精促进了紧密连锁的补偿和有害突变的长期维持,可能是适应性增加的原因。

了解? 好的,您可能首先需要一些背景知识。


作者用 C.elgans 作为模型有机体。 这种“蠕虫”在生物学中无处不在。 有庞大的发育生物学家,遗传学家和神经科学家社区,他们与 线虫 作为模型有机体。 出于进化遗传学的目的,您需要了解一些有关 线虫 尽管。 绝大部分繁殖 线虫 通过“自在”发生。 也就是说,大多数 线虫 是雌雄同体使自己受精。 他们显然不是无性恋者,但他们的生活习惯完全不存在 南园。 少数生殖活动 线虫 以常规方式是有性的,因为在任何给定的世代中,有少数蠕虫是雄性的。 出于本实验的目的,您需要忽略此方面。 他们专注于自拍照。 为此,他们通过引入雄性致死突变,将雄性排除在等式之外, xol-1,或手动将其删除。

因此,现在我们有了selfers。 如果您选择标准的流行音乐文字,例如 人口遗传学原理,您会发现,就进化遗传学的长期发展而言,自交者往往具有一些独特而有趣的特性。 特别是, 他们疯狂地“清除”“遗传负荷”。 这意味着有害的等位基因可通过负选择快速从自交群体中剔除。 为什么? 如何?

让我们回到遗传学101。想象一下一个位点,其中一个人是一个杂合子,并携带一个“野生型”等位基因,另一个是有害的并隐性表达的等位基因。 囊性纤维化是一种隐性疾病,在欧洲人中很常见。 1个欧洲人中有25个是杂合子,而这些人中有1个中的25个会与同时也是携带者的人交配的机会。 在这些配对中,50%的后代也将是携带者,25%将是野生型纯合子,25%将表达囊性纤维化病,因为它们是有害等位基因的纯合子。 根据给出的数字,这意味着每1例分娩中就有2,500例会导致孩子患有囊性纤维化。

囊性纤维化是一种致死性疾病,会极大地降低体能(许多人只是不育)。 这是针对有害等位基因的阴性选择。 但, 选择相对较弱。 为什么? 看看那些谁之间的比例 携带 等位基因,但具有正常的健康状况,以及携带两个副本且健康状况降低的人。 它是100到1。大多数有害有害等位基因的拷贝都被“掩盖”,以免产生任何不利的适应性后果,因为它们与正常的野生型配对,从而补充并补偿了突变体变体的功能。 这就是为什么我们携带如此多的有害等位基因的原因之一。 它们通常与“好”副本配对,以防止个人适应度下降。

现在,让我们将其重新带回去。 在人口中,我们与他人结伴。 因此,您必须将1/25×1/25的独立概率相乘,以生成一个Punnett平方,其中两个杂合子交叉。 在自拍照的情况下,概率是不同的。 基因型对个体者的分类是完美的,因为基因型只是简单地与自身杂交。 如果你是 肥沃的雌雄同体 携带突变型囊性纤维化等位基因的人,您的后代有25%的机会成为囊性纤维化的纯合子,因为您知道杂交会与另一个杂合子(您自己)一起发生。 现在想像 整个人口都是自私者。 而不是每1份中有100份进行选择,而是每1份中有2份进行选择! 这就是selfers如何很好地清除基因负荷的方法。 当选择仅在纯合子工作,他们以生产纯合子的趋势意味着有害等位基因更为暴露的选择。 为什么自交群体总体上会产生这么多纯合子? 与杂合子交配的杂合子产生杂合子和纯合子。 与纯合子交配的纯合子仅产生纯合子。 我汇总的“玩具”图表显示了当您在第1代中采用统一种群的杂合子自交者时发生的情况,并允许他们在后代中进行繁殖。 每一代杂合子的比例都降低了,杂合子的比例降低了,这些个体中有害等位基因被掩盖,因此不受自然选择的净化能力的影响。 选择从种群中清除遗传负荷变得越来越有效。

对于理解本文的含义,还有两个重要的概念。 上位性基因连锁。 但是,让我们先进行一些结果,然后在概念性调味品的进一步帮助下消化它们。 这是图3和图4,我对此进行了一些编辑。 在左侧,您可以看到健康度(生殖力)与诱变剂浓度的关系。 换句话说,当您在x轴上增加诱变剂浓度时,突变率正在增加。 在右侧,您会看到一个图,显示了x代后的平均适应度,每组数据点代表不同的突变浓度。 我已经突出显示了没有诱变剂和最大诱变剂的品系。

怪异的方面是80 mM和100 mM之间的跳跃。 作为 突变率增加,健身会反弹。 想象一下,您正在将一块巨石卷成一个坡度,坡度逐渐变陡。 常识和基本物理学会告诉您,您必须使用越来越多的力才能将巨石移动相同的距离。 现在想象一下,超出一定坡度后,您实际上必须使用较少的力! 那是没有道理的。 在某些方面,这就是这里发生的事情。 但是,演化过程可能不像牛顿力学那样线性和可预测的。

当然,这种奇怪的行为可能有一些直接的原因。 例如, xol-1 产生无雄性种群的突变体可能有 多效的 效果。 为了对此进行测试,他们从没有突变的人群中手动移除了雄性,并获得了相似的结果。 此外,他们还采取了分歧 线虫xol-1 突变体,并进行了相同的实验,然后再次以相同的模式对其自身进行了概括。 最后,总是有可能在一定浓度以上对诱变剂产生抗药性。 如果对诱变剂产生了抗性,大概会使适应性提高的人群增加约100 mM,并将其放回较低浓度的环境中,则会产生与我们之前看到的不同的响应曲线。 如图6所示,这不是发生的情况。

现在我们已经掌握了核心成果,让我们继续尝试了解像这样的水如何向上流动。 回到概念, 基因连锁上位性。 首先很容易。 基因沿着物理DNA链排列。 基因的物理位置越接近,它们越有可能以直接的方式一起遗传。 期望中的纠结是 重组。 在二倍体生物中,每个基因在两条链上都有两个拷贝。 重组可以将特定的基因拷贝从一条链改写到另一条链(或者更准确地说,以某种方式使链断裂并重组,以使两条链均不同于事件发生前的状态)。 物理链上任何两个基因拷贝之间的距离越远,重组将两者分开的可能性就越大。 当两个副本非常接近时,只有很短的物理距离,重组可能会将它们分开。 因此,拷贝越接近,基因越“连锁”。

在解释为什么这很重要之前,让我们先谈谈上位性。 上位性通常可以认为是基因-基因相互作用。 从机械分子的角度讲,您指的是一个基因与另一个基因发生某种相互作用的生物物理过程。 但是还有另一种思考方式:适合度或特质值。 从这个意义上说,基因与基因相互作用的上位性将非线性引入了基因型到表型以及基因型到适应性的映射。 这对于本文而言很重要。 特别地,上位表现为补偿性有害突变。

那么这对自雇者有何影响呢? 回想一下,上面我们讨论的是Selfers如何通过提高暴露于负选择的纯合子的比例来清除有害的遗传负载。 隐式地,我们的模型是单基因座。 我们正在研究一种基因和一种突变体。 但是,如果您有大量的突变体呢? 塞尔瑟斯能否同时产生所有这些纯合子,从而有效地清除负荷? 通过自然选择来消除负担会降低许多人口的适应性; 清除过多,人口崩溃,您很可能会灭绝 突变融解。 在这里,链接和重组重新浮出水面。 重组通常被认为是创造新的遗传组合的一种方式。 但是在纯合的自交系中,重组并没有实现该承诺: 这些生物的基因组内没有足够的杂合性,因此,链之间的改组会产生新的东西! 自交系显示出跨基因座的遗传变异序列之间非常强的联系,这是因为重组无法打破关联。 因此,如果您有两个相关的基因A和B,并且A非常适合而B适度不适合,如果它们是共同遗传的,则B可能会迅速与A固定在一起。当您提高突变率时,理论预测,有害的等位基因将简单地淹没自交系的能力,以足够快的速度清除负荷,以防止最终灭绝。 即使遗传背景不是纯合的,在重组过程中,基因组内太多的突变也会将有害的拷贝换成其他有害的拷贝。

当诱变剂的浓度低于100 mM时,该理论或多或少地诞生了。 但是,当时的期望被弄糊涂了。 为什么? 这就是上位性进入图片的地方。 在先前的模型中,我们隐式地假设 添加剂 模型。 想象等位基因1在基因A〜3上的适合度以及等位基因2在基因B〜-2上的适合度。 将它们加在一起〜1。 等等。 上位性混淆了这个简单的图景,因为它暗示了非线性计算。 A和B的适应性值可能取决于第三个基因C的状态。在任何情况下,补偿性突变都是 实际上,有害程度更高的是有害性较小的。 准确地说,具有两个有害突变实际上可能比具有一个有害突变对健康的打击要小! 在某些方面,这成为语义和分析哲学的问题。 -10 + – 10> – 10只是不连贯。

既然这不是哲学博客,那么这与自交系有什么关系? 它可以追溯到链接。 回想一下,紧密的联系可能会产生这样的情况,即重组不能破坏不健康的联系,而有利的变异与不利的变异联系在一起,而后者可能在选择性扫描中与前者搭便车(在杂合性更高的人群中会增加组合的范围,选择操作;请参阅 穆勒的棘轮)。 不好但是,在补偿性突变的情况下,重组无法打破关联可能是积极的。 这些上位的相互作用取决于持久结合的持久性。 重组会破坏这些组合,从而阻止适合性代代相传。 但是在这些自交系中,同质的遗传背景是相对固定的调色板,这些神秘的遗传相互作用使期望值倒挂起来,从而可以发挥其魔力。

本文得出了一些中等程度的怪异结果。 在他们的一组实验中,对诱变剂浓度增加的反应似乎很强健,但是谁知道这种现象有多普遍? 对补偿性突变的依赖也使我感到惊讶,因为结果太奇怪了,所以它不那么怪异。 在最后一段中,作者似乎承认工作中普遍存在的陌生感:

不管暴露于100 mM EMS的人群所表现出的适应度提高的机制如何,其结果都证明了基因组的弹性。 持续暴露于高突变率会给基因组造成严重破坏,而反复暴露于80 mM EMS(图5)似乎可以做到这一点。 但是,当暴露于80 mM EMS时,基因组能够恢复100 mM EMS丢失的大部分适应性(图3)。 这个结果是非常令人惊讶的,并且挑战了人们长期以来关于突变率和适应性之间关系的信念。

长期以来一直认为,高突变率与平均适应性下降以及最终灭绝有关。 仅基于这种假设,就可以推论出冷战时期的许多世界末日小说。 显然,在大多数情况下,这似乎是有根据的公理。 另一方面, 有时在生物学中,次要例外在解释我们在周围看到的多样性模式时更为重要。 如果对我们有无知的面纱,并且我们必须预测在这个星球上复制生物的性质,我们是否可以预测我们周围看到的难以置信的多样性? 我们会预测智能生活吗? 我怀疑会偏向于使用一种简单而优雅的模型,该模型将地球上的生命优化为极其简单和高度耐用的快速复制器。 原核生物。 并初步近似,基于达尔文假设的逻辑推论是正确的。 原核生物无所不在。 实际上,有人估计有10倍 人体中的细菌细胞与人体细胞一样。 但显然,除了原核生物外,地球上还有其他生物。 而且,我们非常关注预期趋势线中的这种“剩余”…。

引文: Morran LT,Ohdera AH和Phillips PC(2010年)。 清除自体受精的有害突变:随着秀丽隐杆线虫的突变率增加,健身中的悖论性恢复。 一,五(5)个PMID: 21217820

 

800像素-IMGP2147数字1得到一个 更多新闻 比-1,以及 杂合性 引起更多关注纯合性。 具体而言,后两者之间的区别非常简单。 在 二倍体 生物体基因一式两份。 如果等位基因相同,则它们是纯合的。 如果它们不同,则它们是杂合的。 性染色体可能是个例外,因为在 异配性 您通常只有一个基因的拷贝,因为其中一条染色体被截短了。 这就是为什么在男性中 X连锁隐性 与女性相比,这种特征的发生频率如此之高; 当您没有补偿性X染色体来掩盖一个等位基因的功能障碍时,隐性表达就无关紧要。

当然,隐性特征不仅是与性相关的特征的函数。 考虑 小头畸形,一种常染色体隐性遗传疾病。 要表现出这种特性,您需要两个有缺陷的基因拷贝,每个亲本一个。 换句话说,您表现出具有两个突变体拷贝的纯合基因型。 我怀疑纯合性,隐性常染色体疾病这一特别常见的情况是在专业界之外讨论较少的原因之一:整齐的医学和社会因素导致纯合性已经成为人们关注的焦点。 这 基因结构 与疾病的病因学以及家庭背景中的可能原因相比,这种特性的重要性没有引起人们的注意,这可能增加了风险的可能性,尤其是近亲繁殖的风险。 相反,杂合性通常不是那么灾难性的。 即使功能不是100%,也足够进行“政府工作”。 等位基因发生故障的有害后果被“野生型”优质复制品所掩盖。 例外是在诸如育种 混合动力时,杂合子优势可能会脱颖而出。 两个等位基因互补的细节在很大程度上影响了底线,而杂种优势的概念已经渗透到了公众中,更加了解杂合性。

研究博客网站 但是,纯合性在与隐性疾病有关的不幸情况下才引起人们的兴趣。 像杂合性一样,纯合性存在于我们基因组的黑桃中。 我的23andMe样本在我的SNP上的纯合子为67.6%(倾向于约500,000个碱基对,这些碱基对倾向于在人群中有广泛的变异),而Daniel MacArthur博士的结果显示他在他的SNP上纯合子为68.1%。 对于异族而言,这不是非典型的。 相比之下,父母是堂兄弟的人纯合子率高达72%。 这个很重要: 合子并不能简单地告诉您有关 两个等位基因(在本例中为碱基对)中,也可能会告诉您 降落 两个等位基因。 显然,这在碱基对水平上并不总是很清楚。 突变发生的频率很高,即使您携带两个较小的等位基因,也不一定能证明它们在血统(IBD)方面是相同的,或者 自合子 (只是一个术语,表示来自同一原始副本的等位基因的祖先)。 您需要寻找的是全基因组纯合模式,特别是“纯合运行”(ROH)。 这些是偏向纯合基因型的长序列。

220px-Morgan_crossover_1当您在脑海中概念化在二倍体性生物中生物复制过程中发生的基本动态时,ROH可以告诉您的有关个人(也许是人口)的信息变得更加清晰。 每个人都从每个父母那里获得一半的常染色体基因组。 尽管基因是抽象的,但复杂的因果序列的根部是映射到表型,性状的单个单元,但它们还是嵌入在DNA结构中的物理实体。 这个结构是一个物理序列,在这里您具有相邻的碱基对,它们的簇定义了基因,基因间区域,外显子,内含子,启动子等。换句话说, 分子遗传学。 沿着染色体的基因彼此之间的空间关系允许 连锁映射 几十年前,人们就已经知道DNA的生物物理底物对整个过程至关重要。 因此,等位基因的特定序列可以一起遗传,并形成一个等位基因。 单倍型。 在这些世代中,这些独特的等位基因在单倍型中的关联通过 重组,这是侵蚀染色体序列结构完整性的物理过程。

210px-Juan_de_Miranda_Carreno_002牢记这些基础,让我们来看一个具体的令人反感的例子。 想象一下,一位父亲浸渍了他的女儿。 为什么对我们如此排斥? 从结果的“基因之眼”的角度来看,父亲正在掩盖性繁殖之美,从而使个体之间的遗传变异得以混合和匹配。 口语上,女儿在基因上将占父亲的50%,女儿的子女和父亲在基因上将占父亲的75%。 从纯基因的角度来看,这可能是有利的,因为父亲越来越接近克隆自己, 但是我们都知道,这些人中“车辆”的故障率很高。 为什么? 近交导致纯合性的相对大量增加,因为通过下降而相同的染色体区段彼此配对。 我们知道,问题在于近交个体中很可能会出现许多讨厌的隐性疾病。

所有人类都携带大量有害等位基因。 其中一些可能会致命。 但是就像没有触发装置的炸弹一样,等位基因的功能性拷贝可以补充并掩盖突变体的种类,我们继续进行下去。 这些突变体中有许多是我们家庭特有的,其中一些甚至对我们自己而言都是私人的, 从头 使得每个人都具有独特遗传岛的突变(至少直到它们繁殖并传递其突变区别为止)。 因此,一个在乱伦行动中将自己的基因混合在一起的人可能会点燃导火索,从而使这些隐藏的恶意突变体将从隐性遗传畸形爆炸而走向成熟的疾病怪兽。

可以记录乱伦的一项统计数据是ROH; 自然地,当最近的IBD染色体片段的长区域彼此相邻时,您将具有很多纯合性,因为配对的等位基因是复制副本。 假设具有许多长ROH的个体可以生存并随着时间的推移繁殖,则这些大量的同质性将通过突变,重组以及近亲繁殖而被抹去。 乱伦仍然可以说是一场健康灾难,但是人们可以想象,随着时间的推移,进化变异的动力遗传引擎可以治愈这种损害。

而且不一定非得如此极端。 父女或兄弟姐妹的乱伦只是一个边界条件。 堂兄的婚姻并没有灾难性的, 英属巴基斯坦人 尽管遗传异常的发生率较高,这是明确的证据。 他们肯定比非巴基斯坦的英国人更适合进化,后者每个家庭最多只能繁殖4个孩子。 这些氏族将表现出更适度的ROH水平,因为 关系系数 表亲之间的亲戚只有1/8,而父母子女或全兄弟姐妹之间的亲戚只有1/2。

罗氏1左图是2008年的一篇论文 欧洲人的ROH。 特别是这些是Orcadians或部分Orcadians。 您应该在HGDP面板中熟悉的人群。 Orcadians是当地人 奥克尼群岛 就在苏格兰的北海岸。 尽管维京人,苏格兰人和皮克特人的起源有些不同,但由于岛上居民的隔离,他们已经发展出自己的遗传特征。 一个好的经验法则是,任何水域都是偶然基因流动的可怕障碍。 在y轴上,您可以看到给定个体基因组中ROH的总数。 我指着你 方法 如果您对在计算中指定的确切参数感到好奇。 ROH是在基因组窗口范围内评估的,自然可以改变其宽度,以及将特定区域注册为运行或不运行的严格性。 在x轴上是以碱基对表示的总长度。 您会看到ROH数量与序列的总基因组长度之间呈正相关。 由于非奥卡德人血统而在遗传上更加多样化的那些奥卡德人在其基因组中具有最低的纯合性。 那些近亲表亲结婚的产品最多。 但是请注意一个特殊的模式: 有个 曲线趋向于值。 在那些大概有很高的人 近交系数 仅基于ROH总数,ROH的总长度似乎超出了人们的预期。 为什么? 因为它们确实具有非常长的纯合性。 这正是我们从我之前描述的那种过程中所期望的,在这种过程中,长染色体序列被重组分解需要花很多代的时间。

在让您对欧洲纯合性的基因感到兴奋之前,让我们先进行更广泛的了解。 发表以上论文的一些研究人员也得出了一系列调查世界的结果。 纯合子的基因组运行记录种群历史和血缘关系:

人类基因组的特征在于许多纯合基因型的运行,其中从每个亲本继承相同的单倍型。 自从共同祖先以来,每次奔跑的时间部分决定于世代数:表亲婚姻的后代具有长期的纯合性(ROH),而许多较短的道与数十和数百代共同的祖先有关。 人口经历了广泛的人口历史,对血亲持有不同的文化态度。 在全球人口数据集中,通过对长短ROH进行全基因组分析,可以将此处抽样的主要土著人口分为四个主要类别,据推测,这些人口中的大多数具有以下特征:(a)最近的父母亲相关性(南方和西方)亚洲人); (b)数百至数千年前因长期孤立和有限的有效人口规模而产生的共同父母血统(N e),但近亲繁殖很少(大洋洲); (c)古代和近代父母之间的亲戚关系(美国原住民); (d)仅与大陆N相关的共同血统的背景水平 e(主要是城市欧洲人和东亚人;在撒哈拉以南非洲地区的农业工作者中最低),以及偶发的隐性近交个体。 此外,可以沿着代表该人口历史空间的轴定位个人。 因此,长期的纯合性是我们基因组在全球范围内普遍存在且未被重视的特征,它记录了过去的血缘关系和种群隔离,并提供了个人祖先人口史的独特记录。 单独的ROH措施还可以量化由多基因隐性效应引起的疾病风险。

他们的数据集包含HGDP样本人口,因此您自然拥有广泛的地理区域,例如非洲,欧洲,西亚,中亚/南亚,东亚,大洋洲和新世界。 ROH的模式有两个大的动态叠加在一起:“深厚的历史”人口过程,例如瓶颈和人口膨胀,以及我们周围看到的文化人类学模式,例如近亲氏族的表亲婚姻。 要找到前者,您需要仔细检查基因组。 相比之下,后者在基因组学上留下了很明显的体征,以很长的ROH以及隐性疾病簇的形式出现。

第一个数字显示了按人口划分的不同ROH长度的分布:

日记.pone.0013996.g001

这是带走的地方:

–大洋洲人的ROH较短,但是随着您增加ROH阈值的长度,他们一点也不例外

–新世界样本的ROH数量无论长度如何都保持不成比例的增长,尽管数量会随着长度阈值的增加而下降。 这是有道理的,人类基因组的长度是有限的,您只能拥有这么多非常长的ROH

–尽管西亚欧亚和中亚/南亚人口在最低类别中并不例外,但他们的ROHs似乎比其他欧亚或非洲人群更长。

–非洲人的ROH最少,尤其是在短期内

在详细评论这些模式之前,让我们快速查看下图。 它只看非洲人,但是 将样本分为猎人和农耕者。

日记.pone.0013996.g002

狩猎采集者比农耕者拥有更多,更长的ROH。 为什么? 答案在很大程度上也解释了地理格局: 更大的长期有效人口。 有效人口只是指在遗传上有助于下一代的人口比例。 小有效种群意味着由于样本方差增加而导致大量的遗传漂移,并趋于收敛 血缘。 如果您的部落足够小,您的表弟可能就是您唯一可以结婚的人。 正如我在上面提到的那样,这将产生较长的ROH,因为个体将通过同一祖先的多条血统下降,从而大大增加了自噬的可能性。 相同的过程可以解释为什么相对于除美洲印第安人以外的其他群体,西亚人和中亚/南亚人的长期LOH得以提高。 这是一张地图 康桑网:

全局颜色小

许多穆斯林社会实行表亲婚姻,许多穆斯林甚至认为这是 伊斯兰习俗(他与许多表亲结婚是他的表弟。奇怪的是,这些穆斯林并没有主张嫁给有钱的老寡妇也是穆斯林的习俗,尽管有些人确实认为嫁给几乎没有青春期的女孩很重要)。 此外,在印度,南部的许多印度教徒群体都进行近亲通婚,包括叔叔侄女通婚。 这一切现在都在发生,因此在许多家庭中会产生长ROH的特征。 最终数字将按选定的人群细分个体,其中y轴是ROH的数量,x轴是ROH的总长度:

日记.pone.0013996.g003

人口集代表更广泛的地理集群。 Karitiana来自亚马逊,Maneneka来自塞内加尔,Balochi来自巴基斯坦。 如果您不知道法语和日语的来源,请问您永远不要在此博客上发表评论。 请注意,一些法国人,曼登卡人和日本人偏离了主要人群。 这些是秘密近交的,也许他们的父母是表亲,或者他们的一些祖父母是表亲。 相比之下,Bal路支的ROH长度范围很广; 这是典型的人口,其中很大一部分人是表亲结婚的产物,但很多不是。 个人在父母之间会表现出预期的相关性差异很大的事实,这意味着他们自己的近交系数和基因组相关性(在这种情况下为ROH)也将有很大的差异。 相同的参数在Karitiana, 濒危民族 大概每个人都有一个小的“伙伴市场”。

那巴布亚人呢? 他们的族群很紧密,并且没有像亚马孙部落那样拥有ROH的总长度。 但是请记住,在第一个图中,他们有许多短ROH。 一个合理的解释是,巴布亚人经历了一个古老的瓶颈,并且从那里开始发展。 瓶颈增加了遗传漂移,因此产生了高度常见的单倍型区,这些区合在一起产生纯合。 但是随着时间的流逝,这些区块将通过突变和重组而瓦解。 那么,巴布亚的ROH只是过去人口统计事件的阴影,而Baloch中的ROH就是当前人口统计事件的证据。

罗氏2当您深入到南亚和中亚群体时,补编中清楚地说明了这两个平衡的现实。 从图中可以清楚地看出,ROH数量始终居高不下的人群是卡拉什(Kalash)。 这是有道理的。 卡拉什(Kalash)是一种遗传隔离株,因为它们传统上是在巴基斯坦偏远的奇特拉尔地区孤立的异教非穆斯林组织。 由于穆斯林无法加入他们的部落一千多年,基因流一直是单向的,因为卡拉什(Kalash)to依伊斯兰教并因此融入了更广阔的巴基斯坦社会。 相比之下,其他巴基斯坦集团的ROH总量差异很大。 样本中总长度和数量中ROH最小的个体是Baloch,Brahui和Makrani,以及在这些统计数据中具有最高值的个体! 尽管卡拉什(Kalash)在人口规模较小的压力下一直持续缓慢地下降,但the路支(Baloch),布拉威(Brahui)和马克拉尼(Makrani)受到近交氏族几代首次表亲婚姻的重击。 这些世代相传的婚姻迅速增加了ROH,因为第一代表亲在遗传上比在人类学上更紧密地联系在一起。

ro在前基因组时代,近交的计算很简单。 只看血统书。 由此得出近交系数。 关键是要记住,在计算中,祖先的总和之间的关系至关重要。 在美国,表亲之间的婚姻发生在通常与祖父母没有亲属关系的个人之间。 但是在其他社会中,祖父母的一代,也许是曾祖父母的一代,也可能是堂兄。 但家谱有局限性,可能会错过深厚的血统。 左图是我引用的第一篇论文的左图,显示了个人血统的比例关系,该关系在y轴上是通过基因组(ROH)方法计算的,在血统上是相同的,而在x轴上是传统方法的比例(谱系)。 两者之间存在明显的相关性,但观察到对最适合线以上的值略有偏差,并且y值高于x。 基因组学估计捕获了常规谱系范围之外的共同祖先!

这些模式的含义有两个方面:首先,回顾人类历史,其次,展望生物医学。 这里的ROH模式与Out of Africa的连续瓶颈模型大致相符。 来自非洲的人口越多,他们的ROH越短。 非洲人口中,由于长期有效人口规模较大,并且相对不受瓶颈过程的影响,它们所占的比例最少。 短期现象是近亲结婚模式,无论是有意识的和文化规范的(例如在穆斯林世界和南亚的部分地区),还是由于人口限制(如猎人与采集者之间的情况)。 由于在医学遗传学领域内隐性疾病的突出表现,这两个过程在一起是相关的。 很明显,ROH时间过长是近亲繁殖的迹象,因此个人对多种疾病的敏感性更高。 但是作者指出,许多短ROH的总和效应也可能是有问题的,特别是由于这些短基因可能共同构成许多种群基因组中ROH的优势。

到目前为止,我基本上已经提到了人口统计学的历史,以及它是如何通过基本中性和随机的过程塑造基因组的。 近交本身可以看作是超负荷漂移的一种形式,它是繁殖群体的长期有效种群 倒塌 本身。 但是自然选择呢? 我决定仔细研究一下 基因组解压缩 ROH。 他最长的区域之一位于2号染色体上,长度约为2 Mb,从位置134606441延伸到位置136593184。在23andMe中,有一个位置可能被解释为:136325116。 rs4988235 在23andMe数据文件中。 此SNP的变体 追踪欧洲人的乳糖酶持久性。 丹尼尔·麦克阿瑟(Daniel MacArthur)博士具有纯合子形式的乳糖酶持久性基因型。 我们是否在这种长ROH中看到了与乳糖酶持久性相关的长单倍型,由于自然选择,在过去10,000年中其频率迅速上升? 通常,本文中概述的参数可以满足人类历史的广泛需求,但是在图片边缘留有一些有趣的细节。

最后,让我们回到杂合与纯合。 我最近看了纪录片 “混血会更好吗?” 抛开明显的现实,这种程序反映了 时代精神 在那个时代(很明显,即使有相同的证据,维多利亚时代的科学家也可能制作了不同的纪录片),在接近尾声时,人们对人群和个人的ROH进行了比较。 该比较实际上是由研究小组完成的,该小组发表了我刚刚评论过的论文。 如果您跳到电影中只花38分钟,只是看他们会列出结果,但我会告诉您他们发现了什么。 他们比较了两个欧洲男人,一个南印度女人和一个父亲是英国人,母亲是尼日利亚人的男人。 欧洲人的纯合度水平符合预期; 在更高端。 这位南印度妇女的纯合子水平较低。 这是可以预料的,因为印度在泛欧范围内具有相对不同的遗传基因。 最后, 混合种族男性几乎没有纯合性可言。 首席调查员承认,在他测试和分析的5,000个人中,这是最极端的结果,因此他必须重新检查。 为什么? 三个因素:

–母亲是尼日利亚人,这是一个遗传多样性相对较高的人群

–父母之间的遗传距离相当高

–最后,由于该人是非洲人和欧洲人倾向于不同的所有基因座上的第一代杂种,因此他更有可能是杂合子

我让作者有最后的话:

长ROH是我们基因组的一个被忽略的特征,在这里我们证明了它在人类中普遍存在,并且与人口历史很好相关。 但是,从个人的背景来看,ROH只能是部分可预测的(由于继承的随机性)。 考虑到许多复杂疾病特征中存在隐性成分的证据,ROH不仅赋予人们对隐性孟德尔疾病的敏感性,而且还可能是常见复杂疾病未被充分认识的危险因素……它们将允许量化不同隐性遗传变异所产生的风险人口。

引文: Mirna Kirin,Ruth McQuillan,Christopher S.Franklin,Harry Campbell,Paul M.McKeigue和James F.Wilson(2010年)。 纯合子的基因组运行记录了人口历史和血缘关系PLoS ONE: 10.1371 / journal.pone.0013996

图片来源:Allison Stillwell

 

509px-果蝇_residua_he自然选择会发生。 它由查尔斯·达尔文(Charles Darwin)进行了详细的假设,并已在实验室,通过观察以及通过现代基因组学方法进行推论得到了证实。 但是科学不仅是广泛的工具。 我们需要向下钻取更细粒度的级别,以精确,详细地了解动态,从而生成可以进行测试的新颖推断。 例如,有多种自然选择的味道: 稳定选择, 否定选择正向选择。 在第一种情况下,自然选择使表型保持在理想均值附近,第二种情况下,有害的表型及其相关等位基因被从基因组中清除,最后,自然选择还可以推动新的性状向着更大的方向发展,因此伴随着等位基因变体与钳工表型有关。

对于许多人来说,最后一种情况特别有意义,因为它通常具有积极的自然选择,通过这种选择,进化会随着修饰而下降。 随着时间的流逝,特质值和特质本身的性质会发生变化,从而使血统改变其性格而无法识别。 这 系统渐进主义进化过程的尺度独立性 受到了挑战,特别是在发育生物学领域(尽管不是全部,甚至不是大多数,发育生物学家)都受到了挑战。 但最终,没有人会怀疑,对进化等位基因频率变化的经典理解(通常由自然选择驱动)是生命之树如何诞生的更大难题的一部分。

研究博客网站 与正向进化有关的现象之一是 选择性扫描。 选择性扫描的发生方式及其后果非常简单。 基因组由一系列碱基对组成(例如,我们有3亿个碱基对)。 如果一个新的突变出现在一个特定的碱基对上,一个新的单核苷酸多态性(SNP),并且该等位基因变异比祖先变异更适合〜10%,那么自然选择会提高它的频率(条件是由于事实(当突变体处于低频时,由于随机力的作用,它很可能仍将灭绝)。 因此,从理论上讲,变体可以从〜0%(N中的1,N是种群中的个体数,N为二倍体,则为2N,依此类推)转变为〜100%。 这将是 固定术 新颖的变体,由 可选择的 动力学。 那是什么 扫描 方面? 在这种情况下,扫描是指所讨论的SNP的频率在相邻基因组区域上非常快速地上升的影响。 所谓的 基因搭便车 如果扫描迅速发生,则会产生动态结果,从而使基因组附近的区域也与首选的SNP一起移向固定状态。 但是在有性繁殖的二倍体生物中 基因重组 不断打破整个物理基因组之间的联系。 因此,一个受欢迎的SNP附近的遗传标记序列的跨度形成了一个 单倍型 取决于重组率以及等位基因频率的上升率,这取决于选择的强度。 强大的选择性扫描具有使偏爱的突变体侧翼的基因组宽泛区域均质的作用; 换句话说,当一个非常长的单倍型取代了许多较短的单倍型时,扫描“清除”了变异的基因库。 例如,在北欧人的基因组中 LCT 其特征是具有很长的单倍型,其本身似乎与乳糖酶持久性状密切相关。 这里的含义是乳糖酶持久性赋予变体是相对较近出现的,并被广泛应用到 通过正向自然选择进行固定。

那是广泛的理论。 但是,正如您所知,演化及其子组件不只是“理论”,它们是一组模型,可以通过观察或通过受控实验室实验进行测试。 致新信 自然 详细说明选择性扫频如何精确地发挥作用 黑腹果蝇(Drosophila melanogaster),经典的“模型生物”。 有趣的是,这是一个实验性进化的案例,这是我们更加熟悉的情况 理查德·伦斯基(Richard Lenski) E。大肠杆菌. 全基因组分析的长期进化实验 果蝇:

实验进化系统允许进行适应性的基因组研究,到目前为止,这主要是在具有小基因组的无性系统中完成的,例如细菌和酵母……在这里,我们介绍了来自全基因组的重测序数据 黑腹果蝇(Drosophila melanogaster) 经历了600多代实验室选择以加速发展的人口。 这些选定种群中的蝇从卵发育到成年的速度比祖先对照种群的蝇快20%,并且已经进化出许多其他相关的表型。 基于688,520个中频,高质量单核苷酸多态性,我们确定了数十个基因组区域,这些区域显示了为加速发展选择的五个重复种群的合并样本与合并对照之间的强等位基因频率差异。 基于来自具有加速发育的单个复制种群的数据的重测序,以及来自每个复制种群的单个果蝇的单核苷酸多态性数据,我们推断选择处理内复制种群之间的等位基因频率差异很小。 选择的特征在质量上与无性物种中观察到的不同。 在我们的性人群中,适应与“经典”扫描不相关,因此新出现的无条件的有利突变得以固定。 更简化的解释包括“不完全”扫描模型(其中突变没有足够的时间修复)和“软”扫描模型(其中选择作用于已存在的常见遗传变异)。 我们得出的结论是,至少对于诸如发展时间之类的生活史特征,极少出现无条件的有利等位基因,它们与小净适应度增益相关,或者由于选择系数随时间变化而无法固定

了解此处发生情况的关键是它们在“经典”“硬扫”和“软扫”之间的区别。 硬扫按照我上面概述的备用描述:

1)在遗传背景下出现了一个新的突变体

2)选择有利于突变体

3)突变体的频率增加并扫向固定,从0%→100%,取代了祖先的变体

相反,要进行轻扫:

1)选择有利于已经在基因库中分离的一组较小的多态性

2)这些多态性的频率上升

3)但他们可能不会扫视固定

在第一种情况下,自然选择的特征将是清晰,独特和不可置疑的。 将会产生一种新颖的单倍型,该单倍型已经取代了祖先的变体,并在扫除时消除了所有其他等位基因状态,从而产生了广泛的遗传同质性区域。 这不是他们在基因组水平上看到的。

芬迪夫但首先, 他们做了什么? 本实验中使用的果蝇来自30年的血统,在将治疗推向新的表型值的情况下,他们选择了600代的果蝇。 假设每世代600年,人类的15,000世代将约为25年。 如果特征是可遗传的,并且您选择的后代偏离均值,则随着时间的推移,您会看到特征值发生变化。 这是经典的定量遗传学,这就是他们所看到的。 他们有五个谱系表现出加速的发育(ACO),还有五个谱系是表现出祖先表型(CO)的对照。 “羽化”是指苍蝇从the中出来。 受自然影响的血统与对照组的生活史截然不同。 这里的特征簇并不令人惊讶,我们从其他分类中知道,短命快速发展的物种比逆向物种更小,并且在代谢上更倾向于枪支。

但是这项研究真正有趣的方面不是表型。 谁没有看到过奇怪的事情 果蝇? 这就是为什么它们首先被选为模型生物的原因之一! 相反,他们探索了谱系内和跨谱系的基因组变异模式,并将结果整合到了进化过程如何发生及其对全基因组结构的影响的更广泛的理论框架中。 应该 看。 在下面,我将图2和3缝合在一起,它们说明了基因组变异的特殊模式。

补品

左图显示了ACO和CO合并谱系之间的等位基因频率差异。 峰值表明差异很大,虚线代表阈值,在总体频率差异之间存在0.1%的随机机会。 垂直轴是对数刻度。 底部的灰线表示与合并的ACO样本在一个特定ACO谱系中的差异。 在右侧面板中,您会看到 杂合性,蓝色表示一氧化碳谱系,红色表示所选的ACO谱系,这缩短了他们的寿命。 灰色再次是特定的ACO血统。 每个垂直面板对应于 黑腹果蝇(Drosophila melanogaster) 基因组。

首先,请注意ACO和CO之间等位基因频率差异的广泛分布。此外,特定的ACO谱系与合并的样本之间几乎没有差异。 尽管有独立的历史,但它们似乎表现出相同的等位基因构型。 其次,请注意,在ACO合并样品的情况下,杂合度低于CO祖先表型谱系。 为什么? 请记住,选择性扫描应消除基因组变异。 但是,这些扫描似乎并没有固定下来,否则,我们会看到更多的反向峰收敛到〜0的杂合度,因为选定的变体取代了种群中的所有其他变体。

在控件和选定的线性之间存在差异的区域中发生了什么? 他们研究了〜650个基因上的〜500个非同义SNP,这些基因在ACO和CO之间最有区别(L 10FET分数> 4),发现以下类别的基因得到了丰富:假想椎间盘发育,平滑的信号传导途径,幼虫发育,翼状椎间盘发育,幼虫发育(su 两栖动物),变态,器官形态发生,假想椎间盘形态发生,器官发育和区域化。 生活史很复杂。 如图2和3所示,将广泛的基因类别与选择的分散基因组影响结合在一起,您可以很好地了解定量遗传进化动力学对底物水平产生的各种后果。 同样有趣的是,他们发现X染色体似乎丰富了选择和进化的特征。 为什么? 他们指出,该染色体将更易于选择隐性或部分隐性表达的SNP。

显然,这项研究没有发现理论可能已经预言过的彻底的彻底调查。 相反,研究人员发现许多部分完成的扫描分布在整个基因组中。 听起来有点熟? 在继续进行更广泛的考虑之前,请先对它们进行以下解释:

–扫描困难,但尚未达到目标。 因此选择系数很小,因此仍然处于瞬态状态

–选择是基于“常规变化”进行的。 也就是说,遗传变异在给定种群中自然存在,可以通过自然选择进行操作,以通过经典育种技术改变种群特征值的平均值

–最后,选择系数(积极选择的变异体相对于总体平均值的适应性更高)可能不是静态参数,而是随时间的变化,取决于等位基因频率。 这并不奇怪。 频率依赖性和上位性会影响统计遗传模型中的线性假设。 作者将有害的等位基因或拮抗多效性称为可能的遗传水平力,这些力也可防止固定

我个人倾向于第一种选择, 因为似乎我们在人类进化基因组学中看到了类似的模式,有许多局部扫描和不完全固定。 一个兄弟需要多少时间? 从长远来看,我们已经死了,热死吞没了整个宇宙。 在短期内,进化压力总是在变化。 立即修复,或者忘记它说我! 等位基因差异的广泛分布以及中等程度的杂合性似乎表明,通过对遗传变异的大规模作用,正在改变数量性状,生活史。 有趣的是,在这个进化实验中,X染色体似乎具有更多的选择和变异特征,这与人类相似。 下一个问题:谁在研究600代小鼠的实验进化?

引文: Burke,Molly K.,Dunham,Joseph P.,Shahrestani,Parvin,Thornton,Kevin R.,Rose,Michael R.和Long,Anthony D.(2010年)。 果蝇性质的长期进化实验的全基因组分析: 10.1038 / nature09352

图片来源:Karl Magnacca

 

蒂布1出于所有合理的关注 “缺乏遗传力”,人类基因组学的时代还没有完全破灭。 正如我之前在2005年的出色著作中所观察到的 突变体 进化遗传学家Armand M. Leroi断言我们对人类色素沉着的正常变异并没有真正的了解。 当时我认为这是可以辩护的主张,但是三年之内,我想说大部分的谜团都已经清除了。 尽管仍然有一些漏洞需要填补,并且还有待阐明的细节,但现在或多或少地了解了色素沉着的遗传结构。 到2006年秋天,Richard Sturm撰写了一篇标题为《 人类色素沉着遗传学的黄金时代我认为这个年龄在某种程度上可能与他2009年的评论有关 人类色素沉着多样性的分子遗传学。 不足为奇的是,许多特性 23andMe 告诉您有关色素沉着的信息。 当然,这种方法的作用有限,有人认为大多数人不会从“拥有棕色眼睛的变化达到85%”这一知识中获得很多收益,尽管这可能对后代预测很有用(我会说我有85%的机会拥有棕色的眼睛,但是由于我不是欧洲人,所以遗传背景不适合做出这样的概率断言。

研究博客网站 但是,随着色素沉着遗传学黄金时代的到来,低垂的果实被剥光了,下一步该怎么办? 我想知道这是否可能是高度适应性。 像色素沉着的高度遗传学已经 大约一会儿,但是似乎该地区最近出现了一些论文,特别是针对三个规范的高海拔民族,即西藏人,安第斯人和埃塞俄比亚人。 去年春季,两个主要小组发表了有关藏族海拔适应的遗传学及其演化历史的论文, 不同 技术。 中的新论文 PLoS遗传学 在这项工作的基础上(验证前两个论文所暗示的藏族选择两个基因座为目标),并将安第斯族人群添加到混合人群中,以评估融合适应的可能性。 使用密集的基因组扫描数据识别藏族和安第斯族人口自然选择的特征:

高海拔缺氧是由高海拔大气压力降低引起的,并导致对人体的严重生理压力。 几千年来,三个人一直居住在高海拔地区,其中包括安第斯高原上的安第斯山脉,喜马拉雅高原上的藏族和塞米高原上的埃塞俄比亚高地。 这些种群中的每一个都表现出独特的生理变化,以应对海拔高度上可用的减少的氧气。 但是,我们才刚刚开始了解导致观察到的生理变化的遗传变化。 当前研究的目的是确定在安第斯山脉和藏族地区可能参与高海拔适应的基因区域。 在这两个高海拔人群中分别确定了显示近期积极选择证据的基因组区域。 我们发现令人信服的证据表明,HIF通路基因,位于11号染色体上的球蛋白簇以及安第斯和藏族的几个染色体区域都处于阳性选择状态。 我们的结果表明,关键的HIF调控基因和靶向基因负责适应海拔高度,并暗示了几个不同的染色体区域。 在安第斯人和藏族人中鉴定出的候选基因和基因区域在很大程度上彼此不同。 但是,一个HIF通路基因EGLN1在两个高海拔人群中均显示了方向选择的证据。

在本文中,作者研究了约50名安第斯人(盖丘亚语和艾马拉语的讲者)和50名藏人,并将它们与不同的群体进行了比较。 除了欧洲和亚洲的HapMap人口外,他们还研究了一些美洲印第安人的人口。 下图显示了采样的地理范围(右图是美洲印第安人低地群):

journal.pgen.1001116.g001

相对于低地居民而言,抽样的两个高地群体的祖先关系相对简单。 面板A和B显示了安第斯人和藏族的PCA图,而C和D显示了 罢工 条形图。 对我来说唯一值得注意的是,盖丘亚语的讲者似乎表现出残留的欧洲血统,而艾马拉人则没有,而哥伦比亚土著群体似乎对中美洲人群的亲和力高于对其他南美样本的亲和力。 对于后者,我无法给出任何见解,但是如果这不仅仅是一种不具有代表性的怪癖,那么可能会看到嫁给盖丘亚语高地贵族的西班牙男人人数比艾马拉地区更南端的要多。 (尽管 波托西 在玻利维亚,所以这可能不合理)。

[nggallery ID = 12]

我们已经对这些群体如何适应他们的高海拔环境有了一些进化的期望。 似乎这三类人的生理过程有些不同,这在很长一段时间以来一直是遗传学家好奇的根源。 生理上有些变化,遗传学也应该是合理的,这似乎是一个大致正确的假设。 在本文中,他们采取了两种通用方法, 查看总基因组,并着眼于特定的候选区域。 据我所知,他们使用第一种技术并没有发现太多新奇的东西,但是他们确实通过研究特定的基因,从遗传适应的角度澄清了藏人和安第斯人之间的关系。 正如作者总结中所指出的,看起来这两个种群确实具有一些不同的遗传结构。 许多似乎已成为选择靶点的基因并没有重叠,而那些确实存在于选择位点的基因似乎发生了不同的局部选择事件,因此由正选择驱动的单倍型是不同的。

他们使用了多种技术来检测自然选择的可能区域:

–特定位置的分支长度(LSBL)

–杂合比(lnRH)的对数

–修改过的田岛D统计量

–全基因组远程单倍型(WGRLH)

LSBL是对Fst的详尽阐述,因此它正在等位基因频率的群体差异之间找到。 回想一下,在任何给定的地点,您都不会期望种群之间的差异,因此,如果有大量的生态适应性,您可能会发现地理差异很大。 杂合性只是两个基因拷贝处于不同状态的基因座比例的度量。 这只是衡量遗传变异的一种方法(尽管还有其他方法)。 Tajima的D统计量是对基因座是否偏离中性预期的一种检验。 这意味着可能存在瓶颈,选择性扫描或平衡选择。 最后,最后一个测试在基因组内寻找相关标记集。 如果存在一个单倍型,一系列标记,则可能是您正在目睹选择性扫描发生时或之后发生的基因组区域。

为什么要进行四种不同的测试? 因为一个给定的测试并不能决定自然选择。 正如田岛的D所指出的那样,人口统计过程具有随机性,会产生假阳性,因此最好不要仅靠一种技术来生存或死亡。

这是图4,它显示了等位基因频率的差异。 EGLN1 基因:

journal.pgen.1001116.g004

我们见过 EGLN1 前。 在上图中,左图显示了安第斯衍生的SNP,右图显示了藏族的SNP。 注意A和B频率的差异。红色表示C和D面板中统计数据的统计上显着的值。安第斯人和藏族人都显示选择的指示,但是当您放大基因时,模式中的细节会有所不同。 最后一个面板上有一个箭头,指出每个群体之间的SNP,其中群体之间的方差最大。 有趣的是,在高海拔地区,祖先等位基因的频率似乎有所增加,因为黑色代表祖先,红色代表第一和最后一组。

让我跳到他们的结论:

总而言之,我们对高海拔和低海拔人群进行了基因组扫描,以识别选择提名的候选基因和两个长期居住的高海拔人群(安第斯和藏族)中的基因区域。 几个染色体区域显示了正向选择的证据。 这些地区对安第斯人或藏人而言都是独特的,这表明这两个高原地区之间缺乏进化趋同。 但是,根据检测到的HIF调节基因信号,建议安第斯人和藏人之间趋同进化的证据。 EGLN1。 此外 EGLN1,第二个HIF调节基因, EPAS1以及两个针对HIF的基因, PRKAA1一氧化氮合酶2A,已被鉴定为藏族人选择提名的候选基因(EPAS1)或安第斯(PRKAA1, 一氧化氮合酶2A). PRKAA1一氧化氮合酶2A 在人类生殖成功必不可少的生理过程中起着重要作用……因此,除了说明自然选择和进化过程的可能目标外,基因组研究还具有明确的潜力,阐明了造成人类发病和致病的主要原因的关键途径。死亡。 根据这项研究的结果,重要的是要通过将基因型与特定的高海拔表型相关联的基因型-表型关联研究来确认结果。

我想展示基因的字母汤,以防万一您是对这些基因座感兴趣的遗传学家。 我以前的论文中都看过这些 我假设将其发布在此的密钥 PLoS遗传学 是研究人员探索这两个种群之间缺乏或存在进化趋同的深层比较维度。 这个发现应该令人惊讶吗? 我不这么认为。 高海拔是极端的环境,由于适应性的原因,文献中充斥着甚至在这些人群中也出现的问题。 可能会有有害的副作用,特别是如果去年春天关于藏人的论文之一是正确的,并且他们是相对较新的高地定居者。 但是直到玩游戏您才知道,因此确认是一件好事。

对遗传结构和适应性质的进一步探索,尤其是当研究扩展到埃塞俄比亚人时,可能会为我们提供进一步了解进化史偶然性的窗口。 这三个事件基本上是三个独立的实验。 在本文中,它们表明某些自然选择的变体可能已经存在于祖先种群中,因此常备变异。 其他是新的突变,独特而新颖。 尽管表型的最终表达有不同的途径,但在实施细节(生理学)上各组之间仍存在差异,但在这种比较中,也有一些基因似乎与藏族和安第斯族有牵连。选择。 样本空间如何受制于可能的选择和隐含的约束 G矩阵? 在相似的生态环境中,不同种群达到适应性适应状态所采取的进化路径有多大的偶然性? 这些是长期问题,我认为随着高度适应性的试验性银河时代逐渐取代黄金时代,这些问题可能会得到回答。

引文: Bigham A,Bauchet M,Pinto D,Mao X和Akey JM(2010)。 使用密集基因组扫描数据PLoS遗传学鉴定藏族和安第斯族自然选择的特征

图片来源:Micah MacAllen

请注意: 我知道,传统上,银器时代是在黄金时代之后,而不是在黄金时代之前。 但是我们确实生活在辉格时代!

 

研究博客网站 在过去的十年中,进化遗传学家 迈克林奇 一直在阐明一种基因组复杂性模型,该模型依赖于随机因素作为增加基因组大小的主要动力。 该论点在 2003纸,并在他的书中进一步阐述 基因组架构的起源。 论文中有几个移动的部分,其中一些需要对基因组的生物物理结构复杂性,孟德尔遗传作为一个过程的本质以及最后的群体遗传学有一个相当细致的了解。 但是该模型的核心很简单: 长期有效种群规模与基因组复杂度之间存在反比关系。 从碱基对和内含子等遗传元件的数量而言,个体数量少〜值大。


快速提醒一下:有效种群数量表示为下一代贡献基因的种群比例。 因此,对于在幼虫期死亡率极高的昆虫而言,有效种群数量可能是 数量级 小于在任何给定的一代人中对人生历程的所有阶段进行评估的人口普查规模。 相反,与人类相比,更大比例的儿童最终为后代的遗传构成做出了贡献。 对于大型生物,我听说您有时可以使用经验法则,即有效人口规模约为人口普查规模的1/3,尽管这可能高估了有效人口规模。 繁殖变异减少有效种群的一个原因,因为许多个体对下一代的贡献远少于其他个体。 方差越大,给定世代中种群中的几个个体对遗传变异的影响就越大,从而减少了有效种群,而后者又有助于下一代(繁殖变异通常被认为是泊松现象,但这可能被低估了) 。 另外,存在随时间变化的问题。 长期有效种群对低界限值比高界限值更加敏感,因此对于任何经历周期的物种,在任何给定时期,长期有效种群都可能比人口普查规模小得多。 例如,在过去的100,000年中,人类的长期有效种群规模相对较小,因为我们似乎已经从少量的初始种群中获得了扩展。 从数学上讲,长期有效人口规模由 谐波均值 毫无疑问,下限值很关键。 如果那对您没有意义, 请记住,种群瓶颈可能对物种的长期轨迹产生巨大影响,特别是消除遗传变异。

这如何影响基因组复杂性? 基本上,Lynch的论点是,当减少有效人口时,会削弱自然选择的能力,特别是净化选择的能力,从而防止通过随机过程增加非自适应复杂性。 不是选择变得毫无意义,而是其信号被噪声淹没了。 这是他2003年论文的摘要:

来自不同系统发育谱系的完整基因组序列显示出从原核生物到多细胞真核生物的基因组复杂性显着增加。 这些变化包括由于重复基因的保留而导致的基因数量逐渐增加,以及剪接内含子和可移动遗传元件的丰度更加突然地增加。 我们认为,许多这些改变是被动响应的,这是对伴随生物体大小增加的长期种群规模减少的反应。 根据该模型,真核基因组的许多重组是通过非自适应过程启动的,这反过来又为通过自然选择对表型复杂性进行二次进化提供了新的底物。 原核生物的巨大的长期有效种群规模可能对复杂的基因组和形态的进化形成实质性的障碍。

这意味着大量自然种群的原核生物通过更有效的自然选择而偏向较小的基因组。 相反,更复杂的生物体具有较小的种群数量,因此受样本方差的影响而受到一代又一代随机波动的影响更大,因此从基因组上讲,这种流线化的方法较少,因为选择只能对付汹涌的噪音。 Lynch的一个引人入胜的论点是,后来基因组复杂性随后在下游有用,成为表型复杂性的基石,但我们暂时将其搁置一旁。

一份新的论文 PLoS遗传学 挑战了Lynch等人对原始数据的统计分析。 曾经是他们的理由。 从技术上讲,争论在于 N eu 和基因组大小。 N e 是有效的人口规模,并且 u 是核苷酸突变率。 尽管争论是技术性的,但基本的反对意见应易于理解: Lynch等人还存在其他可能实际上导致相关性的变量。 辨别。 到纸上 基因漂移是否增加了基因组复杂性?:

不同生物之间的基因组大小(核DNA的数量)差异很大,但不一定与生物复杂性相关。 例如,仅草内的基因组大小相差近20倍,但是在基因组学或生理学方面,大型基因组的草种显然不比小型基因组的草种复杂。 相反,对基因组大小变异的最新解释主要是由种群大小决定基因组大小的想法主导的:增加基因组大小的突变预计会在小种群物种中漂移到固定,但是在大种群物种中这种突变将被消除,而自然种群选择的效率更高。 但是,以前的分析的推论是有限的,因为它们无法识别物种具有进化史,因此不一定在统计上是独立的。 我们的分析采用系统发育学的观点,与以往的研究相反,没有发现证据表明基因组大小或其任何组成部分(例如,转座子数,内含子数)与种群大小有关。 我们认为基因组大小的进化不太可能由诸如种群大小之类的单一因素很好地解释。

林奇图2在Lynch等人的原始分析中。 大约66%的基因组大小变异是由 N eu! 那是一个很大的影响。 图1说明了系统发育如何在建立关系中造成混淆。 以下是一些解释该图的文字:

在该假设示例中,已测量了八个性状的两个性状x和y,如系统发育树(A)尖端处的值对所指示。 普通最小二乘线性回归(OLS)表示统计上显着的正相关(B; r-平方= 0.62,P = 0.02),有可能导致x和y之间存在正进化联系。 但是,对散点图(B)与物种(A)的系统发育关系的关系的检查表明,对于两个主要谱系中的每一个,四种物种的x和y之间的关联为负。 通过具有系统发育独立对比的原点回归…相当于系统发生广义最小二乘(PGLS)分析,解释了物种的非独立性,并表明性状之间没有整体进化关系…物种间的明显模式是由正相关的性状变化驱动的仅在系统发育的基础分裂时; 在整个系统发育的其余部分中,性状大多朝相反的方向变化(A;红色为基础对比)…。

当时的论点似乎是林奇最初作品中的关系是人工制品,这是由于他调查推断该关系的物种的进化史所致。 您所拥有的不是一般的原则或法律,而是偶然的历史过程的结果。 不是很干净整洁。 您可以从1年的论文(图2003)中看到这种关系的类群性质。 科学:

se4532044001

好的,现在让我们看一下本文中相同数据集的可视化效果,就像一棵树来说明相关性:

林奇图3

林奇图5最后一张图显示了使用常规OLS回归的散点图与系统发育最小二乘模型(PGLS)之间的差异。 您从一个明显的线性关系转变为基本上没有任何东西(r平方接近零,无统计学意义),该线性关系转化为上述高r平方。

论文本身并不长,反对很简单。 他们只是声称Lynch没有纠正明显的替代性解释/混淆,而且我们不知道我们以为自己知道什么。 另外,有一种说法认为,有效种群大小可以强有力地预测基因组大小的观点正在成为科学界的常规知识。 我不知道这一点,这似乎是一个不断变化的年轻领域,我认为他们夸大了这种假设的广泛性,以使其反驳的力量变得更加关键。 当然,基因组大小的模式可能非常令人困惑,但我的直觉是,由一个预测变量解释的基因组大小变化的2/3的r平方相当惊人。 显然,在“后基因组时代”,基因组的大小非常容易获得,但是 N eu 对于许多分类单元而言,甚至对于一组感兴趣的物种而言,甚至在给定的分类单元中都很难实现。 对我来说,这对实验进化论者来说是一个机会,他们可以控制这些混杂因素,并观察其谱系中的变化。 即使 N eu 可预测所有事物受控制为独立变量, 如果通常不控制所有事情,并且系统发生历史的随机行为更为重要,该怎么办? 迈克·林奇(Mike Lynch)的功劳得到了肯定,所以我认为不久的将来我们会收到他的回应。

引文: Whitney KD和Garland T Jr(2010)。 基因漂移是否增加了基因组复杂性? PLoS遗传学: 10.1371 / journal.pgen.1001080

 

研究博客网站 进化论的伟大之处之一是它是对现实和动力学的特定具体方面的形式上的抽象。 它使我们可以从对自然状态的不完整的先验知识中榨取推理汁。 换句话说,您可以进行预测和建模,而不必观察自然世界的每个最后细节。 但是抽象,模型和形式主义常常遗漏了无关紧要的细节。 有时候,这些细节并不是那么多余。 查尔斯·达尔文(Charles Darwin)的原始进化论没有连贯的或合理的遗传机制。 费舍尔(RA Fisher)等人将孟德尔主义的经验现实引入了进化论的逻辑中, 产生20世纪人口遗传学的框架。 尽管接受孟德尔主义的遗传继承过程,但这是分子生物学并未掌握的原始合成方法,因为它早于分子生物学。 在詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)发现孟德尔主义的生物物理基础之后,分子进化就崭露头角, 中立理论 出现是对新分子技术正在发现的特定遗传变异模式的反应。 然而,通过RA Fisher的大部分图像,抽象的遗传变异与背景噪声变异的统计数据之间的浮动仍然存在,有时甚至被忽略掉了。 “豆袋遗传学”.

从分子遗传革命引发的第一波讨论开始,我们已经走了很长一段路。 我们有 表观遗传学, 进化 和基因调控的变化。 这些过程都不能“推翻”进化生物学,尽管它们在某些方面可能会彻底改变进化生物学的各个方面。 在所有永恒的革命之后,科学的发展是漫长的,因为理解的边界不断地被推开。 几天之前 我指出了肖恩·卡洛尔(Sean Carroll)的最新作品,强调必须超越顺序层次思考,并专注于特定功能,例如 -常规元素。 在这里,我们一直在探究基因的水平,但是受遗传变异影响的特征,表型又如何呢?

众所周知,基因型-表型关系的最抽象可以这样说明:

遗传变异→物候变异

但是,必须更详细地检查这种关系的每个元素。 什么类型的遗传变异? 序列水平变化? 表观遗传变异? 第二个部分可能是最紧张的部分,箭头挥舞着无数的细节和相互作用,这无疑潜伏在基因型和表型之间。 最后,您具有表型本身。 它们是否在质量上都有相同的创造,以便我们将它们归为二分式的价值和数量?

一份新的论文 PNAS 研究了形态表型和生理表型的细节,以及它们的遗传控制以及进化速率。 形态学和生理学进化的相反遗传途径:

在表型进化中蛋白质功能改变和基因表达改变的相对重要性是进化生物学中一个有争议的但仍是中心的话题。 分析了5,199个具有记录的突变表型的小鼠基因,我们发现,仅在突变时会影响形态特征的基因(称为“ morphogenes”)大量富含转录调节因子,而对那些只影响生理性状(称为“ physiogenes”)的基因则富含通道,转运蛋白。 ,受体和酶。 与生理发生素相比,形态发生素更可能是必需的和多效的,并且不太可能是组织特异性的。 形态发生子在表达过程中进化得更快,但蛋白质序列和基因增益/丢失要比生理发生剂慢。 因此,形态和生理变化具有不同的分子基础。 分离它们有助于辨别表型进化的遗传机制。

这里的形态是指总体的解剖特征。 古生物学家或解剖学家可能会感兴趣的特征和特性。生理学更多是关于功能,以及实现该功能的物理结构。 随着生理学逐渐融合到生物化学中,它自然更接近于分子生物学的规模。 当然,在另一端,生理学也与解剖学融合,因为生理学发生在解剖学家感兴趣的特征内。 通过概括,在本文的上下文中,也许可以认为生理学更细粒度,而形态学更粗略。

他们之所以使用鼠标,是因为它是一个长期用作模型生物的物种,并且在生理学和形态学方面都有许多众所周知的特征突变。 在进化研究的背景下,在这些领域中利用小鼠的历史可以追溯到20世纪初。 因此,系统生物学家已经进行了大量研究。 他们在Mouse Genome Informatics数据库中发现了5199个具有已知表型的小鼠基因。 821仅影响形态性状,而912仅影响形态性状。

图1显示了按 基因本体论:

变形图1

根据我对这些主题的了解很少,第二到第四小组不足为奇。 形态特征是从分子结构建立的,而转运蛋白的活动类别是细胞尺度更大的,因此似乎低于形态特征的显着性阈值。 第一个小组不是我所期望的,但是在事实发生之后是有道理的。 图2阐明了这一点。 右边的面板有比例,左边的计数。

变形图1

重点是:形态发生素似乎比生理发生素影响更多的性状,并且当涉及到特定的性状时,它们的影响是较少的组织特异性。 当这种模式突出显示时,对转录调控的丰富对我来说更有意义,因为转录调控可能允许通过性状水平控制变异来实现更多的性状。 如果与一个基因有许多性状的关系,则与该基因牵涉到一个性状的变异相比,可能会在更大程度上限制序列水平。 当您限制必要的基因时,多效性的鸿沟就被关闭了,这些基因的突变导致适应性降低到零(通过死亡或缺乏繁殖能力)。 据推测,多效性将遗传格局限制在特定的适应峰上。 当您考虑许多生理过程的定位及其生化复杂性时,组织特异性似乎是可以理解的(我在这里想到的是肝脏中基因表达的变异)。

但是,他们不仅关注现在的性状和基因分布方式,还试图探明形态发生子和生理发生子的进化速率是否取决于基因变异的类别。 请记住,您在外显子上会先后发生水平变化,这可能会改变蛋白质。 你有 作用元件作为基因调控中的关键齿轮。 而且您拥有更多的总体基因组特征,例如基因重复或缺失。

变形图3图3显示了在特定基因上的小鼠和人类之间与序列水平替换以及基因表达谱有关的差异。 特别是在前者的情况下,您想知道非同义取代的比率,即碱基对上的那些改变翻译的氨基酸的取代,由总突变率标准化。 因此,面板C是关注的焦点。 请注意,自人类和小鼠血统之间的最后一次分歧以来,生理发生素似乎比形态发生素进化得更多。 为什么会这样呢? 我马上想到的是,表达组织特异性的生理过程比调节总体形态更容易被调节,而总体形态可能受到具有许多多效作用的基因所控制,因此受到限制。 即使在控制组织特异性时,该模式仍然存在,如面板D所示。就基因表达谱而言,该模式似乎相对于进化速率而言是倒置的,如您在后三个面板中所见。 发生了进化,但是在这些情况下是通过某种不同的遗传手段进行的。 作者特别指出手指多效性是形态发生子中序列水平进化的问题,因为如果蛋白质的特征更多,则蛋白质的变化就更有可能成为问题。

从某种意义上说,这些结果表明Evolution必须是一位多才多艺的设计师。 当涉及到生理发生时,插画家要负责,从最基本的遗传原料中创造出新的特征,这里的一个碱基对和那里的一个碱基对都发生了变化。 但是对于形态发生子而言,进化必须使用照相购物的工具和技巧,求助于现存的元素,并在各处进行重新排列或微调,以免在调整边际时不打扰复杂的小车。

关于什么 起作用的监管要素? 在本文中,他们提到了以下论点: 肖恩·卡罗尔作用的调控元件对于形态性状的进化至关重要。 这意味着对于这些元素的变化,应该相对于生理原来富集吗啡原。 他们在图4中找不到。相反。

变形图4

但是我不认为他们认为自己的结果是对卡洛尔的坚决驳斥,因为这在某种程度上是间接的。 我将引用本文的内容:

…因为经过实验证实,哺乳动物 元素很少,可能仅在一种物种中得到证实,并且可能偏向某些类别的基因,我们通过使用检验了上述假设 -以前的元素 都曾预测 仅通过一组脊椎动物基因组序列之间的基序序列保守并记录在 RED数据库(20)。 在 红色,8,440个预测的小鼠顺式元素和7,688个 都曾预测 发现人类的顺式元件分别位于586个小鼠形态发生素及其人类直系同源物附近。 同样,预测了7,082个生理原中的7,215个小鼠顺式元素和621个人的顺式元素…。

我倾向于接受此结果及其可推广性,但是在这种情况下,存在一层分析和建模,而在其他情况下则不存在。 此外,卡洛尔(Carroll)的论文是关于整个动物界的,老鼠与人的比较可能是非典型的。

最后,他们想研究基因复制。 他们发现:

与D一起 FAM 结果,我们的分析表明,尽管生理发生族的扩张/收缩速度比形态发生族的速度快,但对于给定的家族,其世系的扩张/收缩率却相对恒定。

我不知道这里的重复是否与调节生化过程中各种底物的剂量有关。 这可能与生理过程更直接相关。

值得注意的是,正如他们所做的那样,“形态发生”和“生理发生”类别在某种程度上是人为的,形态学和生理学之间的区别也是如此。 本质上说,自然是一种,为了便于我们自己的抽象和分类,我们将其分解为特定的关节。 另外,推测所有基因都对形态和生理有一定影响,尽管这种探索比一些较老的抽象更深入一些,但它也是一种简化。 关键在于,这里的论点似乎是,这些类别和过程的分解为我们提供了关于演化动力学的有用的边际回报。 特质并不总是仅仅是特质。 不同类别的表型就其本质而言可能具有不同的进化遗传意义。 其中一些是常识,在功能上不那么重要的那些性状将表现出更多的基因变异。 但是在形式和功能本身方面的区别在细节上更进一步。 而且,我想我们从老鼠与人的比较中得出的结论在生命之树上有一定的局限性。

引文: 廖BY,翁MP,&张J(2010)。 形态学和生理学进化的相反遗传途径。 美国国家科学院院刊PMID: 20368429

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”