Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
人类进化基因组学

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

可能在KITL基因座上具有等位基因的个人(来源:David Shankbone)

个体上的多态 基特尔 轨迹? (信用: 大卫·香克伯(David Shankbone)

色素沉着是后基因组时代为数不多的复杂特征之一,几乎可以完全表征。 事后看来,原因很明显。 追溯到1950年代(请参见 人口遗传学)有使用人类谱系的推论,表明正常的人类变异对该特征的影响少于十个影响较大的基因。 换句话说, 这是一个多基因特征,但并非如此。 这意味着控制变异的等位基因将具有相当大的响应,并且完全在统计遗传技术的能力范围内以捕获其效应。

我应该谨慎对待这个问题。 直到最近中期(见 突变体)尚未完全了解此特征的细节。 如今,不同人群的继承性质 is 众所周知, εξελικτική 历史 就这些事情而言,也以相当清楚的方式众所周知。 50,000英尺的角度是这样的: 数百万年前,我们失去了皮毛,出现了黑皮肤,而我们离开非洲大约50,000年前,我们中的许多人就失去了色素沉着。 (实际上,北部纬度的人种似乎在 他们的色素沉着)


A 在新纸 手机 进一步细化了细节,这可能是此过程的结果。 成为一个 手机 论文中有很多灵巧的分子技术来阐明其机理途径。 但是我会掩饰这一点,因为它既不是我的专长,也不是我的重点。 该论文的摘要是它表明 p53,是一个相对众所周知的抑癌基因,似乎与反应元件有相互作用(该基因产物在许多区域结合,这是一个 转录因子基特尔 轨迹。 该基因座是众所周知的,部分原因是它与色素的变化有关。 人与鱼。 所以 基特尔 是跨越子生区的普遍的色素沉着途径之一。 欧洲人和东亚人都有一些衍生出的变体,它们与皮肤较浅有关,尽管在两种情况下都具有多态性(它尚未席卷固定)。

适应的工资? (图片来源:Hoggarazzi摄影)

适应的工资? (信用: Hoggarazzi摄影)

但这是一个 手机 因此,必须有一个不仅是进化的,更具体和实用的角度。 还有。 事实证明,在单核苷酸多态性突变 p53 反应元件导致上调的趋势 基特尔 和雄性生殖系增殖。 当涉及到肿瘤的发生,特别是睾丸癌时,后者就显得尤为重要。 这种癌症是似乎没有体细胞突变的一种 p53 本身。 此外,作者观察到,欧洲裔人的睾丸癌发病率比非裔美国人高4-5倍。 而且,大概是 基特尔 与黑色素生成增加有关。 这组作者认为,由于欧洲人皮肤较白,由于在其他基因座进行选种,因此在 基特尔 (增加了晒黑的反应)。 有证据表明在该基因座有选择(长单倍型和纯合性增加),所以这并不是一个不合理的推测,尽管功能等位基因丧失的频率很高,表明该模型很可能是复杂的。

我不知道这个故事的细节是否正确(尽管我对此很感兴趣 变异 基特尔 与其他生物体的癌症有关)。 但这说明了由于人类迁出非洲而导致的快速进化变化的可能后果之一: 由于多效性而产生有害的副作用。 换句话说,当您修改种群的基因组架构时,在优化功能的一个方面时,您将不得不权衡取舍。 基因不仅仅具有一种后果,而且还包含在无数种途径中。 随着时间的推移,进化理论预测会出现缓慢的重新平衡,因为修饰基因的出现掩盖了有害的副作用。 但是在那之前,我们将尽力承担适应的重担。

引文: Zeron-Medina,Jorge等。 “ KIT配体中的多态性p53反应元件会影响癌症风险,并且已经过自然选择。” 细胞155.2(2013):410-422。

 

引文: 电晕,埃里克等。 “在全球人类关系和移民背景下对疾病遗传基础的分析。” PLoS Genetics 9.5(2013):e1003447。

上图是从一篇论文中 公共科学遗传学, 全球人际关系和移民背景下疾病的遗传基础分析。 作者合成了人类基因组学的两个不同领域。 首先,有生物医学重点 全基因组关联研究 以及他们试图识别风险的方式 等位基因 对于某些疾病。 在某些情况下,这些风险等位基因非常 渗透剂,因为特定状态极有可能预测疾病表型。 但是在大多数情况下,由于2型糖尿病等高复杂性状的发生,收率升高或降低。 第二,进化基因组学领域试图重建系统进化史和种群遗传史,以便在适当的背景下构筑当代的变异模式。 在以下情况下,这是多么重要或令人感兴趣的是显而易见的 疟疾抗性基因。 由于平行的环境压力,在多个种群中已经产生了赋予抗性的等位基因。 这些种群之间的亲缘关系应该有助于您预测种群之间突变的相似性。 同时,人口遗传学理论可以为您提供关于 多种改编.

目的是为了加深对疾病发作性质的了解,并可能更有效地针对个人风险。 在图中的上方,您可以看到两种有趣的模式:2型糖尿病等位基因的风险与血统的关系以及与XNUMX型糖尿病等位基因的风险有关。 从头 突变或独立的选择性事件。 系统发育树代表了从HGDP中的> 600,0000个SNP推断出的真实关系 数据集。 风险等位基因是从文献中剔除的,并针对个人和人群进行了计算。 然后将实际人口风险与在这种特殊的系统树和正常的遗传随机漂移过程中可能发生的风险模型进行比较(请参阅 方法 有关血腥的细节!)。 您所看到的是系统发育关系(非洲人口转向更高的风险)和独立事件(皮马印第安人转向更高的风险),其中糖尿病的风险更高(红色转向)。

这种分析有各种各样的缺点。 作者受到研究中风险等位基因的限制,这肯定远没有彻底或详尽。 此外,在某些地区,他们的人口覆盖率很薄,导致在特定情况下甚至无法从其模型中榨取权力的能力也有所下降。 但让您大吃一惊的是,从高度多基因疾病(如2型糖尿病)中的风险等位基因推断出的模式甚至无法追踪您在现实世界中看到的情况。 许多南亚团体有 非常 2型糖尿病的高风险。 碰巧这些人群不在HGDP样本中。 实际上,有两位流行病学家提出了相当有见地的批评 在本文的评论中。 他们提出了许多在细节上浮现在脑海的要点。 但是他们以一种让我大吃一惊的方式结束了:

最后, 人们已经讨论了避免基于遗传风险对人群进行污名化的需要。不难想像基于该出版物的媒体公告“非洲人群中发现的糖尿病遗传风险”。 不久前,人们也对情报提出了类似的要求。 并非所有的猜测都是中立的。

碰巧的是,我来自代谢疾病风险很高的人群。 我不知道是否对这个事实感到羞耻,但我很高兴医疗专业人员开始意识到差异风险,并超越了对人的健康的粗略一统天下的理解。 由于我们分配脂肪的方式(针对相同的风险状况,我们必须更瘦一些,才能为美国人提供的BMI值对南亚人而言不太合适)。 再说一次,我不知道这是否有污名化, 但这是真实的。

因此,尽管我对以上论文中的方法存在真正的担忧, 我相信这些分析是更广泛答案的重要组成部分。 我们现在生活在抗生素革命和对细菌理论的理解时代。 这些是公共卫生投资的巨大回报。 在短期内,人类健康和预期寿命的增长将通过增加而处于边缘。 尽管我一直怀有各种怀疑态度,但最初都试图弄清人口历史与疾病之间的关系,但必须从某个地方开始。

引文: 电晕,埃里克,等。 “在全球人类关系和移民背景下对疾病遗传基础的分析。” PLoS遗传学9.5(2013):e1003447

 

有一篇很棒的论文 手机 马上, 通过选择的EDAR变体的表达对小鼠最近的人类进化进行建模。 它综合了基因组学,计算模型以及鼠标模型的有效执行,以探索人类的非病理性表型变异。 可能是由于本文的最后一个因素推动了人类进化基因组学的发展,找到了解决这一问题的方法。 手机 (当然还有“影响因素”)。

这里的重点是 雷达,您可能以前听说过的轨迹。 通过摆弄EDAR轨迹,研究人员有了 较早创建 “亚洲老鼠。” 更具体地,表现出一组表型的小鼠被称为能够将东亚人与其他人群区分开,特别是在头发形态和皮肤腺体发育方面。 更普遍地,EDAR牵涉到 外胚层组织的发育。 这是一个非常广泛的领域,因此修饰此基因座会导致许多表型变化也就不足为奇了。 上图说明了在HGDP人口中在东亚人中发现的突变的现代分布。

需要注意的一件事是,派生于东亚形式的EDAR出现在美洲印第安人人群中,这些人与东亚人在距今10,000年前(距今15至20,000年)之间的确存在分歧。 在西欧亚大陆中,您可以找到派生的东亚EDAR变体的两个种群是Hazaras和维吾尔族,这两种种群可能都是最近在东西欧亚种群之间混和的产物。 在美拉尼西亚,EDAR频率与南极混合气体相关。 在地图上没有,但也没有人知道,南亚的蒙达(奥亚)部落的人口也很低, 但不平凡,东亚EDAR的频率。 在这种情况下,它们在没有最近东亚混和物的南亚族群中是例外的。 这使人们相信蒙达族是从东南亚入侵的一部分南亚奥秘人民的后裔,那里存在着大多数南亚奥林匹亚语。

但是让我惊讶的一件事是,欧洲人口中甚至在俄罗斯人中都没有东亚EDAR。 我对这个结果感到有些困惑,因为在过去的10,000年中,西伯利亚人与欧洲人的混合生活成为了可能, 正如一些研究人员所引述的 (这不是一个晦涩的结果,它会反复出现在TreeMix中)。 第二个图显示了在过去30,000年中东亚EDAR单倍型从中推断出的区域。 作者利用数百万个带有大量参数的正向模拟对EDAR的扩展进行建模,以使其适合所实现的分布模式(有关参数,请参见此处的补充资料)。 长话短说,他们推断在目前之前约有30,000年存在一个突变,并且在选择系数的驱动下它以大约0.10的数量激增了频率(相对适应度提高10%,非常强大!)。 这是选择性扫描的最末端,可能与表征其特征的单倍型相同 SLC24A5LCT (该块较短,但由于时间深度较深而有意义)。 再次,我感到困惑的是,为什么在美洲印第安人或蒙达族中发现的这种古老等位基因在具有推定的东亚欧亚混合体的欧洲人中却不存在。 整体不适合我。 我的一个或多个假设有一个弱点。

然后是关于鼠标模型的部分。 对我来说,这方面很巧妙,尽管我不能特别评估它的技术性。 小鼠模型较早用于测试突变对EDAR的影响的条件是拷贝数发生粗略变化,从而导致蛋白质的剂量发生大量变化。 在那种情况下,表型结果是相当极端的。 在这里,他们使用“敲门”模型,在其中重新创建了特定的EDAR点突变。 他们没有发现极端的表型,而是发现老鼠的性状范围更加正常,尽管它们的头发形态变化与人类发生的变化非常吻合。 此外,外分泌腺的数量也有所变化,衍生的东亚EDAR携带者的内分泌腺数量更多(具有累加效应)。 最后,他们注意到乳腺垫面积和分支有差异。 这些都不是令人惊讶的,EDAR是一个重要的调节基因,可以塑造生物体的外围和外部。

为了仔细检查人类在小鼠模型中的相关性,他们在一大批汉族人群中进行了全基因组关联。 特定性状的相关性在他们期望的方向上。 那些具有东亚EDAR变体的人的头发更浓密,铲形门齿,外分泌腺密度更高。 可能需要注意的是,汉族人群中衍生变异的频率很高,以至于他们没有足够的纯合祖先基因型来进行统计,因此他们的比较涉及杂合子与衍生突变体以及祖先状态的副本。 。 就像欧洲人中的SLC24A5一样,在这里很难找到具有非欧洲模式变体的双重副本的具有欧洲传统的个人。

让我们回顾一下他们在这项研究中所做的所有令人敬畏的事情。 他们深入研究了EDAR周围地区的进化基因组学,认为该单倍型是在大约30,000年前的祖先变体中经过硬选择扫描而频率升高的。 并且在选择系数方面具有明显优势。 这可能是过去50,000年非非洲人基因组中自然选择的最大影响指标之一。 其次,他们使用人性化的小鼠模型来探索与东亚人这种突变变化相关的表型范围。 因此,您在一个基因座上具有很强的选择系数,并且具有与该基因座的变化相关的一系列性状。 第三,尽管该领域已有研究(即复制),但他们确认了人类特征与突变之间的相关性。 这都是一门伟大的科学,它显示了小组之间协作的力量。

本文的许多优雅之处和影响力也适用于讨论部分, 但坦率地说,这是我开始崩溃的地方。 您可以在其中了解到 纽约时报 片, 与35,000年历史的突变有关的东亚体质特征。 这里的标题指出了从这一研究领域中得出的合理重要的推论, 人类的许多显着身体特征似乎是由于在几个基因座上发生了强烈的选择事件。 除了EDAR,我还在考虑色素沉着基因座,例如SLC24A5。 如果上山褶皱有类似的东西,我也不会感到惊讶。 如果它是可见的,并且定义了种群之间的差异,那么它通常在基因组上并不琐碎。 在这种差异下通常会有一个故事。

在人类自然历史的广阔范围内,对我而言出现的问题是 我们有特质,我们有选择的基因,但是我们有很弱的故事来解释自然选择的机制和背景。 在这里,与乳糖酶持久性和疟疾抵抗力有关的基因座形成了鲜明的对比。 在这些情况下,选择的因果机制似乎相对清楚。 批评进化论的心理学家不会指责“只是这样”的讲故事领域,但是在进化基因组学的知识上更加隔离的领域也出现了同样的问题(部分原因是该领域非常新,并且在数学和计算上也很抽象)。 为了说明我在说什么,我将引用以上论文的讨论内容:

高密度的外分泌腺是关键的人类激素适应性,能够在剧烈的活动(例如长距离行走和奔跑)中进行有效的蒸发蒸腾(Carrier等,1984; Bramble和Lieberman,2004)。 370A携带者的内分泌腺密度的增加可能在温暖和潮湿的季节有利于东亚的狩猎采集者,这会阻碍蒸发蒸腾。

地质记录表明,中国在40,000至32,000年前是相对温暖和潮湿的,但在32,000至15,000年前,气候变得凉爽干燥,然后在全新世爆发之前又变暖了(Wang等,2001; Yuan等)。等(2004)。 然而,在整个这段时间里,由于夏季和冬季季风的贡献不同,中国可能仍处于相对潮湿的状态。

高湿度,特别是在夏天,可能为个体提供了季节选择性的优势,使其能够更好地激活更多的内分泌腺,从而更有效地出汗(Kuno,1956年)。 为了探索这一假设,需要更精确地选择何时何地等位基因(也许使用古老的DNA来源)以及更详细的考古和气候数据。

适应气候总是一个不错的选择。 这个假设的问题是 该等位基因分布的现代梯度与人们对热和湿度的适应性恰好相反。 另外,这种适应方式没有成本吗? 在最初的向上扫描之后,高频率发现了衍生的EDAR突变体的种群经历了令人难以置信的最后一次冰川最大值的寒冷,而像雅库特这样的群体如今已经适应了寒冷。 不仅如此,从北极到热带地区的美洲印第安人都展现出一种适应寒冷的身体形态,这是贝伦吉亚长期逗留的历史后果。

当然,作者并没有这么简单,而且有些脱节的讨论暗示了这样一个事实,即EDAR具有许多表型效应,并且可能受到多种积极的选择压力。 从表面上看,这似乎是合理的,但这种机制的复杂性似乎不适合于该基因座周围的选择信号如此干净,清晰的事实。 似乎这不是一个容易解开的故事,并且在本文中有很多关于这一事实的隐式承认。 但是在正文末尾添加了以下内容:

值得注意的是,由370A等位基因引起的大部分不可见的结构变化可能会赋予功能优势,例如外分泌腺数目增加,直接与视觉上明显的特征相关,例如 头发的表型和乳房的大小。 这创造了这样的条件,在这种条件下,伴侣的偏爱可能会迅速演变并加强更直接的竞争优势。 因此,随着时间的推移,由单一多效性突变引起的多种性状上累积的选择性作用力可能会推动370A的上升和扩散。

一个简单的结论是,最初的气候适应可能已经让位于文化/性选择适应,而西方前东亚经典(黑色和有光泽的)以及偏爱小乳房。 这个方面在 纽约时报 当然。 我会再次引用:

但是西雅图华盛顿大学的遗传学家约书亚·阿基(Joshua Akey)说,他认为该基因在东亚人群中传播的更可能原因是性选择。 粗大的头发和小的乳房是可见的性信号,如果携带者生下更多的孩子,如果男性愿意的话,这种信号很快就会变得越来越普遍。 阿基博士说,具有明显特征的基因,例如欧洲人的蓝眼睛和金发,具有很强的选择信号,而且与汗腺相比,EDAR的可见性效应更可能是自然选择的驱动力。

此处的段落含糊不清,因为该文章的作者Nick Wade不使用引号,而且我不知道什么是Akey,以及Wade对Akey的理解是什么。 例如,出于生殖偏斜的理论原因(几个男人可以生很多孩子),一般来说,性别选择通常是由女性偏爱男性表型驱动的。 我认为Akey知道这一点,所以我怀疑那部分是Wade的光泽(尽管考虑到偏爱较小的乳房的提议,这是一个合理的水平)。 我想到的主要问题是,著名的人口遗传学家,例如约书亚·阿基(Joshua Akey),实际上如何认真地选择性别作为推动人口变异和选择的力量。 似乎很多时候,性选择被呈现为 前机械世界 这种现象可以挽救我们对特定特质起源的困惑。 但是,我们对性选择可能性的评估大概必须以先前的期望为前提,而这种期望是由人们可以从文献中得出的各种力量之间的平衡得出的,在这里,我对当前性选择文献的了解还很薄弱。 也许我的怀疑是建立在我的无知之上,而提出这一解释的种群遗传学家对文献的状况更加了解。

所有这些使我回到了嘲讽的标题。 上周,当这篇论文首次成为新闻时,我正在与一位日本血统的朋友共进晚餐(他在日本上过小学)。 我问他空白,“你喜欢小乳房吗?” 他最初的回答是“ WTF!?!” 拉齐卜,”但作为老鼠遗传学家,在向他概述了上述结果后,他理解了我的问题的主旨。 从与许多东亚裔美国男性的私人交流中,我不相信在这部分人口中,绝大多数人都偏爱小乳房。 但是这里的关键是 美国人。 这些是沉浸在美国文化中的人。 毫无疑问,东亚的规范有所不同。 我们在美国媒体中看到的名人东亚女性的典型视觉表现形式是,与西方女性名人(例如巩俐,韩国流行歌手的新作)相比,她们的继发性特征更苗条,更轻描淡写。 ,甚至考虑到后者的整形手术)。 毫无疑问,部分原因是整个人群的正常变化范围有所不同,部分原因可能是审美偏好的本质。

但是,根深蒂固的心理原因驱使性选择的可能性(据我所知,华南和西伯利亚没有一种文化)使我们回到有关更新世思想的旧观念。 并且,这使我们回到了进化心理学领域,这个领域既是对进化科学在理解人性方面的效用的怀疑论者的怀疑者,也是对进化生物学的严格实践者的鞭策者。 然而,这里并不是进化心理学家,而是我经常在媒体上援引性别选择的,经常被肋骨缠住的统计遗传学家。。 但是我们是否知道这是性选择,还是我们最好的猜测? 因为最好的猜测常常是错误的(尽管最好的猜测比最坏的猜测更可能是正确的!)。

在过去的十年中,进化基因组学已经走了很长一段路。 例如,我们知道遗传结构以及许多性状的自然历史某些方面。 但是,仍然存在缺点。 乳糖酶的持久性是规则的例外。 就象为什么人类色素沉着这样简单的表型,在过去的10年中为什么它一直是欧亚大陆的重复选择目标也无可争议的答案。 通常,正确的答案就是我们只是不知道。

引文: http://dx.doi.org/10.1016/j.cell.2013.01.016

 

几天前我在浏览 霍尔丹的筛子,当我偶然发现一个有趣的讨论时 “关于” 页。 这种“内部棒球”玩笑使我开始思考自己的智力发展。 在过去的几年中,由于基因组学的兴起,“大数据”的泛滥以及可访问的软件包,我一直在更深入地研究系统发育和系统地理学。 这带来了机会成本。 我没有花太多时间专注于经典种群和进化遗传问题。 这些年来,我收集了各种各样的教科书和专着,这充实了我的智力,这些资料和专着散布在我的房间里。 但我必须承认,现在浏览是难得的一天 哈特尔和克拉克 or 自然选择的遗传理论 没有特定目的或雇佣军意图。

费舍尔

就像一条河流无情地在洪泛区上奔流一样,随着新的一年的到来,现在该是一个大转弯的时候了,像我一样扎根于我的根源。 这是我现在正在阅读的原因之一 进化遗传学的奠基人. 费舍尔, 赖特霍尔丹,就像老朋友一样,褪色了,但并没有忘记 穆勒 总是相识。 但是100年前的思想仍然有力量驱使我们探索尚未解决的深层问题,但是在哪里可以找到新的方法和新技术呢?。 对过去的研究不允许我们做出明智的选择,以任何坚定的态度决定未来,但它至少可以增加我们照亮黑暗深处的工具的光度。 通过我们的各种努力,大自然的形状可能会变得不那么透明。

图来自“对任意优势等位基因的定向阳性选择”,Teshima KM,Przeworski M

那么,霍尔丹的筛子又是什么呢? 如在 霍尔丹的筛子 这个概念很简单。 想象两个突变,一个以隐性方式表达特征,另一个以显性方式表达特征。 筛子通过促进出现在随机区域占主导地位的变异体占主导地位的低频区域外来运行(即,即使等位基因具有较大的适应性,在低频区域,随机机会的力量可能仍暗示着该可能性很高)。灭绝)。 一个例子是 乳糖酶持久性,它在模式欧亚变体中似乎占据主导地位。 相反的情况,即有益突变在表达上是隐性的,遭受了结构性问题的困扰,在这种问题中,其益处在理论上比实际实现要多。

这的数学极其简单,这是由于 哈迪·温伯格动力学 of 二倍体 随机交配生物。 我们以与乳糖酶持久性变化有关的基因为例, LCT。 考虑两个等位基因,LP和LNP,前者具有持久性(一个成年人可以消化乳糖),而后者则表现出常规的哺乳动物“野生型”(乳糖酶的生产停止,因为一个人离开了哺乳期的生命阶段)。可行的)。 LP显然是新颖的突变体。 在少数人群中,LP的频率随机上升到10%并非不可想象。 现在怎么办? 在HWE,您有:

p2 + 2pq + q2 = 1,其中q = LP等位基因。 在〜10%时,替换的数字为:

(0.90)2 + 2(0.90)(0.10)+(0.10)2

这就是优势或隐性表达高度相关的地方。 现实情况是,LP是主要特征。 因此,在此人群中,LP的频率为性状:

(0.10)2 + 2(0.90)(0.10)= 19%

现在,想象一个模型,其中LP受到青睐,但它以隐性方式表达。 那么特质的频率将等于q2,纯合子LP等位基因比例。 即1%。 尽管人口遗传学通常是建立在代数基础上的,但其结果却有助于直觉。 就等位基因的可能轨迹而言,遗传系统内源性的结构参数(显性或隐性表达)可能会产生长期的后果。 选择只能“看到”特质,因此具有纯正品质的隐性特质也可能是没有特质的特质。 相比之下,显性表达的等位基因可以像镰刀一样穿过种群切开,因为每个拷贝都“计数”。

在准备这篇文章的过程中,我在百科全书中再次探讨了关于霍尔丹筛子的选择 进化遗传学的要素。 作者指出,这种现象虽然具有复古性,但可以算是进化遗传学领域中的一个年轻领域,尽管仍然可以追溯到现在,但它仍然是一个活生生的现象。 野生种群中偏爱突变的优势,或实验室种群中有害突变的隐性特征,可能反映了这两个基因库所处的不同机制。 事物的性质使得它比显性突变更容易产生隐性突变(即,损失比获得容易),因此在受到正选择压力的野生种群中,显性变体的优势使人们相信进化论而不是发展论。力量和约束条件塑造了许多物种的遗传特征。

但是事情还不是那么整洁。 霍尔丹的筛子,以及显性和隐性等位基因的框架,在性染色体区域的运作方式不同。 在许多谱系中,都有一种“异配性”,其中大部分基因组仅携带一个功能染色体。 在哺乳动物中,这是雄性(XY),而在鸟类中,这是雌性(ZW)。 由于雄性染色体上大多数基因只有一个功能性拷贝,因此隐性表达的掩盖作用不适用于哺乳动物。 这可能意味着由于在异配子性中有许多有害隐性变异体暴露于自然选择,因此人们会在这些染色体上看到不同的等位基因分布和遗传景观(例如,由于异配子性中名义上隐性等位基因的暴露,适应性更强。 ,以及对有害变体的更纯净的选择)。 但是现实更加复杂,该领域的文献有些混乱。 更准确地说,它在系统发育上似乎很敏感。 一旦移至果蝇,这一理论便在哺乳动物的建立者中得到了验证。

这就是为什么继续进行进化遗传学的原因。 该理论激发了经验探索,并对其进行了检验。 在大数据和大计算时代,由于经验的可检验性,许多经典的进化遗传形式理论已经在第二次世界大战之前的几年中形成,现在正变得越来越重要。 在这个领域中,历史学家不仅仅对过去感兴趣。 追寻下一笔拨款并产生预期的出版物的科学家们自己,可以站在巨人的肩膀上,从历史的角度来看,从中受益。

 

上图显示了该地区的人口覆盖率 基因2.0 SNP芯片,由 地理项目。 他们的论文概述了芯片的实用性和原理,现在已经发表 arXiv。 去年夏天,当Spencer Wells主持了有关Geno 2.0发布的网络研讨会时,我看到了这张地图,这确实使我兴奋不已。 他们在此芯片上拥有的标记数量不多,常染色体上仅超过100,000,而X,Y和mtDNA上则有成千上万的标记。 相反, Axiom®全基因组人类起源1阵列板 被...使用 帕特森(Patterson)等人。 拥有约600,000个SNP。 但是,从上图可以清楚地看出,在更多的人群中Geno 2.0可以确定其他可比较的芯片(Human Origins 1 Array使用12个人群)。 显然,如果您只捕获少数群体的变异,那么所有额外的百万个标记都可能不会给您带来很大的收益(更不用说可能在您的群体遗传和系统发育推断中引入的偏见)。


左侧是确定了“人类起源1阵列”的人口清单,对我而言,它们看起来相当全面。 相反,对于Geno 2.0,在450个人群中确定了“祖先信息标记”。 对我来说,最终的问题是:对各种晦涩难懂的群体进行额外的确定是否值得? 如我所说,在初次检查中,Geno 2.0的SNP数量似乎很少, 但是根据我的经验,当您进行质量控制并将不同的面板合并在一起时,无论如何,您通常只剩下几十万个SNP。 根据我的经验,即使在欧洲这样的遗传上均一的地区,100-200,000个SNP也足以阐明它们之间的关系(对于基于模型的聚类来说,这已经绰绰有余了,对于MDS或PCA来说似乎已经过大了)。 关于Affymetrix芯片,一个让我惊讶的问题是,它的确确定了对映体。 相反,Geno 2.0考虑了欧亚的心脏地带。 例如,我怀疑Geno 2.0对于南亚人的人口或血统分配会更好,因为它会为这些人提供更多的信息标记。

最终,我不能说更多,除非我在不同的地方使用了两个标记集 类似的情况。 由于Geno 2.0有意识地排除了许多功能上和医学上相关的SNP,因此其用途主要是在人口统计和历史领域。 如果有问题的人群已被“人类起源1阵列”很好地覆盖,我认为没有理由不应该这样做。 它不仅具有有关生物学功能的更多信息,而且标志物的数量要大很多倍。 另一方面,Geno 2.0在Affy芯片的“空白区域”上可能更有用。 希望有关Geno 2.0的Genographic Project结果报告能尽快出台,我可以拉下他们的数据集并使用它。

引用: 的arXiv:1212.4116

 

要了解自然的所有复杂性,我们必须将多种多样的物种缩减到最小的规模。 为了便于理解,我们用数学形式化,用类比语言表达,并用表示形式可视化。 这些逼近现实不是现实,但是当我们黑暗地透过玻璃看时,它们会给我们带来至关重要的洞察力。 道尔顿的模型 原子的细节在重要的细节上是错误的(例如,基本粒子被证明可分解成夸克),但是它仍然具有概念上的实用性。

同样,LL卡瓦利-斯福尔扎(LL Cavalli-Sforza)在 人类基因的历史和地理 在了解人类人口过去的状态方面仍然很有用。 但是看来,树的分叉模型现在必须被网状阴影强烈着色。 在程式化的意义上,种间系统发育假设生物物种概念的近似真相(即,跨谱系的基因流很小),当我们在种群遗传学的微观进化规模上考虑物种的系统发育时,就会误导我们。 在种内尺度上,基因流动不仅是模型中的麻烦参数,而且是必不可少的现象,必须将其纳入框架中。


这是我的想法,因为出现了诸如 混合树Admix工具。 在众多公共数据集上使用诸如此类的软件,可以让人们感知混合物的真实性,并将侧向基因流叠加在树上作为自然的期望。 但是,也许更深层的结果是树本身的特征被撕裂了。 上图来自新论文, 基于矩的混合参数和基因流来源的高效推断,这是首次亮相 混合映射器。 作者在他们的论述中引入了很多数学方面的内容,但我不能说我全部遵循(尽管某些细节与 皮克雷尔(Pickrell)等人)。 简而言之,与TreeMix相比,MixMapper似乎可以对更狭窄的总体进行更有力的推断,这些总体被选择用于探索非常具体的问题。 相比之下,TreeMix在最少的监督下探索了整个景观。 使用了后者,我可以证明那是真的。

MixMapper的最大结果是它扩展了 帕特森(Patterson)等人。,并确认 现代欧洲人似乎是“北欧亚”人口与模糊的“西欧亚”人口的混合体。 重要的是,他们在撒丁岛发现混合的证据,这表明Patterson等人的原著对假定的参考人群中的混合不敏感(请注意,Patterson也是本文的合著者)。 如本文所述,问题在于,当您没有“纯”祖先参考种群时,很难估计混合。 然而,对我而言,这里的收获是,我们可能需要重新考虑纯祖先种群的整个概念,并将人类系统发生树想象为永恒通量中的一系列晶格,其混合节点会定期扩展,从而产生出人为的假象。多样化的树。 我们越仔细看,在过去的10,000年中经历人口膨胀的大多数人口似乎也是混合产品。 过去10,000年乃至过去100,000年的任何故事都必须在整个群体的叙事弧横向基因流的中心留出空间。

引用: 的arXiv:1212.2555 [q-生物.PE]
 

当我在ASHG的Spencer Wells的海报上时,我主要对条形图感到好奇。 他的空间覆盖率非常好,因此我对本文颇为兴奋(尽管我没有看到系统发育假说的很多明确检验,我认为这类论文现在必须要做;我们已经超出了PCA和条形图的范围)仅论文)。 话虽这么说,Spencer对我更感兴趣地推广 科学赠款计划。 这是更多信息:

Genographic项目的“科学赠款计划”以滚动方式为那些致力于利用创新人类学遗传工具研究人类历史的项目提供赠款。 科学赠款支持的各种项目旨在构建我们古老的迁徙和人口历史,同时加深对世界人口的地理结构的了解。 样本研究主题可能包括诸如印度-欧洲语言的起源和传播,对巴布亚新几内亚的高语言多样性的遗传学见解,从非洲迁出的数量和途径,印加人的起源或印加人的遗传影响等主题。玉米农业在美洲的传播。

接收者通常是人口遗传学家,学生,语言学家,以及对追求与地理计划探索我们的迁徙历史的广泛目标有关的问题感兴趣的其他研究人员或科学家。 地学科学赠款的接收者将成为地学财团的成员,并有望作为更大的地学使命的代理人,参与并报告地学实地考察的多个方面,并提出自己的建议和与任务相一致的试点项目。项目。 财团内部的开放性和透明度是该项目研究团队的关键价值观,受助人将遵守该行为准则。


如果您翻阅他们的材料,他们会说补助金将在 $25 到 $50 美元之间。 那是 125 到 250 个 Geno 2.0 芯片。 说起来,我大约一个月前寄出了一个芯片。 结果应该很快就会回来。

那么,为什么Spencer如此热衷于我再次推动呢? (我之前已经提到过)在ASHG 2012上之后 我对那些对这类历史遗传问题感兴趣的人的小样本空间感到震惊。 我之所以这样说,是因为我已经阅读/阅读了大多数张贴海报的论文。 我有时不知道是否会遗漏某些东西,但是这些结果表明没有,只有这么多的实验室在做这种工作。 最后是关键问题。 这是“自下而上”的非学术科学可以创造奇迹的地方。 一个印度小组在ASHG上展示了一张海报,当他们告诉我艾尔斯(Iyers)和孟加拉婆罗门(Bengali Brahmins)之间的相似之处时,我忍不住承认:“是的,我已经知道了,我的朋友 扎克·阿杰马尔(Zack Ajmal) 得出了这个结论。” 如果您是一名学者,则需要超越工具和方法以及分析见解,那些拥有备用计算机并有少量闲暇时间的人可能会产生这些见解。 对这些数据的学术垄断充其量是短暂的。 和所有的好处。 我已经厌倦了知识分子的租金。

 

大多数读者都知道我参加过ASHG2012。我将把这篇文章分成两半。 首先,会议的一般性。 其次是特定的海报等

通用性:

生命技术/离子激流 显然雇用了d-bag bros在会议上代表他们。 海报的人很好,但是那些负责 离子洪流巴士 如果他们认为这很有趣/可笑/等等,那就是总的困境。 人力资源敏锐度并不总是反映技术上的突破,但是我敢肯定,如果他们认为聘请认为d-bags有趣的人来疏远某人的选择,那么他们(HR)认为这是明智的选择ASHG的会议参加者。 Affy&Illumina!

–说到测序,有一些年轻的公司试图推广技术,以解决缺乏长期阅读的问题。 我充满希望,但是在2000年代后期太平洋生物科学公司惨败之后,我认为对任何一家特定公司寄予希望是没有意义的。

–我走进了海报大厅,阅读了标题,并至少浏览了所有3,000多个海报的摘要。 基因组学无处不在就不足为奇了。 但是,也许会有一个适度的惊喜是,大型外显子组对于以医学为导向的人而言正变得如此。

–在谈到医疗/临床人士时,我注意到他们在介绍中使用了“高加索' 很多。 这在流行一代中并不明显。 它显示了官僚命名法在现代医学中的影响,因为他们倾向于使用有些荒谬的美国人口普查局类别。

– Twitter是 相当大的一笔。 有很多有趣的环节,我发现自己不断检查自己的供稿中是否存在 #ASHG2012 井号。 这也是弄清楚在同一次会议上还有谁的一种简便方法(例如,就我而言,经常 卢克·乔斯汀(Luke Jostins)).

–如果您可以在会议上跟踪智能手机的移动方式,那么看到一个由个人组成的网络将很有趣。 例如,进化论和种群基因组学海报被更多直接的信息学(例如,用于清理原始序列数据的软件)所束缚,从中流血了。 但是在进化和种群基因组学部分的旁边(我说基因组学而不是遗传学,因为后者完全被前者所涵盖),您有某种类型的小儿疾病遗传学过道。 当我错误地继续前进时,我并不是唯一一个害怕的人(即,您从对埃塞俄比亚人口结构的深入讨论,到关于常染色体显性遗传性疾病新生儿可能死亡的具体讨论) ,上面说的是新生儿的照片!)。

–显然哪些会议更具跨学科性:只需注意演讲者之间的“搅动”即可。 人们在逐个发言者之间切换会话,因此,如果不喜欢他们的话,他们会选择退出。

–每个演讲的问题数量似乎随之而来 幂律。 许多很多的谈话必须让主持人问一个令牌问题。 但是有几个小组让人们赶到麦克风,主持人不得不将它们拒之门外(这在我身上发生了两次,尽管我习惯于坐在过道的中间,这样人们就不会超越我,这使我处于不利地位)。

23andMe 据推测,最迟在今年年底之前,将会有新的祖先画作,还有更多的人口。 当我看到它时,我会相信的,但是告诉我这件事的人似乎完全是真诚的,我充满希望。

–在某些晚上,我喝了相当多的酒,并且从很多我不记得的人那里得到了很多名片。 但是似乎正在出现的一件事是中介和b2b服务的激增。 由于选择的多样性,有理由认为,有些公司正陷入混乱之中,并试图通过在交易结束时使两方相匹配来获利。 我一个人 do 回忆起迈克尔·赫尔岑(Michael Heltzen)的 蓝色SEQ,他将其称为“测序的Hotels.com”。

–总体而言,这是一场物流方面的良好会议。 明年我一定会去波士顿!

–关于古人参掺和物和选择的很多东西。 很多。

–朋友不要让朋友使用 结构体 他们什么时候可以使用 混合物。 似乎大多数人都选择了后者,速度很快。 但是少数小组仍在使用前者。 而且不应该这样,因为它们的老化和复制参数设置得很低(我使用 结构体 微卫星),这样一来就不会花费一千年的时间进行收敛。 如果您要这样做,为什么首先要考虑贝叶斯系统进化学的作用呢?

–卢克·乔斯汀斯(Luke Jostins)建议,我在现实生活中的表情与头部镜头不同。 我怀疑卢克在这方面的认知能力较低。 一个受人尊敬的实验室里非常醉酒的人决定在聚会后的昏暗的日子里大喊我的名字,*所以我看起来没什么不同(而且好像并没有很多棕色的家伙在附近走来走去。这些东西)。

康拉德·卡切斯基(Konrad Karczewski) 给了我一个“释放数据”按钮,但是当我问人们是否要发布其数据集时,结果却参差不齐。 一些演示者愿意通过电子邮件将数据发送给我,但是由于我没有刷新徽章,所以我很好奇他们为什么愿意提供这种方法,而不是将其发布给数以百万计的 other 陌生人!

细节:

本节将主要讨论进化论和种群基因组学类别的演讲和海报。 我可以对这些谈话发表评论,因为我去过他们,而对海报则因为我多次看过它们。 要注意的一件事是,许多海报和一些演讲是在已经在发行(预印本或已经出版)的纸上进行的。 我不会涉及太多。 我已经审查/链接到大多数。

–从去年春天开始参与胎儿全基因组测序的一个人说,这里的主要成本将是测序。 他还充满信心,他们可以将测序工作从18周前移到更远的位置(例如,在样品收集和分析周转方面)。

–关于结构变体等的讨论很多,但是对于高通量测序方法,我们仍然没有。 实际上,我参加了CNV演讲,主持人介绍了一些RFLP结果! 他指出,现实情况是,出于临床目的,高通量不足以区分3对4对5拷贝的可行性或准确性。

–我没有太多的CNV内容,这些内容会重复CNV的SNP结果。 例如,用CNV概括了地理精细结构的海报。 这对于第一家酒吧来说还可以,但是一遍又一遍地做似乎是没有必要的。

–西蒙·格雷维尔(Simon Gravel)有一些很棒的东西 软件.

卢卡·帕加尼(Luca Pagani) 对...有信心 滚下的埃塞俄比亚掺和量估算值。 他现在正在迁移到埃塞俄比亚的整个基因组,并计划对该问题进行后续跟踪(他自己的方法与 滚下).

–将东北非洲人口与南部非洲的Khoisan联系起来的传闻论文(即,我已经听过几年的论文)最终将很快出版。 至少那是我被告知的……正如我所指出的,这个结果已经存在很长时间了,但是还没有人发表。 基本上,这个小组有一些来自肯尼亚的库希族语样本,看起来像是埃塞俄比亚人对安达曼岛民的类比(或尽可能接近)。

–我们很快就会在Afrikaner基因组学上看到一些东西。 没有明确告诉我,但这很明显。

——由数百家创建、维护和提供物联网(IoT)全球开放标准的公司所组成的 尼尔森集团 仍在进行高海拔适应他们没有看到硬扫。 当然,我没有得到这些是否是旧变体的确认,但是看起来许多初级的东西似乎没有能力检测第一组中的任何东西。 和往常一样,他们要有所作为。

–谈到尼尔森集团, 梅利莎·威尔逊·塞雷斯(Melissa Wilson Sayres) 对Y染色体谱系进行选择纯化的工作对我来说很有说服力。 基本上,有效的种群差异(例如,一夫多妻制)无法解释Y谱系的较低多样性(他们进行了模拟)。 幸运的是,对于系统学家而言,这不会影响Y树的效用(积极选择会,但是这并不是她在说的)。 无论是不是赛勒斯的谈话,我都有些困惑,但是这些结果可能解释了mtDNA与Y谱系之间的融合不一致(前者具有更深的融合)。

–另外,来自的艾米·戈德堡(Amy Goldberg) 诺亚·罗森伯格(Noah Rosenberg)的实验室提供了一些理论研究成果,这些研究表明复杂的人口统计历史会影响差异,而不是您可以推断出给定性别的平均有效人口规模。 当我看着艾米的海报时,迈克尔·哈默(Michael Hammer)实验室的某人开始问我是否喜欢他们的研究,我说可以(我写了博客),但她的理论结果也解释了我会从中看到的一些奇怪的东西。他们的实验室。

– Sriram Sankararaman在现代人类血统中张贴了有关尼安德特人掺和物的海报。 在粗略的大纲中,Reich实验室和Wall实验室似乎是一致的(以及其他人,例如Slatkin实验室的Melinda Yang)。 我们正在看到一种新的正统/范式的融合。 他们似乎大致同意 格雷厄姆·库普的猜想.

–关于东亚遗传学的东西很多,但没有什么太前沿了。 我有点失望。 一项大规模的Y和mtDNA研究确实表明在藏族高地发生了两次混合浪潮, 先验 对我来说似乎很合理。 但是我的经验法则不能打赌仍然持怀疑态度的尼尔森集团。 另一篇论文提出了缅甸人中单倍型M的深厚血统。 这很有趣,因为缅甸人在文化上可能具有一定的侵扰性,取代了星期一的人口。

–来自不列颠群岛人民的家伙出席了会议。 两点。 首先,大约40%的英格兰血统似乎是盎格鲁-撒克逊人。 其次,他们的聚类方法似乎在“凯尔特边缘地区”和苏格兰发现了更多的“微型种群”。 为什么? 我的直觉是盎格鲁-撒克逊人的扩张不是扩散过程。 相反,亨斯主义者和霍萨人的部落可能与东安吉利安海岸的当地布莱顿尼克人凯尔特人混为一谈,并迅速扩张。 以后有很大的可能性被同化(有迹象表明,阿尔弗雷德大帝的血统是被吸收到盎格鲁-撒克逊人权力结构中的布莱索尼克贵族),但是一个巨大的盎格鲁-撒克逊人/英格兰固有群体的出现是很明显的在显示的图中。 我能想到的与该论据的主要对立是,按距离隔离基因流在英格兰的地形中非常有效,而在更为崎border的边疆地区却不那么有效。

–说到远距离隔离,爱沙尼亚的遗传学家向我宣称,爱沙尼亚人和芬兰人之间的区别可能与最初的芬兰人从东部到来以及随后的分离有关。 爱沙尼亚人与拉脱维亚人进行基因交流时,他们与芬兰人分道扬across,在瑞典人到来之前,他们更加孤立。

–有一个海报(没有与主持人交谈)对一个或两个南印度人进行了全基因组分析,并指出有证据表明这些人是所有其他非非洲人的基础。 这是重申非洲古老的“南方路线”的可能性的另一种尝试。 我没有被说服,因为他们的方法没有太多细节(他们指出了多样性的估计,但是现在还不够)。

–另一个印度团体证实了很多东西 扎克 已经找到了,但补充了很多低种姓/部落的样本,这是大多数人所缺乏的。 他们断言(正确) 南亚各地的人口/种姓之间存在遗传距离,这类似于洲际差异。

–我对空间和遗传变异数据的综合感到兴奋……但是我开始意识到这是有局限性的,因为我们无法将遗传变异表示形式转移到tesseract上(因为我们无法可视化tesseracts)。 简而言之,二维或三维表示法会删除细粒度的重要信息。 现在,我们正在关注更细粒度的内容。

–显然墨西哥人和智利人高估了他们的欧洲血统。 主持人发现,他们智利人的血统中有40-45%是美洲印第安人。 我问采样问题,他们承认这可能是个问题。 他们的其他结果也是如此。 我们在这里需要更粗的数据集。 基本上,如果它是一个不同的国家/地区,就不能在该国家/地区标记饼图。

–有一幅关于将巴西人OCA2-HERC2与头发,眼睛和皮肤颜色相关联的海报。 OCA2-HERC2与肤色之间的联系不混和,欧洲人对此比较混杂,但似乎在这一人群中出现。 假设分层不是问题(我相信他们是从基因组角度看的),似乎只有当您具有特定的色素沉着基因结构时,才会对皮肤产生影响。 这是统计问题,而不是生物学问题。

–说到颜料,马克·史瑞佛(Mark Shriver)的海报将感知的,表观的和基因组的种族联系在一起。 感知意味着您如何被他人感知。 表观者正在获取身体特征并对其进行定量平均(面部特征,肤色等)。 而基因组祖先就是您所了解的。 估计祖先量子。 令人惊讶的是,人们似乎从明显的物理特征中低估了非洲的祖先(从表象到基因组祖先的分散性来看)。 这违背了民间智慧,后者认为“非洲特色占主导地位”。

–大量纠正Fst天真用法的文献。 价格实验室的一名海报建议使用似然比,如果可能的话,使用哈德森的Fst。 这以各种形式多次出现。 Fst不会死,但是会重生!

–看到一个海报,声称表亲首次婚姻使后代的期望值降低了3厘米! (这不在“进化论”和“流行基因组学”部分中,我可能应该花更多的时间研究复杂的特性等,但是您只能做很多事情)

–更多证据表明有许多人迁移到新大陆。 许多新世界基因组学。 我没有与这些主持人交谈,因为他们总是很忙。

– Spencer Wells告诉我,他们最终将很快使用Geno 2.0的结果发表论文。 他们确实有很好的人口覆盖率,尽管我希望他们可以将条形图旋转90度。 我看不懂标签。

最后, 有很多软件和很多方法。 这是我认为在未来十年内它将被一些大型公司淘汰的事情之一。 目前,实验室正在抽出软件来推断血统,相位数据等,并发挥其优势。 这一切都很好,但是在某些时候,重点将放在生物学上,而软件将是它的翅膀下的风。 我正在尝试腾出时间来使用某些软件,尽管其中许多软件尚未在线(演示者始终保证会很快上线,但是我知道这是怎么回事。)。

* 这是 不能 令人愉快的经历。

 

好吧,也许我可以帮上忙。 库普博士谈到自己与约瑟夫·皮克雷尔博士之间的合作, 霍尔丹的筛子,这是我几天前添加到我的RSS中的(您可以看到我将其推送到了我的RSS中 通知板)。 来自 “关于”:

如上所述,Haldane的《 Sieve》的大多数帖子都是相关预印本的基本描述,几乎没有评论。 所有帖子都会有评论部分,欢迎对文件进行讨论。 第二种类型的帖子将是对供稿人特别感兴趣的预印本上的详细评论。 这些帖子可以采用期刊评论的形式,也可以只是一些简短的评论。 我们希望他们能为预印本的作者提供有用的反馈。 最后,预印本的作者将发表一些帖子,在其中描述他们的工作并将其放在更广泛的背景下。

我们要求评论者记住,通过将文章提交给预印服务器,作者(通常是生物学家)迈出了不寻常的一步。 因此,应以建设性的方式表达意见,以帮助作者。

如果其他可能会有所帮助 进化/遗传博主 重新博客这个,所以我们可以把它推高 谷歌搜索 结果。 如果您用Google搜索“ Haldane's Sieve”,那么某些结果会很有趣……而且不一定是好的方法。 我确实为读者无法获得的东西而感到内lt,因此,预印本的接受程度越高,我们(如普通公众)对进化的理解就越多。

 

昨天我指出,戴维·赖希(David Reich)有一个 中度不屑一顾 对...的态度 新文 in PNAS, 古代人口结构对现代人口与远古人类共享多态性程度的影响。 这是赖希说的话:

…但是Reich认为,如果公开进行讨论,情况将会有所不同。 PNAS对尼安德特人掺和物提出质疑的论文解决了大约两年前不断发展的问题,但不是Reich和Slatkin的最新著作。 “几年来一直是一个问题。 他们对此进行工作是正确的,” Reich说。 但现在, “有点像 过时的 纸,” 他说。

下面是 尼克·帕特森,赖希的同事通过电子邮件告诉我:

当我们撰写Green等人的文章时,考虑了非洲的古代结构。 论文,我们知道这可以解释D统计量。 但是,这一假说不再是欧亚大陆尼安德特人遗传学的主要解释。 在最近的论文中对此进行了讨论 杨等。 (MBE,2012年)。 (PNAS论文未引用)。

一个使我信服的非常简单的论点是 等位基因频率 欧亚大陆的尼安德特人等位基因的光谱下降得很快。 瓶颈使频谱变得平坦,事实证明,必须将尼安德特人基因流放在非洲以外的瓶颈之后,否则频谱太平坦了。

来自Reich实验室(Sankararaman等人)的arXiv的论文正在尝试做比这更微妙的事情,并确定流程的日期。 我个人不再对将这种渗入解释为古老的结构感兴趣。 那条船开了。

当然,关于古代非洲的遗传结构的问题是非常开放的,并且仍然非常有趣。

如果尼克的解释对您来说有点神秘(他 杨等人的图2。 论文很清楚地列出了它:

让我们备份一会儿并准备好舞台。 他们在 PNAS 一篇论文声称不能拒绝欧亚人对尼安德特人的亲和力是由于古代非洲人口结构所致的模型(即,欧亚人的非洲祖先与尼安德特人的亲和力更强,也许是由于连续的基因流动所致)? 基本上,他们创建了一个具有时间维度的显式空间模型。 作者模拟了基因流的参数(及其缺乏)以及瓶颈等,发现 古老的结构很容易产生D统计量,尼安德特人掺和纸的原始作者依赖此统计量。

那么,为什么对Reich&Patterson如此不屑一顾呢? 因为杨等。 论文承认了这个问题,并提出了一种方法来测试替代方案,这些方案仅生成那些D统计量,但展现出不同的人口统计历史。 他们在Yang等人中发现了什么。 就是它 出现人口瓶颈再混合的模型最适合您在当今实际人口中看到的站点频谱。 换句话说,他们还模拟了古代结构产生等效的D统计量到混合量的情况,然后进一步探索了其他人口遗传统计量可以进一步削减替代方案的情况。 可以说,适当的后续文件 PNAS 贡献实际上已经发表 before 它。

纸上 arXiv (将发布在 PLoS遗传学)走得更远。 利用基因组中连锁不平衡的模式,他们产生了混合发生的日期。 这里的统计遗传学对偶然的读者来说有些模糊,因此对这些结果的解释可能应该以Yang等为条件。 纸,其结果更优雅且易于消化。

归根结底,戴维·赖希(David Reich)的判断并非非典型。 我个人认识的一些人,并深深地沉浸在人类基因组学中,对此并没有留下深刻的印象。 PNAS 纸。 那样的事情发生了,也没有什么可耻的。 但是Reich有一点: 更快的出版和审阅过程可以为很多人节省一些精力.

相关新闻: 迪内克斯的评论.

 

二烯 有摘要 分子生物学与进化学会2012年与人类相关的摘要。

1)请记住,这些不是论文,并且某些摘要至少可能以可识别的形式可能永远不会成为论文

2)说到 估计祖先南亚人口混合的日期:


语言学和遗传学研究表明,当今南亚几乎所有族群都来自两个高度不同的族群:与中亚人,中东人和欧洲人有关的祖先北印度人(ANI),以及与中亚人无关的祖先南印度人(ASI)印度次大陆以外的所有人口。 据估计,ANI和ASI与一个共同祖先相距60,000万年前,但是ANI-ASI混合的日期尚不清楚。 在这里,我们分析了大约60个南亚群体的数据,以估计 主要的ANI-ASI混合物发生在1,200-4,000年前。 有些混合物可能更旧-超过了我们可以使用混合链接不平衡进行查询的时间-因为它在整个次大陆都是普遍的:出现在所有讲印欧语或德拉维语的人群中,在各个等级和原始部落中都存在。 在近四千年来发生ANI-ASI混合物之后,文化转变导致广泛的内婚制,从而降低了其他混合物的比率。

要对此发表评论。 估计约1,200的大型外加剂几乎是不可能的。 从历史上看,唯一可能成为这一目标的人群是旁遮普邦(Jatts of Punjab),他们的神话来自前伊斯兰中亚最后一批入侵印度次大陆的人。 实际上,如果1,200-4,000表示一个间隔,则预期值为〜2,600年前。 大约是佛陀的时间。 这似乎太过新了,似乎没有道理。 但是……作者确实注意到可能存在较旧的混合事件。 If 他们收到的信号是印度-雅利安扩张,这似乎是合理的,因为与那段时期一样,印度东部-东印度洋平原和印度中部大部分地区的大片土地正在发展更大的一部分 阿里亚瓦尔塔.

 

多年来,在人类进化遗传学和古人类学(或更确切地说,在媒体上对话题的流行论述)中反复出现的一个问题是,“人口X是最古老的Y”的想法。 X始终是指较大集合Y中的人口,而Y是由相对边缘化或保留较旧的文化风俗定义的。 因此,例如,我看到有人说安达曼岛居民是“最古老的亚洲人口”。 为什么? 现在有一阵子的标准模式是,非非洲人来自于50到100万年前离开祖先大陆并开始多样化的非洲人。 据推测,安达曼岛民的血统可以追溯到最初的分散状态,就像欧洲人和中国人一样(修正案表明,原住民可能是早期浪潮的一部分,但仍将安达曼人列为第二浪潮)。 安达曼人被称为古代人的原因很简单:他们是亚洲最后的狩猎采集者,字面上是向外来者投掷长矛。 一个古老的 生活方式 与...混为一谈 遗传学。

非洲,the格米人,哈扎和布什曼的狩猎采集者面临的问题要大得多。 原因是这些人群特别受关注,因为他们似乎很早就与人类其他地区背道而驰了。 Y染色体和mtDNA都证实了这一点,现在对整个基因组进行的常染色体分析也证实了这一点。 换句话说,他们是 基础 对人类。 我相信这有一定的误导性。 随着 班图扩展 非洲许多遗传多样性消失了。 狩猎采集者看起来特别长,而且 因为他们所有的亲戚都走了,所以在系统树上分支了!

但是狩猎采集者仍然存在,他们的遗传物质已经被收集起来供科学家研究。 中的新论文 PLoS遗传学 将重点放在西方P格米人及其与班图人邻居的关系上。 西非P格米人的祖先模式,自然选择的特征以及与身材的遗传关联:

非洲被认为是过去200,000万年来现代人类的起源地,也是过去100,000万年来我们在全球分布的起源。 非洲还是环境,文化,语言和表型极端多样性的地区,居住在那里的人口显示出世界上遗传多样性最高的地区。 关于非洲观察到的表型变异的遗传基础,或者最近的局部适应和人口统计学如何影响这些模式,人们所知甚少。 在这里,我们分析了一组混血的讲班图语的农业人口和西部P格米人的狩猎-采集者种群,这些种群在身高上存在极大差异。 y格米人平均距离比其班图人邻居短约17厘米,并且在全球范围内是最短的人口。 我们的多方面方法确定了可能已成为自然选择目标的几个基因组区域,因此可能藏有西非P格米人独特的解剖学和生理学基础的变体。 特别是第XNUMX号染色体的一个区域具有强烈的自然选择,种群分化以及与高度相关的信号。 该区域还与欧洲人的身高以及已知的调节生长激素信号传导的候选基因密切相关。

这里的方法很简单。 先前的工作已经证实,给定的矮小​​侏儒的高度是由它们携带在基因组中的非矮胖祖先的数量强烈预测的。 现在,这里的作者将重点放在基因组区域上,这些区域不仅显示与相关表型的关联,而且还显示出自然选择的特征。 在这一点上,我对自然选择测试的关联性和阳性结果非常谨慎,以防万一接受其表面价值,但是我们这里有一些先例可以使其合理化。 就是说,有很强的功能原理,而且the格米人似乎在身高表型上并不独特。

让我们考虑自然选择高度的可能性。 让我着迷的是,作者认为选择是在西方和复活节P格米人的时代之后才提出的。。 为什么这很重要? 因为它可以为我们提供关于“侏儒”表型性质的更好线索,“侏儒”表型在世界各地的遗物狩猎者和采集者中很常见。 布什人,P格米人和亚洲的各种“内格里托人”很小。 有人认为这是原始人类类型,或者是自然适应,或者是对雨林的适应。 另一方面,大洋洲的人口并不少。 据我所知,亚马逊河的印第安人并不比P格米人大。 为了把我自己的牌放在桌子上,我倾向于这样的主张:当人口被赶到边缘,或者被疾病和压力所困扰时,就会出现“侏儒”式的身体计划。 现在看来,菲律宾内格里托斯人的近亲是大洋洲人,其中大多数人的身材并不小。 有一些非布什门人科伊桑人,他们的身材不小。 而且,据报道,孤立的前哨岛安达曼人的身材不小!

这里的重点是研究边缘化的狩猎采集者在告诉我们人类祖先的性质方面有局限性。 P格米人可能在许多方面 衍生 在它们的表型上,是对当代紧急情况的相对较新的适应。 以上结果甚至暗示这些种群的矮小身材可能是各种性状之间遗传相关性的副产品,并且在一个方向上进行选择会导致高度相关的响应。 我想提出一个谦虚的建议:简单地按照自己的意愿来对待这些人,而不再试图将他们置于方便的范式中。 我怀疑P格米人会因其遗传变异而成为21世纪的伟大物理学家( 迪尔德·麦克洛斯基 on 丹·麦克阿瑟(Dan MacArthur) 博客),我也不认为它们是最早的 智人。 他们就是他们。

附录: 虽然我知道 有些人 会对奇异的进化起源感到好奇 其他特征 除了非洲狩猎采集者的身高。

 

中的新文章 美国人类遗传学杂志, 从根部对人线粒体DNA树进行“哥白尼”重新评估,是开放式访问权限,因此您应该将其签出。 讨论深入到问题的核心:

在许多同事的共识支持下,经过几年的犹豫,我们得出的结论是,在深度测序革命即将来临之际……预计在接下来的数年中可能会产生成千上万的额外完整mtDNA序列几年来,我们建议的主要变化不能再推迟了:祖先而不是“系统发育的外围”,来自欧洲的现代有丝分裂基因组应该成为人类mtDNA参考系统的中心。 提议的更改不可避免地会带来一些暂时的不便。 因此,我们提供表格和软件来辅助数据转换。

我们提出的不仅仅是单单文书上的改变。 我们以托勒密的地心系统和哥白尼的日心系统为隐喻。 隐喻进一步延伸:随着对日心系统的接受,绕过了行星轨道上的表观周期,将mtDNA参考转换为祖先RSRS将导致学术上不可接受的结合,实际上所有线粒体基因组序列的一部分都得自衍生自祖先的状态,部分是祖先到派生的状态。 我们的目标是引发相对于其祖先状态与衍生状态的mtDNA突变报道方式的根本但必要的改变,从而与目前所有现代人类线粒体基因组共有共同祖先的共识建立一种智力上的凝聚力。

请注意,问题不仅限于mtDNA。 的确,在完整核基因组的更大视野中,目前通常相对于现代人类参考序列(通常是欧洲起源)进行比较,似乎值得考虑将祖先等位基因的公共参考序列作为有价值的替代品 (在所有灵长类动物中很常见),由此可以区分衍生的等位基因(在某些人群中很常见)。

也许第一代的人类分子进化遗传学可能被认为是“初稿”。 一份有用的初稿,广泛地画出了我们所理解的真理的要旨,但缺少一些必要的细节。

在一个小小的注释上,有一些理论上的原因导致mtDNA不能为古体混合物提供太多证据,这在核基因组学中是显而易见的(例如,由于有效种群数量减少而导致的变化率更高,古代血统的灭绝速度更快) 。 但是,也许现在完整的mtDNA基因组的数量在增加,我们可能会开始看到“长分支”,这反映了古代核基因组产生的推论。

 

脸是我们表型的重要方面。 面部识别非常重要,因此是许多先天性自反性认知能力之一。 借此,我的意思是您可以识别出 完形 就像您可以识别出一组三个弹珠一样。 您不必一步一步地考虑它。 特定类型的脑部伤害实际上可能导致该教师的残疾,而且少数人似乎在出生时就完全缺乏这种能力(围绝症)。 这就是为什么我一直对颅面特征的遗传结构和进化感兴趣的原因。 我很早以前就知道我女儿的色素沉着表型可能存在的范围,因为她的父母双方都已经进行了基因分型,但是当涉及到面部特征时,我们仍然坚持旧的“混合遗传”启发式方法。 揭开颅面特征的遗传结构最明显的重要性是法医。 它可能不会使素描画家失业,但是它将是有问题的目击者报告的绝佳补充。

但这不仅是取证。 这个问题与进化有关。 就形态而言,直到最近,我们自己的血统还是有很多多样性。 我特别想到的是最近在 中国尼日利亚,似乎一直坚持到全新世。 更广泛地说,在过去的10,000年中,人类整体上变得更加温和。 为什么? 我们可以寻找两个极端的答案。 首先,脆弱的人类已经取代了健壮的人类。 第二,自然选择的灵活性导致了 原位 过去约10,000年间许多人口的演变。 有趣的是,看起来许多显着性状已成为选择的目标,因此进化和种群分化.

在这里, 偏离的前10个SNP 从HGDP数据集中的总体人口系统关系树中得出:

 

SNP 染色体 最近的基因 表型
rs1834640 15 SLC24A5 皮肤色素沉着
rs260690 2 雷达 头发形态
rs10882168 10 CYP26A1 / FER1L3 ?
rs4918664 10 CYP26A1 / FER1L3 ?
rs2250072 15 SLC24A5 皮肤色素沉着
rs6583859 10 CYP26A1 / FER1L3 ?
rs2384319 2 KIF3C ?
rs6500380 16 朗普2 ?
rs4497887 2 CNTNAP5 ?
rs9809818 3 福克斯1 ?

我想说两件事。 第一的, 给定的SNP可能具有许多表型效应。 因此,就效果而言,我们“看到”的特征可能与自然选择“看到”的特征不同。 其次,在给定的变异可能影响到身体上突出的变异中脱颖而出并不令人惊讶。 有时候,您确实会去寻找黑暗的街道上的灯光。 我们知道,东西欧亚人肤色较浅似乎是由于 独立的进化事件。 换句话说,它们不是源自共同祖先。 当谈到头发的形式 雷达 地点似乎是造成东亚人独特特征的原因,并且最近已被选定。

这与颅面特征有什么关系? 简单:几十年来,物理人类学家用来对人类进行分类的粗糙和“皮肤深层”特征对于系统发育和自然选择的细节的首次近似提供了相当有益的信息。 我认为颅面部特征没有任何不同的原因。 人类变得更加轻柔,一些人口似乎在迅速变化。 我高度怀疑这是一个中立的过程。 我们非常关心面部特征,与规范的偏离可能会引起人们的注意。 如果发生了变化,要么是由于人口置换,要么是由于人口选择(可能是相关的响应,或直接的选择)。

我正是在此序言中在现代人类遗传变异研讨会上提供了马克·史里佛的摘要:

确定人脸正常范围变异的基因可以说是一些最有趣的,进化最快的基因。 但是,到目前为止,很少有工作致力于发现这些基因。 在假设导致孟德尔颅面部畸形的基因在确定正常范围的面部特征变异方面也可能很重要,并且与面部特征人群差异相关的那些基因应该经历更高水平的进化(等位基因频率变化)的假设下,我们已经采用混合映射/选择扫描方法来识别和研究直接影响面部特征的基因。 我们已经应用了自动准地标分析,偏最小二乘回归和个体基因组祖先估计的方法,以探索面部特征在两类人群(西非人和欧洲人)中的分布。 使用三个样本的混合对象(美国; N = 159,巴西人; N = 197和佛得角; N = 248),我们对父母群体中的面部变异进行了建模,并比较了从面部得出的祖先估计与基因组祖先估计。 我们还使用混合映射测试了六个选择提名的颅面候选基因对面部特征的功能影响。 在客观测试中,这六个基因中的两个(FGFR1和TRPS1)显示出对面部特征的显着影响。 此外,人类观察者对受试者和等位基因特异性面部形态之间相似性的评价对这两个基因显示出相同的效果。 另外,基于这些基因中正常范围变异的夸张的等位基因特异性形态,概括了与它们相关的颅面畸形的症状相。

我问马克这些基因的性质和特征。 该论文即将出版,但他告诉我他不认为 颅面部特征的遗传结构将与色素沉着基因一样简单或容易表征。 另一方面,据报道,他用他的标记集捕获了非洲与欧洲之间35%的差异,因此这并非微不足道,并且某些单个基因座具有足够强的效果,以至于可以用肉眼看到! 而且,鉴于现存的多样性 他认为,这些人群(色素沉着基因在非洲人和欧洲人之间常常是不相交的),他认为选择事件是最近的。

 

优秀的网站 io9 有一个 今天凑起来 这是通俗易懂的科普出版物性质的引人入胜的指标。 滞后指标。 这是去年四月发表的一篇文章的转载, 线粒体夏娃如何联系全人类并重写人类进化。 在其中,您将通过进化遗传学对人类自然历史的理解中包含特定时期的概括。 请注意,例如,关注母体传播的血统,mtDNA和Y染色体。 对家谱的引用可追溯到中期。 就细节而言,该科学基本上是正确的(或者至少是可以辩护的,最后我检查了关于用于Y染色体谱系的分子钟的有效性仍存在争议), 但它错过了如何 在过去的几年中,我们重新构筑了对人类过去的理解。 从这个意义上说,2011年到2009年之间的距离比2009年到1999年(甚至2009年和1989年!)之间的距离要大得多。 io9作品反映了范式破裂之前的时代。

我们不再说话 只是 关于非洲mtDNA夏娃和她的丈夫Y染色体亚当。 我将有意识地避免使用“革命”一词,因为肯定会保留旧故事的大致轮廓。 相反,由于我们不愿意这样做,似乎我们对某些笔触变得有点大胆,并且在边缘处消除了迷人而微妙的景观元素。 有 面包屑,以及其他各种 乌加斯布加斯。 绘画还没有完成。 因此,除了令人着迷的事实之外,我们无法真正得出关于“这意味着什么”的任何结论。

附录: 评论中的某人观察到一个关于夏娃在故事中的描写:“她对一个东非人来说真是太苍白了。” 从优点上说是对的,但逻辑有点愚蠢。 为什么我们确切地认为大约150,000万年前的人们看起来像现代的东非人? 大约35,000年前的欧洲人很可能看起来不像 达丽尔汉纳.

 

我已经在博客上发表了 遗传基因 of 海拔 适应 前。 世界上似乎有8,000个人口受到非常强烈的自然选择,导致生理差异,以应对人类的缺氧趋势。 其中两个是相对知名的,即藏族和安第斯山脉的土著人民。 但是埃塞俄比亚的高地居民没有得到很好的研究,也没有得到足够的重视。 但是,埃塞俄比亚的首都亚的斯亚贝巴海拔却近XNUMX英尺!

此现象的另一个有趣方面是,看起来这三个总体对适应性压力的反应不同。 它们的生理反应各不相同。 而且,最近在基因组学方面的研究表明,尽管亚洲和美洲人口之间存在相似之处,但也存在差异。 这说明了趋同的进化原理,其中不同的群体通过不同的方法接近相同的表型最优值。 据我所知,没有对非洲的例子进行过多的调查。 到现在。 一份新的临时文件 基因组生物学 出来了 埃塞俄比亚高原对高海拔地区的遗传适应:

我们重点介绍了几个参与埃塞俄比亚高海拔适应的候选基因,包括CBARA1,VAV3,ARNT2和THRB。 尽管大多数这些基因在以前的高海拔藏族或安第斯族人群样本研究中尚未发现,但是其中两个基因(THRB和ARNT2)在HIF-1途径中起作用,该途径与以前在藏族中报道的工作有关。和安第斯研究。 这些综合结果表明,由于在埃塞俄比亚的高海拔阿姆哈拉(Amhara)人群中趋于一致的进化,因此对高原的适应独立出现。

对我而言,这篇论文的主要缺点是它没有 强调这种适应的进化历史。 在本文中,作者将Amhara(高地人口)与附近的低地人口进行了比较。 但是没有探索 人口结构的性质 以及它如何影响适应弧。 这些是非常古老的改编吗? 还是新的? 似乎人类素已经在埃塞俄比亚居住了几百万年。 如果是这样的话,那么从远古时代开始就已经适应了更高的海拔。 但是,如果这些修改是新的呢?

更明确地说,埃塞俄比亚人可以被建模为阿拉伯人口与东非土著人口的复合体。 如果这是最近的一次真正的外来事件,则可以通过单倍型结构确定适应性变体是否源自古代非洲遗传变异,或者它们是否是新突变。 看来本文是迈出良好的第一步,但这里还有更多值得一看的地方……。

引文: 基因组生物学, doi:10.1186/gb-2012-13-1-r1

图片来源: 维基百科上的数据

 

二烯麻菊 都对一篇新论文发表了评论,该论文研究了西班牙新石器时代遗迹中乳糖酶持续存在的可能性,但我想我也要对此发表评论。 该文件是: 在新石器时代的西南欧洲,乳糖酶持续性的患病率较低。 该位置位于现代巴斯克自治区的边缘,而时间范围是公元前3000年左右。 表3显示了主要结果:

乳糖酶的持久性是一个主要特征。 这意味着任何具有至少一个T等位基因拷贝的个体都是持久性的。 正如Maju所指出的,这里的独特之处在于基因型是 不在哈迪-温伯格平衡中。 具体而言,纯合子过多。 使用SJAPL位置作为潜在的随机交配场景,您应该期望〜7个T / C基因型,而不是2。有趣的是,Longar位置中的持久个体也是纯合子。


HWE做一些假设。 例如,没有选择,迁移,突变或分类交配。 与HWE的偏离暗示了其中的一种动态。 这里的样本量很小,但是偏差是不容忽视的。 回想乳糖酶的持久性具有主要的遗传模式。 如果正为您选择特质,则只需一个副本。 如果选择,纯合子的富集是出乎意料的 原位 在这里发生。 不能排除一个人正在观察两个不同种群的混合。 一代人的随机交配会产生HWE,但是当种群在现实情况下杂交时,这并不总是一个合理的假设。 而是,交配交配往往持续了几代人,减缓了人口子结构的减少。

在这种情况下回避猜测,我们能说些什么? 首先, LCT 基因座具有较大的突变靶标。 乳糖酶持久性的特征是由于整个旧世界的不同突变事件而多次出现的。 但是,似乎确实有一个特定的变体,它可以从 西班牙飞往印度北部。 有一些 旁证 该等位基因起源于欧亚大陆中部,但目前其模态频率出现在北欧,斯堪的纳维亚半岛和德国。 该突变周围的基因组区域的特征是非常长的单倍型。 作为人类基因组中自然选择的候选基因,它是最确定的基因座之一。 现在有大量的古代DNA证据表明,在过去约5,000年左右的时间里,欧洲的乳糖酶持久性是一个特征。 在现代巴斯克人中,等位基因的频率为66%。

对我而言,关键问题是在每种特定情况下,都应分拆迁移和选择的角色。 -13910T的频率似乎并不正确 LCT 巴斯克和旁遮普邦的等位基因反映了近来共同祖先的出现频率。 这意味着自然选择正在这个地方发挥作用。 另一方面,在巴斯克语和旁遮普语中都存在的单倍型很可能是从一组共同的个体中衍生而来的,这意味着存在一条族谱链,将这两个非常不同且相距遥远的欧亚人口联系在一起。 因此,我们可以潜在地推断出迁移在传播独特等位基因方面的力量。 我们经常将选择与家谱信息区分开来,因为选择常常使信号失真。 但是,家谱可能是不同自然选择事件分布的核心。 LCT 轨迹。

总体而言,我想说的是古代DNA的结果是无序且使简单的优雅模型模糊不清。 人们希望并假设,随着这一领域中样本数量的增加,随着新范例的形成,我们将开始看到更多的清晰度。

引文: 欧洲人类遗传学杂志, 10.1038 / ejhg.2011.254

 

在不久的将来,我将分析一个人的基因型,其中所有四个祖父母都已被分型。但这让我开始思考自己的处境: 有什么办法可以“重建”我自己的祖父母吗? 他们都没有活着。进行打字的最简单方法是从医院获取组织样本。这并非完全难以置信,尽管在这种情况下,这些医院将是孟加拉国的医院,因此他们可能没有保存样本,甚至没有良好的折边记录。另一种方法是从埋葬地点提取 DNA。这不一定是可口的。但假设你这样做了,如果你可以访问法医实验室,这可能会很容易(尽管我认为大多数法医实验室使用 VNTR,而不是 SNP 芯片,所以我不知道它们是否会接触到每条染色体),我不确定质量对于更多的普通打字操作是否是最佳的,特别是对于可能被很多细菌。

对我来说,最简单的选择就是看亲戚。我的每个祖父母碰巧都有兄弟姐妹,因此有很多亲戚与每个感兴趣的人相关。我也有很多表兄弟姐妹,因此将所有基因型集中在一起并使用谱系信息可以确定哪些染色体片段可能来自特定的祖父母。举个具体的例子,我母亲有一个表姐,和她关系很亲近。通过输入我的母亲和她的表弟 人们可以推断,两个人共享的部分来自共同的外祖父母。 当然存在一个问题,表兄弟姐妹的相关系数只有1/8,所以会丢失很多信息。但是,如果你有很多表兄弟姐妹,你可能可以更好地重建基因型。

 

但如果你没有这些怎么办?我想出了一个疯狂的想法,我想把它扔出去看看它有多疯狂。从您(没有祖父母信息的个人)的角度来看,问题在于,对于您的母亲或您的父亲,您不知道哪个同源染色体来自哪个父母(您的祖父母,他们的父母)。碰巧的是,每个人都有一个父亲和一个母亲。 因此,如果您可以将一个染色体区域指定为来自男性,将另一个染色体区域指定为来自女性,那么你就可以重建你祖父母的一些基因型,因为你知道他们的性别。你怎样才能做出这个决定呢?

基因组印记。这是一种现象,来自给定父母(通常是特定性别)的基因被表达,而其他性别的基因被抑制(通常表现为甲基化或缺乏甲基化)。因此,如果你有一个基因 A,如果从父本遗传,该基因通常会表达;如果从母本遗传,则该基因通常会受到抑制,那么该基因在染色体区域内的状态可以成为性别的“标签”。起源的父母。有了足够多的印记基因,您就可以根据起源性别创建个体基因组的镶嵌图。显然,不同性别的基因组区域来自不同的父母。如果你有足够多的这两个父母的孩子,你应该能够推断出这些个体的整个基因组。

这可能行不通的一个重要原因是人类基因组中没有足够的印记基因。但读者们怎么看呢?

 


Zinedine Zidane,以 卡拜尔

里面有一篇新论文 PLoS遗传学 其目的是更详细地描述北非人口的血统特征。这个很重要。这 HGDP数据集 确实有北非人口 莫扎比人,但仅用一个群体代表数亿人并不理想。这篇新论文的第一作者是 Brenna Henn,她也是另一篇论文的第一作者 具有多样化的非洲数据集。重要的 该数据已发布在网上。 不幸的是,尽管大多数人群没有太多标记。这本身并不是一个问题,但当尝试将其与其他数据集结合时,它就变得很重要。如果您将标记限制为跨两个数据集相交的标记,您就会开始将它们细化很多,直到它们变得无用。尽管论文的结果值得一谈, 作者声称他们将把 在线数据。这很重要,因为他们使用了大量标记,因此交叉点会很好(例如,我可以设想在不久的将来探索北非人和 IBS 伊比利亚样本之间的关系)。

至于纸张本身, 北非人的基因组祖先支持从非洲返回非洲的迁徙:

北非和邻近地区之间拟议的迁徙包括来自近东的旧石器时代基因流动、1,400 年前阿拉伯人在整个北非的迁徙 (ya) 以及来自撒哈拉以南非洲的奴隶跨撒哈拉运输。历史记录、考古学以及线粒体和 Y 染色体 DNA 已被整合起来支持一种或另一种理论,但关于北非人口的整体遗传背景或其起源和扩张几乎没有达成共识。我们使用七个人群基因组中约 730,000 个单核苷酸多态性来描述北非的遗传变异模式。我们观察到两种截然不同、相反的血统梯度:从东到西,可能是北非本土血统的增加,而从东到西,可能是近东阿拉伯血统的减少。北非土著血统在柏柏尔人中可能更为常见,并且似乎与非洲以外的人群关系最为密切,但马格里布人与近东/欧洲人之间的分歧可能早于全新世(>12,000年)。我们还发现撒哈拉以南非洲血统的显着特征在人群中差异很大。这些撒哈拉以南地区的血统似乎是最近才传入北非人口的,可追溯到约 1,200 年前的摩洛哥南部和约 750 年前的埃及,可能反映了这一时期发生的跨撒哈拉奴隶贸易的模式。

这里的模型概要很简单:

– 公元前 10,000 年以上,西欧亚裔人口迁徙穿过地中海南部边缘(马格里布)

– 后来被后来的西亚移民(近东)所覆盖

– 这里的第三个主要元素似乎是撒哈拉以南非洲的混合物,这些作者声称这是相当新的(后罗马)

本博客的读者会熟悉其中使用的两种方法。他们使用 ADMIXTURE 生成条形图,在给定 K 个组件的情况下,对假定的祖先组件进行分级。其次,他们还使用 PCA 在平面上可视化样本内最大的遗传变异成分。

[nggallery ID = 33]

当您“向上移动”K 时,您会注意到马格里布人与近东的卡塔尔人“分裂”。这得到了 PCA 的支持,这表明近东人和欧洲人与马格里比人之间存在一定的差异。作者指出,这个维度与撒哈拉以南非洲与欧亚大陆的组成部分正交。这表明,假定的马格里布成分很可能是“走出非洲”人群的一部分,而不是简单地经历了与西欧亚人的持续基因流动的非洲人群。

他们还估计了 Fst,这是一种划分群体内部和群体之间遗传变异的统计数据。使用 HGDP SNP 数据,撒哈拉以南非洲人和欧洲人之间的价值约为 0.15,欧洲人和东亚人之间的价值约为 0.10。他们使用托斯卡纳人和卡塔尔人作为欧洲和西亚的参考资料,对照东西向沿线的北非人口,估计 Fsts 在 ~0.03 到 ~0.06 之间。较高的最终值来自与近东元素混合较少的人群,彩色多边形说明了 ADMIXTURE Fsts 生成的域 推断 祖传成分。您还可以在图表中看到估计的背离时间。我不会深入讨论模型中的假设,但作者确实指出,距今约 12,000 年。似乎是 下限 估计马格布雷比人何时与其他西欧亚人分道扬镳。这很重要,因为它早于农业。

本文概述的最后一组方法在更细粒度的基因组规模上研究祖先。在左侧,您可以看到一个图,其中每个水平条代表一个个体的 1 号染色体(在一组北非人中)。该条中的每种颜色都表示祖先的一个组成部分(黑色除外,它们是着丝粒)。这类信息很重要,因为说某人有 50% X 和 50% Y 的概括信息,以至于忽略了它。中欧婚姻的第一代产物将与各自人口中的维吾尔人拥有相同的祖先比例。但基因组祖先的精细绘图看起来会非常不同, 因为混合物的历史非常不同。

论文中有很多推论,我不会一一阐述。相反,让我专注于这一断言:

考虑到假定的近期混合物(图 1)后,本土马格里布成分(基于 k) 据估计,与近东/欧洲人的差异在 18-38 基亚之间 (图 3),在 Ne 和 k 值范围内。因此,我们认为,马格里布人的祖先在全新世之前就与近东/欧洲人分离,并且马格里布人并不代表来自近东的农牧民的大规模扩散。

从表面上看,这并非难以置信。与其他西欧亚群体相比,莫扎比特 HGDP 样本中的血统情态成分往往具有相对较高的 Fst。我想知道这是否是由于古代撒哈拉以南非洲的混合物产生了一种特殊的稳定杂交,但这些结果表明该成分并不比其他西欧亚人更接近。 我感到困惑和怀疑的是不同论文产生的分歧时间范围,这似乎有些难以置信 在一起.

有论文认为东亚人与欧洲人分离约距今 25,000 年。这与马格里布人和西欧亚人之间的差异在同一范围内,但马格里布遗传距离(Fst)约为马格里布人的 1/2。此外,这些结果将 20-40,000 年范围内许多现存非非洲谱系的分离“聚集”在一起,这意味着“走出非洲”事件之后的分化非常迅速,如果该事件确实发生了约 50,000 年几年前(至少对于大多数欧亚人来说,甚至假设澳大利亚原住民源自早期浪潮的修订模型)。一次一个任何给定的分歧估计可能大体上是合理的, 但文献在这个问题上并不是特别连贯,而且在考古学上常常显得难以置信。

引文: Henn BM、Botigué LR、Gravel S、Wang W、Brisbin A 等。 2012 年北非人的基因组祖先支持返回非洲的迁徙。 PLoS Genet 8(1):e1002397。 doi:10.1371/journal.pgen.1002397

图片来源: 拉斐尔·拉贝

 


人的颅骨能力增加,礼貌 卢克·乔斯汀(Luke Jostins)


几年前,剑桥大学桑格研究所(Sanger Institute)的一位统计遗传学家, 卢克·乔斯汀(Luke Jostins),发布了 上图 使用化石的人源颅骨能力数据( 人类血统)。 如您所见,直到现在为止〜250,000年之前,颅骨容量都在逐渐增加,然后迅速增加。 我还应该指出,根据我对经验数据的了解, 人的平均颅骨容量达到峰值 末次盛冰期. 我们的全球洞察力 大脑一直在萎缩,甚至相对于我们的体型(我们不像冰河时代那样大)。 但这既不是这里也不是那里。 在评论乔斯汀斯 观察:

上面的数据包括所有已知的Homo头骨,但是如果排除24个尼安德特人,结果不会改变。 实际上,如果排除智人但保留尼安德特人,您会看到相同的结果。 趋势是泛人的,并不局限于特定的血统……。


换句话说: 世俗 我们沿袭的颅骨能力的增长可以追溯到过去的数百万年,并且也横向转移到“侧支”(使用我们的特定末端节点, 智人,作为参考)。 这就是为什么我经常争辩说 人类在某种程度上是不可避免的。 就人类而言,我不是说 智人,是非洲人种的一部分的后代,它们在现在之前已经发展了大约100,000年,但是聪明而有文化的人种不可避免地会构成技术文明。 卢克·乔斯汀斯(Luke Jostins)观察到,人参家族树不同分支上的平行趋势向我表明,我们的血统不是 特别,但简单地 第一。 就是说,如果非洲人的行为在距今约100,000年之前被外星人灭绝,那么在某些时候类似于 智人 文化生产的创造力和快速性最终将出现(很可能以后,但可能更早!)。

这并不意味着我认为人类在地球上是不可避免的。 对于大多数 这个星球生命的历史是单细胞的。 我并不认为地球上的生命可能由于复杂生物出现之前的天文学事件而达到其“出售”日期的说法是不可信的(实际上,据我所知生命即将结束〜未来十亿年 由于Sol的能源产量持续增长,而不是在Sol变成红色巨人的将来约4亿年。 但是,一旦出现复杂的生物 看来,进一步的复杂性是不可避免的。 这是理查德·道金斯(Richard Dawkins)在 祖先的故事 仅基于描述性记录。 但是,复杂生物的出现是否必然带来了技术物种的进化? 我不这么认为。 它花费了500亿年的时间(似乎没有形成煤炭资源) 亿万年前 在人类之前被窃听)。 如果有足够的时间,显然一个技术物种将会进化(例如,将评估时间延长至1万亿年),但请注意,地球只有约5亿年。 智人 在该间隔的最后20%到达现场。

在这里,我假设至少要在5亿年的时间跨度内发生两个不太可能或不可避免的事件,这些事件将导致一种高科技和文化物种:

–多细胞生命的出现

–血统倾向的出现 智人

一个 智人 在非洲以外的地区发展和壮大我怀疑,在这个星球上,某种技术文明的形式变得不可避免。 我们在自己更新后的短时期中看到了并行性。 在过去的10,000年中,多个人类社会从狩猎采集者转变为农业主义者。 新世界文明的经验尤其表明,人类的普遍趋势是真实的。 不仅是“改变游戏规则”的文化形式,例如农业和 文化 在全新世期间独立发明,但它们是 不能 是在较早的间冰期之间发明的(至少有可能)。


胡夫,尼古丁,奥古斯都和拿破仑

为什么不? 好吧,考虑一下 旧石器时代的文化风度,这可能会持续数十万年! 我怀疑其中有些是由于生物学。 但是,即使在全新世时期,我们也确实意识到随着时间的流逝,文化变革的发展速度越来越快(即,至少文化变革一直在加速,加速的速度本身可能还在增加!)。 考虑到古埃及的文明至少跨越了2,000年。 尽管存在明显的差异,但古王国埃及与亚述和波斯征服之前的最后一个王朝之间的连续性对我们来说非常明显,而对古埃及人来说也很明显。 相比之下,距奥古斯都罗马有2,000年的历史。 这里的连续性也很清楚(例如罗马字母),但是文化上的变化也很清楚(如果您想说早期和现代时期是 自成一格,从奥古斯都罗马到新古典文艺复兴时期的1,500年时间与古代埃及参考文献*相比仍然形成了鲜明的对比,尽管后者采用了前者的形式。

到目前为止,我专注于时间的垂直维度。 但是在人参家族树的各个分支上也有横向施肥。 这 穴居人元素的混合物 进入非非洲国家已经开始 最近被广泛接受得益于考古学和基因组学在古代DNA领域的融合。 即使人们拒绝了尼安德特人掺和物的可行性,仍然必须解决这些结果之谜。 需要脱离一个简单的模型 来自少数非洲人口的人类最近的独家血统。 也有与其他混合的提示 太平洋边缘的古风非洲内部.

直到最近,人们普遍认为现代人类是我们自己的血统, 有一些特殊的天才 这使它可以扫地并熄灭我们的堂兄。 卢克·乔斯汀斯(Luke Jostins)的情节的定性结果是已知的。 其他人参家族谱系也表现出脑病。 实际上,一个奇怪的事实是,尼安德特人平均具有比解剖学上现代的人更大的颅骨能力。 但是现实仍然是 我们更换了它们, ERGO,我们必须有一个特殊的天才。 直到尼安德特人与现代人类之间没有区别 在涉及必要的基因座上 (如果还不够的话)这种特质是使“我们”与众不同的主要原因的语言能力。 但是现在我把“我们”放在引号中。 数据确实表明,在过去的100,000年中,非洲或近非洲人口中非非洲人的血统急剧下降。 但是,“古老的混合物”并非微不足道。 什么是 他们 ,那恭喜你, uswe 变成了什么 他们 可能已经。

两个多世纪以来,西方一直在争论 单基因和多基因。 前者是人类从一对或一对人口中衍生的地位(前者是标准亚伯拉罕模型的直接概括)。 后者的立场是,不同种族的人类起源于不同的原始人类,或者,对于基督教多元论者来说,只有欧洲人从亚当和夏娃世袭而来(其他种族是“非Adamic”的)。 这种冲突的回响一直持续到现在。 “走出非洲”的许多早期游击队员声称,多区域主义的拥护者是后来的多基因主义者(并非没有充分的正当理由)。 一些案例).

但是,一元论与多元论之间的冲突并不是现实在我们眼前揭露的恰当框架。 在现代人类的创造中,我们看到的是一种具有多元遗传学风味的单基因基础。 在过去的200,000年中,现代人类从很大程度上从非洲人口的增长而来。 但是在边缘,还有其他的祖先线和细丝,它们将不同的种群与谱系联系起来,这些谱系从主干中分离出的时间很早。 在我们自己的年龄之前,至少有几十万年,也许是一百万年。 今天,基因组学使我们能够利用统计能力从不稳定的“走出非洲”的叙述中提取出这些不一致的信号,但是如果在不久的将来我们偶然发现越来越多的“长分支”,而引人注目的数量较少,我将不会感到惊讶。 掺混物可能是人参家族中一个古老而持久的故事,此时只有最近的大量分离和杂交才引起人们的注意和好奇。

这是什么意思呢? 为何我将近代自然历史与相对较近的古人类学相提并论呢? 让我们从两个命题开始:

–尽管有一定的前提条件,技术文明是不可避免的,但它是不可避免的,极端复杂的情感的外在表现。 智人 在合理的时间内将其概率提高到了约1.0)

–极端复杂的情感并非是特定排他性的垄断,而该排他性是来自特定前辈的天才

约翰法雷尔 指出罗马天主教会在人类起源的新模式中可能存在的问题。 但是天主教只是一种更普遍的人类思想的反映。 世俗的或虚构的后裔群体在人类的想象中占了很大比重。 这 进化论 因为这不是很难解释的,但是我们在许多不同的领域中选择了亲属关系的重要性。 像进化一样,人类的文化形式只是简单地利用已经存在的东西,并对其进行改造和修改以使其具有品味。

那人类为什么如此特别? 人类为什么拥有不可剥夺的权利? 我们中的许多人可能不同意我们是亚当夏娃的后裔的主张,因此我们被赋予了永恒灵魂的神圣恩典。 但是,在许多不同意罗马天主教会主张的思想家的假设中可以找到这种逻辑的暗示。 最近我听了 雪莉特克 反对依赖“机器人同伴”,这些同伴可以向那些缺乏同伴关系的人(例如年老体弱的人)展现人类情感的真实性。 尽管Turkles的论点并非没有根据,但她的某些论点的形式是“他们不是我们,他们不是真实的,我们是真实的。 那很重要。” 确实是这样 现在,但是会永远这样吗? 这个“他们”和这个“我们”是谁? “真实”是什么意思? 情绪是一种神秘的人类特质,会被那些从亚当,字面或隐喻中脱颖而出的人所掌握吗?

If 出现了非人类情感成为现实的情况,它们是否具有与我们相同的权利? 尽管从数量上来说,差异是根本的,但我认为我们知道答案: 他们 ,那恭喜你, 他们的方式人类 ,那恭喜你,,而不是他们祖先的方式。 在当今人类生命之树中,具有不同血统的混合物的“污点”并没有导致 更新我们对人权的理解。 那是因为我们都是亚当的孩子,或是亚当的后裔 线粒体前夕,是我们理解人类权利以及人类是什么之后的事实依据。 这是一种特殊的生态位,是一种存在的方式,而不是谁从某个特定的人或某些人的生物学关系中堕落而来。

*可以追溯到公元6世纪,古王国埃及的文化基础一直以活化石的形式存在于Philae的神庙中! 因此,有3,500年的文献连续性。

图片来源:来自的所有公共领域图片 Wikpedia

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”