Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
人类进化遗传学

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

可能在KITL基因座上具有等位基因的个人(来源:David Shankbone)

个体上的多态 基特尔 轨迹? (信用: 大卫·香克伯(David Shankbone)

色素沉着是后基因组时代为数不多的复杂特征之一,几乎可以完全表征。 事后看来,原因很明显。 追溯到1950年代(请参见 人口遗传学)有使用人类谱系的推论,表明正常的人类变异对该特征的影响少于十个影响较大的基因。 换句话说, 这是一个多基因特征,但并非如此。 这意味着控制变异的等位基因将具有相当大的响应,并且完全在统计遗传技术的能力范围内以捕获其效应。

我应该谨慎对待这个问题。 直到最近中期(见 突变体)尚未完全了解此特征的细节。 如今,不同人群的继承性质 is 众所周知, εξελικτική 历史 就这些事情而言,也以相当清楚的方式众所周知。 50,000英尺的角度是这样的: 数百万年前,我们失去了皮毛,出现了黑皮肤,而我们离开非洲大约50,000年前,我们中的许多人就失去了色素沉着。 (实际上,北部纬度的人种似乎在 他们的色素沉着)


A 在新纸 手机 进一步细化了细节,这可能是此过程的结果。 成为一个 手机 论文中有很多灵巧的分子技术来阐明其机理途径。 但是我会掩饰这一点,因为它既不是我的专长,也不是我的重点。 该论文的摘要是它表明 p53,是一个相对众所周知的抑癌基因,似乎与反应元件有相互作用(该基因产物在许多区域结合,这是一个 转录因子基特尔 轨迹。 该基因座是众所周知的,部分原因是它与色素的变化有关。 人与鱼。 所以 基特尔 是跨越子生区的普遍的色素沉着途径之一。 欧洲人和东亚人都有一些衍生出的变体,它们与皮肤较浅有关,尽管在两种情况下都具有多态性(它尚未席卷固定)。

适应的工资? (图片来源:Hoggarazzi摄影)

适应的工资? (信用: Hoggarazzi摄影)

但这是一个 手机 因此,必须有一个不仅是进化的,更具体和实用的角度。 还有。 事实证明,在单核苷酸多态性突变 p53 反应元件导致上调的趋势 基特尔 和雄性生殖系增殖。 当涉及到肿瘤的发生,特别是睾丸癌时,后者就显得尤为重要。 这种癌症是似乎没有体细胞突变的一种 p53 本身。 此外,作者观察到,欧洲裔人的睾丸癌发病率比非裔美国人高4-5倍。 而且,大概是 基特尔 与黑色素生成增加有关。 这组作者认为,由于欧洲人皮肤较白,由于在其他基因座进行选种,因此在 基特尔 (增加了晒黑的反应)。 有证据表明在该基因座有选择(长单倍型和纯合性增加),所以这并不是一个不合理的推测,尽管功能等位基因丧失的频率很高,表明该模型很可能是复杂的。

我不知道这个故事的细节是否正确(尽管我对此很感兴趣 变异 基特尔 与其他生物体的癌症有关)。 但这说明了由于人类迁出非洲而导致的快速进化变化的可能后果之一: 由于多效性而产生有害的副作用。 换句话说,当您修改种群的基因组架构时,在优化功能的一个方面时,您将不得不权衡取舍。 基因不仅仅具有一种后果,而且还包含在无数种途径中。 随着时间的推移,进化理论预测会出现缓慢的重新平衡,因为修饰基因的出现掩盖了有害的副作用。 但是在那之前,我们将尽力承担适应的重担。

引文: Zeron-Medina,Jorge等。 “ KIT配体中的多态性p53反应元件会影响癌症风险,并且已经过自然选择。” 细胞155.2(2013):410-422。

 

软服务

的特点 乳糖酶持久性 (乳糖耐量)可能是人类自然选择中较好的教科书实例之一。 造成这种情况的原因可能有两个。 有一个非常 选择的有力标志 在已知与该性状相关的特定基因中 人口众多。 而且,有一个非常引人注目的 历史叙事 这很好地解释了过去约5,000年间,这些人群在这种特殊的功能变化上如何进行如此强烈的选择。 但是阐明这种遗传适应的起源和传播也很有趣,因为它看起来好像是 不是一个单一的事件。 与阿拉伯人,丹麦人和马赛人不同的人群似乎在感兴趣的基因座周围携带不同的等位基因,从而赋予了消化牛奶的能力。 这说明了选择压力具有可行的目标时,在基因组水平上会有快速响应的事实。 在哺乳动物成熟的某个时刻,产生乳糖酶的调节途径关闭。 然而,在众多人群中,这种逐渐关闭的过程已被短路。

在我阅读时,与这种适应有关的各种回应带给了我 埃塞俄比亚乳糖酶持久性等位基因的多样性–软选择性扫描的签名,在最新一期中 美国人类遗传学杂志:

乳糖酶在人类中成年后的持续表达是最近的一种遗传适应方法,它允许在断奶后食用其他哺乳动物的乳汁。 在欧洲,上游区域中的一个单一等位基因(−13910 * T,rs4988235)可作为乳糖酶基因LCT表达的增强子,负责乳糖酶的持久性,并且在过去5,000年中似乎一直处于强烈的方向选择之下,通过在扩展单倍型上广泛存在该等位基因来证明。 在非洲和中东,情况更加复杂,同一LCT增强子区域中的至少三个其他等位基因(−13907 * G,rs41525747; −13915 * G,rs41380347; −14010 * C,rs145946881)可能导致持续的乳糖酶表达。 在这里,我们在超过350个个体的大型耐乳糖试验埃塞俄比亚队列中研究了LCT增强子序列。 我们显示,进一步的SNP,-14009T> G(ss 820486563)与乳糖二酯状态显着相关,并且体外功能测试证实,-14009 * G等位基因也增加了LCT启动子构建体的表达。 LCT增强子区域中的衍生等位基因分布在几个种族中,我们报道了乳糖消化系统中的遗传多样性要比非消化系统中的更大。 通过检查侧翼标记以控制突变和人口统计学的影响,我们从经验证据中进一步描述了: 柔和选择性扫描的特征.

就我的口味而言,在某种程度上来说,这篇论文是相当混乱的。 重要的是,他们甚至没有考虑 帕加尼等人的结果。 (在同一期刊中!)进行分析。 总体结果是,尽管在欧亚大陆和东非,乳糖酶的持久性似乎是通过“硬性”选择性扫描在人群中传播的,而在埃塞俄比亚,它可能是通过“软性”扫描传播的。 前者是单个新突变体赋予有益表型的情况。 在没有等位基因竞争者的情况下,该变异体的频率会迅速上升,基因组的侧翼区域会产生一个长的单倍型区。 在欧洲人中,这导致了周围基因组的高度均质化区域 LCT.

鉴于上述模型,埃塞俄比亚的情况有点矛盾。 似乎没有几个等位基因,而是几个正在分离。 而且,乳糖酶持久性单倍型比非持久性变体表现出更多而不是更少的遗传多样性。。 如文章中所述,可能存在针对乳糖酶持久性的强烈选择性约束。 显然,非洲之角人口中存在长期的非持续性单倍型,这说明了该样本子集的多样性降低。 相对于不利的祖先变体,在硬扫掠中单个突变的频率会增加,而在这种情况下,您会进行软扫掠,其中具有相似适应性值的替代变体的频率可能会增加。

但是所有这些都需要考虑到 帕加尼等。,这表明埃塞俄比亚最近有掺混物。 上面的讨论似乎暗示 原位 非洲之角内发生了一些选择性事件,但可能是扫荡可能是在埃塞俄比亚人的欧亚祖先中发起的(也许有些混合映射会有用吗?)。 最终,这将是一个复杂的故事。 乳糖酶的持久性是自然选择的一个很好的模型,这并没有从更大的角度出发,尽管我不太确定本文的具体特征,但草图中仍有更多细节需要填写。

 

层和层……。

还有 事实 进化。 然后有一个长期的争论 形成一种 它进行。 前者是一个已解决的问题,只剩下很少的智力。 后者是进化遗传学和进化生物学的重点。 辩论是一个古老的辩论,其历史可以追溯到19世纪,那时您遇到了像阿尔弗雷德·拉塞尔·华莱士(Alfred Russel Wallace)这样的拱门选择主义者(请参见 一切的理由)几乎与整个学术世界格格不入(例如,托马斯·亨利·赫克瑟利(Thomas Henry Huxely),“达尔文的斗牛犬”,不足以相信自然选择的力量是进化变化的推动力)。 在20世纪初进化生物学和遗传学融合之后,这一古老的分歧为更多的争议性问题埋下了种子。 它们的范围从 赖特·费舍的争议 进化遗传学的早期 中立主义者与选择主义者的辩论 1970年代(在某些情况下留下了不好的感觉)。 在斯蒂芬·杰伊·古尔德(Stephen Jay Gould)的作品中可以找到关于选择权而非随机偶然性的辩论含义的动画片视图。 进化论的结构)和理查德·道金斯(Richard Dawkins)(请参阅 祖先的故事): 进化是否会由于偶然事件而导致无限创意的分类,还是会朝着有限的理想化形式集发展,这些形式会填充可能的参数空间?*


但是,最终这些10,000英尺的辩论更多的是哲学问题,而不是科学问题。 至少在消除科学问题的争议之前,会出现平衡共识。 这只能通过出版物的积累来实现,其结果在时间上是可靠的,并且足以说服反对者。 这就是为什么Enard等人的预印本, 人类进化过程中普遍存在的积极选择的全基因组信号,引起了我的注意。 随着基因组学的兴起,人们首先被列为分析对象,因为通常可以从该物种中找到最好的数据,因此在此就不足为奇了。 相当, 鉴于过去十年对该主题的来回探索,本文的重要之处是什么?**

通过对人类基因组变异模式的更深入,更微妙的观察,该小组推断出 在过去约100,000年中,通过经典的积极选择进行适应已成为人类基因组的普遍特征。 这并不是一个简单的推断,因为在过去的十年中,随着全基因组数据集的到来,用于推断选择的群体遗传统计数据引起了很大争议(尤其是误报)。 事实上,有一个小组认为,基因组内更突出的选择力是“背景选择”,指的是由于纯化大量有害突变和邻近的链接位点而对遗传变异造成的限制。

的总和 Enard等。 就该方法而言,可能看起来很深奥,甚至不透明。 但是每个元素实际上都非常简单明了。 主要要点是 基因组内许多选择的测试都集中在非同义和同义突变变体之间的差异上。 前者是指基因组中导致氨基酸状态改变的碱基位置,而后者是指那些不同碱基仍可产生相同氨基酸的氨基酸位置(请参见第三个位置)。 在这些位置上,特定基态的取代,跨谱系的取代之间的比率是在分子水平上选择驱动的适应性的粗略度量。 同义位置的变化受否定选择的约束要少得多,而由于通过新表型增加适应性而导致的正选被认为仅是通过非同义变化发生的。 什么Enard等。 指出的是 人类基因组在特征分布上是异质的,如果不考虑其他混淆变量,而将注意力集中在此类类别上的成对差异上,可能会掩盖尝试中的动态变化。 特别是,他们认为,在同义突变替代的可能性更高的地区(即,它们在功能上受到更多限制,因此非同义变体将受到不利影响),背景选择往往会更强,这一事实掩盖了积极的选择性扫除的证据。 这导致非同义替换区域周围的中性多样性升高,而同义替换的区域受到强烈限制。 一旦校正了背景选择的威力,作者就证明了人类基因组中新的适应性变体的扫描,而这些变体以前是隐藏的。

1000个基因组数据集有两个有趣的经验发现。 首先,作者发现,积极选择倾向于 根据监管要素运作 而不是编码顺序更改。 您可能知道这是 辩论 目前在分子进化生物学领域。 第二,撒哈拉以南非洲人中没有积极选择的证据,或者该人群的背景选择更少。 我自己的直觉是,正是前者,随着环境条件的变化,整个欧亚大陆以及新世界和大洋洲的人口脉动自然导致了当地的适应。 尽管非洲的病原环境可能特别适合人源素免疫系统,因此与非非洲人相比,这种新突变给新突变带来了更高的成本。 因此,我不会立即放弃第二个想法。

关于选择力的争论将在哪里结束,这是任何人的猜测。 我也不在乎。 相反,重要的是获取工作动态的更细粒度的地图,以便我们可以更清晰地感知现实。 必须对从人推算时保持谨慎(例如,作者指出, 果蝇 基因组的编码序列成比例地丰富)。 但是由于基因组数据的不断涌现而产生的人类结果将为其他生物的可能性提供有用的概述。

引文: 人类进化过程中普遍存在的积极选择的全基因组信号

*卡通资格是由于我知道选择也是随机的。

** Voight,Benjamin F.等人。 “人类基因组中最近的阳性选择图。” PLoS生物学4.3(2006):e72。, Sabeti,Pardis C.,等。 “从单倍型结构检测人类基因组中最近的阳性选择。” 自然419.6909(2002):832-837。, Wang,Eric T.,等。 “最近推断出的达尔文人对智人的选择的全球格局。” 美国国家科学院院刊103.1(2006):135-140。, Williamson,Scott H.等人。 “定位人类基因组中最近的适应性进化。” 《公共科学图书馆·遗传学》 3.6(2007):e90。, 霍克斯,约翰等。 “人类适应性进化的最新进展。” 美国国家科学院院刊104.52(2007):20753-20758。, Pickrell,Joseph K.等人。 “全球人口样本中最近积极选择的信号。” 基因组研究19.5(2009):826-837。, Hernandez,Ryan D.等人。 “经典的选择性扫掠在最近的人类进化中是罕见的。” 科学331.6019(2011):920-924。

 

里面有两篇论文 科学 出现在Y染色体上 Y染色体测序解决了男性与女性共同祖先在时间上的差异1200撒丁岛的低通DNA测序重建了欧洲Y染色体系统发育。 我可以推荐什么 二烯 不得不说,在我看到这部令人震惊的作品之前,我不会发表评论 新科学家: 阿拉伯飞行:150年来早期人类发散。 由于标题的原因,我最初并不认为这与Y染色体有任何关系,但事实证明,该文章利用了以下发现:三个主要的非非洲单倍群体彼此迅速连续地分开,以此作为标题的钩子。 实际上,Y不仅不提供人类历史的确切记载,甚至甚至不一定告诉我们有关人类历史的信息。 这是一个标记,而不是时间机器。 重复: 特定遗传基因座的历史 不是人口的历史. 必须说。

 
• 类别: 科学 •标签: 人类进化遗传学, Y染色体 

引文: 电晕,埃里克等。 “在全球人类关系和移民背景下对疾病遗传基础的分析。” PLoS Genetics 9.5(2013):e1003447。

上图是从一篇论文中 公共科学遗传学, 全球人际关系和移民背景下疾病的遗传基础分析。 作者合成了人类基因组学的两个不同领域。 首先,有生物医学重点 全基因组关联研究 以及他们试图识别风险的方式 等位基因 对于某些疾病。 在某些情况下,这些风险等位基因非常 渗透剂,因为特定状态极有可能预测疾病表型。 但是在大多数情况下,由于2型糖尿病等高复杂性状的发生,收率升高或降低。 第二,进化基因组学领域试图重建系统进化史和种群遗传史,以便在适当的背景下构筑当代的变异模式。 在以下情况下,这是多么重要或令人感兴趣的是显而易见的 疟疾抗性基因。 由于平行的环境压力,在多个种群中已经产生了赋予抗性的等位基因。 这些种群之间的亲缘关系应该有助于您预测种群之间突变的相似性。 同时,人口遗传学理论可以为您提供关于 多种改编.

目的是为了加深对疾病发作性质的了解,并可能更有效地针对个人风险。 在图中的上方,您可以看到两种有趣的模式:2型糖尿病等位基因的风险与血统的关系以及与XNUMX型糖尿病等位基因的风险有关。 从头 突变或独立的选择性事件。 系统发育树代表了从HGDP中的> 600,0000个SNP推断出的真实关系 数据集。 风险等位基因是从文献中剔除的,并针对个人和人群进行了计算。 然后将实际人口风险与在这种特殊的系统树和正常的遗传随机漂移过程中可能发生的风险模型进行比较(请参阅 方法 有关血腥的细节!)。 您所看到的是系统发育关系(非洲人口转向更高的风险)和独立事件(皮马印第安人转向更高的风险),其中糖尿病的风险更高(红色转向)。

这种分析有各种各样的缺点。 作者受到研究中风险等位基因的限制,这肯定远没有彻底或详尽。 此外,在某些地区,他们的人口覆盖率很薄,导致在特定情况下甚至无法从其模型中榨取权力的能力也有所下降。 但让您大吃一惊的是,从高度多基因疾病(如2型糖尿病)中的风险等位基因推断出的模式甚至无法追踪您在现实世界中看到的情况。 许多南亚团体有 非常 2型糖尿病的高风险。 碰巧这些人群不在HGDP样本中。 实际上,有两位流行病学家提出了相当有见地的批评 在本文的评论中。 他们提出了许多在细节上浮现在脑海的要点。 但是他们以一种让我大吃一惊的方式结束了:

最后, 人们已经讨论了避免基于遗传风险对人群进行污名化的需要。不难想像基于该出版物的媒体公告“非洲人群中发现的糖尿病遗传风险”。 不久前,人们也对情报提出了类似的要求。 并非所有的猜测都是中立的。

碰巧的是,我来自代谢疾病风险很高的人群。 我不知道是否对这个事实感到羞耻,但我很高兴医疗专业人员开始意识到差异风险,并超越了对人的健康的粗略一统天下的理解。 由于我们分配脂肪的方式(针对相同的风险状况,我们必须更瘦一些,才能为美国人提供的BMI值对南亚人而言不太合适)。 再说一次,我不知道这是否有污名化, 但这是真实的。

因此,尽管我对以上论文中的方法存在真正的担忧, 我相信这些分析是更广泛答案的重要组成部分。 我们现在生活在抗生素革命和对细菌理论的理解时代。 这些是公共卫生投资的巨大回报。 在短期内,人类健康和预期寿命的增长将通过增加而处于边缘。 尽管我一直怀有各种怀疑态度,但最初都试图弄清人口历史与疾病之间的关系,但必须从某个地方开始。

引文: 电晕,埃里克,等。 “在全球人类关系和移民背景下对疾病遗传基础的分析。” PLoS遗传学9.5(2013):e1003447

 

有一篇很棒的论文 手机 马上, 通过选择的EDAR变体的表达对小鼠最近的人类进化进行建模。 它综合了基因组学,计算模型以及鼠标模型的有效执行,以探索人类的非病理性表型变异。 可能是由于本文的最后一个因素推动了人类进化基因组学的发展,找到了解决这一问题的方法。 手机 (当然还有“影响因素”)。

这里的重点是 雷达,您可能以前听说过的轨迹。 通过摆弄EDAR轨迹,研究人员有了 较早创建 “亚洲老鼠。” 更具体地,表现出一组表型的小鼠被称为能够将东亚人与其他人群区分开,特别是在头发形态和皮肤腺体发育方面。 更普遍地,EDAR牵涉到 外胚层组织的发育。 这是一个非常广泛的领域,因此修饰此基因座会导致许多表型变化也就不足为奇了。 上图说明了在HGDP人口中在东亚人中发现的突变的现代分布。

需要注意的一件事是,派生于东亚形式的EDAR出现在美洲印第安人人群中,这些人与东亚人在距今10,000年前(距今15至20,000年)之间的确存在分歧。 在西欧亚大陆中,您可以找到派生的东亚EDAR变体的两个种群是Hazaras和维吾尔族,这两种种群可能都是最近在东西欧亚种群之间混和的产物。 在美拉尼西亚,EDAR频率与南极混合气体相关。 在地图上没有,但也没有人知道,南亚的蒙达(奥亚)部落的人口也很低, 但不平凡,东亚EDAR的频率。 在这种情况下,它们在没有最近东亚混和物的南亚族群中是例外的。 这使人们相信蒙达族是从东南亚入侵的一部分南亚奥秘人民的后裔,那里存在着大多数南亚奥林匹亚语。

但是让我惊讶的一件事是,欧洲人口中甚至在俄罗斯人中都没有东亚EDAR。 我对这个结果感到有些困惑,因为在过去的10,000年中,西伯利亚人与欧洲人的混合生活成为了可能, 正如一些研究人员所引述的 (这不是一个晦涩的结果,它会反复出现在TreeMix中)。 第二个图显示了在过去30,000年中东亚EDAR单倍型从中推断出的区域。 作者利用数百万个带有大量参数的正向模拟对EDAR的扩展进行建模,以使其适合所实现的分布模式(有关参数,请参见此处的补充资料)。 长话短说,他们推断在目前之前约有30,000年存在一个突变,并且在选择系数的驱动下它以大约0.10的数量激增了频率(相对适应度提高10%,非常强大!)。 这是选择性扫描的最末端,可能与表征其特征的单倍型相同 SLC24A5LCT (该块较短,但由于时间深度较深而有意义)。 再次,我感到困惑的是,为什么在美洲印第安人或蒙达族中发现的这种古老等位基因在具有推定的东亚欧亚混合体的欧洲人中却不存在。 整体不适合我。 我的一个或多个假设有一个弱点。

然后是关于鼠标模型的部分。 对我来说,这方面很巧妙,尽管我不能特别评估它的技术性。 小鼠模型较早用于测试突变对EDAR的影响的条件是拷贝数发生粗略变化,从而导致蛋白质的剂量发生大量变化。 在那种情况下,表型结果是相当极端的。 在这里,他们使用“敲门”模型,在其中重新创建了特定的EDAR点突变。 他们没有发现极端的表型,而是发现老鼠的性状范围更加正常,尽管它们的头发形态变化与人类发生的变化非常吻合。 此外,外分泌腺的数量也有所变化,衍生的东亚EDAR携带者的内分泌腺数量更多(具有累加效应)。 最后,他们注意到乳腺垫面积和分支有差异。 这些都不是令人惊讶的,EDAR是一个重要的调节基因,可以塑造生物体的外围和外部。

为了仔细检查人类在小鼠模型中的相关性,他们在一大批汉族人群中进行了全基因组关联。 特定性状的相关性在他们期望的方向上。 那些具有东亚EDAR变体的人的头发更浓密,铲形门齿,外分泌腺密度更高。 可能需要注意的是,汉族人群中衍生变异的频率很高,以至于他们没有足够的纯合祖先基因型来进行统计,因此他们的比较涉及杂合子与衍生突变体以及祖先状态的副本。 。 就像欧洲人中的SLC24A5一样,在这里很难找到具有非欧洲模式变体的双重副本的具有欧洲传统的个人。

让我们回顾一下他们在这项研究中所做的所有令人敬畏的事情。 他们深入研究了EDAR周围地区的进化基因组学,认为该单倍型是在大约30,000年前的祖先变体中经过硬选择扫描而频率升高的。 并且在选择系数方面具有明显优势。 这可能是过去50,000年非非洲人基因组中自然选择的最大影响指标之一。 其次,他们使用人性化的小鼠模型来探索与东亚人这种突变变化相关的表型范围。 因此,您在一个基因座上具有很强的选择系数,并且具有与该基因座的变化相关的一系列性状。 第三,尽管该领域已有研究(即复制),但他们确认了人类特征与突变之间的相关性。 这都是一门伟大的科学,它显示了小组之间协作的力量。

本文的许多优雅之处和影响力也适用于讨论部分, 但坦率地说,这是我开始崩溃的地方。 您可以在其中了解到 纽约时报 片, 与35,000年历史的突变有关的东亚体质特征。 这里的标题指出了从这一研究领域中得出的合理重要的推论, 人类的许多显着身体特征似乎是由于在几个基因座上发生了强烈的选择事件。 除了EDAR,我还在考虑色素沉着基因座,例如SLC24A5。 如果上山褶皱有类似的东西,我也不会感到惊讶。 如果它是可见的,并且定义了种群之间的差异,那么它通常在基因组上并不琐碎。 在这种差异下通常会有一个故事。

在人类自然历史的广阔范围内,对我而言出现的问题是 我们有特质,我们有选择的基因,但是我们有很弱的故事来解释自然选择的机制和背景。 在这里,与乳糖酶持久性和疟疾抵抗力有关的基因座形成了鲜明的对比。 在这些情况下,选择的因果机制似乎相对清楚。 批评进化论的心理学家不会指责“只是这样”的讲故事领域,但是在进化基因组学的知识上更加隔离的领域也出现了同样的问题(部分原因是该领域非常新,并且在数学和计算上也很抽象)。 为了说明我在说什么,我将引用以上论文的讨论内容:

高密度的外分泌腺是关键的人类激素适应性,能够在剧烈的活动(例如长距离行走和奔跑)中进行有效的蒸发蒸腾(Carrier等,1984; Bramble和Lieberman,2004)。 370A携带者的内分泌腺密度的增加可能在温暖和潮湿的季节有利于东亚的狩猎采集者,这会阻碍蒸发蒸腾。

地质记录表明,中国在40,000至32,000年前是相对温暖和潮湿的,但在32,000至15,000年前,气候变得凉爽干燥,然后在全新世爆发之前又变暖了(Wang等,2001; Yuan等)。等(2004)。 然而,在整个这段时间里,由于夏季和冬季季风的贡献不同,中国可能仍处于相对潮湿的状态。

高湿度,特别是在夏天,可能为个体提供了季节选择性的优势,使其能够更好地激活更多的内分泌腺,从而更有效地出汗(Kuno,1956年)。 为了探索这一假设,需要更精确地选择何时何地等位基因(也许使用古老的DNA来源)以及更详细的考古和气候数据。

适应气候总是一个不错的选择。 这个假设的问题是 该等位基因分布的现代梯度与人们对热和湿度的适应性恰好相反。 另外,这种适应方式没有成本吗? 在最初的向上扫描之后,高频率发现了衍生的EDAR突变体的种群经历了令人难以置信的最后一次冰川最大值的寒冷,而像雅库特这样的群体如今已经适应了寒冷。 不仅如此,从北极到热带地区的美洲印第安人都展现出一种适应寒冷的身体形态,这是贝伦吉亚长期逗留的历史后果。

当然,作者并没有这么简单,而且有些脱节的讨论暗示了这样一个事实,即EDAR具有许多表型效应,并且可能受到多种积极的选择压力。 从表面上看,这似乎是合理的,但这种机制的复杂性似乎不适合于该基因座周围的选择信号如此干净,清晰的事实。 似乎这不是一个容易解开的故事,并且在本文中有很多关于这一事实的隐式承认。 但是在正文末尾添加了以下内容:

值得注意的是,由370A等位基因引起的大部分不可见的结构变化可能会赋予功能优势,例如外分泌腺数目增加,直接与视觉上明显的特征相关,例如 头发的表型和乳房的大小。 这创造了这样的条件,在这种条件下,伴侣的偏爱可能会迅速演变并加强更直接的竞争优势。 因此,随着时间的推移,由单一多效性突变引起的多种性状上累积的选择性作用力可能会推动370A的上升和扩散。

一个简单的结论是,最初的气候适应可能已经让位于文化/性选择适应,而西方前东亚经典(黑色和有光泽的)以及偏爱小乳房。 这个方面在 纽约时报 当然。 我会再次引用:

但是西雅图华盛顿大学的遗传学家约书亚·阿基(Joshua Akey)说,他认为该基因在东亚人群中传播的更可能原因是性选择。 粗大的头发和小的乳房是可见的性信号,如果携带者生下更多的孩子,如果男性愿意的话,这种信号很快就会变得越来越普遍。 阿基博士说,具有明显特征的基因,例如欧洲人的蓝眼睛和金发,具有很强的选择信号,而且与汗腺相比,EDAR的可见性效应更可能是自然选择的驱动力。

此处的段落含糊不清,因为该文章的作者Nick Wade不使用引号,而且我不知道什么是Akey,以及Wade对Akey的理解是什么。 例如,出于生殖偏斜的理论原因(几个男人可以生很多孩子),一般来说,性别选择通常是由女性偏爱男性表型驱动的。 我认为Akey知道这一点,所以我怀疑那部分是Wade的光泽(尽管考虑到偏爱较小的乳房的提议,这是一个合理的水平)。 我想到的主要问题是,著名的人口遗传学家,例如约书亚·阿基(Joshua Akey),实际上如何认真地选择性别作为推动人口变异和选择的力量。 似乎很多时候,性选择被呈现为 前机械世界 这种现象可以挽救我们对特定特质起源的困惑。 但是,我们对性选择可能性的评估大概必须以先前的期望为前提,而这种期望是由人们可以从文献中得出的各种力量之间的平衡得出的,在这里,我对当前性选择文献的了解还很薄弱。 也许我的怀疑是建立在我的无知之上,而提出这一解释的种群遗传学家对文献的状况更加了解。

所有这些使我回到了嘲讽的标题。 上周,当这篇论文首次成为新闻时,我正在与一位日本血统的朋友共进晚餐(他在日本上过小学)。 我问他空白,“你喜欢小乳房吗?” 他最初的回答是“ WTF!?!” 拉齐卜,”但作为老鼠遗传学家,在向他概述了上述结果后,他理解了我的问题的主旨。 从与许多东亚裔美国男性的私人交流中,我不相信在这部分人口中,绝大多数人都偏爱小乳房。 但是这里的关键是 美国人。 这些是沉浸在美国文化中的人。 毫无疑问,东亚的规范有所不同。 我们在美国媒体中看到的名人东亚女性的典型视觉表现形式是,与西方女性名人(例如巩俐,韩国流行歌手的新作)相比,她们的继发性特征更苗条,更轻描淡写。 ,甚至考虑到后者的整形手术)。 毫无疑问,部分原因是整个人群的正常变化范围有所不同,部分原因可能是审美偏好的本质。

但是,根深蒂固的心理原因驱使性选择的可能性(据我所知,华南和西伯利亚没有一种文化)使我们回到有关更新世思想的旧观念。 并且,这使我们回到了进化心理学领域,这个领域既是对进化科学在理解人性方面的效用的怀疑论者的怀疑者,也是对进化生物学的严格实践者的鞭策者。 然而,这里并不是进化心理学家,而是我经常在媒体上援引性别选择的,经常被肋骨缠住的统计遗传学家。。 但是我们是否知道这是性选择,还是我们最好的猜测? 因为最好的猜测常常是错误的(尽管最好的猜测比最坏的猜测更可能是正确的!)。

在过去的十年中,进化基因组学已经走了很长一段路。 例如,我们知道遗传结构以及许多性状的自然历史某些方面。 但是,仍然存在缺点。 乳糖酶的持久性是规则的例外。 就象为什么人类色素沉着这样简单的表型,在过去的10年中为什么它一直是欧亚大陆的重复选择目标也无可争议的答案。 通常,正确的答案就是我们只是不知道。

引文: http://dx.doi.org/10.1016/j.cell.2013.01.016

 

几天前我在浏览 霍尔丹的筛子,当我偶然发现一个有趣的讨论时 “关于” 页。 这种“内部棒球”玩笑使我开始思考自己的智力发展。 在过去的几年中,由于基因组学的兴起,“大数据”的泛滥以及可访问的软件包,我一直在更深入地研究系统发育和系统地理学。 这带来了机会成本。 我没有花太多时间专注于经典种群和进化遗传问题。 这些年来,我收集了各种各样的教科书和专着,这充实了我的智力,这些资料和专着散布在我的房间里。 但我必须承认,现在浏览是难得的一天 哈特尔和克拉克 or 自然选择的遗传理论 没有特定目的或雇佣军意图。

费舍尔

就像一条河流无情地在洪泛区上奔流一样,随着新的一年的到来,现在该是一个大转弯的时候了,像我一样扎根于我的根源。 这是我现在正在阅读的原因之一 进化遗传学的奠基人. 费舍尔, 赖特霍尔丹,就像老朋友一样,褪色了,但并没有忘记 穆勒 总是相识。 但是100年前的思想仍然有力量驱使我们探索尚未解决的深层问题,但是在哪里可以找到新的方法和新技术呢?。 对过去的研究不允许我们做出明智的选择,以任何坚定的态度决定未来,但它至少可以增加我们照亮黑暗深处的工具的光度。 通过我们的各种努力,大自然的形状可能会变得不那么透明。

图来自“对任意优势等位基因的定向阳性选择”,Teshima KM,Przeworski M

那么,霍尔丹的筛子又是什么呢? 如在 霍尔丹的筛子 这个概念很简单。 想象两个突变,一个以隐性方式表达特征,另一个以显性方式表达特征。 筛子通过促进出现在随机区域占主导地位的变异体占主导地位的低频区域外来运行(即,即使等位基因具有较大的适应性,在低频区域,随机机会的力量可能仍暗示着该可能性很高)。灭绝)。 一个例子是 乳糖酶持久性,它在模式欧亚变体中似乎占据主导地位。 相反的情况,即有益突变在表达上是隐性的,遭受了结构性问题的困扰,在这种问题中,其益处在理论上比实际实现要多。

这的数学极其简单,这是由于 哈迪·温伯格动力学 of 二倍体 随机交配生物。 我们以与乳糖酶持久性变化有关的基因为例, LCT。 考虑两个等位基因,LP和LNP,前者具有持久性(一个成年人可以消化乳糖),而后者则表现出常规的哺乳动物“野生型”(乳糖酶的生产停止,因为一个人离开了哺乳期的生命阶段)。可行的)。 LP显然是新颖的突变体。 在少数人群中,LP的频率随机上升到10%并非不可想象。 现在怎么办? 在HWE,您有:

p2 + 2pq + q2 = 1,其中q = LP等位基因。 在〜10%时,替换的数字为:

(0.90)2 + 2(0.90)(0.10)+(0.10)2

这就是优势或隐性表达高度相关的地方。 现实情况是,LP是主要特征。 因此,在此人群中,LP的频率为性状:

(0.10)2 + 2(0.90)(0.10)= 19%

现在,想象一个模型,其中LP受到青睐,但它以隐性方式表达。 那么特质的频率将等于q2,纯合子LP等位基因比例。 即1%。 尽管人口遗传学通常是建立在代数基础上的,但其结果却有助于直觉。 就等位基因的可能轨迹而言,遗传系统内源性的结构参数(显性或隐性表达)可能会产生长期的后果。 选择只能“看到”特质,因此具有纯正品质的隐性特质也可能是没有特质的特质。 相比之下,显性表达的等位基因可以像镰刀一样穿过种群切开,因为每个拷贝都“计数”。

在准备这篇文章的过程中,我在百科全书中再次探讨了关于霍尔丹筛子的选择 进化遗传学的要素。 作者指出,这种现象虽然具有复古性,但可以算是进化遗传学领域中的一个年轻领域,尽管仍然可以追溯到现在,但它仍然是一个活生生的现象。 野生种群中偏爱突变的优势,或实验室种群中有害突变的隐性特征,可能反映了这两个基因库所处的不同机制。 事物的性质使得它比显性突变更容易产生隐性突变(即,损失比获得容易),因此在受到正选择压力的野生种群中,显性变体的优势使人们相信进化论而不是发展论。力量和约束条件塑造了许多物种的遗传特征。

但是事情还不是那么整洁。 霍尔丹的筛子,以及显性和隐性等位基因的框架,在性染色体区域的运作方式不同。 在许多谱系中,都有一种“异配性”,其中大部分基因组仅携带一个功能染色体。 在哺乳动物中,这是雄性(XY),而在鸟类中,这是雌性(ZW)。 由于雄性染色体上大多数基因只有一个功能性拷贝,因此隐性表达的掩盖作用不适用于哺乳动物。 这可能意味着由于在异配子性中有许多有害隐性变异体暴露于自然选择,因此人们会在这些染色体上看到不同的等位基因分布和遗传景观(例如,由于异配子性中名义上隐性等位基因的暴露,适应性更强。 ,以及对有害变体的更纯净的选择)。 但是现实更加复杂,该领域的文献有些混乱。 更准确地说,它在系统发育上似乎很敏感。 一旦移至果蝇,这一理论便在哺乳动物的建立者中得到了验证。

这就是为什么继续进行进化遗传学的原因。 该理论激发了经验探索,并对其进行了检验。 在大数据和大计算时代,由于经验的可检验性,许多经典的进化遗传形式理论已经在第二次世界大战之前的几年中形成,现在正变得越来越重要。 在这个领域中,历史学家不仅仅对过去感兴趣。 追寻下一笔拨款并产生预期的出版物的科学家们自己,可以站在巨人的肩膀上,从历史的角度来看,从中受益。

 

上图显示了该地区的人口覆盖率 基因2.0 SNP芯片,由 地理项目。 他们的论文概述了芯片的实用性和原理,现在已经发表 arXiv。 去年夏天,当Spencer Wells主持了有关Geno 2.0发布的网络研讨会时,我看到了这张地图,这确实使我兴奋不已。 他们在此芯片上拥有的标记数量不多,常染色体上仅超过100,000,而X,Y和mtDNA上则有成千上万的标记。 相反, Axiom®全基因组人类起源1阵列板 被...使用 帕特森(Patterson)等人。 拥有约600,000个SNP。 但是,从上图可以清楚地看出,在更多的人群中Geno 2.0可以确定其他可比较的芯片(Human Origins 1 Array使用12个人群)。 显然,如果您只捕获少数群体的变异,那么所有额外的百万个标记都可能不会给您带来很大的收益(更不用说可能在您的群体遗传和系统发育推断中引入的偏见)。


左侧是确定了“人类起源1阵列”的人口清单,对我而言,它们看起来相当全面。 相反,对于Geno 2.0,在450个人群中确定了“祖先信息标记”。 对我来说,最终的问题是:对各种晦涩难懂的群体进行额外的确定是否值得? 如我所说,在初次检查中,Geno 2.0的SNP数量似乎很少, 但是根据我的经验,当您进行质量控制并将不同的面板合并在一起时,无论如何,您通常只剩下几十万个SNP。 根据我的经验,即使在欧洲这样的遗传上均一的地区,100-200,000个SNP也足以阐明它们之间的关系(对于基于模型的聚类来说,这已经绰绰有余了,对于MDS或PCA来说似乎已经过大了)。 关于Affymetrix芯片,一个让我惊讶的问题是,它的确确定了对映体。 相反,Geno 2.0考虑了欧亚的心脏地带。 例如,我怀疑Geno 2.0对于南亚人的人口或血统分配会更好,因为它会为这些人提供更多的信息标记。

最终,我不能说更多,除非我在不同的地方使用了两个标记集 类似的情况。 由于Geno 2.0有意识地排除了许多功能上和医学上相关的SNP,因此其用途主要是在人口统计和历史领域。 如果有问题的人群已被“人类起源1阵列”很好地覆盖,我认为没有理由不应该这样做。 它不仅具有有关生物学功能的更多信息,而且标志物的数量要大很多倍。 另一方面,Geno 2.0在Affy芯片的“空白区域”上可能更有用。 希望有关Geno 2.0的Genographic Project结果报告能尽快出台,我可以拉下他们的数据集并使用它。

引用: 的arXiv:1212.4116

 

要了解自然的所有复杂性,我们必须将多种多样的物种缩减到最小的规模。 为了便于理解,我们用数学形式化,用类比语言表达,并用表示形式可视化。 这些逼近现实不是现实,但是当我们黑暗地透过玻璃看时,它们会给我们带来至关重要的洞察力。 道尔顿的模型 原子的细节在重要的细节上是错误的(例如,基本粒子被证明可分解成夸克),但是它仍然具有概念上的实用性。

同样,LL卡瓦利-斯福尔扎(LL Cavalli-Sforza)在 人类基因的历史和地理 在了解人类人口过去的状态方面仍然很有用。 但是看来,树的分叉模型现在必须被网状阴影强烈着色。 在程式化的意义上,种间系统发育假设生物物种概念的近似真相(即,跨谱系的基因流很小),当我们在种群遗传学的微观进化规模上考虑物种的系统发育时,就会误导我们。 在种内尺度上,基因流动不仅是模型中的麻烦参数,而且是必不可少的现象,必须将其纳入框架中。


这是我的想法,因为出现了诸如 混合树Admix工具。 在众多公共数据集上使用诸如此类的软件,可以让人们感知混合物的真实性,并将侧向基因流叠加在树上作为自然的期望。 但是,也许更深层的结果是树本身的特征被撕裂了。 上图来自新论文, 基于矩的混合参数和基因流来源的高效推断,这是首次亮相 混合映射器。 作者在他们的论述中引入了很多数学方面的内容,但我不能说我全部遵循(尽管某些细节与 皮克雷尔(Pickrell)等人)。 简而言之,与TreeMix相比,MixMapper似乎可以对更狭窄的总体进行更有力的推断,这些总体被选择用于探索非常具体的问题。 相比之下,TreeMix在最少的监督下探索了整个景观。 使用了后者,我可以证明那是真的。

MixMapper的最大结果是它扩展了 帕特森(Patterson)等人。,并确认 现代欧洲人似乎是“北欧亚”人口与模糊的“西欧亚”人口的混合体。 重要的是,他们在撒丁岛发现混合的证据,这表明Patterson等人的原著对假定的参考人群中的混合不敏感(请注意,Patterson也是本文的合著者)。 如本文所述,问题在于,当您没有“纯”祖先参考种群时,很难估计混合。 然而,对我而言,这里的收获是,我们可能需要重新考虑纯祖先种群的整个概念,并将人类系统发生树想象为永恒通量中的一系列晶格,其混合节点会定期扩展,从而产生出人为的假象。多样化的树。 我们越仔细看,在过去的10,000年中经历人口膨胀的大多数人口似乎也是混合产品。 过去10,000年乃至过去100,000年的任何故事都必须在整个群体的叙事弧横向基因流的中心留出空间。

引用: 的arXiv:1212.2555 [q-生物.PE]
 

当我在ASHG的Spencer Wells的海报上时,我主要对条形图感到好奇。 他的空间覆盖率非常好,因此我对本文颇为兴奋(尽管我没有看到系统发育假说的很多明确检验,我认为这类论文现在必须要做;我们已经超出了PCA和条形图的范围)仅论文)。 话虽这么说,Spencer对我更感兴趣地推广 科学赠款计划。 这是更多信息:

Genographic项目的“科学赠款计划”以滚动方式为那些致力于利用创新人类学遗传工具研究人类历史的项目提供赠款。 科学赠款支持的各种项目旨在构建我们古老的迁徙和人口历史,同时加深对世界人口的地理结构的了解。 样本研究主题可能包括诸如印度-欧洲语言的起源和传播,对巴布亚新几内亚的高语言多样性的遗传学见解,从非洲迁出的数量和途径,印加人的起源或印加人的遗传影响等主题。玉米农业在美洲的传播。

接收者通常是人口遗传学家,学生,语言学家,以及对追求与地理计划探索我们的迁徙历史的广泛目标有关的问题感兴趣的其他研究人员或科学家。 地学科学赠款的接收者将成为地学财团的成员,并有望作为更大的地学使命的代理人,参与并报告地学实地考察的多个方面,并提出自己的建议和与任务相一致的试点项目。项目。 财团内部的开放性和透明度是该项目研究团队的关键价值观,受助人将遵守该行为准则。


如果您翻阅他们的材料,他们会说补助金将在 $25 到 $50 美元之间。 那是 125 到 250 个 Geno 2.0 芯片。 说起来,我大约一个月前寄出了一个芯片。 结果应该很快就会回来。

那么,为什么Spencer如此热衷于我再次推动呢? (我之前已经提到过)在ASHG 2012上之后 我对那些对这类历史遗传问题感兴趣的人的小样本空间感到震惊。 我之所以这样说,是因为我已经阅读/阅读了大多数张贴海报的论文。 我有时不知道是否会遗漏某些东西,但是这些结果表明没有,只有这么多的实验室在做这种工作。 最后是关键问题。 这是“自下而上”的非学术科学可以创造奇迹的地方。 一个印度小组在ASHG上展示了一张海报,当他们告诉我艾尔斯(Iyers)和孟加拉婆罗门(Bengali Brahmins)之间的相似之处时,我忍不住承认:“是的,我已经知道了,我的朋友 扎克·阿杰马尔(Zack Ajmal) 得出了这个结论。” 如果您是一名学者,则需要超越工具和方法以及分析见解,那些拥有备用计算机并有少量闲暇时间的人可能会产生这些见解。 对这些数据的学术垄断充其量是短暂的。 和所有的好处。 我已经厌倦了知识分子的租金。

 

大多数读者都知道我参加过ASHG2012。我将把这篇文章分成两半。 首先,会议的一般性。 其次是特定的海报等

通用性:

生命技术/离子激流 显然雇用了d-bag bros在会议上代表他们。 海报的人很好,但是那些负责 离子洪流巴士 如果他们认为这很有趣/可笑/等等,那就是总的困境。 人力资源敏锐度并不总是反映技术上的突破,但是我敢肯定,如果他们认为聘请认为d-bags有趣的人来疏远某人的选择,那么他们(HR)认为这是明智的选择ASHG的会议参加者。 Affy&Illumina!

–说到测序,有一些年轻的公司试图推广技术,以解决缺乏长期阅读的问题。 我充满希望,但是在2000年代后期太平洋生物科学公司惨败之后,我认为对任何一家特定公司寄予希望是没有意义的。

–我走进了海报大厅,阅读了标题,并至少浏览了所有3,000多个海报的摘要。 基因组学无处不在就不足为奇了。 但是,也许会有一个适度的惊喜是,大型外显子组对于以医学为导向的人而言正变得如此。

–在谈到医疗/临床人士时,我注意到他们在介绍中使用了“高加索' 很多。 这在流行一代中并不明显。 它显示了官僚命名法在现代医学中的影响,因为他们倾向于使用有些荒谬的美国人口普查局类别。

– Twitter是 相当大的一笔。 有很多有趣的环节,我发现自己不断检查自己的供稿中是否存在 #ASHG2012 井号。 这也是弄清楚在同一次会议上还有谁的一种简便方法(例如,就我而言,经常 卢克·乔斯汀(Luke Jostins)).

–如果您可以在会议上跟踪智能手机的移动方式,那么看到一个由个人组成的网络将很有趣。 例如,进化论和种群基因组学海报被更多直接的信息学(例如,用于清理原始序列数据的软件)所束缚,从中流血了。 但是在进化和种群基因组学部分的旁边(我说基因组学而不是遗传学,因为后者完全被前者所涵盖),您有某种类型的小儿疾病遗传学过道。 当我错误地继续前进时,我并不是唯一一个害怕的人(即,您从对埃塞俄比亚人口结构的深入讨论,到关于常染色体显性遗传性疾病新生儿可能死亡的具体讨论) ,上面说的是新生儿的照片!)。

–显然哪些会议更具跨学科性:只需注意演讲者之间的“搅动”即可。 人们在逐个发言者之间切换会话,因此,如果不喜欢他们的话,他们会选择退出。

–每个演讲的问题数量似乎随之而来 幂律。 许多很多的谈话必须让主持人问一个令牌问题。 但是有几个小组让人们赶到麦克风,主持人不得不将它们拒之门外(这在我身上发生了两次,尽管我习惯于坐在过道的中间,这样人们就不会超越我,这使我处于不利地位)。

23andMe 据推测,最迟在今年年底之前,将会有新的祖先画作,还有更多的人口。 当我看到它时,我会相信的,但是告诉我这件事的人似乎完全是真诚的,我充满希望。

–在某些晚上,我喝了相当多的酒,并且从很多我不记得的人那里得到了很多名片。 但是似乎正在出现的一件事是中介和b2b服务的激增。 由于选择的多样性,有理由认为,有些公司正陷入混乱之中,并试图通过在交易结束时使两方相匹配来获利。 我一个人 do 回忆起迈克尔·赫尔岑(Michael Heltzen)的 蓝色SEQ,他将其称为“测序的Hotels.com”。

–总体而言,这是一场物流方面的良好会议。 明年我一定会去波士顿!

–关于古人参掺和物和选择的很多东西。 很多。

–朋友不要让朋友使用 结构体 他们什么时候可以使用 混合物。 似乎大多数人都选择了后者,速度很快。 但是少数小组仍在使用前者。 而且不应该这样,因为它们的老化和复制参数设置得很低(我使用 结构体 微卫星),这样一来就不会花费一千年的时间进行收敛。 如果您要这样做,为什么首先要考虑贝叶斯系统进化学的作用呢?

–卢克·乔斯汀斯(Luke Jostins)建议,我在现实生活中的表情与头部镜头不同。 我怀疑卢克在这方面的认知能力较低。 一个受人尊敬的实验室里非常醉酒的人决定在聚会后的昏暗的日子里大喊我的名字,*所以我看起来没什么不同(而且好像并没有很多棕色的家伙在附近走来走去。这些东西)。

康拉德·卡切斯基(Konrad Karczewski) 给了我一个“释放数据”按钮,但是当我问人们是否要发布其数据集时,结果却参差不齐。 一些演示者愿意通过电子邮件将数据发送给我,但是由于我没有刷新徽章,所以我很好奇他们为什么愿意提供这种方法,而不是将其发布给数以百万计的 other 陌生人!

细节:

本节将主要讨论进化论和种群基因组学类别的演讲和海报。 我可以对这些谈话发表评论,因为我去过他们,而对海报则因为我多次看过它们。 要注意的一件事是,许多海报和一些演讲是在已经在发行(预印本或已经出版)的纸上进行的。 我不会涉及太多。 我已经审查/链接到大多数。

–从去年春天开始参与胎儿全基因组测序的一个人说,这里的主要成本将是测序。 他还充满信心,他们可以将测序工作从18周前移到更远的位置(例如,在样品收集和分析周转方面)。

–关于结构变体等的讨论很多,但是对于高通量测序方法,我们仍然没有。 实际上,我参加了CNV演讲,主持人介绍了一些RFLP结果! 他指出,现实情况是,出于临床目的,高通量不足以区分3对4对5拷贝的可行性或准确性。

–我没有太多的CNV内容,这些内容会重复CNV的SNP结果。 例如,用CNV概括了地理精细结构的海报。 这对于第一家酒吧来说还可以,但是一遍又一遍地做似乎是没有必要的。

–西蒙·格雷维尔(Simon Gravel)有一些很棒的东西 软件.

卢卡·帕加尼(Luca Pagani) 对...有信心 滚下的埃塞俄比亚掺和量估算值。 他现在正在迁移到埃塞俄比亚的整个基因组,并计划对该问题进行后续跟踪(他自己的方法与 滚下).

–将东北非洲人口与南部非洲的Khoisan联系起来的传闻论文(即,我已经听过几年的论文)最终将很快出版。 至少那是我被告知的……正如我所指出的,这个结果已经存在很长时间了,但是还没有人发表。 基本上,这个小组有一些来自肯尼亚的库希族语样本,看起来像是埃塞俄比亚人对安达曼岛民的类比(或尽可能接近)。

–我们很快就会在Afrikaner基因组学上看到一些东西。 没有明确告诉我,但这很明显。

——由数百家创建、维护和提供物联网(IoT)全球开放标准的公司所组成的 尼尔森集团 仍在进行高海拔适应他们没有看到硬扫。 当然,我没有得到这些是否是旧变体的确认,但是看起来许多初级的东西似乎没有能力检测第一组中的任何东西。 和往常一样,他们要有所作为。

–谈到尼尔森集团, 梅利莎·威尔逊·塞雷斯(Melissa Wilson Sayres) 对Y染色体谱系进行选择纯化的工作对我来说很有说服力。 基本上,有效的种群差异(例如,一夫多妻制)无法解释Y谱系的较低多样性(他们进行了模拟)。 幸运的是,对于系统学家而言,这不会影响Y树的效用(积极选择会,但是这并不是她在说的)。 无论是不是赛勒斯的谈话,我都有些困惑,但是这些结果可能解释了mtDNA与Y谱系之间的融合不一致(前者具有更深的融合)。

–另外,来自的艾米·戈德堡(Amy Goldberg) 诺亚·罗森伯格(Noah Rosenberg)的实验室提供了一些理论研究成果,这些研究表明复杂的人口统计历史会影响差异,而不是您可以推断出给定性别的平均有效人口规模。 当我看着艾米的海报时,迈克尔·哈默(Michael Hammer)实验室的某人开始问我是否喜欢他们的研究,我说可以(我写了博客),但她的理论结果也解释了我会从中看到的一些奇怪的东西。他们的实验室。

– Sriram Sankararaman在现代人类血统中张贴了有关尼安德特人掺和物的海报。 在粗略的大纲中,Reich实验室和Wall实验室似乎是一致的(以及其他人,例如Slatkin实验室的Melinda Yang)。 我们正在看到一种新的正统/范式的融合。 他们似乎大致同意 格雷厄姆·库普的猜想.

–关于东亚遗传学的东西很多,但没有什么太前沿了。 我有点失望。 一项大规模的Y和mtDNA研究确实表明在藏族高地发生了两次混合浪潮, 先验 对我来说似乎很合理。 但是我的经验法则不能打赌仍然持怀疑态度的尼尔森集团。 另一篇论文提出了缅甸人中单倍型M的深厚血统。 这很有趣,因为缅甸人在文化上可能具有一定的侵扰性,取代了星期一的人口。

–来自不列颠群岛人民的家伙出席了会议。 两点。 首先,大约40%的英格兰血统似乎是盎格鲁-撒克逊人。 其次,他们的聚类方法似乎在“凯尔特边缘地区”和苏格兰发现了更多的“微型种群”。 为什么? 我的直觉是盎格鲁-撒克逊人的扩张不是扩散过程。 相反,亨斯主义者和霍萨人的部落可能与东安吉利安海岸的当地布莱顿尼克人凯尔特人混为一谈,并迅速扩张。 以后有很大的可能性被同化(有迹象表明,阿尔弗雷德大帝的血统是被吸收到盎格鲁-撒克逊人权力结构中的布莱索尼克贵族),但是一个巨大的盎格鲁-撒克逊人/英格兰固有群体的出现是很明显的在显示的图中。 我能想到的与该论据的主要对立是,按距离隔离基因流在英格兰的地形中非常有效,而在更为崎border的边疆地区却不那么有效。

–说到远距离隔离,爱沙尼亚的遗传学家向我宣称,爱沙尼亚人和芬兰人之间的区别可能与最初的芬兰人从东部到来以及随后的分离有关。 爱沙尼亚人与拉脱维亚人进行基因交流时,他们与芬兰人分道扬across,在瑞典人到来之前,他们更加孤立。

–有一个海报(没有与主持人交谈)对一个或两个南印度人进行了全基因组分析,并指出有证据表明这些人是所有其他非非洲人的基础。 这是重申非洲古老的“南方路线”的可能性的另一种尝试。 我没有被说服,因为他们的方法没有太多细节(他们指出了多样性的估计,但是现在还不够)。

–另一个印度团体证实了很多东西 扎克 已经找到了,但补充了很多低种姓/部落的样本,这是大多数人所缺乏的。 他们断言(正确) 南亚各地的人口/种姓之间存在遗传距离,这类似于洲际差异。

–我对空间和遗传变异数据的综合感到兴奋……但是我开始意识到这是有局限性的,因为我们无法将遗传变异表示形式转移到tesseract上(因为我们无法可视化tesseracts)。 简而言之,二维或三维表示法会删除细粒度的重要信息。 现在,我们正在关注更细粒度的内容。

–显然墨西哥人和智利人高估了他们的欧洲血统。 主持人发现,他们智利人的血统中有40-45%是美洲印第安人。 我问采样问题,他们承认这可能是个问题。 他们的其他结果也是如此。 我们在这里需要更粗的数据集。 基本上,如果它是一个不同的国家/地区,就不能在该国家/地区标记饼图。

–有一幅关于将巴西人OCA2-HERC2与头发,眼睛和皮肤颜色相关联的海报。 OCA2-HERC2与肤色之间的联系不混和,欧洲人对此比较混杂,但似乎在这一人群中出现。 假设分层不是问题(我相信他们是从基因组角度看的),似乎只有当您具有特定的色素沉着基因结构时,才会对皮肤产生影响。 这是统计问题,而不是生物学问题。

–说到颜料,马克·史瑞佛(Mark Shriver)的海报将感知的,表观的和基因组的种族联系在一起。 感知意味着您如何被他人感知。 表观者正在获取身体特征并对其进行定量平均(面部特征,肤色等)。 而基因组祖先就是您所了解的。 估计祖先量子。 令人惊讶的是,人们似乎从明显的物理特征中低估了非洲的祖先(从表象到基因组祖先的分散性来看)。 这违背了民间智慧,后者认为“非洲特色占主导地位”。

–大量纠正Fst天真用法的文献。 价格实验室的一名海报建议使用似然比,如果可能的话,使用哈德森的Fst。 这以各种形式多次出现。 Fst不会死,但是会重生!

–看到一个海报,声称表亲首次婚姻使后代的期望值降低了3厘米! (这不在“进化论”和“流行基因组学”部分中,我可能应该花更多的时间研究复杂的特性等,但是您只能做很多事情)

–更多证据表明有许多人迁移到新大陆。 许多新世界基因组学。 我没有与这些主持人交谈,因为他们总是很忙。

– Spencer Wells告诉我,他们最终将很快使用Geno 2.0的结果发表论文。 他们确实有很好的人口覆盖率,尽管我希望他们可以将条形图旋转90度。 我看不懂标签。

最后, 有很多软件和很多方法。 这是我认为在未来十年内它将被一些大型公司淘汰的事情之一。 目前,实验室正在抽出软件来推断血统,相位数据等,并发挥其优势。 这一切都很好,但是在某些时候,重点将放在生物学上,而软件将是它的翅膀下的风。 我正在尝试腾出时间来使用某些软件,尽管其中许多软件尚未在线(演示者始终保证会很快上线,但是我知道这是怎么回事。)。

* 这是 不能 令人愉快的经历。

 

好吧,也许我可以帮上忙。 库普博士谈到自己与约瑟夫·皮克雷尔博士之间的合作, 霍尔丹的筛子,这是我几天前添加到我的RSS中的(您可以看到我将其推送到了我的RSS中 通知板)。 来自 “关于”:

如上所述,Haldane的《 Sieve》的大多数帖子都是相关预印本的基本描述,几乎没有评论。 所有帖子都会有评论部分,欢迎对文件进行讨论。 第二种类型的帖子将是对供稿人特别感兴趣的预印本上的详细评论。 这些帖子可以采用期刊评论的形式,也可以只是一些简短的评论。 我们希望他们能为预印本的作者提供有用的反馈。 最后,预印本的作者将发表一些帖子,在其中描述他们的工作并将其放在更广泛的背景下。

我们要求评论者记住,通过将文章提交给预印服务器,作者(通常是生物学家)迈出了不寻常的一步。 因此,应以建设性的方式表达意见,以帮助作者。

如果其他可能会有所帮助 进化/遗传博主 重新博客这个,所以我们可以把它推高 谷歌搜索 结果。 如果您用Google搜索“ Haldane's Sieve”,那么某些结果会很有趣……而且不一定是好的方法。 我确实为读者无法获得的东西而感到内lt,因此,预印本的接受程度越高,我们(如普通公众)对进化的理解就越多。

 

髓: 皮肤变白的演变很复杂,并且似乎是分阶段发生的。 当前的欧洲表型可以追溯到上一个冰河时代的末期。

一份新的论文 分子生物学与进化, 欧洲人色素沉着减轻的时机,很有趣。 这很重要,因为皮肤的色素沉着已经 主要成就之一 人类基因组学的第一个时代。 在2002年,我们真的不了解人类正常肤色的特定基因(基本上,我们知道 MC1R)。 这就是Armand Leroi在观察中 突变体 在2005年,想知道我们对这样一个显着特征的无知。 尽管Leroi的争论已经过时了(事实上, 突变体 正要按 它变成了 已过时)。 今天,我们确实知道色素沉着的遗传结构。 这就是为什么 GED比赛 可以预测我女儿的眼睛仅来自她的SNP(现在是淡褐色)就会变成浅褐色。 色素沉着似乎是大多数人的变异受六个基因控制的一个特征,从而促进了这种基因组产量的提高。 相反,身高或智商受无数基因控制。

但首先,是一个主要问题。 在讨论中,他们写道:“我们的估计还表明,在SLC24A5,SLC45A2和TYRP1这三个基因中,多态性的地理分布是 主要限于欧洲人口.”这只是字面上的错误。 SLC24A5 在欧洲以外的地区,其衍生的皮肤呈亮白状态。 作为从地图 HGDP浏览器 左侧指示,派生的“欧洲”变体在中东人中几乎是固定的。 如果减去撒哈拉沙漠以南的混合物,它在中东人中几乎是固定的。 在南亚人中也以高频率发现它。 HGDP样本是巴基斯坦人的,但派生的变体在非洲的频率为95% 哈普地图古吉拉特人! 我的父母也是衍生自“欧洲”变体的纯合子。 我相当确定在非欧洲人中,派生出更多的“欧洲”等位基因拷贝:南亚人,中东人和北美人。 我认为这里的问题是语义上的。 作者的确在泛泛地谈论西欧亚,但由于他们的数据使用了欧洲人,东亚人和非洲人,因此,他们觉得自己不得不专门谈论欧洲人。 此外,在最后一次冰河期 欧洲大部分地区 没有人居住,或者没有人居住。 在我看来,“欧洲色素沉着”的大部分演变可能已经超出了欧洲地理范围。

至于论文,结果非常简单而且引人注目。 说到打击,我将粘贴这张图,首先说明在四个皮肤色素沉着位点处相邻的单倍型网络,以指导您进行定位。 黄色气泡是派生血统(在这种情况下,它们通常与与较白皮肤相关的SNP相关),而黑色是祖先的血缘。

您在前两个面板中看到的是派生谱系紧密地聚集在一起。 SLC24A5 特别是看起来几乎具有“星状系统发育”,因此您会看到这种单倍型快速扩增的特征。 SLC45a2 相反,它们分散在整个网络中。 作者认为,可能发生了重组事件,导致衍生谱系跃迁到祖先的背景上。 最后,用 基特尔 您会看到一种模式,尽管有许多派生谱系与祖先的分支有所不同,但它们广泛分布。

他们是如何做到的? 出于这篇博客文章的目的,我要说的是,他们首先关注的是SNP,即一种与皮肤变白有关的nuclotide多态性。 这不一定是因果突变,但通常它们与性状密切相关,因此可以用作有用的标记。 其次,围绕这些焦点SNP,他们组装了一组微卫星,可以用它们进行系统发育测试。 微卫星 快速变异,并累积变化。 主要问题是它们的突变速度如此之快,以至于您在更深的时间深度上都失去了分辨率。

通过结合SNP和微卫星数据,作者针对显式模型测试了他们的经验模式,并从中生成了模拟。 基本上,这里的目标是测试中立性。 换句话说,根据中性动力学,您会有一组期望的结果(即,只是通过漂移来改变频率),并且您会看到“真实世界”的结果如何适应。中性模式,也许是选择? 通过查看这些基因座周围的变异模式,您还可以了解自上一个共同祖先以来的选择强度和时间。 下表列出了结果:

众所周知,选择系数为0.01是可取的,而0.10则是巨大的。 特别是在 SLC24A5 看起来有很多选择,而且最近。 几年前的一次会议介绍暗示,有选择地扫荡 SLC24A5 开始于6,000年前据我所知,从来没有出现过一篇论文,而据我所知,部分原因是因为这个极低的数字可能不正确,您可能不得不将其退回一些。 这些结果看起来在我所听到的正确范围内。 其他人也发现了类似的年龄 SLC24A5 SLC45A2 打扫。 但是看看置信区间。 在这种情况下,我真的很想了解他们的数据和模型假设,并查看它们的稳健性。

更直观的是 基特尔 在地理方面,以及在单倍型系统发育树方面。 作者基本上得出以下结论: 基特尔 是在欧洲人和东亚人之间进行区分之前的一个变体,而其他基因的扫描则早于该差异。 鉴于欧亚大陆西部和东部皮肤色素沉着结构的差异,后者是有道理的。 一再地,作者基本上承认这是一个复杂的问题,因此我不会将这些结果带回家。 确实令我担心的是,他们假设人口统计模型是一棵没有网状结构的树。 关于约25,000年的西欧和东亚欧亚大陆的差异,我自己的问题是,混合和基因流在多大程度上及时地推动了这一节点的发展。 其次,作者关注了欧洲,东亚和非洲的一些代表性人群。 但是那里有整个世界。 似乎这些对立体不是孤立地发生进化,其他每个人都是后续混合物的线性组合。 实际上,我想知道这里的估计值是否针对侵入欧洲而不是土著的人口。 观点之一是,人们可能会推测新来者吸收了欧洲冰河时代的狩猎采集者中的老式闪电变体。 但是单倍型结构减轻了这种情况。 如果它们是从冰河世纪欧洲现存的古代变种库中提取的,则应该会看到更多不同的派生变种。

那么作者的解释是什么? 他们提出的一项建议是 人类进化正在加速 由于更大的有效种群数量导致更多的遗传变异。 我认为他们之所以会提出这一论点,是因为它看起来不像最近选择的变体来自常规变体,而这种多样性在扫频时已经存在。 相反,这些扫描是由最近出现的新突变触发的(对于所有派生变体,在网络中,突变的发生率都较低,因此,“步骤”变少了)。

最终,这里有很多事情要考虑。 但是我确实想知道古老的DNA将如何更新和修订事物。 正如我一遍又一遍地讲过的那样,在我于2000年代阅读了数十篇系统发育模型论文后,我对推理和模拟持更加怀疑的态度,这些论文“证明”过时的技术与现代人类之间没有任何混杂。

图片来源: 丽塔·莫尔纳(Rita Molnar)

 

二烯 有摘要 分子生物学与进化学会2012年与人类相关的摘要。

1)请记住,这些不是论文,并且某些摘要至少可能以可识别的形式可能永远不会成为论文

2)说到 估计祖先南亚人口混合的日期:


语言学和遗传学研究表明,当今南亚几乎所有族群都来自两个高度不同的族群:与中亚人,中东人和欧洲人有关的祖先北印度人(ANI),以及与中亚人无关的祖先南印度人(ASI)印度次大陆以外的所有人口。 据估计,ANI和ASI与一个共同祖先相距60,000万年前,但是ANI-ASI混合的日期尚不清楚。 在这里,我们分析了大约60个南亚群体的数据,以估计 主要的ANI-ASI混合物发生在1,200-4,000年前。 有些混合物可能更旧-超过了我们可以使用混合链接不平衡进行查询的时间-因为它在整个次大陆都是普遍的:出现在所有讲印欧语或德拉维语的人群中,在各个等级和原始部落中都存在。 在近四千年来发生ANI-ASI混合物之后,文化转变导致广泛的内婚制,从而降低了其他混合物的比率。

要对此发表评论。 估计约1,200的大型外加剂几乎是不可能的。 从历史上看,唯一可能成为这一目标的人群是旁遮普邦(Jatts of Punjab),他们的神话来自前伊斯兰中亚最后一批入侵印度次大陆的人。 实际上,如果1,200-4,000表示一个间隔,则预期值为〜2,600年前。 大约是佛陀的时间。 这似乎太过新了,似乎没有道理。 但是……作者确实注意到可能存在较旧的混合事件。 If 他们收到的信号是印度-雅利安扩张,这似乎是合理的,因为与那段时期一样,印度东部-东印度洋平原和印度中部大部分地区的大片土地正在发展更大的一部分 阿里亚瓦尔塔.

 

多年来,在人类进化遗传学和古人类学(或更确切地说,在媒体上对话题的流行论述)中反复出现的一个问题是,“人口X是最古老的Y”的想法。 X始终是指较大集合Y中的人口,而Y是由相对边缘化或保留较旧的文化风俗定义的。 因此,例如,我看到有人说安达曼岛居民是“最古老的亚洲人口”。 为什么? 现在有一阵子的标准模式是,非非洲人来自于50到100万年前离开祖先大陆并开始多样化的非洲人。 据推测,安达曼岛民的血统可以追溯到最初的分散状态,就像欧洲人和中国人一样(修正案表明,原住民可能是早期浪潮的一部分,但仍将安达曼人列为第二浪潮)。 安达曼人被称为古代人的原因很简单:他们是亚洲最后的狩猎采集者,字面上是向外来者投掷长矛。 一个古老的 生活方式 与...混为一谈 遗传学。

非洲,the格米人,哈扎和布什曼的狩猎采集者面临的问题要大得多。 原因是这些人群特别受关注,因为他们似乎很早就与人类其他地区背道而驰了。 Y染色体和mtDNA都证实了这一点,现在对整个基因组进行的常染色体分析也证实了这一点。 换句话说,他们是 基础 对人类。 我相信这有一定的误导性。 随着 班图扩展 非洲许多遗传多样性消失了。 狩猎采集者看起来特别长,而且 因为他们所有的亲戚都走了,所以在系统树上分支了!

但是狩猎采集者仍然存在,他们的遗传物质已经被收集起来供科学家研究。 中的新论文 PLoS遗传学 将重点放在西方P格米人及其与班图人邻居的关系上。 西非P格米人的祖先模式,自然选择的特征以及与身材的遗传关联:

非洲被认为是过去200,000万年来现代人类的起源地,也是过去100,000万年来我们在全球分布的起源。 非洲还是环境,文化,语言和表型极端多样性的地区,居住在那里的人口显示出世界上遗传多样性最高的地区。 关于非洲观察到的表型变异的遗传基础,或者最近的局部适应和人口统计学如何影响这些模式,人们所知甚少。 在这里,我们分析了一组混血的讲班图语的农业人口和西部P格米人的狩猎-采集者种群,这些种群在身高上存在极大差异。 y格米人平均距离比其班图人邻居短约17厘米,并且在全球范围内是最短的人口。 我们的多方面方法确定了可能已成为自然选择目标的几个基因组区域,因此可能藏有西非P格米人独特的解剖学和生理学基础的变体。 特别是第XNUMX号染色体的一个区域具有强烈的自然选择,种群分化以及与高度相关的信号。 该区域还与欧洲人的身高以及已知的调节生长激素信号传导的候选基因密切相关。

这里的方法很简单。 先前的工作已经证实,给定的矮小​​侏儒的高度是由它们携带在基因组中的非矮胖祖先的数量强烈预测的。 现在,这里的作者将重点放在基因组区域上,这些区域不仅显示与相关表型的关联,而且还显示出自然选择的特征。 在这一点上,我对自然选择测试的关联性和阳性结果非常谨慎,以防万一接受其表面价值,但是我们这里有一些先例可以使其合理化。 就是说,有很强的功能原理,而且the格米人似乎在身高表型上并不独特。

让我们考虑自然选择高度的可能性。 让我着迷的是,作者认为选择是在西方和复活节P格米人的时代之后才提出的。。 为什么这很重要? 因为它可以为我们提供关于“侏儒”表型性质的更好线索,“侏儒”表型在世界各地的遗物狩猎者和采集者中很常见。 布什人,P格米人和亚洲的各种“内格里托人”很小。 有人认为这是原始人类类型,或者是自然适应,或者是对雨林的适应。 另一方面,大洋洲的人口并不少。 据我所知,亚马逊河的印第安人并不比P格米人大。 为了把我自己的牌放在桌子上,我倾向于这样的主张:当人口被赶到边缘,或者被疾病和压力所困扰时,就会出现“侏儒”式的身体计划。 现在看来,菲律宾内格里托斯人的近亲是大洋洲人,其中大多数人的身材并不小。 有一些非布什门人科伊桑人,他们的身材不小。 而且,据报道,孤立的前哨岛安达曼人的身材不小!

这里的重点是研究边缘化的狩猎采集者在告诉我们人类祖先的性质方面有局限性。 P格米人可能在许多方面 衍生 在它们的表型上,是对当代紧急情况的相对较新的适应。 以上结果甚至暗示这些种群的矮小身材可能是各种性状之间遗传相关性的副产品,并且在一个方向上进行选择会导致高度相关的响应。 我想提出一个谦虚的建议:简单地按照自己的意愿来对待这些人,而不再试图将他们置于方便的范式中。 我怀疑P格米人会因其遗传变异而成为21世纪的伟大物理学家( 迪尔德·麦克洛斯基 on 丹·麦克阿瑟(Dan MacArthur) 博客),我也不认为它们是最早的 智人。 他们就是他们。

附录: 虽然我知道 有些人 会对奇异的进化起源感到好奇 其他特征 除了非洲狩猎采集者的身高。

 

中的新文章 美国人类遗传学杂志, 从根部对人线粒体DNA树进行“哥白尼”重新评估,是开放式访问权限,因此您应该将其签出。 讨论深入到问题的核心:

在许多同事的共识支持下,经过几年的犹豫,我们得出的结论是,在深度测序革命即将来临之际……预计在接下来的数年中可能会产生成千上万的额外完整mtDNA序列几年来,我们建议的主要变化不能再推迟了:祖先而不是“系统发育的外围”,来自欧洲的现代有丝分裂基因组应该成为人类mtDNA参考系统的中心。 提议的更改不可避免地会带来一些暂时的不便。 因此,我们提供表格和软件来辅助数据转换。

我们提出的不仅仅是单单文书上的改变。 我们以托勒密的地心系统和哥白尼的日心系统为隐喻。 隐喻进一步延伸:随着对日心系统的接受,绕过了行星轨道上的表观周期,将mtDNA参考转换为祖先RSRS将导致学术上不可接受的结合,实际上所有线粒体基因组序列的一部分都得自衍生自祖先的状态,部分是祖先到派生的状态。 我们的目标是引发相对于其祖先状态与衍生状态的mtDNA突变报道方式的根本但必要的改变,从而与目前所有现代人类线粒体基因组共有共同祖先的共识建立一种智力上的凝聚力。

请注意,问题不仅限于mtDNA。 的确,在完整核基因组的更大视野中,目前通常相对于现代人类参考序列(通常是欧洲起源)进行比较,似乎值得考虑将祖先等位基因的公共参考序列作为有价值的替代品 (在所有灵长类动物中很常见),由此可以区分衍生的等位基因(在某些人群中很常见)。

也许第一代的人类分子进化遗传学可能被认为是“初稿”。 一份有用的初稿,广泛地画出了我们所理解的真理的要旨,但缺少一些必要的细节。

在一个小小的注释上,有一些理论上的原因导致mtDNA不能为古体混合物提供太多证据,这在核基因组学中是显而易见的(例如,由于有效种群数量减少而导致的变化率更高,古代血统的灭绝速度更快) 。 但是,也许现在完整的mtDNA基因组的数量在增加,我们可能会开始看到“长分支”,这反映了古代核基因组产生的推论。

 

脸是我们表型的重要方面。 面部识别非常重要,因此是许多先天性自反性认知能力之一。 借此,我的意思是您可以识别出 完形 就像您可以识别出一组三个弹珠一样。 您不必一步一步地考虑它。 特定类型的脑部伤害实际上可能导致该教师的残疾,而且少数人似乎在出生时就完全缺乏这种能力(围绝症)。 这就是为什么我一直对颅面特征的遗传结构和进化感兴趣的原因。 我很早以前就知道我女儿的色素沉着表型可能存在的范围,因为她的父母双方都已经进行了基因分型,但是当涉及到面部特征时,我们仍然坚持旧的“混合遗传”启发式方法。 揭开颅面特征的遗传结构最明显的重要性是法医。 它可能不会使素描画家失业,但是它将是有问题的目击者报告的绝佳补充。

但这不仅是取证。 这个问题与进化有关。 就形态而言,直到最近,我们自己的血统还是有很多多样性。 我特别想到的是最近在 中国尼日利亚,似乎一直坚持到全新世。 更广泛地说,在过去的10,000年中,人类整体上变得更加温和。 为什么? 我们可以寻找两个极端的答案。 首先,脆弱的人类已经取代了健壮的人类。 第二,自然选择的灵活性导致了 原位 过去约10,000年间许多人口的演变。 有趣的是,看起来许多显着性状已成为选择的目标,因此进化和种群分化.

在这里, 偏离的前10个SNP 从HGDP数据集中的总体人口系统关系树中得出:

 

SNP 染色体 最近的基因 表型
rs1834640 15 SLC24A5 皮肤色素沉着
rs260690 2 雷达 头发形态
rs10882168 10 CYP26A1 / FER1L3 ?
rs4918664 10 CYP26A1 / FER1L3 ?
rs2250072 15 SLC24A5 皮肤色素沉着
rs6583859 10 CYP26A1 / FER1L3 ?
rs2384319 2 KIF3C ?
rs6500380 16 朗普2 ?
rs4497887 2 CNTNAP5 ?
rs9809818 3 福克斯1 ?

我想说两件事。 第一的, 给定的SNP可能具有许多表型效应。 因此,就效果而言,我们“看到”的特征可能与自然选择“看到”的特征不同。 其次,在给定的变异可能影响到身体上突出的变异中脱颖而出并不令人惊讶。 有时候,您确实会去寻找黑暗的街道上的灯光。 我们知道,东西欧亚人肤色较浅似乎是由于 独立的进化事件。 换句话说,它们不是源自共同祖先。 当谈到头发的形式 雷达 地点似乎是造成东亚人独特特征的原因,并且最近已被选定。

这与颅面特征有什么关系? 简单:几十年来,物理人类学家用来对人类进行分类的粗糙和“皮肤深层”特征对于系统发育和自然选择的细节的首次近似提供了相当有益的信息。 我认为颅面部特征没有任何不同的原因。 人类变得更加轻柔,一些人口似乎在迅速变化。 我高度怀疑这是一个中立的过程。 我们非常关心面部特征,与规范的偏离可能会引起人们的注意。 如果发生了变化,要么是由于人口置换,要么是由于人口选择(可能是相关的响应,或直接的选择)。

我正是在此序言中在现代人类遗传变异研讨会上提供了马克·史里佛的摘要:

确定人脸正常范围变异的基因可以说是一些最有趣的,进化最快的基因。 但是,到目前为止,很少有工作致力于发现这些基因。 在假设导致孟德尔颅面部畸形的基因在确定正常范围的面部特征变异方面也可能很重要,并且与面部特征人群差异相关的那些基因应该经历更高水平的进化(等位基因频率变化)的假设下,我们已经采用混合映射/选择扫描方法来识别和研究直接影响面部特征的基因。 我们已经应用了自动准地标分析,偏最小二乘回归和个体基因组祖先估计的方法,以探索面部特征在两类人群(西非人和欧洲人)中的分布。 使用三个样本的混合对象(美国; N = 159,巴西人; N = 197和佛得角; N = 248),我们对父母群体中的面部变异进行了建模,并比较了从面部得出的祖先估计与基因组祖先估计。 我们还使用混合映射测试了六个选择提名的颅面候选基因对面部特征的功能影响。 在客观测试中,这六个基因中的两个(FGFR1和TRPS1)显示出对面部特征的显着影响。 此外,人类观察者对受试者和等位基因特异性面部形态之间相似性的评价对这两个基因显示出相同的效果。 另外,基于这些基因中正常范围变异的夸张的等位基因特异性形态,概括了与它们相关的颅面畸形的症状相。

我问马克这些基因的性质和特征。 该论文即将出版,但他告诉我他不认为 颅面部特征的遗传结构将与色素沉着基因一样简单或容易表征。 另一方面,据报道,他用他的标记集捕获了非洲与欧洲之间35%的差异,因此这并非微不足道,并且某些单个基因座具有足够强的效果,以至于可以用肉眼看到! 而且,鉴于现存的多样性 他认为,这些人群(色素沉着基因在非洲人和欧洲人之间常常是不相交的),他认为选择事件是最近的。

 

最新版本 美国人类遗传学杂志 有两篇论文使用“老式的”单亲标记来分别追踪人类从非洲和西伯利亚的移民。 我说过时是因为这些技术的新颖性最高是在大约10年前,在密集的常染色体SNP标记分析之前,更不用说全基因组测序了。 但是,从母系传下来的mtDNA和从父辈传给儿子的Y染色体仍然有用。 大概来说,它们很有用,因为经过将近20年的调查,这些标记集的数据集现在如此之大。 从技术上讲,因为基因组的这两个区域不重组,因此它们很适合作为树的系统进化树。 最后,尤其是mtDNA特别适合通过分子时钟方法进行估计(它具有较高的突变率区域,因此您可以在给定数目的碱基对上采样更大范围的变异;可以使用STR,它们可以快速突变) ,适用于Y染色体,但在约会中似乎有很多争议)。

这些文件是 阿拉伯摇篮:从非洲南部路线出发的线粒体遗迹线粒体DNA和Y染色体变异为美国原住民和土著阿尔塔人之间最近的共同祖先提供了证据. 二烯 已经对第一篇论文发表了评论。 我也不打算在这两个方面采取任何详细的立场, 但我必须补充一点,我们需要 非常 谨慎地从母系或父系进行推论,并假设人口流动率足够低,我们就可以从现在开始对过去进行系统推断。 例如,如果您将整个mtDNA南亚人与东亚人而不是欧洲人紧密地联系在一起,而如果您查看Y染色体,就会发现相反的情况。 整个基因组的情况更加复杂。 此外,欧亚大陆北部的古代DNA分析显示,过去和现在的人口之间存在很大的不连续性。 因此,在两个不同地区的两个不同血统之间回到最后一个共同祖先的合并实际上可能是由于最近一个共同来源人口的多样性所致,从而导致人口膨胀并取代了其他群体。

如果你需要论文, 给我发电子邮件。 你们中有些人比我更了解单倍群的字母汤。 以下是我认为给出最高结果的两个数字。

 

优秀的网站 io9 有一个 今天凑起来 这是通俗易懂的科普出版物性质的引人入胜的指标。 滞后指标。 这是去年四月发表的一篇文章的转载, 线粒体夏娃如何联系全人类并重写人类进化。 在其中,您将通过进化遗传学对人类自然历史的理解中包含特定时期的概括。 请注意,例如,关注母体传播的血统,mtDNA和Y染色体。 对家谱的引用可追溯到中期。 就细节而言,该科学基本上是正确的(或者至少是可以辩护的,最后我检查了关于用于Y染色体谱系的分子钟的有效性仍存在争议), 但它错过了如何 在过去的几年中,我们重新构筑了对人类过去的理解。 从这个意义上说,2011年到2009年之间的距离比2009年到1999年(甚至2009年和1989年!)之间的距离要大得多。 io9作品反映了范式破裂之前的时代。

我们不再说话 只是 关于非洲mtDNA夏娃和她的丈夫Y染色体亚当。 我将有意识地避免使用“革命”一词,因为肯定会保留旧故事的大致轮廓。 相反,由于我们不愿意这样做,似乎我们对某些笔触变得有点大胆,并且在边缘处消除了迷人而微妙的景观元素。 有 面包屑,以及其他各种 乌加斯布加斯。 绘画还没有完成。 因此,除了令人着迷的事实之外,我们无法真正得出关于“这意味着什么”的任何结论。

附录: 评论中的某人观察到一个关于夏娃在故事中的描写:“她对一个东非人来说真是太苍白了。” 从优点上说是对的,但逻辑有点愚蠢。 为什么我们确切地认为大约150,000万年前的人们看起来像现代的东非人? 大约35,000年前的欧洲人很可能看起来不像 达丽尔汉纳.

 

我已经在博客上发表了 遗传基因 of 海拔 适应 前。 世界上似乎有8,000个人口受到非常强烈的自然选择,导致生理差异,以应对人类的缺氧趋势。 其中两个是相对知名的,即藏族和安第斯山脉的土著人民。 但是埃塞俄比亚的高地居民没有得到很好的研究,也没有得到足够的重视。 但是,埃塞俄比亚的首都亚的斯亚贝巴海拔却近XNUMX英尺!

此现象的另一个有趣方面是,看起来这三个总体对适应性压力的反应不同。 它们的生理反应各不相同。 而且,最近在基因组学方面的研究表明,尽管亚洲和美洲人口之间存在相似之处,但也存在差异。 这说明了趋同的进化原理,其中不同的群体通过不同的方法接近相同的表型最优值。 据我所知,没有对非洲的例子进行过多的调查。 到现在。 一份新的临时文件 基因组生物学 出来了 埃塞俄比亚高原对高海拔地区的遗传适应:

我们重点介绍了几个参与埃塞俄比亚高海拔适应的候选基因,包括CBARA1,VAV3,ARNT2和THRB。 尽管大多数这些基因在以前的高海拔藏族或安第斯族人群样本研究中尚未发现,但是其中两个基因(THRB和ARNT2)在HIF-1途径中起作用,该途径与以前在藏族中报道的工作有关。和安第斯研究。 这些综合结果表明,由于在埃塞俄比亚的高海拔阿姆哈拉(Amhara)人群中趋于一致的进化,因此对高原的适应独立出现。

对我而言,这篇论文的主要缺点是它没有 强调这种适应的进化历史。 在本文中,作者将Amhara(高地人口)与附近的低地人口进行了比较。 但是没有探索 人口结构的性质 以及它如何影响适应弧。 这些是非常古老的改编吗? 还是新的? 似乎人类素已经在埃塞俄比亚居住了几百万年。 如果是这样的话,那么从远古时代开始就已经适应了更高的海拔。 但是,如果这些修改是新的呢?

更明确地说,埃塞俄比亚人可以被建模为阿拉伯人口与东非土著人口的复合体。 如果这是最近的一次真正的外来事件,则可以通过单倍型结构确定适应性变体是否源自古代非洲遗传变异,或者它们是否是新突变。 看来本文是迈出良好的第一步,但这里还有更多值得一看的地方……。

引文: 基因组生物学, doi:10.1186/gb-2012-13-1-r1

图片来源: 维基百科上的数据

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”