Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
 玩笑基因表达博客
/
统计报表

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

基因组解压缩, 规模很重要,还有医学遗传学的其他经验教训:

...较小的研究无法检测出这些微小的影响, 本质上是随机的p值生成器。 有时p值是“重要的”,有时不是,与变体是否真正相关没有任何关联。 此外,由于研究人员通常只在一个基因中只考虑几个变异(通常只有一个!),他们坚信该变异与疾病有关,因此他们通常能够对数据进行子集化(例如,将男性和女性分开)在某个子组中找到“重要”结果。 这与在工作台抽屉中发表积极结果并留下消极结果的趋势相结合,导致了一系列相互矛盾且令人困惑的文献,从而积极地阻碍了医学遗传学的发展。

容易选择的是对“ p值”的依赖,这是具有统计意义的阈值。 只是因为某事是 具有统计意义 并不意味着它是实质。 统计意义只是一个数字,在大多数人类活动中盲目遵守数字标准通常会导致测量值出现偏差和“游戏化”。 p值将随机分布,对于发布,您只需要在0.05阈值以下的池中钓鱼即可。 它只是表明您不能退后一步,而是真正在思考您的结果意味着什么以及如何获得这些结果。

(如帖子中所示, 这在很多领域都是一个问题, 可能在医学和药学研究中最令人担忧的是)

 
• 类别: 科学 •标签: 统计报表 

在这个领域中,我进行了密切追踪的两个主要研究途径是全基因组关联研究(全球风电系统),试图在性状/疾病与特定的遗传标记之间建立联系,并查询可塑造人类基因组变异结构的进化参数。 通常与特定的性状/疾病有特定的关系。 所谓的演化参数,是指随机的和确定性的力。 突变,迁移,随机漂移和自然选择。 这两个角度显然是相连的。 两者都关注与更广泛的进化原理相关的现象: 终极存在理由,复制。 随机力(例如随机遗传漂移)反映了繁殖过程中一代又一代基因采样的误差,而通过自然选择进行适应是生殖适应性随遗传性状的变化而变化的结果。 这两种力量都与GWAS(和 连锁映射).

由于GWAS在确定特定疾病的致病遗传因素方面具有相关性,因此经常出现在新闻中。 例如, 精神分裂症。 但是它们在非疾病环境中也很有用。 人类 色素沉着 由于最近的许多关联研究,该字符的遗传结构得到了很好的阐明。 这 常见疾病-常见变异 在色素沉着方面取得了令人瞩目的成果; 看来 一些常见的变体 负责该特征的大部分变化。 但这是例外,而不是规则。

GWAS的承诺与具体的有形结果之间存在这种脱节的原因是: 许多重要的性状/疾病可能是多基因的和定量的。 这意味着表型的变化受许多基因之间的变化控制,并且变化本身表现出逐渐的连续性(可以将其建模为值的正态分布的连续性)。 GWAS检测跨基因和较小边际效应特征的相关变异的能力明显受到限制。 相比之下,似乎大约有六个基因可以解释色素沉着的群体差异之间的大多数。 一 SNP 能够解决欧洲人和非洲人之间阴影差异的25-40%。 该SNP在欧洲人中固定,在非洲人和东亚人中几乎不存在,并且在祖先和派生变体中隔离开来,例如南亚人和非裔美国人。 相反,尽管诸如 精神分裂症高度 基本上是遗传性的,该性状在群体水平上的许多变异可以通过基因变异来解释。 在任何给定位置的效应大小可能很小,或者可以通过较大的低频效应变异之和来累积变异。 换句话说,许多效果不大的常见变体,或众多独特的 大效果的稀有变体.


研究博客网站 基因结构的这些细微差别与所讨论特征的可能进化弧线无关。 导致性状或疾病发生频率高的适应模型之一是,新突变迅速“扫视”固定或几乎固定。 换句话说,在正向选择的驱动下,该位点等位基因群体中的频率从约0%转变为约100%。 这种快速 “硬扫” 还会导致与最初偏爱的突变体相邻的基因组区域中相关变体的“搭便车”,从而产生高 连锁不平衡 在基因组中 单倍型 跨基因座的相关等位基因块。 在以下情况下,这样的模型似乎确实可行 一些变体 导致色素沉着的多样性。 但是,在许多变体与性状变异之间的强关联与通过适应性驱动的积极选择的特征之间的这种巧妙的衔接在许多情况下并不容易实现。

关于什么可以驱动特定等位基因的高频率,还有其他的进化可能性。 人口瓶颈和近交可以仅通过偶然机会提高变体的出现频率。 这可能是在特定人群中隐性表达或以准孟德尔形式表达的许多特征和疾病的起源。 现在让我们将这种随机可能性设置在一边。 简单选择基于奇异新突变的正选择模型并不能充分挖掘自然选择的优势。 另一个模型是基于固定遗传变异的“软扫掠”模型。 考虑例如具有0.50的遗传力的性状。 性状值的50%的变异可以用基因的变异来解释。 与特质值相关的选择可以迅速改变特质在人群中的分布,如 育种者方程。 但是在该模型中不需要新的突变,相反,现存等位基因的频率会随时间变化。 实际上,随着比例的变化,将出现曾经很少在同一个人中一起发现的罕见等位基因的新颖组合,从而提供了一代中的平均性状价值的可能性。 t + n代 可能不在特质值范围内 t = 0.

随着时间的流逝,对数量性状的这种选择理论上会耗尽其自身的燃料,遗传变异。 但是通常这在实际中是行不通的,因为这样的性状受新突变的背景水平的影响, 平衡选择。 在中位表型附近稳定选择,以及频率依赖性和变化的环境压力,可能会产生一种情况,在这种情况下,适应永远不会超出瞬态通量而达到新的平衡。 永恒种族的元素是生命的核心 红皇后假说,其中病原体和宿主参与进化战争,宿主免疫反应受到负频率依赖性的影响。 随着等位基因频率的增加,其相对适应性也会下降。 随着频率的降低,其适应性也随之提高。

自然地,这种复杂的进化模型受偶然性的影响,其通用性较弱,只有在简单的硬扫掠模型不再足够时才具有吸引力。 但是,某些性状的遗传结构似乎是高度合理的,这些性状似乎受到了“缺少遗传力”将需要更多巴洛克式的进化模型来解释其最终出现和持久性。 中的新论文 PLoS遗传学 通过查看GWAS中涉及的SNP变异模式来解决这种复杂性。 人均国内生产总值 数据集。 人类基因组多样性项目人群中的全基因组关联研究SNP:选择是否会影响具有特质关联的未关联SNP? 一,摘要:

全基因组关联研究(GWAS)已经确定了2,000多个性状-SNP关联,并且这一数目还在继续增加。 GWAS专注于对人体健康有潜在影响的特征,包括许多免疫,代谢,心血管和行为表型。 鉴于复杂性状的多基因性质,选择可能会通过改变许多相关基因座的等位基因频率而对其产生影响,这一可能性有待实证研究。 在这里,我们使用等位基因频率变化的38种不同测量方法和8个iHS分数来表征1,300个全球分布人群中的53多个GWAS SNP。 我们应用这些相同的技术来评估按性状关联分组的SNP。 我们发现与色素沉着,血压,传染病和自身免疫性疾病特征相关的SNPs组在某些地理位置表现出异常的等位基因频率模式和升高的iHS分数。 我们还发现,在欧亚大陆和东亚,GWAS SNP在等位基因频率变化和iHS方面的得分普遍较高。 总的来说,我们相信我们的结果为选择一些导致多个相关基因座等位基因频率发生变化和/或iHS分数升高的复杂性状提供了证据。 由于GWAS SNP共同表现出较高的等位基因频率测量值和iHS评分,因此对复杂性状的选择可能相当广泛。 我们的发现与这种选择是正面的还是负面的最一致,尽管很难区分两者的相对贡献。 我们的结果还表明,在欧亚样品中鉴定出的性状-SNP关联可能在非洲,大洋洲和美洲不存在,这可能是由于连锁不平衡模式的差异所致。 该观察结果表明,非欧亚和非东亚样本人群应包括在未来的GWAS中

现在作者总结:

自然选择通过改变基因组多态性的等位基因频率来发挥其影响。 与有害性状相关的等位基因频率降低,而与有益性状相关的等位基因变得更常见。 在一个简单的情况下,选择作用于一个单一多态性所控制的性状。 在这种多态性下,等位基因频率的较大变化可以消除种群中的有害表型或修复有益的表型。 然而,许多表型,包括2型糖尿病,克罗恩病和前列腺癌等疾病,以及诸如身高,体重和头发颜色等生理特征,都由多个基因组位点控制。 通过影响单个关联多态性的等位基因频率或通过改变许多关联多态性的等位基因频率,选择可以对此类性状起作用。 为了寻找后者的病例,我们组装了具有共同性状关联的基因组多态性组,并研究了其在全球53个分布人群中的等位基因频率,以寻找地理空间中等位基因行为的共性。 我们发现与血压相关的变异往往与纬度相关,而与艾滋病毒/艾滋病进展相关的变异与经度相关。 我们还发现证据表明,选择可能正在全球范围内发挥作用,以增加等位基因的频率,从而提高自身免疫性疾病的风险。

在本文中,跳到这些方法可能会有用。 尽管我确信作者并没有打算这样做,但有时您会感到仿佛您正在跟随狂欢节招标操纵的大理石。 由于我不熟悉统计的某些术语,因此仅对方法进行简单的提及就不够详细了。 无论如何,这里的关键是他们专注于 与GWAS中的性状差异相关的SNP集,并将其与在53个人口的HGDP数据集中发现的总SNP进行比较。 请注意,并非GWAS中的所有SNP都在HGDP SNP面板中。 但是对于一般性的问题,单核苷酸多态性的交集就足够了。 此外,他们还产生了SNP的另一个子集,这些子集很可能与性状变异有关。 这些是具有相关功能的其他SNP在1 MB以内的SNP,或者是在多个GWAS中发现的SNP。

论文中有四个主要统计数据:Delta,Fst,LLC和iHS。 Fst和iHS很熟悉。 Fst衡量一组人口之间的人口差异之间的程度。 Fst高意味着大量的人口结构,而Fst〜0意味着基本上没有人口结构。 iHS是一项基于基因组连锁不平衡模式检测自然选择可能性的测试。 基本上,对于本文而言,重要的是iHS倾向于擅长检测中等频率的等位基因,而这些频率仍可能通过扫描。 这与较早的EHH测试相反,后者仅检测几乎完成的扫描。 如果作者专注于多基因性状和柔毛扫频,则出现在EHH上的可能性很低,因为这是基于硬扫频,几乎完整的扫频而来的。 LLC根据纬度和经度来衡量性状的遗传变异之间的相关性。 据推测,这对于抽出那些受到生态压力驱动的特征是有用的(一般意义上的一个明显例子是,随着生物体从温暖到寒冷的气候发展,整个分类群的面积/体积比的变化是一致的)。 最后,Delta会测量整个人群中的等位基因频率差异。 Delta的符号仅是所比较的等位基因频率在比较的第一群体或第二群体中是否较高的函数。

在进行比较时,作者并没有简单地以成对的方式对所有53个人群进行比较。 相反,他们经常汇集大陆或区域集团。 左侧是表1的一部分。它显示了用于生成Delta值的总体以及如何将其汇总。 这 HGDP人口 以一种非常直接的方式按区域进行细分。 但也请注意,有些比较是在区域内的人口与生活方式不同的人口之间进行的。 我认为本文中突出显示的比较是为了在这种探索性尝试中最大程度地压缩信息性汁液而进行的。 据我所知,在HGDP数据集中,欧亚人口中没有专职的狩猎采集者,因此无法进行农业学家和狩猎采集者之间的比较。 非洲数据集中有这样的比较。 作者通过将GWAS SNP与HGDP数据集中的随机SNP进行比较来生成p值。 特别是,他们正在寻找HGDP数据集的独特性特征。

这种独特性是可以预期的。 与疾病和值得注意的特征有关的SNP集不可能是整个基因组中SNP的代表性子集。 记住 中性模型 分子进化的意义意味着我们应该期望基因组内的大多数遗传变异将归因于随机力。 图1的面板A显示,实际上,来自GWAS的SNP确实表现出与HGDP面板中的SNP总数不同的模式。 请注意,GWAS SNP的次要等位基因频率(MAF)的分布有些偏向更高的值。 如果GWAS的逻辑是针对“常见变异”的,而这种变异会在人群中足够频繁地产生一种足够强大的效应,以至于研究被赋予样本量,那么偏向于更常见变异(更高的MAF)是可以理解的。

左侧是一些具有低p值的SNP和特征(即,它们偏离了预期,超出了您对随机噪声的预期)。 毫不奇怪,他们发现与色素沉着相关的SNP在所有的种群分化和变异测量中都倾向于强烈显示。 rs28777位于 SLC45A2,这是区分欧洲人与非欧洲人的场所。 rs1834640在 SLC24A5,从而将欧洲人+中东人+中亚/南亚人与其他人群区分开来。 rs12913832是与“蓝眼睛”相关的变体。 也就是说,它是欧洲人的蓝眼睛和非蓝眼睛颜色差异相关的标志之一。

鉴于色素沉着是目前技术已充分阐明的少数几个特征之一,应该预料到,旨在检测种群内和种群内遗传变异的更微妙和彻底的方法应首先偶然发现这些标记。 作者指出,“与SNP相关的SNP和研究组 色素沉着和免疫学特征占我们分析中有意义的大部分。” 长期以来一直在寻找色素沉着和疾病相关基因座周围的选择特征的趋势。

在低p值的模式中从地理上也很明显的一种模式是欧亚群体趋于富集的趋势。 如图2所示。GWAS研究中的大多数SNP均来自欧洲的研究人群。 因此,在评估的SNP集合中可能存在偏差,这对欧洲人和相关人群特别有用。 此外,欧亚人离开祖传非洲环境时可能受到不同的选择压力约150-50,000年BP在任何情况下,出于医学分析的目的,作者的确发现使用东亚人群的SNP产生了一些不同结果要比使用欧洲人群的结果好。 尽管一些研究表明SNP在人群中具有广泛的适用性,但是毫无疑问,非欧洲人群中的许多变异都没有被发现,因为GWAS研究并不特别针对非欧洲人群。 考虑:

…然而,我们的结果表明,GWAS中与色素沉着相关的SNP几乎在欧洲,中东和中亚地区都显示出异常的等位基因频率模式。 这向我们表明,可能存在SNP,可能在除 SLC45A2,IRF4,TYR,SLC24A4,HERC2,MC1R,知识产权协会,与非欧亚人口的色素沉着有关,但尚未被GWAS识别。 需要使用非欧洲受试者进行的针对色素沉着性状的GWAS,以进一步探索这种可能性。

人们发现,在HGDP人群中,有两种主要的特征/疾病类别也有系统地不同:

–与高血压相关的变异似乎随着纬度的降低而降低

–传染性和自身免疫性疾病SNPs得分较高。 具体来说,与欧洲人相关的一些与HIV相关的SNP似乎具有抗药性

第一组特征自然会来自GWAS衍生的SNP,因为如此大量的医学研究已开始识别风险,治疗高血压和其他循环系统疾病。 一致的模式,其中 地理而不是祖先预测变化 是外生选择压力的绝佳证明。 地球的物理性质使得随着哺乳动物从赤道扩散开来,它们的体形将因不同的生态参数集而发生变化。 西伯利亚人口有 适应冷压力,而且在身体形态上似乎存在一致的跨类群转移,以使哺乳动物之间的热辐射最大化或最小化。

在第二种情况下,您对疾病再次产生抵抗力,以及 多效性,因此遗传变化会产生多种下游后果。 通常,这在时间上是同时发生的。 考虑 驯服的银狐。 但是有时您会改变过去,由于不同的选择压力而在后来产生了后续后果。 免疫学反应具有多种用途也就不足为奇了,因此,即使欧洲人没有对艾滋病毒产生抗药性作为普遍的选择压力,类似的压力似乎也导致了具有普遍效用的抗药性反应,并且如今已针对艾滋病毒进行了特定用途。 选择通常可能是一种钝器,将自身置入具有多种后果的相互作用网络中,同时在最大程度地提高本地适应性的过程中同时重塑许多特征。 当您具有以下特质时,这一点最明显 镰状细胞病,这仅仅是因为杂合性的适应性优势如此之大。 但是毫无疑问,当涉及到许多特征时,副产物更加微妙,或者对我们而言似乎是神秘的。 我们仍然不知道为什么 雷达 在东亚人中被驱使的频率更高(较少的体味和浓密的直发似乎是难以置信的选择目标)。

就像自然选择对基因和性状的协方差的影响可能是直率的和粗鲁的一样,自然选择的放松可能会消除令人窒息的恶习。 考虑一下血压的可能性:也许北欧亚人的血压较低的原因是放宽了对与较高值相关的其他相关性状的选择,从而使该特定维度的适应性最大化。 同样,非裔美国人的镰状细胞疾病发生率低于其约80%的西非血统,因为没有消除杂合子的地方性疟疾选择压力,这允许从基因库中清除等位基因。

尽管如此,作者的确得出以下结论:

尽管我们采用了广泛的方法,但我们仅发现了可能是对单一选择压力的多基因反应的几个例子。 我们确实使用了严格的显着性标准,这可能意味着可以在研究组中找到一些其他示例,这些示例并未完全达到我们的显着性标准。 也可能是关于“ GWAS”特征及其潜在遗传的某些东西破坏了我们的方法。

他们对为何无法成功提出了一些建议:
– GWAS变体不是变体的主要来源。 可能是拷贝数变体,罕见的大效应变体(“合成”)

–上位性。 基因-基因相互作用,将掩盖或混淆变体和性状之间的线性关联

–选择对GWAS SNP的影响小,或者平衡或否定选择

他们完成:

总而言之,我们检查了1,336个CEPH-HGDP人群中的53个与性状相关的SNP,以寻找具有异常等位基因频率模式和iHS分数升高的单个SNP和SNP组。 我们与一个相关的SNP或研究组一起确定了13个不同的性状,这些性状在至少一项Δ,Fst,LLC或iHS量度中得分显着提高,占所分析特征总数的一小部分。 我们认为,有限的阳性结果可能是由于我们严格的意义标准或性状本身的遗传结构特征所致。 具体来说,尽管积极研究的领域很少见,但稀有变异,上位性和多效性在人类复杂性状中的作用仍未得到很好的理解。 我们的措施对于检测所有作用于GWAS性状的选择类型也不是最佳的。 据推测,复杂性状的潜在变异主要受到负选择或平衡选择的影响,这可能不会为我们的测量方法带来极端价值,特别是如果这些力在人群中相对统一或作用于基因组中的许多区域时。

如果对多基因性状的选择性压力如此普遍,那么基因组学家可能会不屑一顾。 定量遗传学导论。 这些是特征和进化过程,缺乏明显的区别。 在许多方面,对正选择和强力推销建模都类似于均衡的经济学。 当涉及到受许多基因影响的连续性和定量性状时,必须提出一种不同的思维方式。 暂时不再成为停滞之间的标点,而是事物本身。 有例如 HLA 在黑猩猩中发现的人类基因,因为宿主和病原体之间永恒的种族关系的性质意味着所有旧的花样都至少在低频时得以保留。 人类在智力,身高以及各种其他责任和特征方面的变化,可能一直伴随着我们,并受到众多选择压力的不断冲击。 问题是,我们的原始统计方法是否能掌握这个分散但功能强大的网络?

引文: Casto AM和Feldman MW(2011)。 人类基因组多样性项目人群中的全基因组关联研究SNP:选择是否会影响具有特质关联的未关联SNP? PLoS遗传学: 10.1371 / journal.pgen.1001266

 

回应我 职位 在无神论统计的下面,评论和网络上的人们(例如Facebook)指出,佛教必定是/可以是无神论的,佛教不一定是宗教,因此可以解释该统计信息。 这些人中有些人通过论证的方式来判断他们是懒惰/愚蠢的人,但他们显然是建立在以现实为基础的,这种现实在书籍和纪录片中得到了表达,使人们认识了佛教。 有一个小问题混淆了对无神论统计数据的分析: 大多数东亚人不认为自己是佛教徒。 这主要是因为中华人民共和国的大多数公民都不认同佛教。 话虽这么说,佛教在历史上显然是许多东亚国家中占主导地位的有组织宗教(尽管上一代在韩国并非如此)。 我拒绝天主教在欧洲大部分地区和佛教在东亚地区的作用之间的对等(教会是一个比佛教徒更强大,更有声望和影响力的机构 僧伽 仅有几个例外时期),但可以说,这是佛教文化,就像儒家社会一样。

但是,这个异议还有一个更大的问题: 多数认为是佛教徒的亚洲人是 自己有神论者. 这也是 美国佛教徒的案子。 有人反对 有神论 在佛教的语境中,在印度教中,特别是在亚伯拉罕意义上,它不等于有神论。 显然没有创造神。 很好,但是我认为必须指出的是,无论他们信仰的神学细节如何, 大多数佛教徒似乎确实接受超自然实体的存在,我们称其为“神”。 我个人是意识到这一点的,因为我遇到了几位中国血统的人,他们告诉我他们是佛教徒,他们信仰上帝,当我告诉他们我是无神论者时(通常是在回答有关我是否是无神论者的问题时穆斯林)。

先前关于某个人是“宗教人士”,“不是宗教人士”还是“被说服的无神论者”的问题可以通过宗教加以细分。 我是这样做的。 以下是仅佛教徒的数据。 我还提供了佛教徒的样本量。 N的总数约为1,000-2,000。 因此,您可以看到在中华人民共和国中只有一小部分(实际上是5%)的中国人确定为佛教徒。 其他值显然是百分比。

国家 N 宗教 不是宗教人士 有说服力的无神论者
日本 319 37 60 3
韩国 298 37 61 3
中国 70 91 9 0
台湾 224 50 41 8
越南 226 62 15 23
香港 160 100 0 0
泰国 1484 34 66 0
马来西亚 240 78 20 2
 
• 类别: 科学 •标签: 无神论, 佛教, 数据分析, 宗教, 统计报表 

大多数进化模型中隐含的一种观念是,生命之树具有共同的根源。 换句话说,所有物种的所有个体都代表着血统的终点,这些终点最终会融合为原始的共同祖先。 可以说是第一个地球人。 我之所以说是隐含的,是因为进化没有必要保持共同的血统。 毕竟,如果存在这样的情况,我们大概会认为进化过程在外部生物学环境中是有效的。 因此,现代现存世系有可能是从单独的独立先例衍生而来的。 “多重花园”模型。 随着生物学的分子基础已经阐明,这似乎越来越不合理。 它看起来像遍布整个生命之树的基本工具包。 但是有了新发现,人们意识到诸如 水平基因转移 开闭案例面临着新的歧义。 也许不是?

这是来自的帖子 接线, 地球上的生命只出现了一次:

马萨诸塞州沃尔瑟姆市布兰代斯大学的生物化学家道格拉斯·塞伯德(Douglas Theobald)说,生命形式具有共同祖先的观念是“进化论的中心支柱”。 “但是最近有一些喃喃自语,尤其是来自微生物学家的抱怨,以至于它可能没有被如此干燥。”

由于不同物种的微生物经常交换基因,因此一些科学家提出,多种原始生命形式可能会将其遗传物质抛入生命的混合物中,从而形成了网状结构,而不是生命树。

为了确定哪个假设更可能正确,Theobald通过严格的统计检验放置了各种进化祖先模型。 结果发表在13月XNUMX日的《自然》杂志上,其中绝大多数归结为一位祖先。

通用祖先至少为102,860 Theobald计算得出,比有多个祖先的可能性高两倍。

该文件现在在 自然 网站 对普世祖先理论的正式考验。 他们专门研究了生命三个领域(即真核生物,原核生物和古细菌)中跨23个类群的12个非常保守的蛋白质。 这是作者在这里解释统计技术背后的原理的地方:

在几种竞争性科学模型中进行选择时,必须考虑两个相反的因素:拟合优度和简约性。 通过增加自由参数的数量,可以任意提高模型对数据的拟合度。 另一方面,首选简单假设(那些假设具有尽可能少的临时参数)。 模型选择方法从统计学上权衡这两个因素,以找到最准确和最精确的假设。

比较的模型种类如图2所示。一种是左侧,您有通用的普遍血统模型,另一种是原核生物(细菌)具有独立的起源。 线代表通过水平转移或垂直转移的23个保守蛋白序列之间的连接。

大自然09014-f2.2

如上所述 接线 件没有比赛在这里。 普遍支持普遍血统。 我让作者完成:

序列数据的什么属性如此决定性地支持共同祖先? 当将两个相关的分类单元分成两棵树时,将不再对序列之间存在的强相关性进行建模,从而导致可能性大大降低。 因此,在将共同祖先模型与多重祖先模型进行比较时,较大的测试分数是我们准确预测谱系相关蛋白相对于无关蛋白的序列的能力提高的直接量度。 如果某个分类单元的序列比对中的列被随机打乱,则将消除该分类单元的进化枝与树的其余部分之间的序列相关性。 在这种情况下,这些基于模型的选择测试应首选多祖先模型。 实际上,在具有随机混排数据的实际测试中,统一树的最佳估计(针对最大似然和贝叶斯分析)都包含一个非常大的内部分支,将混排的分类单元与其余部分分开。 在所有尝试的情况下,使用各种各样的演化模型(从最简单到最丰富的参数),混洗数据集的多谱系模型比通用谱系模型(LLR大约为一千)要大幅度偏爱),即使内部分支机构很大。 因此,有利于UCA模型的较大测试分数反映了树结构的巨大威力,再加上逐步的马尔可夫残基取代机制,可以准确和准确地解释在谱系相关的生物大分子中发现的序列相关性的特定模式。

引文: Theobald,道格拉斯·L。, 对普世祖先理论的正式考验,自然,doi:10.1038 / nature09014

 
• 类别: 科学 •标签: 基因, 基因组学, 统计报表 

艾伦·邓普顿(Alan Templeton),其文字 人口遗传学与微观进化论 就在下面 哈特与克拉克 在我的书中,最近发表了一篇措辞强烈的论文, 系统地理学和人类进化的相干和非相干推理。 在发表的著作中出现统计错误的可能性并不令人震惊,我听说,当统计学家被要求对医学遗传学期刊的论文进行分类时,在约3/4的基本错误中,有超出同行评审范围的错误。 话虽这么说,邓普顿似乎比简单地驳斥基本错误提供了更强的理由,特别是他建议“ ABC”方法是本文的核心 我校审了 上周根本没有连贯性。 这是邓普顿的摘要:

当假设是更一般的假设的特例时,它就嵌套在更一般的假设中。 复合假设由一个以上的成分组成,并且在许多情况下,不同的复合假设可以共享部分但并非全部这些成分,因此是重叠的。 在统计学中,嵌套和重叠复合假设的一致性一致性度量从技术上讲是与形式逻辑的约束一致的度量。 例如,嵌套特例的概率必须小于或等于嵌套特例的通用模型的概率。 任何将特殊情况分配给较大可能性的统计数据都被认为是不连贯的。 人类进化中显示了一个不连贯的例子,为此,近似贝叶斯计算(ABC)方法为人类进化模型分配了一个概率,该概率比在其中完全嵌套第一个模型的更一般的模型大了XNUMX倍。 确定这种不连贯的可能原因,并建议进行更正和限制以使ABC和类似方法保持连贯。 另一个基于合并的方法,巢式进化谱分析,是连贯的,并且还可以测试复合假设的各个组成部分,这是ABC和其他合并模拟方法所缺乏的另一个属性。 不连贯性是非常不希望的特性,因为这意味着该推论在数学上是不正确的,并且在形式上是不合逻辑的,并且已发表的有关人类进化的不连贯性推论支持非洲以外的替代假设,没有统计或逻辑上的有效性。

Templeton偏爱的方法自然是他过去所推崇的方法。 无论如何,我都不十分了解统计细节,以至于不需多加评论,但我看到了 统计学家已经回应了邓普顿 已经,所以我建议您检查一下。 我立即去寻找答复,因为该论文使用了非常强硬和不屑一顾的语言,在尝试拆除整个研究领域的基础知识时,我对此有些警惕(我想强调一点,总体而言,我喜欢邓普顿的工作,但论文让我想起了太多 杰里·福多(Jerry Fodor))。 特别是他对波普尔的引用似乎是对权威的一种诉求,其目的是说服听众中的非统计学家,除了修辞实用性之外,我没有看到这一点。 我确实倾向于在某种程度上接受邓普顿对模型的批评,该模型假设在非非洲移徙之前人源蛋白种群之间的基因流很小,尽管据我所知,似乎非洲确实已经 相对 在过去的50,000年中,撒哈拉以南地区几乎没有回迁现象,所以也许这也是一个较早的时期。 我谨慎地乐观地认为,从化石本身中提取DNA可能会使某些论点因参数的变化而搁置,尽管自然的解释始终是纯数学之外的问题。

对于它的价值,这是邓普顿方法偏爱的模型:


TEMPL

细线代表种群之间的连续基因流动,而粗线则代表极强的人口统计和遗传脉冲,这些脉冲周期性地淹没了遗传结构的现状。 我暗示类似的事情在较小规模的 智人.

引文: 地理学和人类进化的相干和非相干推断,PNAS 2010 107(14)6376-6381; doi:10.1073 / pnas.0910647107

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”