我已经提到了 PLoS遗传学 纸, 尼安德特人与现代人类之间的杂交日期,之前是因为它的版本 arXiv。 最后的论文有一些补充。 例如,它提到了 通常平移 (至少在我参加的圈子中) PNAS 这篇论文指出古代的人口结构可能产生相同的模式,早先用来推断与尼安德特人的混合(作者还指出 杨等。 作为对掺混物而非结构主张的支持)。 重申了从尼安德特人和解剖学上的现代人类之间混合到现在约40-80,000年之前的主要结果。
一个有趣的方面是,他们的方法是利用连锁不平衡(LD)衰减。 有趣的是,数万年的时间对于通过LD检测混合事件是一个漫长的地狱! 特别是因为在中间存在混合因素和其他各种人口统计事件(例如,瓶颈和选择性扫描也可能产生LD)时,可能会产生最淡淡的效果。 那么他们是怎么做到的呢? 基本上,作者通过比较现代人类与尼安德特人在给定SNP的频率(特别是通过观察非洲人中低频且源自尼安德特人的变体),找出了哪对SNPs可能从尼安德特人中渗入。 这里的一个主要技术问题是“遗传图谱”,它允许人们评估随着时间的推移重组的本质是什么,从而打破了关联性,而关联性是LD的标志,不够精确,无法可靠地使他们进行重组。他们想要的推论。
但是我相信这里正在出现分歧,因为开发人员大胆地切入大量数据的方法正朝着其他生物学家可以遵循的方向发展。 当然,不仅是生物学家。 这些有关深厚历史和人类系统发生树的特定问题是古人类学家们非常感兴趣的问题,他们中的大多数人显然不能轻易流利地讨论有关古代结构或混合物以及D统计的相关性。 理查德·克莱因(Richard Klein)说服时,显然就是这样 纽约时报 写 一篇文章 这使他对统计遗传学家的专业见解变得清晰起来,这些遗传学家推翻了他位置优越的苹果推车,并在他的特定领域为他提供了令人信服的竞争对手。 但是在克莱因的辩护中,他优雅的言语模式至少对公众是清楚的。 统计基因组学存在方法上的不透明性,我们不得不承认这是不可否认的。
最终,根据我个人的经验,有一种主要途径可以真正实现 格罗克 像这样的论文中发生了什么: 用相同的计算技术复制他们的分析,并自己开发 直觉。 不幸的是,这需要时间,每个人都有自己的任务,因此发生的情况少于实际情况(例如,成千上万的模拟计算并不便宜)。 但是,像上述小组一样,所有小组都可以提供软件工具,并指向数据所在的位置(这凸显了当今开放科学的至关重要性)。 其他人可以重新分析,并重要地复制仿真并根据自己的喜好调整参数。 这比扶手椅批评(无论是否同行)都有用得多。 一旦熟悉魔术,魔术就会成为一种技能。
引文: Sankararaman S,Patterson N,Li H,PääboS,Reich D(2012)尼安德特人与现代人类之间的杂交日期。 PLoS Genet 8(10):e1002947。 doi:10.1371 / journal.pgen.1002947
Very interesting. Even the “emerging classic” ROLLOFF has major issues with sub-centiMorgan distances and time scales over a couple thousand years, as discussed in Moorjani et al. Part of it is non-admixture LD and part, uncertainity in genetic maps; the bias generally results in overestimated time scales, and the calculated CIs are somewhat meaningless as they “only” describe the level reprodicibility of the estimates within the model (see also a recent discussion 此处).
These guys operate on a 0.01 cM (!) scale, and one of the improvements of ROLLOFF algorithm seems to be very straightforward: only consider those SNP pairs where 都 alleles differ in the “main” vs. “admixing” populations. Dienekes? Is there anything you can apply to your ancient-admixture ROLLOFF results? Or the similarity between the human groups is such that there will be too few pairs of adjacent introgressed alleles to analyze?
关于定量基因组学的不透明性质:我想知道这种情况是否会持续到未来,或者人们(阅读:其他生物学家、人类学家等)是否将被迫对主要主题产生一种舒适的熟悉感……?我的意思是,如果“大数据”真的风靡一时,那么我觉得奇怪的是,许多“追随文献”的人无法坐下来掌握理论基础,更不用说复制结果了……我的想法是现在还处于游戏的早期阶段,未来几年情况将会发生变化,但我看到很多学生(下一代)仍在追求仅进行台式工作,或者在我的特定领域,仅进行骨骼研究并从表面上接受基因组学的结果。
基因组学 从表面上看。
shit! :=) beware, lest someone rips your face off.
很少有生物学新研究生具备开始分析这些数据的技能,不幸的是,我发现很少有具备这些技能的学生从生物学知识开始理解实验,更不用说结果了。 我曾经参加过一门专注于生物信息学算法的 CS 课程,在最初几周的每节课中,我通常必须与 CS 学生一起复习中心法则,并解释实验的目的,其中量化 mRNA 丰度或突变基因。
我最近注意到很多典型的实验室实验室潜入测序项目并将新研究生投入这些项目,所以我认为当这些学生成为博士后时,情况会在 4-5 年后发生变化……不利的一面(1 ) 似乎很少有 PI 有耐心让学生培养所需的技能(我很幸运,我的 PI 忍受了延迟,因为我几乎从头开始学习)(2)许多 PI 深入研究这些项目与糟糕的实验设计。 最终结果是,你看到很多研究生在 seqanwers.com 等网站上发帖询问如何拯救一个没有生物复制的项目……
There’s only one ‘k’ in “grok.”