-Unz评论

拉齐布汗 •18年2012月XNUMX日

•500字

上图显示了该地区的人口覆盖率基因2.0 SNP芯片，由地理项目。他们的论文概述了芯片的实用性和原理，现在已经发表 arXiv。去年夏天，当Spencer Wells主持了有关Geno 2.0发布的网络研讨会时，我看到了这张地图，这确实使我兴奋不已。他们在此芯片上拥有的标记数量不多，常染色体上仅超过100,000，而X，Y和mtDNA上则有成千上万的标记。相反， Axiom®全基因组人类起源1阵列板被...使用帕特森（Patterson）等人。拥有约600,000个SNP。但是，从上图可以清楚地看出，在更多的人群中Geno 2.0可以确定其他可比较的芯片（Human Origins 1 Array使用12个人群）。显然，如果您只捕获少数群体的变异，那么所有额外的百万个标记都可能不会给您带来很大的收益（更不用说可能在您的群体遗传和系统发育推断中引入的偏见）。

左侧是确定了“人类起源1阵列”的人口清单，对我而言，它们看起来相当全面。相反，对于Geno 2.0，在450个人群中确定了“祖先信息标记”。对我来说，最终的问题是：对各种晦涩难懂的群体进行额外的确定是否值得？如我所说，在初次检查中，Geno 2.0的SNP数量似乎很少， 但是根据我的经验，当您进行质量控制并将不同的面板合并在一起时，无论如何，您通常只剩下几十万个SNP。根据我的经验，即使在欧洲这样的遗传上均一的地区，100-200,000个SNP也足以阐明它们之间的关系（对于基于模型的聚类来说，这已经绰绰有余了，对于MDS或PCA来说似乎已经过大了）。关于Affymetrix芯片，一个让我惊讶的问题是，它的确确定了对映体。相反，Geno 2.0考虑了欧亚的心脏地带。例如，我怀疑Geno 2.0对于南亚人的人口或血统分配会更好，因为它会为这些人提供更多的信息标记。

最终，我不能说更多，除非我在不同的地方使用了两个标记集和类似的情况。由于Geno 2.0有意识地排除了许多功能上和医学上相关的SNP，因此其用途主要是在人口统计和历史领域。如果有问题的人群已被“人类起源1阵列”很好地覆盖，我认为没有理由不应该这样做。它不仅具有有关生物学功能的更多信息，而且标志物的数量要大很多倍。另一方面，Geno 2.0在Affy芯片的“空白区域”上可能更有用。希望有关Geno 2.0的Genographic Project结果报告能尽快出台，我可以拉下他们的数据集并使用它。

引用： 的arXiv：1212.4116

• 类别：科学 •标签：人类学, 基因2.0, 人类进化遗传学, 人类进化基因组学, 人类遗传学, 人类基因组学, 个人基因组学

地理计划：走向常态！

拉齐布汗 •25年2012月XNUMX日

•400字 • 4 Comments

RSS

地理计划 现在正在超越单亲世系基因2.0。斯宾塞·威尔斯（Spencer Wells）友善地邀请我参加上个月的电话会议，他在会议上概述了许多细节，因此，我将着重介绍此Weblog读者的要点：

*他们发布了一个新的SNP芯片和一个新项目，该项目已从Y和mtDNA转移到常染色体。但是他们也在扩大单亲标记的范围。

*尽管只有“常染色体”的130,000个标记，但Wells和他的合作者已经选择了一个标记子集，这些标记子对人口结构具有很高的信息意义（例如，第一时间）。他们的SNP偏向于许多人群中具有中等水平多态性的SNP，以最大程度地发挥分化诊断的能力。

*他们非常努力摆脱确定性偏见。这意味着在以前的许多芯片中，都有一种趋势可以解决欧洲人的多态性，然后使用此标尺检查全球范围内的变异。这种方法的问题是显而易见的。该项目的一位科学家概述了他们如何寻找对确定性偏向特别重要的人群（大洋洲人和美洲印第安人）非常有用的SNP。他们在这个问题上的点滴态度使我印象深刻。

*主要缺点是标记上没有很多特质信息SNP。这意味着他们只对系统发育和系统地理学感兴趣，而对特定特征集的演变不感兴趣。

我敢肯定，威尔斯会说更多。但是，当前轨迹的一些其他方面令我兴奋。首先，他们将在某个时候公开其基因型结果。其次，他们将通过将它们提供给特定的研究人员和小组来鼓励Geno 2.0芯片的使用。第三， 他们的人口覆盖率是 非常彻底. 他们正在筹备中的一些出版物，这是让我激动的最后一点。我看到了印度覆盖率的一些幻灯片，并且我99％的确定该数据集是该小组声称印度种姓制度早于印度-雅利安人的说法的来源。

附录： 而且，从某种意义上讲，他们现在正进入科学谱系领域的23andMe领域。如果您好奇，请参阅您的遗传家谱学家，因为她的职位更为详尽。

• 类别：科学 •标签：基因2.0, 基因组学