上图显示了该地区的人口覆盖率 基因2.0 SNP芯片,由 地理项目。 他们的论文概述了芯片的实用性和原理,现在已经发表 arXiv。 去年夏天,当Spencer Wells主持了有关Geno 2.0发布的网络研讨会时,我看到了这张地图,这确实使我兴奋不已。 他们在此芯片上拥有的标记数量不多,常染色体上仅超过100,000,而X,Y和mtDNA上则有成千上万的标记。 相反, Axiom®全基因组人类起源1阵列板 被...使用 帕特森(Patterson)等人。 拥有约600,000个SNP。 但是,从上图可以清楚地看出,在更多的人群中Geno 2.0可以确定其他可比较的芯片(Human Origins 1 Array使用12个人群)。 显然,如果您只捕获少数群体的变异,那么所有额外的百万个标记都可能不会给您带来很大的收益(更不用说可能在您的群体遗传和系统发育推断中引入的偏见)。
左侧是确定了“人类起源1阵列”的人口清单,对我而言,它们看起来相当全面。 相反,对于Geno 2.0,在450个人群中确定了“祖先信息标记”。 对我来说,最终的问题是:对各种晦涩难懂的群体进行额外的确定是否值得? 如我所说,在初次检查中,Geno 2.0的SNP数量似乎很少, 但是根据我的经验,当您进行质量控制并将不同的面板合并在一起时,无论如何,您通常只剩下几十万个SNP。 根据我的经验,即使在欧洲这样的遗传上均一的地区,100-200,000个SNP也足以阐明它们之间的关系(对于基于模型的聚类来说,这已经绰绰有余了,对于MDS或PCA来说似乎已经过大了)。 关于Affymetrix芯片,一个让我惊讶的问题是,它的确确定了对映体。 相反,Geno 2.0考虑了欧亚的心脏地带。 例如,我怀疑Geno 2.0对于南亚人的人口或血统分配会更好,因为它会为这些人提供更多的信息标记。
最终,我不能说更多,除非我在不同的地方使用了两个标记集 和 类似的情况。 由于Geno 2.0有意识地排除了许多功能上和医学上相关的SNP,因此其用途主要是在人口统计和历史领域。 如果有问题的人群已被“人类起源1阵列”很好地覆盖,我认为没有理由不应该这样做。 它不仅具有有关生物学功能的更多信息,而且标志物的数量要大很多倍。 另一方面,Geno 2.0在Affy芯片的“空白区域”上可能更有用。 希望有关Geno 2.0的Genographic Project结果报告能尽快出台,我可以拉下他们的数据集并使用它。
引用: 的arXiv:1212.4116