皮弗踢刺，詹姆斯汤普森

皮弗（Piffer）对抗壁虎

回复审阅者和博客评论者

詹姆斯·汤普森 •2年2019月XNUMX日

•3,500字 • 311 Comments • 回复

634 分享

◄►书签◄❌►▲ ▼全部切换变革理论▲▼添加到图书馆从图书馆中删除 • B显示评论下一个新评论下一个新回复了解更多

回复同意/不同意/等等更多... This Commenter This Thread Hide Thread Display All Comments

同意不同意谢谢LOL轮唱

这些按钮可将您的公开协议，异议，感谢，LOL或巨魔与所选注释一起注册。仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用，并且在任何八个小时的时间内也只能使用三次。

忽略评论者关注评论者

搜寻文字 区分大小写 确切的词 包括评论

列表书签

在发布 Piffer 的论文之前，我将其发送给了一位从事情报研究工作的审稿人。我解释说，许多遗传学家对 Piffer 在群体智力方面的工作不屑一顾，并征求了批评意见。这是该意见和 Piffer 的答复。 Piffer 还包括对来自博客评论的主要主题的回应。

情报研究员：Piffer 的工作是人类智力分子遗传学目前最重要的方向之一。总的来说，他的工作很有价值，应该得到支持。如果他使用种族之间的比较来从关联到因果变异，也许他可以与一些领先的基因组学机构合作。

背景有点像这样：我们已经有了关于赫恩斯坦任人唯贤假说的可重复的分子遗传学结果。社会阶层之间的教育/智商多基因分数存在差异，在家庭中，多基因分数较高的孩子比多基因分数较低的孩子更有可能向上流动。赫恩斯坦关于遗传驱动社会分层和社会流动的说法因此在分子水平上得到了明确的证明。

在发育障碍的情况下，我们已经有一些研究表明，较低的多基因评分会导致较高的生育能力。这个结果不是 100% 一致的，但我们预计这种影响只会在那些实际上具有大量畸形生育能力的人群中发挥作用。我们还没有研究，例如，将 19 世纪代表性种群的平均多基因分数与其现代后代进行比较，以显示几代时间尺度上的基因缺陷。梅尼的伍德利已经进行了一项非常初步的研究，显示了欧洲过去 3000 年时间尺度上的优生生育率。最近使用古代 DNA 的整个分子优生学和基因缺陷学领域需要更多的工作，特别是因为它对我们理解宏观历史趋势非常重要。在过去的 2000 年中，欧洲的多基因分数是否上升而中东的分数下降？

Piffer 现在正在解决第三个主要问题，即种族差异在长达 60,000 年的时间尺度上演变（大约是现代人类从非洲大迁徙以来的时间）。在这个问题上的工作并不像在其他问题上的工作那么先进，到目前为止 Piffer 所做的只是解决这个问题旅程的第一步。在这个问题上进展如此缓慢的部分原因是政治上的，但也有需要克服的科学障碍。到目前为止，一个很大的限制是，所有针对智商或教育进行的全基因组关联研究都使用了欧洲血统的受试者。

皮弗：我的系统发育/空间分析提供了有关当代人口差异的信息，它还揭示了最后 60ky 的选择压力。我同意跨时间比较种群将产生对方向选择假设的直接检验，并提供跨时间更细粒度的分析。不幸的是，这种方法也受到 LD 衰减问题的影响，尽管程度要小得多，至少在 10ky 周期内。自欧洲青铜时代以来，伍德利和皮弗就显示出优生生育能力，但我们的研究是一项非常初步的研究，样本量和遗传标记的数量有限。在我的下一个项目中，我想将来自最近的 EDU 和智能 GWAS 的更广泛的知识与过去几年在古代基因组学方面取得的巨大进展结合起来。 Reich 的实验室拥有在线数据库，该数据库会不断更新古代基因组样本的新增内容。

情报研究员：我们从这些研究中获得的 GWAS 命中是与智商或教育在统计上相关的遗传变异，但其中大多数不是这些结果变化的原因。在整个基因组中，数百个不同的基因中都有因果变异。这些变异中的每一个都起源于过去某个时间的新突变，有时是最近的，比如 10,000 或 20,000 年前。在其他情况下，它起源于更早，几十万年前。每当一个新的突变出现时，它就会出现在一条染色体上的某个位置，该位置已经在突变左右的可变位点中具有一组变体。因此，我们不仅有新的因果变异，而且还有一大群非因果、随机的变异，分布在新突变左右的数十万个碱基对上。所有这些都被认为是遗传相关的，因为它们被一起传递，仅仅是因为它们在染色体上物理上靠近在一起。随着时间的推移，由于减数分裂中存在交叉，遗传连锁缓慢衰减，但即使在 100,000 年后，因果变异左右约 100,000 个碱基对仍存在大量连锁不平衡（非随机关联）。

在这里，我们在研究种族差异时遇到了一个问题。如果一种新的因果变异起源于大约 60,000 万年前的非洲人大迁徙之后，那么它很可能仍将仅限于世界人口的一部分。它现在的分布将更多地反映它的起源地，而不是作用于它的选择压力。由于不同的独立突变，一个基因可以有不同的因果变异，这些变异起源于不同的种族。另一种可能性是，由于远古人口瓶颈，因果变异与附近的非因果变异群之间的关联在不同种族中可能不同，即使这些种族通过共同血统共享因果变异。

皮弗：确实，大多数 GWAS 命中本身并不是因果变异，而是可以说是代理（用技术术语“标记”SNP）。我认为这个问题在理论和经验上都被夸大了，并且经常导致广泛声称精度降低等于零精度。这就像立即取消调查或民意调查，因为它们代表了整个人群，而且由于统计不确定性，即使是最完美的随机抽样也不能代表它所来自的人群。

首先，必须凭经验证明对欧洲人进行的 GWAS 实际上会导致对欧洲 PGS 的高估。如果不能证明这一点，至少他们必须说明为什么他们期望找到这个结果。我看不出有什么理由应该是这样，到目前为止，没有任何批评者提出为什么欧洲 GWAS 应该导致偏向于偏袒而不是反对欧洲人口，以及为什么东亚人应该受到更多的青睐。

他们还必须说明为什么其他性状的 GWAS 显示出不同的模式，例如，东亚人从身高等位基因的层次结构的顶部切换到底部，而非洲人则上升到高于平均值，这与刻板印象一致和人类身高的统计数据。

GWAS 还可以选择实际上降低特征的人群特定变体（如果特征是社会需要的或导致增强的适应性，则“有害”）。例如，最近对秘鲁人进行的 GWAS（Asgari 等人，2019 年）发现了一个非美国人群中不存在的等位基因，而该等位基因实际上使身高降低了近一英寸！

群体特定的变异可能更有可能是有害的，因为它们是最近的突变，而纯化选择没有时间将它们从基因库中消除。这实际上会导致对参考（在大多数情况下是欧洲）人口的偏见。当我们计算 PGS 时，我们翻转等位基因的频率，因此如果性状降低等位基因的频率为 X，则性状增加等位基因的频率为 1-X。因此，如果存在具有负面影响且频率为 5% 的特定人群等位基因，则正面影响等位基因在参考人群中的频率为 95%，在其他人群中为 100%。因此，如果特定人群的变异平均而言是有害的，这实际上会导致非参考人群得分的膨胀。

最终这个问题可以凭经验解决，这样做的一种方法是仅使用在所有研究人群中以 1%-99% 频率存在的等位基因来计算 PGS（一个简单的列表删除命令，此阈值在R 会工作）。相反，可以计算仅存在于欧洲人中的等位基因，以确定其中是否有更多具有正面或负面影响的基因，该指数将给出对 GWAS 偏差的估计。去除非非洲特定的 SNP 也将创造一个公平的竞争环境，通过丢弃非非洲人从更多可能的人群特定变异中有益突变的过度表现中获得的可能优势。这种过度代表是否高于或低于我们为非非洲人发现的情况尚不清楚，但为了简洁起见，我们假设它是相同的。

一个例子可以说明这种方法背后的逻辑：假设我想测量两个人的身高以确定谁更高，并且我不能使用相同的卷尺来测量两个人。此外，他们住在不同的国家，所以我不能把他们放在一起。我知道约翰身高 185 厘米，但我用来测量杰克的卷尺比我用来测量约翰的卷尺要短，而且只能测量到杰克的肩膀。我没有宣布我无法确定谁更高，而是将杰克的尺子量到他的肩膀上，然后我再次测量了约翰，但这次我也量到了他的肩膀而不是头顶。然后我比较他们的肩高，发现杰克的肩高是 150，而约翰的肩高是 165。我确定比约翰更高。由于约翰的肩高比杰克高 15 厘米，因此他很可能实际上比杰克高。只有杰克的脖子长得不成比例或头大，情况才不会如此。通过这个类比，非洲人必须拥有不成比例的本地智力增强等位基因，以抵消我们在他们与欧洲人共享的变体中发现的多基因评分差异。

我已经发布了初步分析（ https://rpubs.com/Daxide/488754 ) 通过计算没有那些推定的欧亚特异/非非洲起源的 SNP 的多基因评分，发现 1) 80% 的 SNP 是常见的，20% 是推定的非非洲起源； 2) 仅使用常见 SNP 计算出的 PGS 与全 PGS 具有相同的群体 IQ 相关性，即 r=0.88； 3）黑白差距小幅缩小0.11%，从2.43%降至2.32%，而东亚差距小幅扩大。

图 1 和图 2 显示了完整的和“常见的”PGS（在去除非非洲来源的 SNP 之后）。

图1

图2

只有通过跨种族 GWAS，我们才能完全掌握不同的选择性力量，我们将能够计算出更准确的多基因分数，但这不会很快发生，因为 GWAS 的大部分工作仍然集中在欧洲人身上。

皮弗的评论：我想在这里添加一个注释，以解决本论坛读者的一些批评。对 Dunkel 等人的参考。可能会误导一些读者。它指的是他们对表型智商 (110) 的估计，而不是他们的 PGS 计算方法。他们的估计是从对其他研究的非系统审查得出的，可以被认为是最好的猜测。犹太人的 PGS 计算方式与其他人群一样，完全独立于 Dunkel 等人的工作。如果某些读者可能被误导，我很抱歉，我希望我在论文中更清楚地说明了这一点。

情报研究员：这样做的结果是，为欧洲人构建的多基因评分可能对远缘种族的预测不佳。我特别希望这适用于非洲人和非非洲人之间的比较。这是对 Piffer 结论的主要批评，他必须承认，这确实需要在未来进行大量工作。

目前，Piffer 可以尝试寻找数据集，其中数千名非欧洲人已用 DNA 微阵列进行基因分型，并确定了他们的智商或教育程度。当比较种族时，多基因分数应该只从那些在被比较的种族中具有方向一致效应的 GWAS 命中计算。

今天，我们拥有的关于基因种族差异的最有力证据是德系。 Curtis Dunkel 在威斯康星纵向研究中发现犹太人的多基因分数高于外邦人，并且在他的最后一篇论文中，Piffer 在一个基因组数据库中发现，德系犹太人样本在该数据库中的任何群体中具有最高的多基因分数。在这种情况下，结果可能是有意义的，因为德系犹太人在基因上与其他欧洲人非常相似，因此极不可能出现不同连锁阶段等问题。这几乎就像在同一个国家比较不同的社会阶层。

最终目标当然是为每个种族分别找到因果变异，并仅使用这些变异来计算多基因分数。 Piffer 倾向于关注具有最大影响的 SNP，我认为他这样做是正确的，因为这些 SNP 最有可能是因果本身，或者与因果变异非常密切相关。在介绍他的研究时，Piffer 应该强调，非欧洲人的关联研究不仅需要比较种族，还需要根据不同种族中可能不同的连锁阶段找到因果变异。

皮弗：我在我的论文中广泛讨论了这个问题，所以我在这里简要介绍一下。当我使用 Lee 等人确定的一组极有可能的因果变量时，PGS 与 IQ 的相关性为 0.8，实际上增加了黑白差距。

一段时间以来，我一直计划仅使用在黑人和白人中具有一致影响的等位基因来计算多基因分数，我应该尽快这样做。这构成了普遍有效的 PGS 的进展，尽管它没有解决特定人群的变异偏差。正如我之前所展示的那样，这种偏见可以得到解决，或者更准确地说是跨种族 GWAS。

情报研究员：Piffer 在展示他的结果时应该考虑的另一件事是，并非每个 GWAS 命中都具有高 IQ 人群中高 IQ 等位基因的最高等位基因频率。很多时候情况恰恰相反，（在欧洲人中）高智商变异在低智商人群中最为常见。这可能有很多不同的原因，据我所知，也许 55% 的 GWAS 命中率与预期的人口智商不同，而 45% 则相反。有时，当一项特定关联研究碰巧产生非预测性多基因评分或预测方向错误时，这会导致结果混乱。在展示他的结果时，Piffer 应该强调这一点。

该物种存在大量遗传变异，其中只有一小部分反映为表型种族差异。当然，我们在这里主要处理非因果变异，它们仅与因果变异处于连锁不平衡状态，但仍然如此。它让我们认为，因果变异很可能也具有这种非常混乱的模式，有时与表型人口平均值一致，有时与表型相反。

皮弗：从经验上讲，这个问题可以通过执行我在论文中提出的蒙特卡罗模拟的一个版本来回答，但不是使用相关系数作为连续变量（每个 SNP 的相关系数与人口 IQ 的分布），使用二分变量，计算与 IQ 正相关或负相关的 SNP 的数量。

确实，物种存在巨大差异，我们看到的许多关联与表型差异定义的简单模式背道而驰，但这在多基因模型下是预料之中的。每个 SNP 对性状的影响很小，通常仅选择一个性状不足以抵消随机漂移的影响。此外，明显不相关的性状之间存在大量遗传相关性，这仅仅是由于它们在染色体上的物理位置，对遗传相关性状的相反选择压力降低了结果表型的净选择系数。

另一个重要因素是大多数 SNP 实际上是代理，这将进一步混淆图片。这就是为什么我只选择 GWAS 显着命中来获得更接近因果 SNP 的集合，并且通过相关向量的方法，我表明具有较低显着性的 SNP 与群体智商的相关性也较低。如果标签 SNP 推动了 PGS 和 IQ 之间的相关性，则会出现相反的模式（即不太显着的 SNP 将与群体 IQ 具有更强的相关性）。

让我也澄清两个不断被提出的问题。

1）李等人。报告预测黑人受教育程度的准确度降低了 80%。然而，他们的分析是肤浅的，因为他们仅使用单个 PGS 进行尝试，并且没有尝试使用不同的显着性截止值来查看 SNP 显着性如何影响跨种族准确性。他们的样本也存在问题，因为它来自一个地位低、年长的非裔美国人群体，在这些群体中，智商的遗传性非常低。一些同事正在研究另一个非裔美国人的样本，发现减少的幅度要小得多，黑人的分数保留了大约 50% 的有效性，而对于更重要或推定的因果关系的 SNP，这甚至更高。

2）个体预测不同于群体级预测。即使多基因评分只预测了个体间智力差异的 10%，群体间的准确性也可以高得多。这是因为自然选择在整个基因组中作用相同，具有相同功能的基因将受到相同的选择压力。因此，我们可以有把握地假设，当未来的 GWAS 发现更多 SNP-IQ 关联时，它们将符合相同的模式，因为它们受到相同的选择压力。社会科学中使用了类似的原则，其中衡量人格特质甚至智商的量表由少数项目组成。怀疑论者会争辩说，为了衡量某人的智力，需要管理无限数量的项目，以评估每种可能的心理状态下的每个可能的认知领域。没关系爱丽丝在 WAIS 上得了 160 分，如果她再参加一次测试，她可能会变成智障。怀疑论者还会争辩说，为了评估一个人是内向还是外向，仅包含 10 个问题的量表是不够的，因为第 11 或第 12 或第 N 个问题可能会改变分数并翻转个人的心理状况。如果我们遵循这条推理路线，我们应该抛弃所有心理学。

这个类比也可以扩展到一般的科学。科学研究从总体中选择样本，因为出于实际原因，不可能研究总体中的每个个体。然后得出从样本到总体的推论。同样，GWAS 研究产生了一个 SNP 样本，我证明这个样本足够大，可以产生非常强的预测能力，在传统的显着性测试中幸存下来。在科学中要求更大的样本是一种健康的方法，但认为一项研究是无效的，因为它没有包括一些个人（或一些 SNP，在这个特定的例子中）会当场扼杀整个统计领域，并带来几乎所有的生物和社会科学研究都被它打倒。

我认为牛顿的推理定律应该提醒那些喜欢假设牵强附会的场景的读者，这可能会破坏我的论点。我想提醒的是，所有这些仍然是基于经验证据的推测，直到提出反驳我论文的证据，我在论文中描述的场景仍然是最有可能的。我想以规则 2、3、4 结束，这些规则在这里特别相关：

2规则) 因此，对于相同的自然结果，我们必须尽可能将相同的原因归为相同的原因。至于人和动物的呼吸；石头在欧洲和美洲的起源；我们烹饪的火光和太阳的光芒；光在地球和行星中的反射。

3规则) 物体的性质，既不允许强度也不允许程度的缓和，并且被发现属于我们实验范围内的所有物体，应被视为所有物体的普遍性质。

4规则）在实验哲学中，我们将把从现象中通过一般归纳收集的命题看作是准确的或几乎是正确的，尽管可以想象出任何相反的假设，直到其他现象发生时，它们可以变得更准确，或有例外的责任。

634 分享

• 类别：科学 •标签：戴维·皮弗（Davide Piffer）, 基因组学, 全球风电系统, IQ