我们正面临一个法国人的困境:皮弗有一种研究种族智力差异遗传学的方法,这似乎在实践中有效,但在理论上应该行不通。 他的技术似乎与遗传研究的总体趋势背道而驰,因为他似乎在仅基于 18 个 SNP 预测群体智力差异方面取得了良好的结果,而遗传学研究人员在基于此预测个体智力方面只能得到合理的结果。许多 SNP。
例如,精通这些事务的人告诉我,他们在一个独立的欧洲人群中进行了样本外预测,使用所有 SNP,他们得到了 4.8% 的方差。 这是使用所有 SNP 对非欧洲人群进行预测的上限。 Pfiffer 在非欧洲人群中只使用了 18 个 SNP,他的相关性很大,这是没有意义的。
无论如何,我认为大多数遗传学研究人员可能会等到 Piffer 发表他的更新论文后再发表评论。 当然,使用 GWAS 预测人群内的智商与将 GWAS 结果应用于人群间差异之间存在差异,这就是 Piffer 所做的。
他解释说:
这些解释群体内差异的 SNP 是多基因选择的标志。 他们不必解释群体之间甚至群体内部的大量差异。 多基因进化模型预测,少数 SNP 的频率与无数其他 SNP 的频率相关。 我只需要知道几个最重要的 SNP 即可收集信号并推断其他未知 SNP 的分布。
如果选择压力通过将它们在群体 A 中的频率高于 B 来对这 9 个 SNP 起作用,那么它也会对其他 SNP 产生同样的影响。 我们不需要知道这些其他 SNP 是什么,因为理论预测它们将具有相似的分布。
所以,对 Piffer 的官方回应是:“发布,然后我们会给你我们的评论作为回复。” 这需要时间,但这是传统的做事方式。
非官方的回应是现在鼓励更多的批评,因为如果发现是一个简单的错误的结果,就应该尽快曝光和纠正。
这是 Piffer 方法的开放季节。 招募评论家并让他们立即进行同行评审。
为什么它在理论上不起作用? 不是反问。 我没有对该方法持立场(没有足够仔细地研究它),但我没有看到用于从 2 个 SNP 预测个体智商的微小 r8 和用于预测组排序的大 r2 之间的理论矛盾,鉴于 Piffer 的假设。
我同意你的看法。 但是,我对该方法的研究还不够,无法确定我没有遗漏一些伪影,或者蒙特卡洛方法不能完全控制偶然发现。 对我来说,Piffer 迈出了非常有趣的第一步,该方法可以在发现每个新的智能 SNP 时一次又一次地进行测试。
然而,我从遗传研究人员那里得到的信号是,这与文献的总体趋势背道而驰,以至于他们认为这一发现不太可能。 结果如此之好,以至于人们担心它们好得令人难以置信。 并不是说 Piffer 以任何方式发明了它们(他已经完整地阐述了他的工作原理),而是说一般方法和假设存在问题。
我知道我无法更进一步,也承认我不会花时间学习 R。我习惯了 SPSS,然后是 Statistica,并且对遗传统计程序的知识非常简单,只有与我们精神病学系的研究人员交谈,他们在精神分裂症的遗传学方面做了早期的工作,而在后来更强大的东西上却没有。
理想情况下,更多掌握所有这些技能的遗传学家会立即涌入,并在技术上敲出漏洞。 但是,我认为我们将不得不坐视通常的发布延迟,并希望他们稍后再处理它。
在正常情况下,我倾向于赞同这种观点。 然而,考虑到时代精神(又名叙事)对皮弗结果的影响,在这种情况下,我认为这不是一个原因。
说到这,更多关于最近 Vox/Charles Murray 的争议:
http://quillette.com/2017/06/11/no-voice-vox-sense-nonsense-discussing-iq-race/
来自 Vox 文章的一位作者(Paige Harden): http://www.geneticshumanagency.org/ff/the-science-and-ethics-of-group-differences-in-intelligence-part-1/
我的印象是,支持 Vox 文章的人似乎忘记了该文章声称的零遗传效应,而是在争论非零环境效应。 这似乎符合一些谬误(例如 Motte 和 Bailey)。
Vox 的头条大喊“垃圾科学”也是一个不错的选择,但大部分争论都围绕着道德。
这是可以理解的。 如果你改变主意,我认为这是一个很好的入门课程: https://www.coursera.org/learn/r-programming
R 与 RStudio 相结合提供了一个强大(而且免费!)的工作环境。 如果您与流利使用 R 的其他人一起工作,则可以相当轻松地运行和扩展他们的数据和分析文件(如果提供)。 我能够使用他提供的数据文件复制 Piffer 的 RPubs 工作。 重新创建 RMD(分析,代表“R Markdown”)文件是最难的(耗时多于困难,如果 Davide 愿意提供自己的分析文件,这可能有助于复制工作,GitHub 提供了很好的工具来共享整个 R 项目) 部分,但是一旦完成,重新运行它并创建 HTML 输出(如在 RPubs 上)是微不足道的,因为实际上在 RPubs 上共享它。 还有许多其他不错的功能,例如创建 PDF 和 Microsoft Word 文档以共享表格、图形等。
我没有看到理论上的矛盾
正确的。 但是基因组不是理论上的。 就是这样。 一般而言,SNP 在种群和人类基因组中具有特定的分布和结构。
如果 ps(9 个 SNP 的多基因评分)在群体内有很大的差异,那么 Piffer 公式也必须(在某种程度上)在群体内有效,才能在群体平均值上有效。 如果它在种群中不起作用,则 Piffer 的结果无效。
然而,如果 ps 在总体中的方差非常小,那么 Piffer 的公式在总体中将不起作用,但这一事实不会排除它在总体平均值上正确的可能性。 那么,不同人群的方差 Var(sp) 是什么? 这应该从可用的数据库中估计。
虽然我不确定,但我不认为 Var(ps) 很小。 因此,如果 Piffer 的公式在总体中不起作用,那么它对总体平均值的极好拟合 (r=0.91) 一定是虚假的。
注1: 理论上 Var(ps) 可以假设广泛的值。 对于表 8 中的频率,可以估计方差的最小值和最大值。 就智商而言,大约范围是(50,300)。 请记住 Var(iq)=225。 在最“平等主义”的人群中实现最低,每个人的多基因分数等于其人口平均值(±0.5 SNP)。 当 SNP 彼此独立随机分布时最高。
注2: Piffer 公式 =24.5+131.1* 准确预测了 Craig Venter 的智商,但高估了 James Watson 的智商 21 分。 据称 Venter 和 Watson 都有 8 个 SNP 中的 9 个。
打扰一下,但是您是如何推断出我的公式高估了 Watson 的智商的? 我将 Watson 和 Venter 基因组中的等位基因汇集在一起,因为每个人的数量都太少了。 事实上,沃森的等位基因计数较低。
SNP 是 9,而不是 8。最初我使用 8,但后来我也发现了第 9 个。
感谢您的评论以及指向 R 的链接。出于感谢,我点击了它,但不做任何承诺。
从您给 D. Thompson 的电子邮件中:
但如果 Watson 拥有所有 9 个 SNP,那么估计值就太离谱了。 您的公式 IQ=24.5+131.1*PS 给出了 PS=155.6/9=9 的 IQ=1,这对于 Watson 来说太高了 35 IQ pnts。
我认为一些 SNP 可以预测群体的相对智力的方式将成为那些标志着一个真正重大发现的显而易见的事情之一。 我认为这可能类似于精度如何随着具有高斯误差的许多独立测量的平方根而提高。 进化已经对基因组的适应度进行了许多“测量”,更适合的片段通过进化过程相互关联,以及与某些中性标记序列相关联,就像测量序列与被测量的数量相关联一样. 不同种群中适应度相关性最强的序列的相对频率反映了一个迭代的、生态共同进化的适应度测量过程的结果,该过程不仅包括种群中的所有个体,还包括其祖先的种群。两个种群最后一次分开。
纵观整个种群,有些个体是幸运的或不幸的,但它们通常在大群体中相互抵消,因此进化适应度测量/相关过程是控制群体基因构成的因素,而不是在个别情况下看到的随机机会,因此,人们会期望某些序列的种群频率与要研究的任何影响适应度的特征具有高度相关性。 其中一些变体可以追溯到种群分离之前,它们将在不同环境中经历选择,对所考虑的性状有不同的要求/回报,并且还会受到不相关的随机效应,因此种群的频率会有所不同某些序列以与特征高度相关的方式,即使序列通常不会导致特征,它们只是与影响特征的所有位相关。 或类似的东西。 如果假设是正确的,遗传模拟应该显示这种相关效应自然出现。
这是我希望遗传学家评论的。 我将在某个时候发布可以使用这种通用技术的另一种方式。