Swanning about: 被代数愚弄了？，James Thompson

惊呆了：被代数骗了吗？

詹姆斯·汤普森 •3年2019月XNUMX日

•2,600字 • 444 Comments • 回复

电邮

打印

RSS

◄►书签◄❌►▲ ▼全部切换变革理论▲▼添加到图书馆从图书馆中删除 • B显示评论下一个新评论下一个新回复了解更多

回复同意/不同意/等等更多... This Commenter This Thread Hide Thread Display All Comments

同意不同意谢谢LOL轮唱

这些按钮可将您的公开协议，异议，感谢，LOL或巨魔与所选注释一起注册。仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用，并且在任何八个小时的时间内也只能使用三次。

忽略评论者关注评论者

搜寻文字 区分大小写 确切的词 包括评论

列表书签

纳西姆·尼古拉斯·塔勒布 (Nassim Nicholas Taleb) 在推特上发表了一系列关于情报研究的评论。

https://threadreaderapp.com/thread/1076845397795065856.html

他现在将这些内容汇总成一种格式，并附有链接和说明。

https://medium.com/incerto/iq-is-largely-a-pseudoscientific-swindle-f131c101ba39

对他的文章不缺乏信心。这里有很多东西要讨论，接下来的内容涵盖了我认为的要点。我添加了一些指向相关出版物的链接，但您可以在我的搜索栏中输入任何概念和作者姓名以获取更多详细信息。

1 智商很大程度上是一种伪科学的骗局

鉴于塔勒布批评情报研究人员使用的统计数据不佳，温和的评论是最好更精确。我假设他的意思是一半以上的情报研究结果是错误的，而且是出于恶意的原因。如果这是他的观点，那么他实际上是错误的。

2 智商是陈旧的，主要衡量非常低的智力，或者是纸牌洗牌者或那些不适合现实生活的人的次等智力。 “它最多可以解释某些任务中 13% 到 50% 的性能”。它基于糟糕的数学，并受到种族主义者和骗子的推动。

似乎塔勒布对很多人的看法都很差。 “洗牌员”大概包括了所有为明星交易员保管账簿和处理交易的幕后工作人员。 Taleb 解释说，他对 IQ 背后的数学表示怀疑的原因是，他可以根据特定假设通过计算机生成相关性，这些相关性看起来就像一些报告的关于智力和学业成绩的发现。他暗示，如果他能在简单的基础上做到这一点（创建一个神话测试，只测量低于 IQ 100 的表现，并逐渐增加高于该水平的噪音），那么 Frey 和 Detterman (2004) 报告的实际观察结果无效。这不是一个令人信服的论据。一个简单得多的解释是，将一项人口范围的衡量标准（一般智商）与仅由精选的优秀学生（SAT）进行的学术测试进行比较，但仍然很好地展示了两者之间的联系。这是一个现实生活中的发现，据说是塔勒布喜欢的那种。

3 如果你想检测某人在某项任务上的表现，比如高利贷、打网球或随机矩阵理论，让他/她完成这项任务；我们不需要概率挑战的心理学家对现实世界的功能进行理论考试。

事实上，心理学家已经明白这一点。亨特、施密特和昆泽尔指出，检验一个人能否胜任工作的最好办法就是让他们去尝试。然而，这在时间和金钱上都是昂贵的，因为你必须监督他们预防灾难，给他们详细的指示并仔细监控他们的表现，所有这些至少需要两周时间才能对申请人的能力进行合理的评估。您不能对所有申请人都这样做，否则会占用所有员工进行实际业务工作所需的时间。上述研究人员表明，就结果而言，智力测试几乎是次佳的，而且速度更快、成本更低。添加一个诚实的测试，你有一个有效的选择系统。

4 不同的总体有不同的方差，甚至不同的偏度，这些比较需要更丰富的模型。

同样，大多数心理测量学家都同意这一点，并且几十年来一直为人所知。至少，他们喜欢看到正确绘制的数据，因此实际发现是可见的，并且可以通过不同的统计方法对其进行分析。这里没有什么新的或有见地的。

5 一种适用于左尾而不是右尾的度量（IQ 随着它变得更高而去相关）是有问题的。

Lubinski 和 Benbow 在大样本的前瞻性研究中表明，智商在最高水平仍然具有预测性，并且在每个更高的水平上继续发挥作用。塔勒布的观点显然是错误的。

6 它（智商）可以衡量一些被认为有用的任意选择的心理能力（在测试环境中）。但是，如果您对智力采取波普尔-哈耶克 (Popperian-Hayekian) 的观点，您会意识到要衡量它，您需要了解未来生态系统所需的心理技能，这需要对所述未来生态系统具有可预测性。它还需要具备面向未来的技能（因此需要有心理偏见才能生存）。

智力测试项目不是随意的。选择它们来代表从实际任务和现实生活问题中提取的各种能力。它们与专门基于美国社会现实生活任务的测试高度相关，例如 Wonderlic Personnel Test。几十年来，琳达·戈特弗雷德森 (Linda Gottfredson) 多次展示了这一切。至于“未来生态所需的心理技能”，这是智能行为的一个很好的例子，生存也是如此。在苏格兰的一项人口研究中，伊恩·迪瑞 (Ian Deary) 表明，在 11 岁时测试的智力可以预测寿命到老年。聪明的人能够比不那么聪明的人活得更久。塔勒布又错了。

7 现实生活从来不会提供有清晰答案的清晰问题（大多数问题没有答案；也许智商最糟糕的问题是它似乎选择了不喜欢说“没有答案，不要浪费”的人时间，找点别的”。）

如果这是一个相关的反对意见，那么苏格兰 11+ 要求的清晰答案就不会显示出与寿命和几十年的成就有任何关系。同样，SMPY 参与者所需的清晰答案不会预测他们的中年成就（并且随着后续行动的继续，可能会预测数十年的成就）。向后数字是一个清晰的答案任务。它浪费的时间很少，但却是一般能力的一个很好的预测指标。清晰的测试答案还与神经影像学评估的许多大脑结构和功能测量相关（海尔，2017 年）。此外，鉴于所有谜题都需要脑力，这些选定的项目可能会挖掘解决更普遍和紧迫性质的谜题的一般能力。

8 需要某种类型的人将智慧的注意力浪费在课堂/学术问题上。这些是毫无生气的官僚，他们可以鼓起无用的动力。有些人只能关注真实的问题，而不是虚构的教科书问题。

塔勒布对他的侮辱非常自由。它可能会影响那些已经采取反智商立场的人。可以在两分钟内获得粗略的能力衡量标准，这不会影响集中度。当然，许多人更喜欢实用而不是学术，并且可能最专注于现实生活中的问题。这是可测试的，再一次，在广泛的人群和广泛的现实生活问题上，智力测试保持预测效用。 Detterman 显示了许多相关性。

9 智商不检测凸性（通过类似于偏差方差的论点，您需要犯很多无关紧要的小错误，以避免产生重大的后果。参见 Antifragile 以及任何没有凸性的“智能”度量是无意义的edge.org/conversation/n...)

Taleb 就他所说的“凸性”提出了有趣的观点。在他的 Edge 文章中，他指出“机会”并不是长期收益的好解释。现在我们有一些我们可以达成一致的事情。塔勒布所说的“凸性”意味着，在他看来，研究的进展是通过“收益（因为它们需要很大）和错误（小或无害）之间的显着不对称性，并且正是由于这种不对称性，运气和反复试验才能产生结果”。这是一个凸函数，因此得名。美好的。这可能是也可能不是，并且不清楚如何直接测试这个假设（因此不科学），也不清楚为什么这个提议意味着智力测量是“无效的”。一项测试可能是查看 IQ 与期权交易/金融投资之间的相关性。后者是具有相当重要意义的现实世界测试，如果结果为零，则会加强他的论点。

幸运的是，这里有一份相关的出版物。

https://sci-hub.shop/10.1016/j.jfineco.2011.05.016

我们分析 IQ 是否影响交易行为、绩效和交易成本。该分析将股票收益、交易和限价订单数据与对几乎所有应征年龄的芬兰男性进行的智力 (IQ) 测试的二十年分数结合起来。控制多种因素，我们发现，高智商的投资者受处置效应影响较小，避税交易更积极，更有可能在股票创下一个月高位时提供流动性。高智商投资者还表现出卓越的市场时机、选股技巧和交易执行能力。

作者发现，通过更好地选择股票和降低交易成本，高智商的受试者每年比低智商的受试者表现好 4.9%。鉴于实际回报率平均为 7%，这是一个巨大的差异，它会随着时间的推移而累积，并为更聪明的投资者带来高得多的个人净资产。顺便说一下，智力是在征兵年龄衡量的，早在有很多投资历史之前，所以更有可能是因果关系。

https://www.sciencedirect.com/science/article/pii/S0304405X1100211X

10 看到浅薄的模式并不是一种美德——会导致天真的干预主义。一些心理学家回信给我：“智商选择模式识别，对现代社会的运作至关重要”。不。除非模式很重要，否则看不到模式是现实生活中的一种美德。要在生活中做得好，您需要深度和能力来选择自己的问题并独立思考。

能够看到其他人无法看到的模式的能力传统上被视为智慧的标志。有趣的是，塔勒布承认有些问题是肤浅的。他怎么知道？大概他可以看穿它们，并且发现它们很容易。好的。物品难度各不相同。深度、选择问题和独立思考的能力是智力的标志。这是与心理测量学一致的一点，尽管他可能没有意识到这一点。

11 功能商数：如果你把 IQ 重命名，从“智能商数”到 FQ“功能商数”或 SQ“Salaryperson Quotient”，那么一些东西将是真实的。它最能衡量成为一个好奴隶的能力。

塔勒布的论点似乎是智商测试只适用于从事单调工作的普通人。不完全是义务。这是智力测试不衡量创造力的古老观点的一个版本。很容易断言，但证据似乎反对它，只要你用质量和数量来衡量创造力。 Rex Jung 创造性地、仔细地研究了这个问题。

昆泽尔表明，即使在远非单调乏味的工作中，大学入学考试也可以预测成功。

12 “智商”最能预测军事训练中的表现，w/correlation~.5，（这是循环的，因为招聘不是随机的）。

两个批评。首先，军事训练数据本身很有趣，但就调查结果的普遍性而言，关键问题是相当多的任务与非军事任务相同。例如，车辆维修是相同的任务，因此我们所拥有的关于智商/培训环节的详细信息远比通常在商用汽车修理厂中收集的信息要详细得多。

其次，远非“圆形”，观察到的 5 的相关性实际上因范围限制而减弱。 Taleb 会犯一个简单的统计错误吗？不可能的。由于美国军方被允许筛选低能力的候选人，他们提供了对塔勒布早些时候断言的精确测试，即测试只对低能力的人有效。 5 的相关性是在能力较高的人身上实现的。如果我们假设至少需要 100 IQ，那么真正的相关性可能是 7

13 我在这里没有备份的心理参考：简单地说，这个领域很萧条。到目前为止，约有 50% 的研究没有重复，而效果较弱的论文。不算差转移到现实。

为什么他不提供参考？可能是因为，事实上，心理测量学的主要发现与心理学的其他领域一样好或更好。只是很多人讨厌结果。

14 弗林效应应该警告我们不仅智商在某种程度上取决于环境，而且它是循环的。

好吧，弗林效应并没有提高数字跨度或数学分数，所以这里有一个关于测量问题的被忽略的故事。不清楚FE是ag效应。很少有心理测量学家怀疑环境会影响能力。智商不是循环的，但可以由所有文化中都存在的非常简单的心理任务决定，并且对更复杂的任务具有长期预测能力。

总结

塔勒布以极大的信心做出了全面的断言，并充斥着侮辱性的语言。这些断言很可能会影响那些对智力不确定的人，以及那些认为对自己有把握的人必须知道他们在说什么的人。这是可以理解的：一个不确定的人意识到他们需要做更多的阅读和思考才能感到自信，并且仁慈地假设只有一个有必要阅读的知识渊博的人才会敢于自信地说话。

然而，塔勒布并没有在他的文章末尾给出科学参考，而是自信地断言他不需要这样做，因为这个领域被打破了，因为…… 凸度。这似乎是统计分析的基本要素，而不是他关于研究策略的有趣想法之一。这很有趣，因为即使在 Taleb 称之为他自己的领域，作为一名金融工具交易员，也很容易找到一项仔细、长期、大样本的研究，显示情报对投资行为的有益影响。在自己的主场，他1-0落后。

另一个失误是忽略了情报研究人员（特别是詹森）几十年来为改进情报措施而进行的辩论，以便它们符合 SS Stevens 提出的要求。数字跨度就是这样一个衡量标准。数字符号也是如此，如果广泛测量，词汇也是如此。简单和复杂的反应时间是其他例子。总体而言，Taleb 并未提供推动该领域发展的新见解或原创见解。但他的目标似乎没有建设性，甚至没有提供信息。

我不知道为什么一个有能力的人对能力的衡量如此不屑，但只能假设他很清楚自己的能力，并且认为自己高于这些世俗。他没有给出参考文献，但提到了他即将出版的一本书。最好坚持事实。

塔勒布吹嘘他明显不擅长的领域是否意味着我们应该忽视他对其他领域的贡献？可能不会。公众人物有时会偏离他们的职权范围。这是一种由公众奉承带来的职业危害，自罗马时代就已为人所知。然而，如果他在超出他的深度时能如此夸张，那么以稍微批判性的眼光回到他的其他作品是明智的。当我读到他关于概率的想法时，我对他关于风险的一些声明做出了积极的假设，这是非常谨慎的理由，我无法反驳他的数学研究。也许我被代数愚弄了。也许我不是唯一的。

塔勒布将自己描述为一个流浪者，也就是一辆婴儿车，是那种四处游荡的人。没有问题。天鹅很迷人，但美丽的形状可能会让我们误入歧途。

• 类别：科学 •标签：经典卡, 房源搜索, IQ, 心理测验, 种族和智商