Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
 博客浏览詹姆斯·汤普森档案馆
因子工厂

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者
搜寻文字 区分大小写  确切的词  包括评论
列表 书签

过度分解测试图

如果您或您的家人受到临床或神经问题的困扰,接受面对面的智力测试,则很可能是韦克斯勒。 它被认为是黄金标准,而全面智商结果是花费一个多小时进行 10 项子测试的结果,就像进行十项全能:您会在广泛的智力领域获得可靠的结果。 正是大卫韦克斯勒测试不同技能的务实方法使韦克斯勒在其他测试中占据主导地位,尤其是在临床领域。 在头部受伤的情况下,即使是轻微的; 或者在调查初期记忆问题或儿童发育障碍时,通常会进行宽带智力测试作为其他调查的基准。 正流形适用于非常广泛的能力领域。 可能是聪明人记忆力不足的证据可能是能力较差的人的正常记忆力。 在某种程度上,所有专业的临床测试都在一般智力的阴影下进行。

尽管 Wechsler 测试是最著名的,但像 Woodcock Johnson 这样的其他测试已经建立了非常好的记录,尤其是在职业环境中,而其他像 Raven's Matrices 的测试已经在跨文化中被广泛使用。 所有这些都可以工作并产生非常有用的结果。 平均而言,对正常样本的重新测试将在原始测试的 4 个 IQ 点以内。 正如您将在下面看到的,列表中的其他测试包括考夫曼评估电池、斯坦福比奈、伍德科克约翰逊、差异能力量表和雷诺智力评估测试。

但是,如果您接受 Wechsler 测试,则有一个问题可能会影响您。 除了全量表结果之外,它们还会产生因子分数,有时测试提供者会以超出谨慎推断的方式解释这些因子分数和它们之间的差异。 为什么是这样? 好吧,你已经知道我的格言“没有人绕过抽样理论,甚至西班牙宗教裁判所”。

在我古老的职业历史中,韦克斯勒有 5 项口头子测试,外加 5 项补充测试; 和 5 个非语言测试,加上 6 个补充测试。 所以,除了全部总数之外,还有两个因素,一个是言语智商,一个是表现智商。 鉴于每个因素总结了 XNUMX 个甚至 XNUMX 个测试,这似乎是合理的。 这种方法坚持了几十年,导致儿童和成人结果之间以及中年和老年人测试之间的容易可比性。 接下来发生的事情要么令人兴奋,要么令人沮丧,这取决于您对现在所谓的“更新”的态度。

测试构建者似乎决定从相同的子测试中提取更多因素,也许是为了让用户觉得他们得到了更多的回报。 这是非常愚蠢的,因为所有的测试结果摘要都是基于所取的单个项目,并且只有当一个因素占方差的很大比例时才值得声明存在。 否则,只需给出子测试分数。 如果您提取的因素过多,就会遇到抽样问题:您的测试项目与因素的比率下降,并且尽管测试用户不可见,但信度和效度会受到影响。 我学到了一个简单的经验法则:你的人数至少应该是变量的五倍。 也可能是每个因素至少应该有 5 个子测试。 正如您将在下面看到的,所有智力测试都有一个普遍趋势,即测试与因素的比率较低。 也就是说,测试的长度是相当静态的,但随着时间的推移,他们中的大多数人声称发现了更多的因素。

重新审视商业智能测试衡量的因素数量的历史增长:Frazier 和 Youngstrom (2007) 的更新和扩展
Ryan J. McGill 和 Thomas J. Ward、Thomas W. Frazier 和 Eric A. Youngstrom。 ISIR 2018 海报会议。

过度因素智力测试

标准化样本量大多相当不错,因为这是一个昂贵的过程,涉及一个多小时的面对面测试。 然而,一些样本很小,并且确定的假定因素高得令人难以置信。 这是完整的海报:

https://drive.google.com/file/d/1oNDWhNIcXiX6IrPqGqEmNTrOPLsDvLHk/view?usp=sharing

事实上,同样的作者在谈到最常用的 WISC V(韦克斯勒儿童智力测验)时说,该测验的最佳因子解决方案是一个因素:一般智力。

Wechsler 儿童智力量表的结构效度——英国第五版:16 个主要和次要子测试的探索性和验证性因素分析
Gary L. Canivez1*、Marley W. Watkins2 和 Ryan J. McGill3

1伊利诺伊州查尔斯顿东伊利诺伊大学
2贝勒大学,德克萨斯州韦科
3威廉和玛丽,威廉斯堡,弗吉尼亚

https://drive.google.com/file/d/1vlljbuz4PWH3jIXvDScGWamFICYsRIPA/view?usp=sharing

总而言之,测试很好,但声称的因素太多。 这使得一些临床医生可以自由地推测为什么一个人在一个因素上表现良好而不是另一个因素,并提出由于某些外在原因而存在缺陷。 这是法医案件中的常见索赔。 我认为测试构造器和解释器应该坚持更可靠、有效和审慎的声明。 智力测试,只要他们对广泛的能力进行抽样,就可以准确衡量整体能力。 他们可能可以区分语言和非语言,但并不总是充满信心。 在紧要关头,他们可以冒险猜测三个因素,但这正在推动它。

不要让你自己或你的家人被过度考虑。

 
• 类别: 科学 •标签: IQ 
隐藏12条评论发表评论
忽略评论者...跟随Endorsed Only
修剪评论?
    []
  1. 如果 Menie 的 Woodley 是对的(“g”正在下降,而更具体的能力正在上升),那么这些“多因素”测试可能在 100 年或更长时间后更合适:)

  2. res 说:

    谢谢。 我不习惯思考样本量与可靠因素的数量之间的关系。

    最终链接的表 1 给出了斜四因子解的每个因子的百分比方差。 我对每个因素的解释百分比方差有多低感到惊讶:36.55、6.5、3.38、3.03。 这是典型的结果吗?

    该论文的支持信息可在 https://onlinelibrary.wiley.com/doi/abs/10.1111/bjep.12230

    图 S1 给出了将 WISC-V 标准化样本 (N = 415) 与随机数据进行比较的碎石图。 我认为在回应 Shalizi 反对 g 的论点时参考这是一件好事。 它还有助于正确看待每个因素的解释力。 该图向我表明,一、二或四因子模型有一些理由。 但第一个因素显然占主导地位。

    表 S1 和 S2 与表 1 相似,只是它们给出了二、三和五斜因子解的结果。

  3. dearieme 说:

    “被临床或神经问题困扰……”:这是否意味着一个人的沙拉日得出的智商可能在几年后有用,允许进行可能导致诊断的比较?

    • 回复: @James Thompson
  4. @dearieme

    是的,基线很好地表明了之前可能已经下降的水平。 全国成人阅读测试对这些水平给出了很好的预测,即使只是针对说英语的人。

    • 回复: @dearieme
  5. dearieme 说:
    @James Thompson

    嗯嗯,那很遗憾我11和21的考试没有任何数值结果。

    我的大学考试成绩被张贴在布告栏上,任何人都可以看到——事实上,有些是在全国性报纸上发表的。 然而,期望任何人掌握我的结果并尝试从他们那里推断出智商可能有点过分了。

  6. 在 ISIR 2018 和我在那里进行的讨论之后,我认为通常的标准化样本对于因子分析精度来说可能太小了。 所考虑的方差很小,但如果主要因素确实吸收了大部分方差,这不是问题,它经常这样做。 真正的困难是决定您的阶乘解决方案是否会在新样本上复制,基本上是在未来十年将有数千人进行测试。 一个全国性的出生样本,或类似的样本将给出更强有力的结果。

    • 回复: @Wizard of Oz
  7. Anonymous [又名“CGVibes”] 说:

    作为一名临床医生,我敏锐地观察着学者和研究人员之间的辩论。

    但是,CHC 理论(Woodcock-Johnson 所基于的)具有三个不同的水平(g / 广泛能力 / 狭义能力)对于评估特定学习问题的可能原因非常实用。 这些广义和狭义的能力(已通过因子分析进行了调查)具有实用性。

    例如,从听觉处理(广泛能力)测试语音编码(狭义能力)可以帮助挑选在阅读(解码)和拼写(编码)方面有困难的学生。 在流动推理(广泛能力)中,归纳和演绎能力(狭义能力)的差异可以帮助制定数学教学的指导方针。

  8. obwandiyag 说:

    你忘了补充一句:“黑人是劣等的。”

  9. “它经常(原文如此)做” 什么样的有用测试(以及用于什么用途)没有占主导地位的 g 因素?

  10. g 通常会出现,只要有广泛的任务和应试者。

当前评论者
说:

发表评论 -


 记得 我的信息为什么?
 电子邮件回复我的评论
$
提交的评论已被许可给 Unz评论 并可以由后者自行决定在其他地方重新发布
在翻译模式下禁用评论
通过RSS订阅此评论主题 通过RSS订阅所有James Thompson的评论