Unz评论•另类媒体选择
美国主流媒体大都排除了有趣,重要和有争议的观点
 玩笑基因表达博客
人口统计学语言情报
通过电子邮件将此页面发送给其他人

 记住我的信息



=>

书签 全部切换总目录添加到图书馆从图书馆中删除 • B显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... 这个评论者 这个线程 隐藏线程 显示所有评论
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者
搜寻文字 区分大小写  确切的词  包括评论
列表 书签

几年前,我发表了一篇文章, WORDSUM&IQ与相关性,作为“参考”帖子。 基本上,如果有人反对使用WORDSUM, 一般社会调查,那么我将指向该帖子并观察一下 WORDSUM与一般智力之间的相关性是0.71。 这是有道理的,因为WORDSUM是一项词汇测试,并且语言流利度与智力高度相关。

但是我意识到多年来,我已经使用GSS和WORDSUM发布了许多帖子,但从未明确列出WORDSUM分数的分布,其范围从0(十分之十)到0(十分之十)。 我曾经使用过“愚蠢的区间10-10”之类的类别,但在读者提示后,通常只在评论中提及百分位。 这篇文章将永远解决该问题,并将为将来提供参考。

首先,请记住,我将样本限制为2000年及以后。 N约为7,000,但对于某些交叉变量而言,N则低得多。 所以, 我邀请您复制我的结果。 在图表之后,我将列出所有变量,因此,如果您愿意的话,您应该能够在大约10分钟内复制显示所有样本量。 我还将要在原始表数据中附加一个csv文件。 至于图表,它们很简单。

– x轴是WORDSUM类别,范围从0到10

– y轴是获得该分数的给定人口统计类别的百分比。 我标记了其中一些图表不太忙的地方

所有图表都有一条线,代表样本中的总人口(“全部”)。




方法:

在所有情况下,“行”变量均为WORDSUM。 我在“选择过滤器”中输入了YEAR(2000- *)。

对于列:

性别=性别

种族/种族=对于非西班牙裔黑人和白人,将HISPANIC(1)放入过滤器中。 然后是RACE。 对于西班牙裔,只将样本限制为西班牙裔即可,例如HISPANIC(2- *)。 该行中没有任何内容。

教育=学位

地区=区域

政治思想= POLVIEWS(r:1-3“自由”; 4“适度”; 5-7“保守派)

政党= PARTYID(r:0-2“民主党”; 3“独立”; 4-6“共和党”)

信仰上帝=神(r:1-2“无神论者和不可知论者”; 3-5“有神论者”; 6“有说服力的有神论者)

宗教=宗教

关于圣经的观点=圣经

Income standardized to 1986 = REALINC(r:0-20000″0-20″;20000-40000″20-40″;40000-60000″40-60″;60000-80000″60-80″;80000-100000″80-100″;100000-120000″100-120″;120000-140000″120-140″;140-*”140-“)

财富=财富(r:1-3“”)

进化=进化

你可以找到原始表 点击此处.

(从重新发布 探索/ GNXP 经作者或代表的许可)
 
隐藏31条评论发表评论
忽略评论者...跟随仅认可
修剪评论?
  1. 谢谢。

    哇,宗教图真的从其他地方跳了出来。 据推测,如果将宗教限制为白人,那将不会是那么极端,但仍然……

  2. 您不小心将圣经列出了两次。 有《寓言书》的人。

  3. 您正在使用什么绘制曲线? 三次样条?

    数据很少的国家(犹太人,无神论者)会因为不采用单峰模式而跳出来。 在某些方面,这是图形的一个很好的功能,警告不要从该特定行中花费太多。 但是犹太人的数据实际上在高端是单峰的,非单调曲线是平滑方法的结果。 我想这是一个迹象,表明数据确实很奇怪,由于数量很少,即使它不是单峰的也很奇怪。

  4. Razib:您知道一个在线进行WORDSUM测试的网站吗?
    谢谢,唐

  5. 我一直惊讶于Wordsum被认为与智力之间存在轻微的关联。

    WORDSUM分数只能分为两个有用的描述性类别:

    0-9 =愚昧无知

    10 =最低程度的识字

  6. @“好奇”:那么根据您的调查,有95.9%的样本是“愚蠢且无知的”(因为只有4.1%的人获得10分)?

    另外,我不知道“持续惊讶Wordsum被认为与智力有轻微关联”是什么意思。 IQ和WORDSUM之间的样本相关性为0.71。 根据我的经验,这与社会科学有很大的关联性,那么您的惊讶是否源于这样的信念,即智商是智力的不良指标? 这是有根据的立场,但否则我不明白您所说的“考虑”是什么意思。

  7. 有用的技巧,以获取更好的图形:标记轴。 认真标记轴。 即使读者可以理解,仍要标记轴。 就这些。

  8. 党的隶属关系看起来很时髦。 似乎每个不是民主党人或共和党人的人都陷入了“独立”之中。

    不成为注册选民并不能使您成为独立人士。 注册的“无党派关系”也将是一个有趣的数据点。

  9. 我不知道您是否知道这一点,但是对于红色/绿色色盲的人(例如我),您选择的红色和绿色几乎是不可能的。 在图上比图例更容易区分,但这仍然非常困难。

  10. 为什么要指定它是言语能力? 为什么不是通用情报,因为这就是相关性?

  11. 另外,为什么csv文件中的wordum在GSS中为0-10时却为1-10?

  12. 令我感到失望的是,像《发现》杂志之类的杂志会使用设计不佳的图表。 数据很有趣,但是,由于我是色盲者,因此我无法阅读其中的大部分内容,而且您所选择的颜色很难辨别。 谢谢你。

  13. 嘿拉齐布,我在公交车上坐在您旁边。 我是去奇科的人。 我看到你在做这个。 当我在reddit上找到此链接时,我大吃一惊。 希望你能回家。

  14. @好奇的

    你为什么这么说? 您的智商低(<115),但是您有10? 数据说明一切。

  15. 一些小问题

    wordsum从0中的10变为10中的10。只有很小的比例在0中得到10,但是它们在那里。

    回复:平面设计。 正如#14在上面提到的那样,我在自己坐公交车的大约20分钟内写了这篇文章。 为美观而道歉,但这不是重点。 这就是为什么我提供.csv文件的原因。 尽管将来我会牢记色盲问题,但我没有想到这一点。 我基本上只是使用开放式办公室的网页导出功能来创建图表的JPG版本,而且确实很烂。 而且我还使用了开放式办公室的默认图表颜色。 将来可能不得不在R中编写一个可重用的函数,以使此操作1)在时间上容易实现2)在读者眼中。 我没有标记轴等,因为空间(最大600像素)和时间(可能花了50分钟才能写完整个内容,添加标签在使用向导时变得有些乏味)。

  16. 我希望这些数字能够鼓励其他人通过全面的智商测试来研究这一点。 有趣的是,还可以看到哪些组通过语言能力与空间进行聚类。

  17. 我的糟糕的col = pres08和row = wordsum向我显示了wordum为1-10,但在帮助部分中却将其列为0-10。 (它被剪裁是因为我猜n = 0等于wordum = 0)

  18. 我从来没有参加过不得分满分的考试,这是 真的,真的很容易 这样做。 这些单词在小学和中学程度中等的人甚至是读了很多书的人中并不少见。 我简直不相信一个人可能会与不得分10的其他人进行半途半熟的对话。 但这也许只是我或我队列中的其他人,他们在1970年代的教育腐烂发生之前就拥有上学的优势,尽管我确实承认拥有智能的测试结果使我比平均水平高出了一些偏差,我认为这是一个不错的选择教育应该允许120种IQ类型成为WORDSUM。

    也许我是错的。 在这种情况下,我们需要制定大规模的优生计划,并恢复过去的教育水平。

    我喜欢阅读GNXP,因为它会引入我不知道的单词,概念和含义。 Razib无疑会因为没有与年龄做我自己的WORDSUM相关性来证明我的观点而受到我的谴责,但是我对此很懒惰(而且如果我没有得到报酬,我总是这样。我已经退休了,宁愿选择将我的辛苦思考限制在投资和扑克桌上。)

  19. 以下是年龄与单词和某些随意分组的相关性:

  20. 似乎更夸张的测试示例显示了认知能力随着年龄的增长而下降。 哦,好了,当我们接近智能机器将由某些“奇异”发烧友预测的对社会的影响时,我们将需要越来越少的任何种类的人来从事任何工作。 这就要求采取更加严格的优生程序来减少无用群众的绝对数量,因为任何一个群众都不会有生产性工作。

    使成群的奴隶劳工聚集在一起(几乎没有什么意义)似乎是毫无意义的,这样成群的无知用户可以产生大量毫无意义的Twitter骗子。

  21. “很好奇”,我认为您可能没有更多的正常认知类型。 很好,但我不认为在这种情况下否认WORDSUM有用的意义是什么。 您在这里比较两个不同的问题。

  22. 我对您的图表显示的宗教与智慧相矛盾的信息感兴趣。 在第一张图中,似乎暗示无神论者的得分要比一般无神论者更高。 下图显示犹太人的得分远高于无神论者。 怎么会这样呢? 我能得出的唯一结论是,犹太人的样本量很小,这对有神论者的总体平均水平几乎没有影响。 如果数据真的被搞砸了,为什么您觉得值得发布呢? 显然,这些图没有任何意义。

  23. #23,只有30%的“不信教”的人是无神论者或不可知论者。 极少数犹太人是无神论者和不可知论者。 是的,无论如何,犹太人的数量很少。 尽管无神论者和不可知论者比无神论者所占的比例更大。

  24. 没有轴标签? 真的吗? 这些图表令人沮丧,并且在没有标记轴的情况下难以阅读。 该漫画应该可以帮助您: http://xkcd.com/833/

  25. 拉齐布(Razib),您可以发布数据还是指向我可以在哪里找到有关不同变量的相对样本大小的数据。 只是想弄清楚统计意义; 抱歉,如果您已经完成此操作,但我错过了,但是在您发布的CSV文件中没有看到它。 (顺便说一句,发布后,您的帖子激发了我在Facebook上的热烈讨论,非常有趣的数据。感谢您的帖子)。

  26. #26,这就是为什么我提供变量的原因。 只需访问gss网站,然后复制查询即可。 如果太混乱了,则默认设置将向您显示加权N。

  27. 在绘制其他变量或控件时,提供一些变量或控件之间的相关性将很有用。 我猜想,例如,由于美国学术界中犹太人的人数过多,当控制教育时,宗教图看起来会大不相同。

  28. #28,我给了您3分钟内进行此类检查的工具。 做吧。

  29. 我了解WORDSUM的实用程序,因为它是GSS变量,但是当分解组时,我很难接受它作为一种有用的情报措施。 几个普遍的问题……由于测量误差大,在分布的末端附近显然是一场灾难。 其次,您引用的相关性来自1960年代收集的数据-足够重要,样本是士兵接受陆军的智力/职业测试。 这些人与GSS样本几乎没有相似之处,并且居住在不同的世界中。 最后,鉴于语言暴露程度和受教育程度的差异,我看不出任何特殊原因会导致WORDSUM-g相关在各个亚组之间保持稳定。 例如,平均而言,与黑人和贫穷的孩子相比,白人和富有的孩子阅读书籍的机会更多,并且阅读书籍的机会更多,而这似乎对WORDSUM来说是合理的输入,而WORDSUM显然是一种文化习得的知识。

    而且这些轴也不会令人困惑-对阅读文本的人来说都是显而易见的,而您在顶部定义了这些轴,这是一篇博客文章。 最近刚刚听说过Tufte的人们四处乱骂每个人的排行榜。 好可爱

  30. #30, 考虑到语言暴露程度和受教育程度的变化,我看不出任何特殊的原因,即WORDSUM-g相关在各个亚组之间都将保持稳定。

    似乎是可检验的:SAT的数学部分与语言部分之间的相关性是否随组而变化? 后者不太“文化公平”,因此如果您的主张正确,他们应该这样做。

评论被关闭。

通过RSS订阅所有Razib Khan评论