几天前,我被吸引到了一个游戏 乱涂 和我的母亲和祖母。 女族长都是多产的球员,但如此大胆,无论如何我都希望获胜。 相反,我妈妈和我绑在一起,即使在筋疲力尽之后 决胜局规则.
我把责任归咎于旧的 美国遗产 字典 我们正在使用。 很明显是穴居人写的,它无法识别“渣滓”作为一个词,将名词排他性地识别为复数“dregs”(是否有没有单数形式,只有复数形式的名词?)。 我责怪画了两个 Ls 在比赛中迟到了。 我抱怨说,因为一块只值一分,所以很难使用。
事实证明, L 实际上是 英语中最不常用的单点字母 根据维基百科关于该主题的条目(显然由中央学院的数学教授组成 汤姆林顿).
做得多好 乱涂 字母和点分布 代表英语的实际书面使用? 为了 七十年前被创造 由一位失业的建筑师通过梳理各种书面资料(如 “纽约时报”,游戏做的相当不错。
分数与字母频率分布 (LFD) 呈负相关,具有统计学显着性 71。 这是相当严格的,特别是考虑到价值一个点的瓷砖数量(70 个中的 98 个,或 71%),使用最常用的单点, E,出现频率是最不常见的频率的三倍以上, L.
游戏的图块分布更令人印象深刻,与 91 的 LFD 相关。 多变量分析的混合点数将其提高到 92。
尽管如此,仍有 15% 的关系得到了“解释”。 因此,即使将频率和点值都考虑在内,一些字母在数学上更有利。 通过根据先前指示的数据构建回归公式,将预测的 LFD 与实际 LFD 进行比较,将前者除以后者,再乘以 100 以促进审美,从而创建一个指数。 在控制其得分值和平铺频率后,指标得分越高,该字母越好。 从最好到最坏:
1) 高 – 282
2) 问 – 162
3) 电话 – 144
4) 小号 – 140
5)Z-126
6)中 - 117
7) 电子 – 110
8) 宽 – 109
9) 否 – 107
10) 女 - 103
11) 男 – 102
12) D – 98
13) 右 - 95
14)Ø - 93
15)一个 - 92
16) 是 – 91
17) 大号 – 89
18) P – 81
19) 我 – 78
20) K – 71
21) 乙 – 63
22)你 - 61
23) 后卫 – 58
24) V – 45
25)J – 33
26) X – 32
请记住,尽管分数差异很大,但它们是相互关联的(SD 为 49 指数点)——Butts 在反映他创建的游戏中的实际 LFD 方面做得非常出色。
为了进一步证明他的影响力,请考虑一下 LFD 没有说明各种字母在英语中的出现方式,仅说明了它们各自的频率。 有些字母比它们在现实世界中的绝对频率所暗示的更难使用。
H, 值得巴茨的信用,可能提供了最好的说明。 使用上述方法,绘制的字母是最吉祥的。 但是,虽然近三分之一的英文字母使用频率高于 H,这封信包含在两个 最常用 发生 有向图 (TH, HE),以及第一个和第三个更常用的三合字母 (“, THA). H 比说,他需要更多朋友的帮助 M 一样。
屁股巧妙地限制了频率 S. 由于数量众多,它是游戏中最可靠的独立可玩字母。 添加一个 S 到另一个词的结尾会让你垂直放下一个以开头的词 S 或者使用 S 在来自左侧或来自上方的新创建的单词的末尾。
如前所述,指数分数基于书面英语中的字母频率,而不是拼字游戏中各种字母的效用。 X 似乎是最难画的信,但一个开放的 A 允许使用 X 和轻松的九分。 V 在大多数情况下,似乎是最不适合绘制的字母。
巴茨的综合指数得分为 87(不包括 Y),元音让比赛超载。 但尤其是在游戏后期,元音通常可以弥补在尝试演奏两个或三个字母的单词时所带来的挫败感——其中至少有一半和三分之一的字母是元音的单词。
保持每个字母的点数相同,数学上的“最佳”瓷砖分布(与原始游戏的括号差异)如下:
答:8 (-1)
乙:2 (0)
C:3(+1)
D:4 (0)
电子:12 (0)
女:2 (0)
后卫:2 (-1)
高度:5 (+3)
我:7 (-2)
J:0(-1)
克:1 (0)
L:4(0)
男:3 (+1)
否:7 (+1)
7: 1 (-XNUMX)
人数:2 (0)
问:0 (-1)
回复: 6 (0)
小号:6 (+2)
电话:9 (+3)
你:3 (-1)
五:1(-1)
女:2 (0)
X:0(-1)
是:2 (0)
Z:0(-1)
丢弃稀有字母会增加可玩性,但会降低图块集的总分值。 构造更频繁的交集的更长词的容易性是否会克服点缺陷是难以辨别的。
这个家庭有几个游戏机。 我必须坚持每隔一次使用我的混音,看看每场比赛是否有可观的总分!
拼字游戏者可能会猜测 超级拼字游戏,三年前推出,效果更好。 增加 n,在这种情况下,通过将可玩牌的数量加倍,当然可以做到这一点。 但是,美泰似乎并没有简单地将每个字母的频率加倍并增加电路板尺寸,而是校准了字母频率以更准确地反映实际书写使用情况(尽管每个字母的分数保持不变)。 游戏的图块分布与 LFD 的相关性为 96(包括点数在小数点后第三位略微加强了相关性)。
该指数按字母评分为 超级拼字游戏,以及使用的其余数据,是 可在这里.
关于信件分发的有趣评论。
有几个名词只有一个形式以 s 结尾。 例如,军营、新闻和佝偻病。 做一些谷歌搜索,我相信你会发现更多……
阿农
谢谢。
可能还有几个。
免费的在线词典确实将“营房”列为名词,并指出它通常以复数形式使用。 但我没有听说过它被单独使用。 佝偻病是一种疾病——它一定是复数,还是像金牛座一样,只是以 S 结尾?
上帝保佑我不是数学家。 一定很抓狂。
你只是疯了,你不能打败我——爱,妈妈🙂
我会连比分呢! 在我最糟糕的一天和你最好的一天,我们打平了。 但你不能指望每次都会发生这种情况!
不错的作品; 没有后遗症,这个。 很高兴看到一个 *分数* 频率分布 (SFD),无论是游戏中的单词还是游戏总分——都可以生成一些漂亮的直方图,并且可以让像我这样的拼字游戏爱好者看到他们的排名到底有多低。
另外,与 *单词* SFD,然后您可以将播放的分布与派生形式的字典列表进行比较。 当然,一个复杂的因素是拼字游戏中的双/三字母/单词——所有这些都是乐趣的一部分。
也许可以说服 facebook 上的 scrabulous 分享他们为这样一项有价值的事业所做的记录……
新华社,
感谢您的建议。
如果我没理解错的话,Facebook 连接是我能够获取该信息的唯一途径。 SFD 到底是什么意思? 使用 X 字母的单词获得的平均分数?
我讨厌我这个字母
剪刀、裤子、泳裤、牛仔裤……
剪刀是钝的(不是钝的)。
我的裤子不合身(不是不合身)。
但是上面给出的例子是单数的集体名词:“兵营的屋顶上有一个洞。” “今天的新闻很无聊。” “佝偻病对孩子来说是一场灾难。”
有趣的博客!