Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
丹尼尔·麦克阿瑟(Daniel MacArthur)

书签 全部切换变革理论添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

巴基斯坦仪仗队

几天前,我建议丹尼尔·麦克阿瑟(Daniel MacArthur)博士可能有南亚血统。 现在,当遇到意外时,最好的选择是坚持先前的假设,除非该意外足以使您“更新”模型。 经过几天的进一步分析,我将更新:我确实认为Dan MacArthur具有南亚血统。 Dienekes进一步挖掘,发现沿着2号染色体的前3/10左右有“南印度祖先”祖先的标志。现在,您必须记住,该基因组区域仅是南亚的一半。 另一半是欧洲人。

但是无论如何,有人提出了一个问题:也许麦克阿瑟具有罗曼尼的传统? 我对此表示怀疑,部分原因是:

1)在19世纪,英国的罗曼语并不多

2)英国罗曼语已经非常混杂

另一个自己是种群基因组学家的朋友表达了一些怀疑,认为这么长的一段并没有被几代人的重组所破坏。 我唯一适度了解的答案是:我们只会注意到很长的一段,因为如果在显性祖先成分中嵌入了非常小的“异国”祖先区域,则可能不会在其中的某些测试中显示出来(或者,会以为是噪音)。 丹还有南亚血统的另一部分,但规模小得多。 如果使用更好的参考人群,可能还会发现其他地区。

这是我现在暂时要处理的Dan数据。 首先,占用80 MB左右的内存,并将其分阶段进行。 这样,我将拥有一条南亚染色体和一条欧洲染色体,而我们只能寻找与南亚染色体匹配的染色体。 但是很忙,我没有时间去做。 我确实有时间要做的是减少所考虑的染色体区域,然后在我拥有的私有数据集中运行IBS距离分析。 这是粗略的分析,但并不总是无意义的分析。 但是,通过研究这些关系,我现在可以得出结论,丹·麦克阿瑟(Dan MacArthur)可能没有罗曼尼血统。 为什么? 由于罗曼尼是印度西北部的遗产,而麦克阿瑟的比赛模式使用 二倍体 基因型(因此,南亚+欧洲)与我期望的组合不符。

完整表如下所示,但对我来说,他与西北印第安人的比赛如此之多,这一事实证明了他的血统是 不能 西北印度。 否则,他会更频繁地匹配更多犹他州白人(CEU样本)。 相反,混合使用更传统的南亚血统和欧洲血统的人通常类似于 在这些粗略的衡量标准中,南亚的南亚人口(例如Brahui)。 实际上,与丹的IBS个人资料最接近的匹配项之一是我自己母亲的匹配项。 她是孟加拉人一个相当香草的民族,所以我认为他的印度血统很可能是相似的。 遗传数据薄弱并不是真正的主要原因。 这家英国东印度公司在其大部分历史中都是在孟加拉之外经营的,而孟加拉国简直就是很多。

在这里还有很多事情可以做。 由于我没有时间,所以这是 谱系文件 如果有人想和他们一起玩(Dan是DGM001)。

菌群数 与丹的遗传距离 标准化距离
婆罗辉 0.253 81.268
布鲁修 0.257 82.736
拉齐布的母亲 0.258 82.783
CEU 0.258 82.993
布鲁修 0.258 83.024
CEU 0.26 83.547
萨基利 0.26 83.555
婆罗辉 0.261 83.831
婆罗辉 0.261 83.857
GIH 0.261 83.955
CEU 0.261 83.972
CEU 0.261 83.985
CEU 0.262 84.043
北坎纳迪 0.262 84.169
CEU 0.262 84.207
CEU 0.262 84.318
CEU 0.262 84.33
CEU 0.263 84.391
帕尼亚 0.263 84.408
CEU 0.263 84.437
CEU 0.263 84.445
CEU 0.263 84.488
CEU 0.263 84.606
CEU 0.263 84.609
CEU 0.264 84.691
婆罗辉 0.264 84.709
CEU 0.264 84.752
CEU 0.264 84.764
婆罗辉 0.264 84.822
GIH 0.264 84.826
布鲁修 0.264 84.841
CEU 0.264 84.898
CEU 0.264 84.975
北坎纳迪 0.264 84.992
CEU 0.265 85.087
帕尼亚 0.265 85.212
CEU 0.265 85.226
CEU 0.265 85.25
CEU 0.265 85.25
CEU 0.265 85.278
CEU 0.265 85.299
北坎纳迪 0.265 85.3
布鲁修 0.265 85.309
布鲁修 0.266 85.328
CEU 0.266 85.363
CEU 0.266 85.409
北坎纳迪 0.266 85.412
CEU 0.266 85.436
布鲁修 0.266 85.446
在贝内以色列 0.266 85.508
CEU 0.266 85.521
GIH 0.266 85.618
GIH 0.267 85.661
CEU 0.267 85.696
CEU 0.267 85.722
CEU 0.267 85.732
婆罗辉 0.267 85.777
GIH 0.267 85.793
CEU 0.267 85.799
CEU 0.267 85.816
科钦犹太人 0.267 85.85
CEU 0.267 85.943
婆罗辉 0.268 85.996
CEU 0.268 86.005
科钦犹太人 0.268 86.011
CEU 0.268 86.08
CEU 0.268 86.115
CEU 0.268 86.18
GIH 0.268 86.229
科钦犹太人 0.268 86.234
CEU 0.268 86.244
布鲁修 0.268 86.265
CEU 0.268 86.277
CEU 0.268 86.278
CEU 0.269 86.288
CEU 0.269 86.291
CEU 0.269 86.318
CEU 0.269 86.325
CEU 0.269 86.326
GIH 0.269 86.327
CEU 0.269 86.329
CEU 0.269 86.354
CEU 0.269 86.387
CEU 0.269 86.463
CEU 0.269 86.515
CEU 0.269 86.517
CEU 0.269 86.55
CEU 0.27 86.609
帕尼亚 0.27 86.682
CEU 0.27 86.687
CEU 0.27 86.696
CEU 0.27 86.717
CEU 0.27 86.733
萨基利 0.27 86.74
CEU 0.27 86.866
马来亚人 0.27 86.879
北坎纳迪 0.27 86.883
CEU 0.271 86.937
婆罗辉 0.271 86.952
布鲁修 0.271 86.956
CEU 0.271 86.957
CEU 0.271 86.977
北坎纳迪 0.271 86.995
GIH 0.271 87.018
CEU 0.271 87.042
CEU 0.271 87.066
CEU 0.271 87.07
婆罗辉 0.271 87.09
在贝内以色列 0.271 87.094
萨基利 0.271 87.141
CEU 0.271 87.2
CEU 0.271 87.24
北坎纳迪 0.272 87.253
CEU 0.272 87.297
布鲁修 0.272 87.307
CEU 0.272 87.327
GIH 0.272 87.353
CEU 0.272 87.355
科钦犹太人 0.272 87.381
CEU 0.272 87.384
CEU 0.272 87.5
CEU 0.272 87.535
CEU 0.273 87.594
马来亚人 0.273 87.676
CEU 0.273 87.702
CEU 0.273 87.741
布鲁修 0.273 87.806
CEU 0.273 87.846
柬埔寨人 0.274 87.932
北坎纳迪 0.274 87.951
CEU 0.274 87.951
布鲁修 0.274 88.03
CEU 0.274 88.047
CEU 0.274 88.081
CEU 0.274 88.089
CEU 0.274 88.101
CEU 0.274 88.179
CEU 0.274 88.19
北坎纳迪 0.275 88.243
CEU 0.275 88.32
GIH 0.275 88.325
CEU 0.275 88.349
婆罗辉 0.275 88.393
CEU 0.275 88.402
CEU 0.275 88.457
在贝内以色列 0.276 88.552
CEU 0.276 88.577
CEU 0.276 88.603
CEU 0.276 88.647
CEU 0.276 88.7
CEU 0.276 88.729
CEU 0.276 88.814
CEU 0.276 88.85
婆罗辉 0.276 88.855
CEU 0.277 88.923
GIH 0.277 88.99
帕尼亚 0.277 89.082
CEU 0.277 89.118
CEU 0.277 89.15
CEU 0.277 89.151
CEU 0.277 89.17
CEU 0.278 89.184
柬埔寨人 0.278 89.208
柬埔寨人 0.278 89.233
柬埔寨人 0.278 89.383
CEU 0.278 89.45
CEU 0.278 89.493
柬埔寨人 0.279 89.522
CEU 0.279 89.595
CEU 0.279 89.679
CEU 0.279 89.753
CEU 0.279 89.762
CEU 0.279 89.807
柬埔寨人 0.28 89.942
GIH 0.28 90.085
CEU 0.281 90.178
婆罗辉 0.281 90.364
柬埔寨人 0.282 90.543
柬埔寨人 0.282 90.559
柬埔寨人 0.282 90.77
柬埔寨人 0.283 90.898
CEU 0.283 90.956
CEU 0.284 91.316
冠心病 0.289 92.952
萨基利 0.29 93.103
在贝内以色列 0.29 93.122
冠心病 0.291 93.619
冠心病 0.291 93.663
冠心病 0.293 94.125
冠心病 0.293 94.248
冠心病 0.294 94.451
冠心病 0.294 94.629
冠心病 0.296 94.965
冠心病 0.296 95.279
尤鲁巴斯 0.297 95.298
冠心病 0.297 95.368
冠心病 0.297 95.438
冠心病 0.297 95.441
尤鲁巴斯 0.297 95.567
冠心病 0.298 95.678
冠心病 0.298 95.828
冠心病 0.299 96.032
冠心病 0.299 96.127
冠心病 0.3 96.349
冠心病 0.3 96.403
冠心病 0.3 96.443
冠心病 0.3 96.508
冠心病 0.3 96.523
冠心病 0.3 96.533
冠心病 0.301 96.575
冠心病 0.301 96.598
冠心病 0.301 96.624
冠心病 0.301 96.625
冠心病 0.301 96.738
冠心病 0.301 96.758
冠心病 0.301 96.869
尤鲁巴斯 0.302 97.106
冠心病 0.303 97.37
冠心病 0.303 97.41
尤鲁巴斯 0.304 97.681
冠心病 0.304 97.713
冠心病 0.304 97.747
尤鲁巴斯 0.304 97.829
冠心病 0.304 97.838
冠心病 0.305 98.106
冠心病 0.306 98.309
尤鲁巴斯 0.307 98.499
冠心病 0.307 98.546
冠心病 0.307 98.547
冠心病 0.307 98.606
冠心病 0.307 98.764
冠心病 0.307 98.78
冠心病 0.307 98.803
尤鲁巴斯 0.308 98.947
尤鲁巴斯 0.308 99.03
尤鲁巴斯 0.309 99.411
尤鲁巴斯 0.309 99.417
冠心病 0.309 99.452
冠心病 0.31 99.624
尤鲁巴斯 0.311 100
 

我在这篇文章中的初衷是讨论最近订购的小吃,这导致我的许多朋友在23andMe感到非常恼火。 但是,由于有些书呆子级的阴谋,我想浏览一下他们的新“祖先组成”功能,我认为我必须首先讨论它。 虽然我同意许多 二烯 对于此新功能的担忧,我必须承认,至少该方法不会产生积极的误导性结果。 例如,我之前曾抱怨说,“祖先绘画”在不平凡的情况下给出了疯狂的结果。 它说我是约60%的欧洲人,这在他们的非最佳参考人口群体中有一定的连贯性,但随后我的女儿说我的欧洲人> 90%。 由于23andMe确实确认她与我的血统相同,所以50%的结果是没有道理的; 一些读者认为,在将不明确的基因组片段分配给“欧洲”遗产时,他们的算法存在很大的偏见(这也是东非人的问题)。

这是我女儿的新染色体画:

23andMe的一方面 新的祖先组成特征是,它非常以欧洲为中心。 但是,大多数客户是白人,大概他们使用的参考人群(来自客户)也是白人。 尽管他们可以使用许多公共领域的非白人数据集,但我认为在这种情况下,他们更喜欢吃自己的数据狗粮。 但这确实是宏大计划中的一个小问题。 与以前相比,这是一个巨大的升级。 现在,作为一个南亚人,这并没有告诉我太多。 但是,这也不再告诉我可笑的事情了!

但是关于遗漏,我很想知道为什么这个新功能将我的家庭评价为东亚地区的〜3%,而其他分析则使我们处于10-15%的范围内。 问题所在 非常 很高的价值是,南亚人经常会有一些残留的“东方”信号,我怀疑这不是真正的混合物,而是人工制品。 然而,包括孟加拉人在内的东北印度人经常有真正的东亚外来者。 在PCA地块上,我的家人向东亚人转移了很多。 他们收到的信号可能不是噪音。 我为家人所见过的几乎所有东亚血统都为母亲带来了更大的价值,而这一点在这里仍然成立。 只是值太低了。

无论如何,这不是我所见过的最奇怪的事情。 我在四处寻找与我“共享”基因组的人,但我偶然发现了这一点:

您可以从屏幕截图中猜到 这是 丹尼尔·麦克阿瑟(Daniel MacArthur) 个人资料。 并且据此,第25号染色体的约10%是南亚! 第一次脸红对我来说似乎完全是荒谬的,所以我点击了具有类似北欧背景的人的其他个人资料……但我没有看到任何类似的东西。

该怎么办? 需要更多的证据来证明我的先前假设,因此我下载了 麦克阿瑟博士的基因型。 然后,我将其与三个HapMap人口,犹他州的白人(CEU),古吉拉特人(GIH)和丹佛的中国人(CHD)合并。 最后基本上是一个控件。 我拔出了10号染色体。我还把Dan的妻子Ilana添加到了数据集中,因为我相信Dan的妻子是用相同的Illumina芯片打字的,并且具有相似的种族背景(即非常白人)。 重要的是要注意,数据集中仅剩28,000个SNP。 但是,对于基于洲际尺度变化的基于模型的聚类,通常在SNP数据上10,000绰绰有余。

我做了两件事:

1)我在无监督的情况下以K = 3运行了ADMIXTURE

2)我运行了一个MDS,可以可视化多个维度上的遗传变异

在继续之前,我将陈述发现的内容: 这些方法支持了23andMe在10号染色体上的推断。麦克阿瑟博士似乎与南亚人有亲和力 (即,这是他的“咖喱染色体”)。 这是表格形式的平均(中位数)值,麦克阿瑟和他的妻子被提出进行比较。

第10号染色体的ADMIXTURE结果
K表1 K表2 K表3
CEU 0.04 0.02 0.93
GIH 0.87 0.05 0.08
冠心病 0.01 0.97 0.01
丹尼尔·麦克阿瑟(Daniel MacArthur) 0.29 0.07 0.64
伊拉娜·费舍尔(Ilana Fisher) 0.01 0.06 0.94

您可能想要发行。 在非创始人的CEU样本中,没有一个超过20%的南亚地区。 尽管确实让我感到惊讶的是,有那么高,但使我更容易相信麦克阿瑟在第10号染色体上的结果是fl幸的:

这是MDS的两个最大维度:

同样,很明显,这条10号染色体向南亚人转移。 如果我现在有更多时间,我可能要做的就是得到特定的染色体片段,将其定相,然后将其与各种南亚人群进行比较。 但是我现在没有时间,所以我去检查了 口译。 我提高了设置以减少噪音,这样它只会吐出最可靠和最显着的结果。 如您所见,第10号染色体再次出现,与另一个染色体不太一样。

有没有合理的解释呢? 也许麦克阿瑟博士 可以打电话给有帮助的亲戚? 回想起来,他的父母是从英国移民的,英国的白人确实有南亚血统可以追溯到19世纪,这并非闻所未闻。 虽然说实在的,但我现在对这一切都不了解。 这种基因型已经“淘汰”了好几年了,那么没人会注意到这种特殊性呢? 也许问题在于每个人都在看全基因组平均数,而这还没有引起人们的关注? 我真正想做的是查看所有染色体的分布,然后看看丹尼尔·麦克阿瑟(Daniel MacArthur)的10号染色体如何堆积。 这可能是自然的随机行为。

此外,我想我应该补充一下,南亚的比率约为1.5%,这与麦克阿瑟的曾曾曾祖父母之一是印度人一致。 假设25年的生成时间使它们进入19世纪中叶。 当然,在如此低的比例下,方差会很大,因此很有可能需要将实际的混合物日期推迟一代或一代。

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”