开放数据在基因组学中的重要性(以及一切!)
搜寻文字 区分大小写 确切的词 包括评论
列表 书签
昨天,我的一个朋友碰巧是强悍的德国和斯堪的纳维亚中西部上游股票,在 Facebook 上给我发消息,解释说她父亲的 23andMe 成绩已经出来了……他是撒哈拉以南非洲人的 43%! 几个小时后,她母亲的结果出来了,她是 35% 的撒哈拉以南非洲人。 我去了我的账户,我爸妈也在同一个范围内。 哦,天哪,一夜之间我变成了一个代表性不足的少数群体! 显然这是一个错误。 关键条款是 明显. 有些人收到的结果表明他们是 5% 的撒哈拉以南非洲人等等。 或者像丹麦克阿瑟这样的人 可能有南亚血统,但在 1-2% 的范围内。
你怎么知道这些结果不是bug? 您分析原始数据. 有技能的人 砰砰 or 混合物 可以很容易地再次检查,就像我对丹麦克阿瑟所做的那样。 即使您没有该特定技能,也只需使用类似的服务 口译 or GED比赛. 通过这种方式,您可以使用一系列统计分析来查看它们是否重现了一致的信号。 这种复制是必不可少的。 方法不会给你真相,它们会给你结果,你可以用这些结果来评估真相的可能形式。
这就是为什么我对 Ancestry.com 及其网站如此努力的原因 缺乏原始数据下载. 你不能只相信一家特定的公司会给你完美的分析准确性,他们不是神。 您的基因信息太重要了,不能在解释方面外包给一家公司。 如果你有技能,就没有借口 不能 去DIY。 如果您不具备这些技能,则需要多样化的意见、推理和评估组合。
(从重新发布 探索/ GNXP 经作者或代表的许可)
关注@razibkhan
我认为你很好地说明了你的观点,但请你详细说明那些没有技能的人如何获得“不同的意见、推论和评估组合”。 感谢您。