有一些媒体“解释者”谈到遗传学如何无法与伊丽莎白·沃伦(Elizabeth Warren)的美国原住民遗产对话。 这是一个复杂的问题,并不是我见过的所有媒体断言都是错误的,但是许多细节却非常混乱或错误。 总共, 对于那些不知道从哪里开始,也不知道他们在传达混乱或虚假信息的人来说,这是非常糟糕的新闻。 (我在这里很慷慨,以为他们不知道自己在重复虚假事实)
这篇文章的重点并不是要太过政治化。 甚至争辩说伊丽莎白·沃伦(Elizabeth Warren)应该接受基因测试(我不认为她应该这样做,除非她出于政治杂耍之外的其他原因想要这样做,但这是我个人的看法)。 相反,我认为遗传学是出于政治观点和缺点而被扭曲。 那不是最佳的。 通常,我不会做太多“贴脸”式的帖子,但这是必要的。
我们先从 “华盛顿邮报”, 抱歉,斯科特·布朗(Scott Brown):DNA测试无法告诉我们伊丽莎白·沃伦(Elizabeth Warren)是否有美国原住民血统.
首先,标题是错误的。 如果伊丽莎白·沃伦(Elizabeth Warren)的血统中有百分之几来自于其祖先在1492年之前生活在“新语”中的人,那么在 PCA 与欧洲人和美洲原住民。 她会被转移到美洲印第安人身上。
其次,记者在 “华盛顿邮报” 采访具有认真资历的人作为主要来源:
Nanibaa'Garrison是西雅图儿童医院的生物伦理学家和儿科助理教授。 她是美国原住民,在斯坦福大学遗传学系获得博士学位,研究方向是祖先。
她 当然已经做过基因研究,但我不确定她会不会跟她说话 现代 基因组 推理,在过去十年中取得了很大进步。
下一篇:
那是因为血统的确定是基于 “祖先信息标记” —提供某些祖先可能性的遗传标记。 她说,这些标记中的大多数,即AIM,“基于美国以外的全球人口,主要是欧洲血统的人,亚洲血统的人和非洲血统的人。
这三个人口不足以确定一个人拥有多少美洲原住民血统。
AIM在2000年代很流行。 基本上,它们通常少于100个标记,并且您感兴趣的人群之间的频率差异非常大。 但是今天,除非成本成为主要问题,否则大多数人不会使用AIM (例如,我已经看到AIM有时仍在发展中国家的工作中使用,因为它们负担不起SNP芯片)。 因此,所有有关AIM的讨论都与眼前的问题完全无关。
今天,您可以下载包含数十万个数据集的数据,对于1000个基因组数据,则可以下载数百万个标记。 这些仍被确定为多态性。 变体。 但实际上,它们并不是传统意义上的AIM,因为它们并非针对少数人群,而是寻找大多数人类群体之间的差异。
也, 小组不限于三个人口。 您可以从各种公共面板上获得大量的美国原住民样本,也可以在1000个基因组秘鲁数据集中查看。 对三个人群的关注再次是2005年的产物,这可能是由于HapMap时代(CEU,YRI,CHB + JPT,如果您知道我的意思)的缘故。
然后:
沃伦(Warren)对自己的传承的理解是她是切诺基的一部分,基于外部侦查,她可能只有1/32。 (加里森说,识别特定部落身份的几率本质上为零,加里森说,(布朗驳回了这一要求。)但是,即使存在必要的AIM,这么少的美洲原住民血统也将使识别更加困难。 。
同样,AIM是无关紧要的。 这就像在说明Netflix由于56K调制解调器下载速度而无法正常工作一样。 大多数人不再使用56K调制解调器。 1/32分数可能是个问题,但不是因为无法检测到〜3%。 这是。 几年前我 偶然发现了一个事实 遗传学家丹·麦克阿瑟(Dan MacArthur)是约2%的南亚人。 他检查了一下,他的兄弟在同一范围内,而他的父亲大约是他的两倍。 原来,他有一个祖先,曾在印度的英国军队中担任军官……。
这里更大的问题是 当您前进后代 您越来越少拥有任何给定祖先的基因片段。 因此,如果您有一个200年前的祖先是美国原住民,即使他们是100%的美国原住民,您也可能没有该个体的任何基因片段。
因此,文章说:
即使是经过微调以挑选出美国原住民身份的测试也可能无法在沃伦的基因上找到任何东西,因为必要的标记可能根本没有跨越多代人。
这是对的。 但, 您可能确实有来自五代人的细分市场。 五代人不会继承的可能性约为5-10% 任何 那个祖先的细分。 专家咨询 “华盛顿邮报” 陈述:
“不可能回到那么远,” 驻军说。 “三分之一很低,即使她确实有美国原住民血统,即使偶然地出现在这些AIM面板上的基因也不一定会被遗传掉,即使她可能有其他高度流行的遗传变异。美洲土著。 这都是偶然的,是你从父母那里继承下来的。”
如我所说,AIM是无关紧要的。 今天,您将使用密集的SNP芯片面板,甚至进行全基因组测序。 但是,即使使用AIM,如果您在整个基因组中分布100个井,也很有可能检测到其余基因组的祖先。 正如所主张的那样,这不是“不可能”的。 来源不正确。
下一篇:
“有一个置信区间与(结果)有关,”加里森说。 “该置信区间可能非常宽,特别是在您谈论祖先贡献如此低的时候。” 因此,沃伦(Warren)也许会把结果取回来,并说她是美国原住民-但只能以20%的置信度来确定。 斯科特·布朗可能不会被说服。
这只是AIM的问题。 您可以非常强劲地获得3%的结果。 它也将出现在PCA上。
然后是一些奇怪的切线,我认为这些切线的存在是为了使作者看起来像他们“完成了研究”,并向普通观众放心:
例如,亨廷顿病可以在DNA中发现-但测试不能告诉您该病何时发展,如果您担心四年的病期,这对您没有多大好处。 加里森说:“有太多不同的环境因素,饮食因素和其他健康行为,会影响疾病是否会发展以及在生命中会发展到什么时间,”这种预测是不可能的。 (至少现在)。
我不是医学遗传学家,但我认为将亨廷顿病的例子放在这里有点奇怪(也许是因为人们知道吗?)。 它确实具有良好的遗传特征。 从文章中提供的链接:
随着改变的HTT基因从一代传给下一代,CAG三核苷酸重复序列的大小通常会增加。 大量重复通常与较早出现的体征和症状有关。 这种现象称为预期。 患有成人型亨廷顿病的人通常在HTT基因中有40至50个CAG重复,而患有该病的青少年型的人往往具有60个以上的CAG重复。
在HTT基因中具有27至35个CAG重复的个体不会发展为亨廷顿舞蹈病,但他们有生下会患该疾病的孩子的风险。 随着基因从父母传给孩子,CAG三核苷酸重复序列的大小可能会延伸到与亨廷顿病相关的范围内(36个重复序列或更多)。
沃伦(Warren)年纪已大,以至于她不太可能重复60次以上。 但是亨廷顿氏病是一种我们对发病年龄有良好意识的疾病之一,因为它的三联体重复长度与发病年龄成正比.
接下来我们有一篇文章 石板, DNA测试无法解释伊丽莎白·沃伦(Elizabeth Warren)的祖先。 第一的:
但这就是问题:DNA测试无法确切证明一个人是否是切诺基。 或任何社区的成员,至少不是很可靠。 可以假设的是,假设部落成员的遗传构成存在本质上不同的东西,并且该东西在该社区中是普遍存在的。 这不是真的。
稻草人。 我们一直在谈论概率。 然后:
问题在于DNA片段或标记不一致。 有时它们会被传递,有时它们不会被传递,它们是否存在是随机的。 当然,很大比例的美洲原住民可能共享某些遗传标记。 但是,许多美国原住民可能缺乏相同的标记,许多非美国原住民可能是巧合。
尽管我认为所有这些说法都有一定的底蕴,但我对作者试图达到的目标并不了解。 众所周知,等位基因频率在人群中通常不相交。 这就是为什么现代SNP芯片面板使用成千上万个标记的原因。 大部分的 石板 这篇文章在涉及遗传学时吸引了一个稻草人,因为它的作用就好像我们实际上要依靠一些标记一样,尽管也许不是公众对这些东西如何起作用的看法。 在后一种情况下,作者可以简单地写上这样一句话:“用于检测祖先的遗传检测通常今天依赖成千上万个标记,而不仅仅是几个……”。
这种缺乏具体细节的现象一遍又一遍:
因此,当DNA测试回来时,您占芬兰的28%时,实际上是在说所分析的DNA(大多数公司未分析您的所有DNA),其中28%与完全芬兰人的最相似。人。 最后,这些比较很有趣,但最终 靠不住 思考祖先可能是谁的可能性的方法,而不是 您种族背景的确凿证据.
作品中有一个链接,可带您进入 2007件 关于DTC测试的方式并不是全部被破解。 2007年是基因组学的时代。 因此,请忽略它。 其次,芬兰人的选择对作者来说是不幸的, 因为芬兰人实际上是欧洲人中遗传性更强的人之一,因为有效人口规模很小。 例如,我的一个朋友有一个祖父,祖父母来自芬兰。 23andMe说她是19%的芬兰人。 这是“不可靠的”,这是完全错误的。 通过分段匹配,假设您将遗传距离阈值设置得足够高,如果您获得了正面的肯定,那将是非常可靠的。 另外,根据您如何界定“种族背景”,它可能是确定的。 北欧的样品从未显示出非洲血统的大量证据。 少数美国人这样做。 这不是巧合。
如在 “华盛顿邮报” 作者 石板 作品拥有权威,可以放下他们所看到的真相:
艾伯塔大学土著研究教授金·塔尔伯(Kim TallBear)在47篇推文中对布朗(Brown)关于沃伦的评论。 “ [遗传学家]认为,有了更多的标记,以及更高的历史遗传分辨率,他们将能够查明部落特有的标记。” 但是,这并不说明人们与其他不同的人不断移动和繁殖的事实。 他们将自己的遗传密码与其他社区混合在一起(就像往常一样,可以追溯到我们物种的曙光)。 如果有什么话,我们的DNA变得更加混乱,那就不是更清楚了。
你能读像这样的论文吗 世界首批农民的遗传结构,相信这个吗? 从事历史种群基因组学研究的遗传学家对迁移和基因流动的观念非常熟悉。 正像科学一样,更多的数据正在澄清。
引用的第一权威 “华盛顿邮报” 在某个时候做过一些合法的科学,尽管有点超出了她所咨询的专业知识的核心领域,而且她的知识肯定过时了(关于AIM的不断讨论可以很好地说明这一点)。 金·塔尔·贝尔(Kim TallBear) 出版物 完全不同...。
该作者 石板 片尾:
另一个问题是数据有限且不一致。 例如,Ancestry.com将世界划分为26个遗传区域,仅使用 115样本 创建每个区域的代表-很小的样本量。 并且不同的公司对这些样本施加不同的权重,这些样本来自墓地,现代孤立的社区以及学术出版的数据,例如人类基因组多样性计划。 对于消费者而言,这意味着如果您不喜欢自己的遗产结果,请尝试其他公司。 您将获得完全不同的细分。
目前尚不清楚以错误的推理为基础的身份是否会对人们造成伤害,但是这些商业努力的成功证明,至少,消费者发现这种乐趣。 基因检测基本上只是一种低成本方法,它可以使您的祖先与之相关的照片变得模糊。
首先, 作者需要发布更正。 我立刻知道Ancestry.com并没有使用115个样本。 太低了。 十五秒的Google告诉我 他们的样本量为3,000。 不知道115个样本来自何处,我不在乎。 他错了 石板 应该纠正这一点。 [见附录; 我可能在这里误解了或太苛刻了,但他们却出现了另一点……。]
其次,说图片是“模糊的”是一种误导。 不,可以说它过于精确,并且会误导人们。 这些祖先推论中的许多推论都非常精确和可靠。 即使它们具有随机参数,它们在复制之间的差异也不大。 但, 基于模型的聚类给出结果 空调 在模型上。 结果本身使它们对您要输入模型的参数敏感。 来自不同DTC公司和样本集的不同区域是这些不同的条件。
这并不神秘也不难理解。 如果要将个人分为非洲人和非非洲人,则所有非非洲人都将归为一类。 这是鲁棒,精确和高度可重复的。 实际上,非非洲人会 决不要 与具有正常SNP芯片密度的非洲人聚集在一起。 至少不是在我亲自运行和检查的数千次迭代中。 同样,当您进一步分离总体时,您会看到合理且可理解的划分。
当您开始将非常紧密的遗传群体切成薄片并切成小块时,这些问题就会浮出水面,而这些种群之间的差异并不大。 这就是在北欧发生的事情,这也是大多数DTC公司客户群的来源。 因此,这会引起问题,并且通常难以解释结果。 适度的参数更改可能会产生不同的结果,因为我们要解决的问题实际上很难通过现有数据(少于XNUMX万个SNP)来解决。
有解决此问题的方法。 这与更多数据有关。 特别是,高覆盖率的全基因组测序可以选择非常稀有的等位基因,这些等位基因可以为最近的族谱史提供大量信息,因此,即使是北欧人,也可以以一种更易于理解和更准确的方式对其进行划分。
但实际上问题不在于数据。 我们现在有非常密集的SNP芯片标记。 问题不在于方法。 我们有基于基因型和单倍型的方法,可以做出非常有力的推论,尤其是在洲际水平上(例如,从遗传学角度来看,有1/4日本血统的朋友占24%日本血统;其余是欧洲血统)。 问题是公众, 包括记者,并不总是清楚结果说明了什么。 有时,DTC公司本身可能由于沟通不清而有过错。 坦率地说,小亨利·路易斯·盖茨(Henry Louis Gates Jr.)在他的电视节目中常常引起很多混乱,尽管可能提供很多信息。
回到伊丽莎白·沃伦(Elizabeth Warren), 她可能没有任何土著血统与五代切诺基族的祖先相结合,最大的问题是19世纪的切诺基族已经在基因上混合了。 伟大的首领约翰·罗斯(John Ross)按血量计是切诺基的1/8。 也就是说,他的祖先的1/8存在于1492年的新世界中。伊丽莎白·沃伦之所以成为切诺基人但没有土著血统的简单原因是,她的切诺基祖先可能没有多少土著血统。 这不是因为遗传学无法吸收土著血统, 遗传学可以。 社会和文化的历史和定义很重要,只是这种情况。
老实说,这篇文章有点琐碎。 但是很多人读 “华盛顿邮报” 和 石板。 正如我上面所解释的 伊丽莎白·沃伦(Elizabeth Warren)在其祖先可以100%成为欧洲人并且是切诺基血统的原因很简单。 媒体决定不去解释这一点,而是去寻找那些声称遗传学不能回答这个问题的人。 在此过程中,他们乱码,误导和重复虚假(对熟悉该领域的人来说,Ancestry.com的样本量显然是错误的,但新闻工作者并不熟悉,因此通过了他们的气味测试,因为他们没有理由辨别力)。
该帖子的存在仅是为了至少有一个人在纠正记录。
请注意: 我是一名顾问 逐个基因 并且是他们的开发者 我的起源 工具。 这是我对DTC基因公司了解很多的原因之一。 但这也意味着我有利益冲突,因为我认为DTC基因组学对适当的警告很有用。
附录: 一位读者:
嗯,这真是让人费解。 每个区域115个样本乘以26个区域的总样本大小为2990,这似乎合理地接近3000。反之,3000/26是115.4,因此这就是“每个区域115”的主张的来源。 没有要求“共计115项”; 该作品说,每个区域的代表都是由115个样本构成的。
的确,115是一个平均值,但文章中并没有明确说明,但是我不确定,“波利尼西亚”的代表实际上是由18个样本而非115个样本构成的,这让我感到非常安慰。
一个公平的,但无意间无知的观点。 实际上,〜20的样本量足以生成参考种群。 这部分取决于您尝试使用哪些人口作为参考。