Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
兄弟姐妹

书签 全部切换变革理论添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

研究博客网站
:您将有30个新的突变使您与父母区分开。 但是,这个数字周围有摆动的空间,您可能有更多或更少的空间。 这个数字可能在兄弟姐妹之间有所不同,并解释了兄弟姐妹之间的差异。 此外,以前使用的突变率估计值可能高2倍。这可能会使许多人类和与人类相关的世系的“最后共同祖先”在时间上推迟2倍。

里面有一封新信 “自然遗传学 on 从头 人类的变异,导致媒体上的头条作者陷入了自然的疯狂之中,试图将结果“钩”到 X-战警 专营权。 我隐含地假设大多数人都知道他们都有特定且可识别的新遗传突变。 众所周知,与“突变体”相关的重要问题是它们具有明显的可识别表型,而不是它们具有我们看不见的细微遗传变异。 另一个隐含的方面是,表型是高潜在突变负荷的准确信号或表示。 换句话说,如果可以的话 看到 某人的性格很奇怪,想必他们的内在遗传学就很奇怪。 这就是模型的逻辑,这些模型假定突变负荷与 智能化 or 好物,并且这些自然地与人类审美偏好的进化论基础联系在一起(例如,性选择的“好基因”模型)。

人类家族内部和家族之间全基因组突变率的变化:

JBS Haldane于1947年提出,雄性种系可能比雌性种系更具诱变性。各种研究都支持Haldane在包括人在内的多种哺乳动物中提出了雄性种系中较高的平均突变率的主张……在此,据我们所知,这是首次从两个亲子后代三人组的完整基因组序列中对男性和女性种系突变率进行的直接比较分析。 通过广泛的验证,我们在两个三重后代中鉴定出49个和35个新生线突变(DNM),以及在体细胞或DNA衍生的细胞系中产生的1,586个非生殖系DNM。 最显着的是,在一个家庭中,我们观察到92%的DNM来自父系,而相反,在另一个家庭中,64%的DNM来自于母系。 这些观察结果表明,家庭内部和家庭之间的突变率差异很大。

从我的收集来看,有一个直接的原因说明为什么雄性种系(通过精子传递给雄性后代的遗传信息)更具诱变性: 精子终生产生,随着时间的流逝,复制错误逐渐蔓延。 这与雌性卵相反,雌性卵在出生时就存在完整的补体。 突变通过精子蔓延这一事实只是突变首先蔓延到种系的边界条件,即 DNA修复 过程。 在极少数情况下,这是件好事(因为突变实际上可能会增强适应性),而在很多情况下,这是不好的(因为突变会降低适应性),而且通常是中性的。 请记住,就功能和适应性而言,大量的突变没有任何作用。 请考虑以下事实:1个欧洲血统的人中有25个具有突变,如果该突变表现为纯合子基因型,则该突变可导致普通人群的囊性纤维化。 但是绝大多数的囊性纤维化突变都存在于杂合子中,并具有“掩盖”有害等位基因的常规功能基因。*而且,即使是纯合子形式,也有许多突变是沉默的(例如,如果存在在一个基地的变化 同义词位置).

如上所述,直到最近估计突变率只是一个推断问题。 在最宽广的画布上,人们简单地观察了两个长期分离的相关谱系之间的差异(例如,黑猩猩与人类),因此积累了许多差异突变,并分析了差异。 对于那些表现出表现出显性表达模式的疾病的个体来说,这可能是一个细粒度的推断,因此 从头 后代的突变可能会改变表型。 幸运的是,对于大多数人而言,这不是主要问题,而且突变在我们的大部分生命中仍然是隐秘的。 但是不再。 在不久的将来某个时刻,通过廉价的测序技术,我们大多数人将可以得到我们基因组的准确和精确的副本,并且我们将能够准确地看到我们有独特突变的地方,这些变异将我们与父母和兄弟姐妹区分开来。

在本文中,作者采用了两个“三重奏”,即亲子三胞胎,并以很高的准确性比较了它们在全基因组范围内的遗传变异模式。 当您寻找时,准确度显然很重要 从头 当碱基对数以十亿计时,突变将在数百个范围内计数。 将来,当我们拥有成千上万的基因组文件和无所不能的计算工具时,我怀疑会有各种各样的方法来确定您基因组区域的“典型性”,但是在本文中,作者自然而然地将父母与孩子进行了比较。 。 如果是突变 从头 从父母的遗传模式应该是可以理解的。 但是,测序技术并非十全十美,因此当您寻找测序技术时,误报的可能性将很高。 从头 “在干草堆中”发生突变(例如,可以将后代读取中的错误视为突变)。

所以他们从大约3,000名候选人开始 从头 比较三人组的基因组后,每个家庭三人组的突变(DNM),但由于它们过滤掉了假阳性,因此在实验上进一步缩小了范围。 您可以阅读补充资料中的血腥细节,但似乎他们将重点放在已确定的候选项上,以查看它们是否是:种系DNM,非种系DNM,从父母那里继承来的变体或假阳性。 因此,事实证明,最初的DNM中有一半是体细胞的,而大约1%是种系。 请记住,不同之处在于种系突变将被传给一个人的后代,而体细胞突变只会影响一个人一生的生理适应能力。 为了进化,种系突变更为重要,尽管随着年龄的增长,体细胞突变将变得非常重要。

在进行了繁重的方法学研究之后,结果本身很有趣,尽管泛化性有限,因为您仅关注两个三重奏。 在检查结果之前,这里有个图说明了研究设计:

据我所知,本文有两个主要发现:

1)三重奏中DNM的性别介导性质存在差异。 一对更接近预期。 雄性种系的贡献是绝大多数DNM的原因。

2)对人类突变率的更精确估计,这可能对进化系统发育学中使用的“分子钟”估计有影响。

以下是图中的发现,该结果显示了估计突变率附近的95%置信区间:

CEU是指常用于医学遗传学的白色犹他摩门教徒样品,而YRI是指来自尼日利亚人的约鲁巴语。 请记住,这只是两个家庭。 这严重限制了您可以汲取的见解的力量,但是您已经看到,尽管CEU三重奏显示了男性和女性对DNM贡献的预期不平衡,但YRI三重奏却没有。 但是,这三个三元组的确暗示了比以前的研究更低的突变率,而先前的研究从物种差异中推断出其价值。 这是与人类进化有关的部分: 人类与黑猩猩的差异被推回到7万年正如最近对化石发现的一些解释所暗示的那样。” 仅通过一项研究,我还不会花这笔钱,但我一直听说,这篇论文并不是在科学真空中得出的。 其他研究人员正在对突变率进行类似的重新校准,这可能会将时间推迟到许多不同的类人和人类血统(包括现代人类)的最后一个共同祖先。

将镜头移回当前,并具有更多的个人基因组相关性:

突变是随机过程,因此,预期个体内同期配子之间的突变数量会发生相当大的变化。 如果以泊松过程为模型,则95%置信区间的平均值为 每配子约有30个DNM(突变率约为1×10-8),范围从20到41,这是两倍。 截短选择可能会去除突变最多的配子,从而减少成功繁殖的配子之间的这种差异,但是,干细胞祖先或环境中任何其他异质性(例如,导致同时配子的细胞分裂数量的差异)将可能会增加配子间变异的数量。

使用从23andMe获得的小得多的标记集,我发现我的两个兄弟姐妹在分配全兄弟姐妹方面,在后裔身份方面相差近3个标准差。 在不久的将来,我们也许能够确定整个家庭中突变负载的实际实现程度,而不仅仅是理论上。 正如作者所指出的 其中很大一部分可能是父亲的年龄。 鲁珀特·默多克(Rupert Murdoch)的孩子比他的许多孙辈还年轻,因此那里有许多“自然实验”,因为雄性相距40年以上。

在社会层面上,我们也许能够根据父亲平均年龄的上升所估算的公共卫生成本来估算确切的成本。 就个人而言,我们也许还可以注意到高水平的DNM与感兴趣的特征(例如智力和美丽)之间家庭内部的相关性。 与更细粒度的祖先推断工具相比,我认为这将是炸药。 但这并不是好像我们以前不知道兄弟姐妹有所不同。

引文: Donald F Conrad,Jonathan EM Keebler,Mark A DePristo,Sarah J Lindsay,Yujun Zhang,Ferran Casals,Youssef Idaghdour,Chris L Hartl,Carlos Torroja,Kiran V Garimella,Martine Zilversmit,Reed Cartwright,Guy A Rouleau,Mark Daly,Eric斯通,马修·埃·赫勒斯和菲利普·阿瓦达拉(2011)。 人类家族内部和家族之间全基因组突变率的变化自然遗传学: 10.1038 / ng.862

*在随机交配种群中,比例由哈迪-温伯格平衡(Hardy-Weinberg Equilibrium,p)定义2 + 2pq + q2 = 1,因此q = 0.04,q2 = 0.0016和2pq = 0.0768。 CF的杂合子基因型超过纯合子50比1。

博客附录: 这封信的第一作者是唐·康拉德(Don Conrad),他是 基因组解压缩.

 

髓: 在这篇文章中,我研究了如何看待基因组数据可以确切地说明兄弟姐妹之间的真正相似程度,而不是仅仅假设它们的相似性约为50%。 我将兄弟姐妹之间的这种随机性与父母子女继承的确定性性质进行了对比。 此外,我详细介绍了100年前遗传学的理想备用概念如何通过我们现在对基因在物理上的组织和重组的认识而得到修改。 最后,我解释了这种澄清如何使我们有可能更精确地理解复杂特征的遗传性质,这些特征在家庭内部以及在整个人群中都有所不同。

人类是二倍体生物。 我们从每个父母那里继承了每个基因的两个副本(这里是男性的例外,他们只有一个从母亲那里继承的X染色体,而在从父亲那里继承的Y染色体上却缺少许多补偿性基因)。 我们自己的父母每个基因都有两个副本,一个副本是从每个父母那里继承而来的。 因此,一个人可以将两对祖父母的孙子建模为四个祖先祖父母的基因的镶嵌图。 但是,在任何给定的地点,祖父母与孙子女之间的关系都不是确定的。 相反,它是由概率定义的。 举一个具体的例子,考虑一个有四个祖父母的人,其中三个是中国人,其中一个是瑞典人。 想象一下,瑞典人蓝眼睛。 然后,可以在控制蓝与非蓝眼颜色差异的位点上合理假设,其中一个祖父母对“蓝眼”等位基因是纯合子,而其他祖父母对“棕眼”等位基因是纯合子。 给定的孙子携带“蓝眼”等位基因并成为杂合子的概率是多少? 每个人在给定的位置都有两个“插槽”。 我们知道,在这些狭缝中的一个上,个体仅具有棕色眼睛等位基因的可能性。 因此,它们的变异概率仅在另一个插槽上起作用,该插槽是从我们知道是杂合子的亲本遗传而来的。 那个父母反过来可能会给他们的后代贡献一个蓝眼等位基因,或一个棕色眼等位基因。 因此,任何给定的孙子都有50%的可能性是杂合子,而他们有50%的可能性是纯合子。

研究博客网站 上面一个地点的“玩具”示例旨在说明一个人在个体之间看到的变异部分是由于以下事实:我们不是祖先的“共混物”,而是各种重组的离散遗传元素的组合并世代相传。 然后,每个兄弟姐妹都可以被概念化为不同的“实验”或“试验”,它们的差异是由于它们是其祖先的遗传变异的独特和独特组合这一事实的结果。 那是最普遍的理论,没有直接提及遗传的最近生物物理细节。 作为形式模型的纯孟德尔抽象告诉我们,生殖事件是离散的采样过程。 但是我们生活在基因组时代,正如你在上面看到的 我们可以从经验的角度衡量当今兄弟姐妹之间遗传关系的变化。 正如我们所期望的那样 期望,则为0.50,但该期望值存在差异。 参照他们与您的遗传关系系数,您的所有兄弟姐妹都不可能“被创造平等”。


现在我们知道,人类基因组由大约3亿个A,G,C和T碱基对组成。在最古老的经典进化遗传模型中,可以将这些碱基对中的每一个独立地遗传。 换句话说,进化是独立概率的博弈。 但是这种理想化并不是具体的现实。 左侧是人类雄性核型的可视化图像,人类基因组(不包括mtDNA)表现为23个染色体对的集合。 由于上述约3亿个碱基对在这些染色体中具有物理位置,因此现实是某些碱基对是一起遗传的。 也就是说,由于它们的物理链接,它们的继承模式是关联的。 您看到的核仁明显是二倍体。 每个染色体分为两个对称的同源物,每个同源物均从每个亲本继承(除23个性染色体外)。 染色体数目也大致对应于大小的等级顺序。 为了让您感觉到差距,第1号染色体具有250,000,000个碱基和4,200个基因,而第22号染色体具有1,100个基因和50,000,000个碱基(Y染色体仅有450个基因,而X染色体上只有1,800个基因)。

在上面的玩具示例中,眼睛的颜色轨迹位于染色体上。 具体来说, 15号染色体。 每个人将从其父母那里继承15份副本。 但是,不能保证每个兄弟姐妹都会继承祖父母辈的同一个副本。 让我们对此进行示意性说明。 在下面,您会看到四种可能的组合,它们涉及一个人的父母从其父母那里继承的染色体。 因此,此处的“父”和“母”是父母代的参考,因此每个都有两个。 那些是从我斜体的父母母亲那里继承下来的。


祖父母合并的可能结果
母亲
父系 产妇
父亲 父系 父系 父系 父系 产妇
产妇 产妇 父系 产妇 产妇

结果如下:

左上角的细胞:祖父的染色体+祖父的染色体
右上角细胞:祖父的染色体+祖母的染色体
左下角细胞:祖母的染色体+祖父的染色体
右下角细胞:祖母的染色体+祖父的染色体

例如,如果在15号染色体上,两个兄弟姐妹的特征是左上角的细胞,那么我们可以说它们是100%的“血统相同”(IBD)。 这只是意味着他们的基因来自完全相同的祖先。 另一方面,如果一个兄弟姐妹的特征是左上角的单元格,另一个是右下角的单元格,那么它们将是0%IBD! 换句话说,在理论上,如果使用这种模型,同胞如果连续不断地从祖父母那里继承不同的同系物,那么常染色体上的同胞可能是0%IBD(这对23号染色体是不可能的。雄性必然从中继承相同的Y。他们的父亲,而两位女性 必须 与他们的父亲共享相同的X)。

如果您具有生物学背景,那么您就会知道这是错误的,因为这个故事还有更多内容。 重组 意味着事实上,您不会始终继承祖父母染色体的完整副本。 相反,在减数分裂过程中,一个人的染色体经常“混合并匹配”其链,从而形成新的镶嵌体。 因此,由于继承了两个减数分裂事件(配子形成期间导致一个人的父母,以及在父母配子形成过程中的另一次)。 如果您仍然感到困惑,则以下3分钟的指导视频可能会有所帮助。 旁白具有信息,因此,如果您听不懂,则蓝色=父系染色体片段,红色=母系染色体片段。 在视频播放的一半左右,尤其要注意重组。

http://www.youtube.com/watch?v=kVMb4Js99tA&feature=related

这个流程 由于在同一染色体区域上的物理连锁,与变异体遗传的条件依赖性相矛盾。 换句话说,尽管理论上仍然可行,但无需重组即可 非常 不同的,现实的重组打破了许多关联,并降低了实现的方差。 在上图中,就兄弟姐妹对的遗传距离而言,下界异常值大约介于半兄弟姐妹(0.25)和全兄弟姐妹(0.50)的相关系数与全兄弟姐妹的关联系数〜0.35左右之间(上限为0.65)。

任何给定的基因座,兄弟姐妹的IBD的方差为1/8。 由于期望值约为0.50,因此您可以推断出,在特定基因上,同胞兄弟姐妹之间存在很大偏差。 当您考虑到兄弟姐妹在单基因孟德尔性状上差异很大时,这是有道理的。 但是整个基因组呢? 因为现在您还有更多的“抽奖” “大数律” 倾向于减少方差。 右图显示了IBD按染色体的标准偏差。 请记住,期望值为〜0.50。 观察到较长的染色体具有较低的偏差。 这是由于整个基因组中重组速率的变化。 从抽象的孟德尔模型,到可以理解基因组各区域重组速率差异的观点,我们已经走了很长一段路。 IBD的总基因组标准偏差为0.036,这与预测〜0.04的较旧理论模型相近。 这意味着,如果您随机抽取两个全兄弟姐妹并比较总基因组IBD的程度,则最高可能性是它们与0.50相差0.036。 假设正态分布意味着70%的兄弟姐妹将落在0.536和0.464的相关系数区间内。 约有95%的下降将出现两个标准偏差0.428和572。约99.8%的下降将出现在三个标准偏差(39.2至61.8)之内。

我从中得出数字和统计数字的论文是 通过全兄弟姐妹之间的全基因组血统身份共享进行遗传假设的无假设估计。 引文以及后续论文都非常有趣。 它显示了现代基因组学是如何从字面上吞没整个经典定量遗传学的见解的。 自然是一者,抽象最终映射到具体事物上。 长期以来,我一直以为我应该回顾这篇论文及其见解,因为对兄弟姐妹的比较可能会成为理解许多性状遗传基础的未来途径。 但是我有一个更个人的理由来研究这个问题。

本周,我的许多家人“在线”使用了23andMe系统。 回顾:

RF =父亲
RM =母亲
RS1 =兄弟1(女)
RS2 =兄弟2(男性)

稍后将是另一位男性RS3。 但是他的数据还没有加载。

23andMe具有与疾病风险和血统信息相关的许多功能。 前者对我没有太大兴趣,因为我的家庭足够大,我对自己面临的风险有很好的认识。 23andMe告诉我,在我广泛的血统书中,常见各种疾病的风险更大。 它也告诉我,我患家族中未知疾病的风险更大。 而且,它告诉我,我在整个血统书中常见的疾病风险较小。 最后,它告诉我,我患谱系中不常见的疾病的风险较小。 您得到图片。 对于大多数人来说,这里没有太多的附加值。 我什至都没有触及过 “比值比(统计学用”.

关于祖先,我有 获得了一些价值。 我怀疑我在附近 队伍的尽头 在这方面,除非我认真对待 DYI 遗传学。 我参与了 哈拉帕祖先项目 与其说是我的家庭,不如说是更多地了解变异的区域性模式。

因此,我们处于下一个阶段: 看我自己家庭的模式。 您在上方看到的屏幕截图来自 “家庭继承”,并逐条显示RS2和RF染色体之间的IBD。 我的兄弟姐妹和我的父亲。 如您所见,它们在整个基因组中是“完全相同的”。 在每个基因中,父亲都会在常染色体上贡献一个拷贝。 这里没有差异。 总的2.86 GB值也是您所期望的,大约有3亿个碱基对,并且不包括X和Y以及“无呼叫”。 我可以告诉你,我和父亲表现出与哥哥一样的亲密关系。 相比之下,我姐姐分享了更多细分受众群。 那是因为她有我父亲的X染色体。 与我们母亲的关系也符合预期。 一旦您解释了第23号染色体上的性别差异,我们与父母都同样平等。

以下是家庭继承的屏幕截图,根据我们的基因组比较了三个兄弟姐妹。 请记住,一半相同(浅蓝色)的重量是完全相同(深蓝色)的一半。

[nggallery ID = 30]

这是顶线。 我共享的段的长度与RS1和RS2的一半相同,分别为2.26 GB和2.27 GB。 但是,虽然我的RS0.60完全相同,为1,但我的RS0.86完全相同,为2。 这是更加令人惊讶的部分:RS1和RS2的共同点比我对它们中的任何一个都少得多。 半相同为2.09 GB,完全相同为0.5。

但这还不是全部。 23andMe有一个 “相对发现者” 特征。 主要目的是找到您不认识的亲戚。 与我所听到的大多数其他人相比,到目前为止,我没有任何近亲。 可能数据库中的大多数孟加拉人来自我自己的直系亲属! (尽管有一些印度孟加拉人,但我在数据库中只发现了另一位孟加拉国人,以便与他们“共享”基因)。尽管可以将自己的家庭也包括进来。 您将获得两个不同的值,即DNA共享的百分比和共享段的数量。 前者基本上似乎是IBD的代理。 我有一个欧洲人血统的人,他们有许多“亲戚”,他们拥有0.1-1%的基因组。 一个要求联系的人确实是一个非常遥远的表亲(他的姓氏与祖父母的姓氏相同)。 无论如何,上面的矩阵显示了我一家人到目前为止的结果。 我的父母没有亲戚; 他们不共享任何片段或DNA IBD。 相反,我们与父母的IBD约为50%(请记住,父亲对儿子没有贡献X染色体)。 但是看看同级比较。 特别是,RS1和RS2仅共享其DNA的42%! 这与先前的结果一致。 我和RS1比预期的要近一点。 我和RS2有点不同。 有趣的是,虽然RS2和我共有49个网段,但RS1和RS2共有55个网段。 为什么会有差异? 大概RS1和RS2会加载较小染色体上的片段数。 在上面的图片中这似乎很清楚。

这在哪里离开我们? 我们凭直觉知道兄弟姐妹的性格各不相同且成簇。 这些数据和方法说明了在不久的将来父母将如何确定总基因组含量水平上哪些同胞聚在一起! 正如我之前说过的,RS2和我在身体上特别相似,远比我们两个人都更像RS1。 这可能与我们从基因组学上发现的东西有关吗? 我相信是这样。 物理外观由许多不同基因之间的许多不同变体控制,因此表型可能很好地反映了整个基因组的特征。 这可以推广到其他定量特征。

最后,这对我们对家庭遗传遗传的研究具有明显的含义。 古典遗传技术不得不 承担 兄弟姐妹之间的相关系数为0.50。 偏离这一预期将把误差引入到遗传力的估计中,并可能掩盖了对性状遗传结构的理解。 但是现在我们可以校正与0.50值的偏差,从而更好地了解诸如行为等复杂性状的遗传基础。

引文: P.,Visscher,Medland,S.,Ferreira,M.,Morley,K.,Zhu,G.,Cornes,B.,Montgomery,G。和Martin,N。(2006)。 通过全兄弟姐妹之间的全基因组血统鉴定通过遗传无继承性估算PLoS遗传学,2(3)DOI: 10.1371 / journal.pgen.0020041

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”