一份新的论文 “自然遗传学, 大中东遗传变异的特征,可增强疾病基因的发现,既有趣又重要。 但是,就像关于安达曼岛民基因组的论文一样 它开始于对基于模型的聚类的幼稚和误导性利用,以构筑以后的结果。 这是主要的冒犯部分:
在NWA,AP和PP子区域中发现的混合最少的样品, 这表明这些地区的人口是从建国人口中衍生出来的,但有证据表明GME特有成分存在区域间差异,这表明发生了局部混合(图1b),并可能支持历史事件。 NWA成分存在于北非从西到东的地区,可能代表了柏柏尔的遗传背景……AP成分很可能代表了祖先的阿拉伯人口,几乎在所有地区都可以观察到, 可能是第七世纪阿拉伯人征服的结果 现在,在GME的大部分地区都使用阿拉伯语进行扩展。 相似地, 在第五世纪,波斯向TP和SD地区以及NEA的部分地区扩展是PP信号最有可能的贡献者。
...
在1000个基因组计划控制种群的基础上,使用TreeMix为GME子区域概括了人类迁徙和漂移的模式…推断出的没有迁徙的树显示出欧洲和亚洲人口的紧密簇,但是来自GME区域的受试者之间的表观差异更大。 Ť 他从根源上对GME次区域人口的排序证实了随后的创始人人口的许多“非洲以外”的排序……对于GME种群,其与根的距离模拟了GME样本的从西向东的组织,其中PP种群显示出最大的推断漂移参数,支持了人类迁移的由西向东的轨迹。
您不能假设某个簇K几乎是固定的,实际上没有混合。 如果您的数据集没有足够的变异,那么即使混合了“最小混合”总体,也会像参考文献一样出现。
第二,我很同意7世纪阿拉伯人的征服在人口统计学上具有重大意义,但这些结果并未表明这一点。 由于阿拉伯人的征服,托斯卡纳的人口不是阿拉伯人的25%。 此外,阿拉伯人并没有永久改变安纳托利亚的内部。 他们的突袭走到了相当远的西部,例如 mor,但是阿拉伯统治相对于拜占庭人的高水准,可以说是在公元800年左右的几十年间,只是在边界沿线造成了“无人之地”(尽管一些闪米特人,其中一些是阿拉伯人,是基督教徒)背景确实迁移到了拜占庭)。 同样,波斯-巴基斯坦模态集群与波斯帝国也没有任何关系。
这没什么大不了的,但是, 这些段落真傻。 从表面上看,他们是错误的。 但是“同行评审”认为 “自然遗传学 分配给本文的作者可能不熟悉人类历史系统发育组学。 他们可能认为这些方法在最广泛的意义上是合理的(例如,Admixture,Treemix,PCA等都是很好的方法),并且没有意识到所做的推论是完全错误的。 读过拉扎里迪斯(Lazaridis)等人的人 世界首批农民的遗传结构 将会看到如何修改和更改这些段落。 上面混合在一起的集群在很大程度上是伪像(对于GWAS有用,但仍然是伪像)。 作出的历史推断在现实中没有什么依据。
其次, 上述变异的遗传模式与“非洲外”迁徙无关。 相反,这与以下事实有关:即使在某些地区的“纯”样本中,也存在着隐秘的撒哈拉以南非洲混合物,因为在某些群体中(例如在西北非洲),撒哈拉以南混合物非常混合。 这种血统不是关于“非洲以外”,而是关于非洲血统。 对于“非洲以外”的迁移,这些变化模式几乎没有什么可说的。 整个段落都应该被切除。
可惜的是,这一切 错 在纸上的东西。 我是的忠实粉丝 让·洛朗·卡萨诺娃 因为他的医学遗传学将改变生活,他的发型也很棒。 安迪·克拉克(Andy Clark)在纸上,他是我的 圣杰罗姆 共同创作 人口遗传学原理。 我提出这些批评有点荒谬,但我认为我是对的,可惜作者没有任何人知道足够的人类基因组学来修正本文的这一部分,这真是可耻的。 “自然遗传学 找不到同行评审来指导他们正确的方向。
除了随机的错误历史推论外,本文还是很重要的(我认为 “自然遗传学 值得,但我对出版物一无所知)。 它在最广泛的轮廓中确认了我们所知道的许多内容。 您从非洲走得越远,就多态性多样性而言,遗传多样性就越少。 例如,美洲印第安人的分离多态性比欧亚人口少。 对此建模的一种方法是解决非洲的一系列瓶颈问题。 我认为这太简单了,因为在过去的10,000年来,有大量的基因流动和混合,但是在 最粗略的比例并不是完全误导。
但是,这些动态的一个特殊方面是,当您查看基因组中的纯合序列时,通常测量最近的近交,中东和南亚的遗传多样性往往较低。 要了解南亚人口,您可以阅读 南亚疾病基因发现的希望。 由于种姓/杂种异族配偶,许多南亚群体的遗传多样性比您预期的要少。 这具有疾病的含义。
中东,北非和巴基斯坦的人口更加极端。 您可以在上图中看到它。 在短期的同质性研究中,结果大致收敛于您的期望。 但是从长期来看,中东人口是一个巨大的反常现象。 这是因为:
在GME中,所有婚姻中有20%至50%是近亲的(而在美洲和西欧,这一比例不到0.2%)1、2、3,其中大多数是表亲。 血缘关系高出约100倍,与隐性孟德尔疾病的发生率约翻了一番[19]。20,欧洲,非洲和东亚1000个基因组计划的人口估计近交系数(F)的中位数约为〜0.005 ,而GME F值的范围从0.059到0.098,每个人群中的差异很大(图2c)。 因此,在GME群体中测得的F值大约高10至20倍,反映了所有人类共有的共享基因组区块。 F值由直系亲属的结构决定,而不是历史或人口范围内的数据趋势(补充图8)。 对包括许多亲子三重奏在内的更大的1,794个外显子组的检查也显示了直系亲属结构的压倒性影响,与表亲结婚的后代比非近亲结婚的后代具有更高的F值(图2d)。 。
作者掩盖了等位基因,这是首先将个人包括在数据集中的一部分原因(以防止确定偏差)。 相反,他们专注于功能丧失和衍生等位基因的全基因组模式。 因为他们很自然地看着许多低频变异,所以他们发现了许多新变异,而在欧洲占主导地位的遗传数据集中却是完全没有观察到的。 这就是为什么将基因组学带入世界如此重要的原因。
对我来说,这是最有趣,最可悲的结果:
尽管在GME中近千年来血友病发生率升高,但我们仍未发现清除隐性等位基因的证据。 取而代之的是,我们检测到了大的,罕见的纯合子区块,与其他人群中发现的小纯合子区块不同,这支持了最近的近亲交配的发生,并允许在该人群中的健康人类中鉴定出具有推定的高影响纯合子变异体的基因。 将GME Variome应用于未来针对来自GME的受试者的测序项目,可以帮助鉴定所有疾病类别中具有隐性变异的致病基因。 GME Variome是可公开访问的资源,将促进GME和全球范围内的广泛基因组研究。
理论很简单。 如果有近亲繁殖,则将有害的隐性等位基因汇集在一起,这样它们就容易受到选择的影响。 这样,您可以清除分离的遗传负载。 它适用于植物。 但是人类和一般的复杂动物不是植物。 更准确地说,作者“比较了GME和1000个基因组计划人群中的衍生等位基因频率(DAF)的分布。” 如果清除负荷,则近亲种群中有害等位基因的频率应更低。 不是。
中东人应停止与表兄弟结婚,以减轻疾病负担。 但这只是一个建议。 其中一些国家,例如卡塔尔,有很多钱可以投掷孟德尔疾病。 也许他们会使用植入前基因诊断? 我不知道。