Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
阿姆哈拉

书签 全部切换总目录添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

昨天发帖 我报告了关于非洲之角的普遍已知信息,即其人口在基因上似乎介于撒哈拉以南非洲和欧亚大陆之间。 从地理角度来看,这是完全合理的,但也有人建议这不仅仅是地理因素的影响。 距离隔离 (即,由于基因流动,在0.5到0.0区间上位于1.0位置的种群可能在两个方向上都表现出相同的亲和力)。 例如,您观察到对非洲之角的闪族和库克族人口几乎完全没有“班图”遗传影响,而在欧恩角以南和西部的群体中也缺乏欧亚的影响 在某种程度上,马赛人。

在纪律方面进行横向调整,在过去的几代人中,有一个名副其实的家庭手工业,这为许多人的近代起源提供了理由。 民族语言学 人口通过文化自我创造的过程。 显然,有很多这样的例子,其中有一些是人类学家深入研究的(例如,从丁卡人身份向努尔身份的转变)。 但是,不幸的是,有朝着这个方向过度概括的趋势。 在某些方面,这是特殊的,因为这些模型以文化的可塑性为前提,而没有遵守那些完全相同的现象可以执行的尖锐而强大的规范。 这 非穆斯林的遗传分离 伊斯兰教崛起后在中东地区的研究似乎已经得到了基因组学证据的充分验证。 穆斯林和非穆斯林的规范都使他们偏向内婚,而伊斯兰霸权和统治的性质使得穆斯林很可能与“伊斯兰国际”有世界性的联系。 相反,非穆斯林少数民族在伊斯兰阿拉伯征服之后开始了漫长的内卷进程,直到上个世纪才因移民和较小程度的解放而受到破坏。

回到非洲之角。 非洲之角的绝大多数人民说一种亚非语言。 阿拉伯语和希伯来语是该类别中最著名的成员,但是分类非常广泛,从马格里布的柏柏尔人的方言一直到古代的阿卡德语。 这里有两个特别值得注意的大亚科: 闪族和库奇族。 上面的地图显示了非洲之角内的分布。 可以观察到埃塞俄比亚的闪族人语言倾向于集中在基督教中北部地区,而库什蒂人则在其他地方都可以看到,因此可以“迅速而肮脏”地总结出这里的模式。 此外,宗教和种族之间也存在交汇处,例如库什基派的穆斯林(索马里,阿法尔等)和库什基派的基督徒(许多奥罗莫等)。 据我所知,许多库奇族的社会和政治精英都倾向于融入阿姆哈拉犹太教徒的身份(海勒·塞拉西的母亲是 穆斯林奥罗莫)。 因此,我们可以生成一个可能的模型,其中闪族语种到达埃塞俄比亚的时间较晚,并通过精英模拟传播,因此闪族语族和库奇族人之间的差异在基因组维度上应该是很小的(例如尼日利亚的豪萨人和约鲁巴人之间的边际差异)。 或者,我们可以假定闪米特元素与先前存在的Cushitic底层是有区别的。

长话短说,我发现以非洲之角为中心的数据集运行了更多的ADMIXTURE, 能够 实际区分角中的库奇族和闪族族元素,并尝试将它们识别为具有不同的祖先成分。 首先,技术细节...。


我从运行中开始的数据集开始 发布 昨天。 马赛人的异常离群值已被删除。 这些是少数“固定”少数族裔祖先组成部分的个体。 这说明马赛人内部存在某种结构,但更像是远缘亲戚,而不是种族差异。 运行此程序后,我注意到在非犹太人也门和沙特阿拉伯的样本中会弹出很多类似的内容。 在某种程度上,这就像“打w鼠”。 如果您消除了一个问题,其他问题只需从木制品中弹出即可。 因此,我删除了所有非犹太也门人和沙特人。 标记数目保持不变,为210,000个SNP。

离群值仍然存在一些问题,特别是肯尼亚的班图人,以及较小程度的黎凡特样本。 但是在这一点上,我决定继续使用它,因为无论如何,这对于非洲之角的故事来说是微不足道的。 昨天我说过,总体上非洲之角的人口并没有自己的集群,而是其他大多数(东非和阿拉伯)的混合体。 在我删除了一些伪造的Masai组件并运行ADMIXTURE直到K = 10时,我终于得到了非洲之角群集“ HoAc”。 此外,我还发现您可以看到Cushitic Oromo和Somalis,闪族Ahmara,埃塞俄比亚犹太人和Tigray之间的系统差异。

下面是K = 7和K = 9的条形图。较低的K与我昨天发布的内容没有太大不同,而K = 8和K = 10的次要成分太多。 我只发布了细粒度和非洲之角聚焦的图,而不是显示平均祖先量子量的更一般的摘要图。 此外,在这些下方,我发布了K = 7和K = 9的祖先推断群体之间遗传距离的二维表示。尽管如此,我还是删除了几个组件,因为一个组件显然是虚假的“扩展家庭”聚类,并在某些情况下更好地可视化关系。

顺带一提,似乎非洲之角所有人口都有一个HoAc基地,有人可能会称其为“ Cushitic”,尽管这并不完全准确。 在此基础之上,您会看到基于语言族的差异。 闪族人的祖先成分与也门犹太人中确定的祖先成分相同,而库奇族人则缺乏这一祖先成分。 但是,请注意,闪族人通常在库希特语族群中具有组成部分,尤其是经常固定在其中的索马里人。 这就是为什么我将语言人口扩展的顺序放在上面的原因,从而使Semitic被覆盖在Cushitic的基础上。 此外,似乎有从尼罗河族到埃塞俄比亚人的混合体,但没有索马里人的混合体。 这在奥罗莫语中最为一致和明显,在通过距离模型进行隔离看来似乎是合理的,因为奥罗莫语在地理上最有可能与Nilo-Saharan人口互动,而与索马里语的互动最少。

最后,请记住,如果索马里人是100%的聚类X,这并不意味着索马里人是从某个真实的均质祖先聚类X派生而来的。但是我们应该谨慎,因为他们会随着时间的流逝而在垂直方向上告诉我们有关关系的信息。 如果完全混合在一起的群体表现出一定程度的内部同质性,并且祖先的“参考”种群本身不再存在,则可以分成自己独特的群体。 这似乎是在南亚发生的情况,某些群体摇摇欲坠地称为“ 100%的南亚人”,但他们在更深的基因组水平上似乎是两个祖先群体之间古老融合的稳定混合物,两者之间存在很大分歧。 与非洲之角的南亚比喻可能使我们推断,索马里人与这些人口同等。在“东非祖先”(AEA)阿拉伯人之间最初发生混合事件之后,索马里人与最近到来的该地区缺乏混合过去。 这可能只是地理和历史偶然性的函数,因为索马里人的位置由于其霍恩地区的准半岛性质而更加“受到庇护”。 此外,索马里相对干旱,不适合农业生产,因此它的生态友好程度可能不如埃塞俄比亚的高地,闪族人因此带来了新的农业工具包。

您还可以说更多话,但我会暂缓,并提请注意: 我很可能正在寻找这些特定的集群,并通过确认偏差得出它们。 如前所述,如果以适当的方式调整ADMIXTURE的参数,则可以“到达”所需的答案。 如何防止这种情况发生? 如果我继续进行临时运行并凭直觉进行,那么很多重复通常会有所帮助。 您自然会了解潜在的潜在分布,可以防止锚定离群值,因为您知道它是非典型的(这是出于开创性的结果被忽略的原因,因为它们不适合范式,因此这种偏向存在另一面)。 我也跑 交叉验证 时不时地找到K的最佳数量,但是 放慢程序的速度,所以这对我来说是个权衡的问题。 我相当确定埃塞俄比亚人和索马里人之间的区别是有力的,因为相同的关系模式(例如,阿姆哈拉人比提格里人更喜欢提格里的倾向)会反复出现。 但是我对在这里得出的关于亚非语言族群以及库什蒂克族和闪米特族群体划分的推论并不那么自信。

您可以找到更多文件 点击此处.

图片来源: 维基百科上的数据

 


伊曼,索马里人的典范

自从我开始 非洲祖先计划 感兴趣的主要来源之一是家庭因东北非洲而欢呼的个人。 更具体地说,是非洲之角,埃塞俄比亚,厄立特里亚和索马里。 问题似乎在于23andMe的“祖先绘画”算法使用西非约鲁巴族作为参考人群,而东非人通常没有被很好地建模为西非人的派生类。 因此,举例来说,据我分析,努比亚人在祖先绘画中占“欧洲人”的比例超过50%。 再说一次,按照这种方法,我也是55-60%的“欧洲人”! 因此,我们不应过多地考虑这些判断。 显然有什么问题了,感谢Genome Bloggers 迪内克斯·庞蒂科斯(Dienekes Pontikos) 我们知道问题出在哪里: 非洲之角的人口几乎没有与“约鲁巴河”等西非人有联系的独特“班图”元素。 此外,更仔细的检查表明,这些人群中存在的“欧亚”成分也非常特殊,几乎完全来源于类似阿拉伯的来源。 当将西欧亚人分开时,北欧人和阿拉伯人是最遥远的对,甚至不包括最近的撒哈拉以南非洲混合人群,也就不足为奇了。 对于具有东部非洲背景的人来说,HapMap犹他州的欧洲裔美国人样本和尼日利亚的约鲁巴人不是最理想的选择。 相比之下,非裔美国人是西非人和北欧人的混合体,因此祖先绘画算法对其具有几乎完美的参考人群。 非裔美国人的结果可能不是很详尽和丰富,但是他们提供结果的谷物水平可能相当准确。

尽管我很乐意为东北非洲裔人们提供比23andMe更详细的结果,但这是我从事该活动的动机之一 非洲祖先计划 是为了获得一个数据集,这将使我自己能够探索非洲东部的基因组变异。 在过去的100,000年中,该地区是非非洲“源”人群的有力候选者,并且在过去2,000至3,000年中,该地区的人口周转速度很快。 我的数据集还不足以实现我的雄心壮志。 但是我现在有5个无关的索马里人。 据我所知,对使用厚标记SNP芯片的索马里基因组没有太多探索,为什么不呢? 在极端欠采样的情况下,N = 5优于N = 0。

在继续介绍方法和结果之前,我想指出一下,我存放了大部分文件 点击此处。 这是一个约25 MB的压缩文件夹,其中包含图像,扩展名以及ADMIXTURE和EIGENSOFT的原始输出。 我希望读者以此为邀请,在自己周围开玩笑。


由于我的工作重点是非洲之角,所以与我平时的工作相比,人口覆盖范围相对有限。 从HapMap中,我选择了约鲁巴岛,马塞族和卢希亚。 我将Masai重命名为“ Nilotic Kenya”,将Luhya重命名为“ Bantu Kenya”。 这 Behar等。 数据集具有相当数量的埃塞俄比亚人,外邦人和犹太人。 读者通过ID有用地标记了各个种族。 我本来要这样做的,但是因为这项繁琐的工作为我完成了,所以我更有动力去做一些事情,而不是推迟这项工作! 从Behar等人。 我还带了一些阿拉伯人口,以及格鲁吉亚人,立陶宛人和白俄罗斯人。 我将后两个人口合并为“波罗的海”。 在条形图中,叙利亚人和约旦人被转换为“黎凡特人”。 我离开了沙特人,也门人和也门犹太人。 最后,我从AAP添加了一些人员: 来自非洲之角的所有未婚祖先的人,以及我的努比亚人。 在下面的显示中,AAP成员与Behar等人中合适的种族组合:奥罗莫斯人,阿姆哈拉人和提格里。 我原样离开的埃塞俄比亚犹太人(Beta以色列)。 为了混合使用,我还从Henn等人那里带来了Sandawe。 索马里人全部来自AAP。 他们似乎没有亲戚关系(近亲通常形成自己的集群)。

我试图以一种临时的方式来平衡我的人口。 我只花了约30卢布,却决定增加更多的马赛人,因为他们似乎是混血儿,而不是参考人群,我想补充他们的变化。 根据Zack Ajmal在他对参考数据集的评论中,我删除了密切相关的个人。 合并数据集后,我留下了〜210,000个SNP,而丢失率不到0.1%。 我在ADMIXTURE中将其从K = 2扩展到K = 8,并且还生成了EIGENSOFT中遗传变异的前六个独立维度。 我还从推断出的祖先种群的ADMIXTURE中获取了Fst值,并生成了遗传距离的MDS表示形式(尽管可以在附件文件夹中找到原始文件)。

以下是几种不同类型的地块。 MDS和PCA应该相当简单。 但是对ADMIXTURE条形图有一些解释。 每K有XNUMX个。第一,按人口平均的结果。 其次,细粒度显示所有人群中的所有个体。 第三,细粒度显示感兴趣的人群。 请注意,在第二组图中,我不按人口标记所有个人,因为它不可读。 但是它们按字母顺序排列,因此您应该能够看到人口的起点和终点。

在我什至没有查看结果并进行讨论之前,有一个明显的问题跳出来: Masai数据集中有密切相关的个人或氏族,我需要在以后的运行中删除。 尽管这些人要求获得较高的K,​​但这并不会影响其他人群之间的关系,因此我决定先发布此内容,然后再对其进行完善。 这是一种学习经验。 您可以看到,这些人也在MDS和PCA中形成了自己的集群。 至少使用不同的方法可以系统地重现该问题。

(请注意:有些图片比显示的要大,因此,如果您想为细粒度图看到更好的标签, 获取图像URL并单独查看)

[zenphotopress相册= 287排序=排序顺序号= 50]

 

 

Masai在K = 6时“崩溃”的事实确实存在问题,因为这里可能丢失了一些信息。 但是,一些即时观察:

1)索马里人像埃塞俄比亚人一样,对班图人的扩张几乎没有任何影响。 这与努比亚人相反,努比亚人可能通过中间团体或通过与被奴役并带到苏丹的班图斯直接接触而拥有更多的西非血统。

2)当您分解西欧亚血统时,埃塞俄比亚人和索马里人的贡献几乎完全来自阿拉伯南部的一个祖先部分。 由于地理原因,这是有道理的,但是当您查看“北部”混合成分的比例时,即使在也门犹太人中,比例也没有反映在非洲之角群体中。 一个与此相符的假设可能是,类似阿拉伯人的群体之间的混合事件发生在南部阿拉伯人在基因上更加孤立并且与北部人口不同的时候。 我怀疑在骆驼之前这几乎是肯定的,更不用说伊斯兰教了。 有趣的是,就像努比亚人与西非的亲密关系一样,他们也与欧洲的亲密关系也更多。 努比亚人的血统比埃塞俄比亚人和索马里人的血统更为国际化,这在历史上并不令人惊讶。

3)外加剂估算值有一个粗略的等级顺序。 在非洲方面,它来自索马里>奥罗莫> Beta以色列〜阿姆哈拉>提格里。 尽管样本量很小,所以我们应该谨慎。 Amhara似乎变化最大。 有人可能会怀疑,作为近来埃塞俄比亚的传统核心族裔的阿姆哈拉(Amhara)已将其他群体吸收了。 如果您看一下PCA,索马里人实际上是PC 2上最“东非”的群体。还要注意其他埃塞俄比亚人和马赛人分别对阿拉伯人和班图人的线性分布。 这暗示了东非底物和其他人群之间发生了某种古老的混合事件。 我将这个人口称为“东非祖先”(AEA)。

4)桑达威与其他团体的关系很有趣。 似乎Sandawe与AEA有关,但有些微。 请注意,在整个东非桑达威以外的地区,“桑达威”成分的比例通常较低。 尽管埃塞俄比亚人和索马里人的祖先没有班图人的面貌,但他们可能拥有“祖先桑达威”(AS)。

在修正Masai数据集之前,我不想多说(我可能会求助于Dienekes的一些“技巧”以及监督的跑步)。 但是总的来说,我想说非洲之角的闪族和库奇族人的民族志要早于班图人的扩张。 我将对此进行更多的研究,但是它们似乎并没有像南亚人那样容易地产生“埃塞俄比亚-索马里”星团。 这可能是因为在这些分析中,它们从来都不是很多。 或者,可能是由于混合事件最近发生的可能性,使得潜在的人口没有像南亚人那样被蒙蔽。 目前,我倾向于后者。 像在南亚一样,我认为埃塞俄比亚人的家庭的民族发生不是一个“一次性”的混杂事件。 建议您在该地区有两个主要的语言族,闪族语和库希族语。

图片来源: 维基媒体

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”