Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
人类遗传学

书签 全部切换变革理论添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

“体育画报” 作家 大卫·爱泼斯坦 有一本新书, 体育基因:非凡运动表现科学之内。 标题让我印象深刻,粗俗易懂, 但我知道作者并不总是对此种东西有控制权。 在过去的一年中,我与爱泼斯坦有过一定的往来,他给我发了一些与人类进化遗传学和古人类学有关的文章,以确保它们听起来并不疯狂。 我还没来得及读这本书,但从 访问 我听了 美国国家公共电台 它具有丰富的数据和精妙的理论。 尽管标题似乎暗示运动能力是一个单一的基因特征,其中人口的大部分变异是由于遗传变异造成的, 爱泼斯坦否认了这一事实,而是提出了一种现实,即运动能力是一个复杂的特征,它在许多方面都受到众多遗传和环境变量的影响,并且涉及这些变量之间的相互作用。 那样会使字幕显得不那么性感,但是它具有正确的属性。


爱泼斯坦(Epstein)对这项研究进行的调查涉及必将引起轰动的敏感话题(例如, 连接体育,种族和遗传学的紧迫性和挑战)。 但是从访谈的角度来看,这本书中似乎会有很多“真相”事实。 例如,他报告说 在美国17至2.14岁之间,身高20英尺(40米)高的男性中,有XNUMX%在 NBA! 显然,没有任何基因可以保证使您成为NBA球星,但是拥有等位基因特征使您身高达到XNUMX英尺显然会有所帮助。 这也说明了 “ 10,000小时规则” 在流行文化中已被接受。 练习很重要 ,人才很重要。 在极高的性能水平下,人们经常需要专注于一遍又一遍地执行重复性任务。 但是,人们也可能需要一种自然的基因补充。 大多数NBA球员的孩子都不会成为职业篮球运动员,但是可能性要高得多。 爱泼斯坦在访谈中以轻松,简洁的方式概述了这些事实,并消除了导致基因决定论的婴儿疾病,从而导致购买了DNA试剂盒,该试剂盒会告诉您您的孩子是否是运动员。

尽管很复杂,但我从戴维·爱泼斯坦(David Epstein)对他的书的描述中可以摆脱的一件事是,关于如何造就一位优秀运动员的大量科学文献。 这似乎是合理的,因为职业体育是一项有利可图的企业,而有钱的地方就有科学的探索。 但这有助于时不时地重申这一信息。

附录: 提起詹姆斯·克劳(James F. Crow)2002年论文的好地方 本质上的不平等:遗传学家对人类差异的看法

无法模仿的 乔·皮克雷尔 已将他的Khoisan-are-Italian预印本放到 arXiv, 南部和东部非洲的古代西方欧亚血统。 在描述论文的核心结论时,我一直很高兴,但是有这样的翻转反应是有原因的: 他似乎从遗传数据中得出的推论使我震惊不已 疯狂的. 但是没关系,遗传学告诉我们的是 历史比我们想象的要疯狂得多。

让我们在这里备份一会儿。 几十年来,遗传学家一直认为,卡拉哈里的布什人,科伊桑-这里-科伊桑(Khoisan)是非洲最后一批保留祖传语言和哈德扎(Hadza)语言的狩猎者 ur-人类。 这 基础 在“走出非洲”事件的风口浪尖上,它首先与人类其他物种背道而驰。 这在Y染色体和mtDNA系统发育中很明显,布什曼及其近亲变种与其他物种之间的结合时间很深。 而且,几年前 另一组 揭示了丛林人也可能是过去约50,000年内混合事件的产物,具有独特的人类素谱系,与现在的主谱系相距1万年前,这导致了解剖学上的现代人类。 现在,Pickrell等。 给我们带来一种扭曲,它可能比酸橙更涩: 在他们的基因组中,布什曼及其科依族(Khoisan kin)的Khoe牧民反映了与东非人的古老混合事件,而东非人本身就是西欧亚人与非洲原住民之间杂交的结果。 对于我的结论的简要概括而言,更相关的是,西欧亚部分并不一定像南欧人那样反映了现代中东人口!

他们如何推断出如此奇怪的结果? 魔法? 否。基本上,作者着眼于 连锁不平衡。 知道了? 可能不会。 如果您好奇,困惑并打算了解他们的方法在您的骨头中的作用,那么您可能需要阅读 Loh等。 除非相信伟大的蜂巢思想,否则 帝国实验室,或尝试吞下陈腐的凝结水。

如果您考虑基因组的短至中等长度序列,则存在遗传变异,等位基因,分布在该序列之间。 这些等位基因的频率因人群而异。 并且,有时在等位基因组合中存在相关性,如果在整个基因座上进行等位基因随机分类,则可能会在单个序列中看到。 一个具体的例子是人口,这是非洲人和欧洲人之间最近发生的混合事件的产物。 重组需要很多代人才能打破等位基因之间所有具有非洲和欧洲血统特征的关联,因此可以简单地通过在个体水平上对基因组进行分相来推断出长的血统块。每个同源物都继承自每个亲本,而不仅仅是基因型值)。 群体内将存在连锁不平衡,因为由于最近在基因组水平上不同的祖先,特定的变体将与整个基因座的其他变体相关联。 如果您注意到SNP 1具有非洲等位基因,则位于基因座附近的SNP 2也比预期具有更大的非洲等位基因,直到达到连锁平衡为止。

如上所述,随着时间的流逝,这些关联会随着时间的流逝而被打破 基因重组。 因此, 整个基因组之间连锁不平衡的衰减可以让您推断出自假定的混合事件以来的时间。 这适用于各种时间深度。 非裔美国人的LD较远,因为这种混合物是相对较新的。 迄今为止 较早的混合事件 一个人一定更狡猾,因为随着两个遗传背景的融合,重组破坏了先前的独特联系,LD衰落并变得极其微弱。 但是,多重混合事件以及随之而来的连锁不平衡模式又如何呢? 作者在上一篇文章中所做的是在似乎有两种可能的混合事件的情况下,测试数据与LD曲线的组合的拟合度。 而且,他们发现了确实符合此模型的多个人群。

从LD衰减曲线推断出的混合事件的结果不包括技术性:

Pickrell等人最简约的模型。 提议很简单,因为它很疯狂。

1)在原始的西欧亚大陆人口和原始的苏亚人口之间的非洲之角周边地区发生的一次古老的原始混合事件

2)当事件1的下游派生种群遇到科伊桑人的祖先时发生第二次混合事件

Pickrell等。 推论西欧亚人与非洲人之间约有3,000年历史的埃塞俄比亚高原闪族人混合事件 帕加尼等人 只有一点点疯狂的结果。 然后进入第2步,将原始布希曼/原始pro头与大约1,500年前的杂种东非人混为一谈。 让我们从表面上接受这些遗传结果。 他们带给我的是文化的力量。 尽管如今Khoe Nama等团体已大为减少,但他们设法在欧洲殖民主义时期之前保持其完整和独立(直到20世纪初期,德国人才真正摧毁了纳米比亚)。 一群班图族农民淹没了南部非洲的大部分地区,但科伊桑族的某些群体设法维持了居住区,在那里他们坚持其独特的文化传统并延续了自己的语言。 当然,其中有些当然是生态,因为 卡鲁 该地区并不特别适合班图人文化工具包。 但是,我还怀疑,东非人对Khoe甚至间接对布什人的制度和经济影响(例如,牛文化),也使这些人对班图人的扩张更加健壮。

成为一个 在arXiv上预印本,本文 我在这里说的其中的内容对您是免费的,并在方法和疯狂方面对补充内容进行了详尽的解释。 对于这些结果如何疯狂和不正确的讨论,我并不特别热衷。 他们太疯狂了。 但是我对这里的方法学了解得足够多,可以理解逻辑, 并接受作者正在抓住一些非常奇怪和真实的东西,即使它们的特定解释和特定结果可能会引起争议。 现在让我引用这篇论文:

西方欧亚血统通过阿拉伯进入非洲东部的假说必须与以下事实相吻合:该血统的最好的现代代理人通常是在南欧而不是中东(补充表4)。 这一观察结果可以在欧洲古代DNA的研究中得到解释,该研究表明,大约在5,000年前,与现代南欧人有密切遗传关系的人们就出现在斯堪的纳维亚半岛的最北端[Keller等,2012; Skoglund等,2012]。 因此,我们认为今天居住在中东的人们不能代表3,000年前居住在中东的人们是有道理的。 的确,即使在历史时期,也有从中东进出中东的大规模人口迁移[Davies,1997; Davies,2008; Davies,XNUMX]。 肯尼迪,XNUMX年]。

想一想。 如果Pickrell等。 al。 是对的 您认为中东在这方面特别特别吗? 我想说的是,如果对采样策略不谨慎(我想到的是他们在数据中看到的撒玛利亚人),那么高血缘关系可能会导致奇怪的结果,尽管我怀疑这是一个谨慎的群体。 但是我确实认为,某些欧洲人口比古代黎凡特人更能代表古代黎凡特人,因为现代黎凡特人受到了多个人口统计学波的冲刷(尽管我希望看到更多与基督教阿拉伯*样本的比较)。

Pickrell等人投下了第二个重磅炸弹。 等:

我们注意到,我们已经根据人员的大规模活动来解释混合信号。 解释这些结果的替代框架可能会提出按距离隔离模型,在该模型中,种群主要保留在单个位置,但个体从相对较小的半径内选择配偶。 原则上,这种模型可以通过“类似扩散”的过程将西欧亚大陆血统引入非洲南部。 有两种观点反对这种可能性。 首先,我们观察到的基因不对称:尽管一些东非人口拥有西欧亚血统的50%,但中东和欧洲的撒哈拉以南非洲血统的水平要低得多(最多15%[Moorjani等等(2011年)],并且似乎不包含与科伊桑人有关的血统。 其次,尽管中部非洲在地理上更接近假定的祖先来源,但南部非洲却存在着西欧的血统信号,但中部非洲却没有。 从西欧亚大陆到东部非洲,再从东部到南部非洲的迁移,可以最简单地解释这些特定于地理和非对称的分散模式。

当我们将人类遗传变异称为渐进遗传时,隐含了按距离隔离。 而且,它不是完全没有作为空模型的效用。 但是我认为我们需要在人类氏族的这种简约优雅中以单调逐步的方式永恒地交换伴侣,从而增加另一层复杂性。 在过去的10,000年(甚至更早!)中,许多人口都陷入了动荡的人口动荡,因为远方的外国人将自己融合到当地的土地上,并废除了旧的以带来新的东西。 这篇文章的作者本人是 这种事件的产物。 人类的遗传故事不是 只是 在小型销售社会的环境中,连续不断地扩散的基因流之一逐渐蔓延。 不,这种平静的背景条件周期性地受到易位人群爆炸的干扰,这很可能是由某种技术或文化革命引起的。 在许多情况下,遗传影响太大而无法做任何事情 但是 民间流浪。

与远距离隔离不同,这些图案不会在整个空间中线性流动,而是在生态肥沃的地形中呈现出不协调的绑扎图案。 而不是薄雾滑过平原,而是将山洪冲刷到沟壑中。 一个更温和的比喻是,这些是人口统计波动,这些波动向外扩展,暂时使逐距离隔离动力学的平静表面扭曲,最终淡出背景并成为新常态。 但是一旦涟漪消失,我们如何知道那曾经是? 这确实是一件困难的事情,这些结果表明了固有的问题。 Pickrell等人可能是波纹的回声。 从不再存在的来源检测问题。 古代黎凡特的第一批农民的接穗是否藏在托斯卡纳的山谷和坦桑尼亚的平原中? 一个疯狂的主张也是,但不一定是错误的。

引文: arXiv:1307.8014v1 [q-生物.PE]

*我知道有些基督徒阿拉伯人不想被称为阿拉伯人。

 

众所周知,亚历山大大帝入侵了印度河流域。 巧合的是,在这个地区的山脉上,是一群孤立的部落人口,他们的外表与南亚人不一样。 特别是,它们的皮肤白皙得多,并且通常是金发或蓝眼睛。 自然地,这导致了19世​​纪和20世纪初的猜测,他们是白人失去的种族,也许是亚历山大的一些马其顿士兵的产物。 这部分是鲁德亚德·吉卜林小说的基础 该名男子谁是国王。 当然,随着时间的流逝,这些人中的一些人本身已经提出了这个想法。 对于诸如 卡拉什 在巴基斯坦的这一推测得到了其宗教的异国情调的支持,该宗教似乎是印度欧洲的,类似于吠陀印度教,受伊斯兰教的影响很小。

卡拉什女孩, 信用: 戴夫·瓦茨(Dave Watts)

这一系列论题的主要问题在于它们是错误的。 我之所以提出这个陈旧的想法,是因为许多人,包括Wikipedia,显然都不知道这是错误的。 我已经有记者真诚地提出了这个模型,而且我已经看到他们在会谈中随手提出了这个模型。 有许多历史遗传问题仍然是神秘的或倾向性的。 这不是其中的一个。 卡拉什(Kalash)和布鲁豪(Burusho)的成千上万个SNP分发给了公众。 如果您想知道这些种群是如何遗传积累的,请自己分析它们。 我知道它们与马其顿人无关,因为我有很多欧洲人口数据集,而我有很多南亚数据集。 巴基斯坦山丘上的人民显然是后者的统统的一部分,尽管它已转向伊朗人民。

那些寻求进一步证明而又无法以任何原因自己分析数据的人,可以查看我有关以下主题的文章:

卡拉什的视角

卡拉什人树上

附录: 有人更正了相应的Wikipedia条目会很好。

 

引文: Xing J、Wuren T、Simonson TS、Watkins WS、Witherspoon DJ 等。 (2013)高海拔蒙古人自然选择和表型变异的基因组分析。 PLoS Genet 9(7):e1003634。 doi:10.1371/journal.pgen.1003634

嗯,不完全是。 你必须阅读论文, 高海拔蒙古族自然选择和表型变异的基因组分析,看看我为什么持怀疑态度。 坦率地说,他们似乎并没有在他们的结果中发现太多的笔记,所以我有点困惑为什么这篇论文会进入 PLOS遗传学 (为了给予应有的信任,这个小组有 发表很有趣 我曾经微笑过的过去的工作)。 那么我为什么要发布这篇论文呢? 因为我很确定他们会公布他们的数据, 他们有 (只需翻页到底部)。 所有不厌其烦地这样做的研究人员都应该受到表扬、强调和尊重。 这提高了科学性。 之后 美国心脏协会惨败 我将加倍努力,将焦点放在发布数据的人身上。

附录: 必须指出的是,“蒙古人”身份很大程度上是成吉思汗崛起和至高无上的结果。 蒙古人只是今天蒙古的众多部落之一。 随着的兴起 蒙古人 帝国的许多人口,包括不属于蒙古人附近方言连续统的一部分的突厥人口,几代人就被同化为这种民族认同。 “祖鲁”身份是相似的,因为它是沙卡特定氏族崛起的一个功能。

 
• 类别: 科学 •标签: 人类遗传学 

马来西亚“ Negritos”,大概是马来半岛的土著人民

几天之前 二烯 指向一份报告存在的论文 解剖学上的现代人类 在中国到现在有80-100,000年的历史。 我说“解剖学上的现代”是因为在总体形态上类似于现代的人群之间存在着大概的区别,它们在100到200万年前首次出现在南部和东部非洲(在距今40,000年之后在世界范围内占主导地位) )和“行为现代”的社会,这些社会展现出作为人类特征的千变万化的象征文化表现形式的所有特征。 报告这类旧样本的论文并不是特别具有革命性。 相反,它是不断发展的语料库的一部分,该语料库为占主导地位的模型做出了“反叙述”,通过这种行为,行为现代的人类在“走出非洲”事件发生后大约BP横扫了欧亚大陆(和澳大利亚)约50,000年。 显然,这里的问题是,如果在这种扩张之前的几万年前在中国有解剖学上的现代人类,他们会被取代吗? 还是年代顺序错误? (例如 突变率之争,不过请注意,主导模型也有许多自然人类学家支持)。 我在Twitter上指出 艾尔文·斯卡利(Aylwyn Scally)我们确实有证据表明东亚和东南亚有大量人口替代。

来自中国,日本和东南亚的最新人类遗传学结果向我表明,这些种群的遗传距离太近而无法在全新世之前(即,距今约10,000年之前)生根。 但是,还有另一种迹象表明,人口膨胀和替换是相对较新的: 在东南亚最偏远的地区,马来西亚和菲律宾,仍然发现身体上非常有特色的“内格里托”人口。 帝国集团 几年前也有报道说,这些内格里托人本身就具有人口子结构,菲律宾人与可能的第一批定居者有着深厚的古代渊源。 Sahul,而马来西亚人则更接近安达曼岛民。 仅仅因为马来西亚的内格里托人享有土著人民的声誉,就不能轻视他们确实不是土著人民的可能性,而是取代甚至更早的人口(如果我没看错的话,这就是帝国集团的结果的暗示)。 如果我们先更新一下人口流离失所的可能性, 那么,根据考古记录来解决人口在时间上趋于浅层收敛这一悖论的“解决方案”可能仅仅是因为老年人口对当前血统的贡献不大。 这并不意味着零贡献。 回想一下,只有使用密集的标记集和古老的参考序列,尼安德特人混合的结果才几乎可以确定。 发散 智人 各组之间的差异不会那么大,因此它们可能已经遗留下来,但是处于较低的水平,以至于当前的数据集和技术没有能力检测它们。

最弱者

但是我们不需要关注史前史。 东南亚的最近历史和半历史很复杂,充满了文化和人口事件,表明人口分布发生了巨大变化。 我读到的最好的提纲是维克多·利伯曼(Victor Lieberman)的特别标题 奇怪的平行,概述了800至1800年间东南亚大陆政体的崛起。过去1,200年间,东南亚大陆地区最重要的转变是东南亚大陆政体的崛起。 /泰语 人民,以及经济衰退 孟高棉 组。 泰国和老挝以及缅甸东部高地的主要语言最初是在历史时期源自南方华裔的the族。 当汉人在公元一千年前向南推时,土著居民要么被吸收,要么通过组织自己的政体做出反应(例如,南朝)。 最终,抵抗是徒劳的,中国人征服自己的家园,促使precipitate族大规模外迁到高棉地区。 今天的泰国曾经是大柬埔寨的一部分。 在越南东部,越南人(Kinh)沿着海岸向南推进,最终吸收或吸收了湄公河下游的高棉人,因此发生了一些不太引人注目的现象。 再往南,海洋东南亚的局势更加混乱。 我自己的信念是,在南朝鲜人到来之前,这些地区中的南亚语系语言很可能占主导地位。 但是到了我们写书面记录的时候,南方方言才是普遍的,只有马来西亚内陆的内格里托人才保留南亚语作为他们的第一语言。

我们可以通过遗传学来进一步探讨这个问题的一种方法。 例如,这是来自 哈拉帕 数据集。 我只发布了最相关的祖先成分,并修剪了种群。*

种族 “印度人” “东南亚” “东北亚” “西伯利亚人”
他们 5% 87% 0% 4%
马来新加坡 11% 72% 6% 3%
柬埔寨 11% 71% 10% 3%
0% 69% 30% 0%
越南语 2% 62% 35% 0%
泰国人 14% 61% 12% 3%
拉hu 3% 55% 37% 3%
0% 37% 61% 1%
汉新加坡 0% 36% 63% 0%
汉南 0% 33% 66% 0%
缅甸人 17% 28% 42% 6%
汉北京 0% 19% 76% 3%
桑塔尔 72% 17% 0% 1%
纳西 4% 15% 73% 7%
日文 1% 11% 74% 11%
蒙古 0% 7% 62% 23%
孟加拉语 47% 6% 5% 2%

 

一些快速的评论。 首先,请注意,尽管汉族之间存在差异,但华南土著人(Dai)与华南人之间的差距比后者与华北人之间的差距要大得多。 其次,在所有土著东南亚人群中,缅甸人的样本脱颖而出。 为什么? 与他们的东部邻居不同,缅甸人讲的是 藏缅人。 “ Tibeto”(前缀)一词表示与中国北部和西部边缘地区的人们有亲缘关系,而这通常是这些人的起源传说的一部分。 这些传说似乎是正确的。 不仅存在文化亲和力,而且这些结果表明,外来的缅甸人对人口的人口构成做出了重大贡献。 东南亚遗传学的一个困难方面是 南亚似乎有两个组成部分。 柬埔寨人可能正在反映出一个非常古老的混合事件。 对于缅甸人来说,也有可能是这种情况,但其中的某些混合物几乎可以肯定是最近的(例如原始文件显示一些缅甸人有“巴洛克”,这是最近南亚人基因流的一个征兆)。 将这两者分开可能并不容易,但是如果要很好地了解历史上南亚移徙的影响,则有必要将它们分开。 在缅甸和马来西亚,古代和中世纪的移民以及最近来自印度的殖民时代定居使这个问题变得更加复杂。 最后,在土著居民南岛人伊班人看来,他们是上述人口中“最东南亚”的人。 在这里看来,这在某种程度上似乎是孤立和缺乏世界主义的作用。 马来人有印度人和中国人的混合物。

这只是最后四到五千年的表面。 我们有一个整洁的故事讲述关于东南亚定居> 5,000年,回到现在的50,000年的可能性有多大? 从现存的遗传变异来看,这将是困难的,人口覆盖率,标记物密度和方法精度都需要最大化。 在这一点上,我们感到困惑,无法说出一个整洁的故事,我并不感到惊讶。

*过滤掉至少5%的“东南亚”,N> = 5,并删除不感兴趣或重复的人群

 
• 类别: 科学 •标签: 基因, 人类遗传学, 人类基因组学, 东南亚 

与穆罕默德有关吗?
信用: 伊恩·贝蒂

去年一篇论文 出自AJHG 据报道,埃塞俄比亚人口似乎是西欧亚人和撒哈拉以南非洲人的复合体。 由于多种原因,结果本身并不太令人惊讶。 首先,埃塞俄比亚人和非洲之角的其他人口在西欧亚大陆人与撒哈拉以南非洲人之间在物理上是等距的。 因此,20世纪的人类学家有时将它们放入“高加索人”种族分类中。 第二,非洲之角的语言有 亚非关系。 亲密语言(例如索马里语)与更熟悉的语言(例如阿拉伯语)有着深厚的联系,但闪族的埃塞俄比亚语言(例如阿姆哈拉语)在历史上距离更近。 第三,以前对这些种群进行了大量的遗传分析,从这些种群中可以明显看出它们的合成特征(例如,mtDNA和Y结果表明存在各种各样的单倍群)。 什么 联合会 一篇论文报道说,埃塞俄比亚人的欧亚祖先与大约3,000年前的撒哈拉以南印度土著人混合在一起,发生了一次脉冲事件,而今天他们在西亚最亲近的现代关系是黎凡特人。 为了给它一个温和的光泽,约会是有争议的(使用基因组长度上标记的遗传相关性衰退的模式)。 这不只是渐进式变化。


就像我一样 注意到 if 这种混合物的约会是正确的,然后现代埃塞俄比亚人将其作为连贯的生物文化实体 发布日期 埃及文明已有数千年的历史了。 在位期间 哈特谢普苏特,大约在公元前1500年,有一个贸易代表团派往蓬特(可能是索马里兰)的土地。 埃及人对邦特人的描写很奇怪,因为他们看上去不像撒哈拉以南非洲人,而且邦特兰的女王似乎表现出 肥胖症 在科伊桑人中更为普遍。 我推测是在古埃及文明时期 东非的人口结构一直在发酵。 统治喀麦隆东部和南部撒哈拉以南非洲景观的班图人才开始认真地扩大 公元前1000年后 (大约在1,500年前到达南部非洲)。 看来,类似科伊桑人的人民的范围比今天的情况更偏北和偏东。 此外,景观上可能还有其他种群,目前尚无特征(可能是Khoisan织布机很大,因为它们的分布使得遗物种群得以生存到今天仍待研究)。 这 提什科夫实验室 例如,有一篇论文正在准备研究西欧亚人到达时在非洲之角存在的假定的撒哈拉以南非洲人口(高地埃塞俄比亚人的撒哈拉以南部分似乎不像班图人)。

我再次提出所有这些,因为 二烯 突出显示摘要 乔·皮克雷尔 在接下来的几周 2013年中小企业:

南部非洲的历史涉及土著猎人与采集者之间的互动,这些人暂时或永久地进入该地区。 这些相互作用对当前种群遗传结构的影响尚不清楚。 在这里,使用连锁不平衡的模式,我们表明,在南部非洲的狩猎采集者和牧民的遗传历史中,至少有两个混合事件:一个涉及与讲尼日尔-刚果的非洲人口有关的人口,另一个涉及祖先与西欧亚(欧洲或中东)人口密切相关。 我们估计,在Khoisan中至少有百分之几的祖先起源于后一个混合事件,该事件平均发生在1,200-1,800年前。 我们表明,整个东非都存在着类似西欧亚血统的信号。 特别是,我们还发现了肯尼亚,坦桑尼亚和索马里几个种群的遗传史中的两次混合事件的证据,最早的涉及与南欧人有关的种群,我们可以追溯到大约2700年至3300年前。 因此,我们建议西欧亚血统通过东非间接进入南部非洲。 这些结果证明了大规模的基因组数据集如何为复杂的人口运动模型提供信息,并突出了人类历史上大量未描述的从非洲到非洲的迁徙对基因组的影响。

这里没有指定Khoisan,所以我自由地将布什曼的形象放在职位的头上。 但似乎更合理 科伊,他们在遥远的过去某个时候从非班图族(班图族抵达时就接受了)养殖牛。 已经有证据表明,神秘的坦桑尼亚桑达威人有古老的欧亚混合物,因此这并不奇怪。 这 桑达威语言 与Khoisan(点击)的语言具有相似性,尽管作为一个连贯实体的更广泛的语言家族仍存在争议(除了单击等广泛的独特相似性外,某些布什曼语言本身可能并没有真正的亲和力)。 直到我们获得更密集的地理覆盖范围的人口数据集之前,桑达威人的民族起源的整个问题似乎都蒙上了一层阴影。

欧拉姆人民领袖扬·琼克·阿夫里卡纳(Jan Jonker Afrikaner)

至于欧亚血统如何进入科伊桑河,这是一个容易想象的过程,因为近五个世纪以来,欧洲和亚洲的近代血统已经以历史记录的方式进入了这些人口。 其中一些是通过有组织的民族融合而实现的,一个人被另一个人同化(就像阿兰人在被罗马人击败后被西班牙人破坏者同化)。 考虑情况 奥兰人,他们现在是 娜玛·考伊(Nama Khoi) 纳米比亚的一个部落。

在20世纪初期的现代南非崛起与18世纪的开普殖民地建立之间的这段时期内,北欧,亚洲(印度和印尼)和本地人(科伊桑和后来的班图人(Bantu)起源于各种接触(欧洲男人和奴隶之间的关系,非洲和亚洲奴隶之间的关系等)。 最终的人中最有名的是 开普彩色。 尽管阿夫里卡纳(Afrikaner)在语言上和荷兰宗教改革(Dutch Reformed)在宗教上,但这些人拥有多种多样的种族传承,白人阿夫里卡纳(Afrikaners)被降为二等身份。 鲜为人知但仍广为人知的是 格里夸,边疆人 建立了自己的政治单位 类似于他们的白人南非荷兰人表亲在19世纪到达东部以逃避殖民统治以及由于其“野兽”身份而遭受的种族压迫。 最后,您会遇到像Oorlam这样的组织,他们像Griqua一样,通过其欧洲文化遗产和与纳米比亚灌木丛的联系而获得了优于本地居民的优势,而这些国家甚至超越了荷兰共和国和英属南非最遥远的边境地区。 但是,在班图人部落强加给他们的一系列失败之后,他们最终被淹没在Khoi Nama中。 您在这里看到的是欧洲和本土文化传统之间的平衡变化,其显着性是与开普殖民地的距离的函数(众所周知,一些格里夸人已经消失在沙漠中并同化为他们的“母亲的亲戚”,这或许可以解释为一些丛林人有欧洲和亚洲血统)。

这种活力似乎完全有可能在非洲的古代发挥作用(并且 other 地方)。 在某些情况下,人口优势和环境条件是可以接受的,合并后的人口与欧亚人保持着很大的亲和力,而不是“本国”。 在非洲之角,情况确实如此,埃塞俄比亚政体介入了阿拉伯事务,并成为东方东正教政治团体(包括埃及的科普特人,亚美尼亚人和叙利亚东正教徒)的一部分。 埃塞俄比亚在很大程度上是西欧亚大陆的边疆 iko烯 而非撒哈拉以南非洲的一部分。 相反,您所处的环境就像Sandawe一样,长期以来人们一直怀疑其模糊的Cushitic亲缘关系,但他们像Hadza邻居一样成为狩猎采集者,并采用了Khoisan语言和文化的广泛元素。 最后,您可能会认为,科伊人只保留了极为有用的文化知识,例如欧亚前辈的畜牧业,无论如何,祖先的血统都可能是由已经杂交的类似桑达威的牛牧民所介导的。*

从总体上看,这些结果告诉我们,人类史前的故事是复杂且多层次的,从基因上将其剥离会给我们留下更多的印象 问题答案. 十年前,一个距今约50,000万年前的简单故事,就是非洲以外的人(例如,欧洲人与亚洲人分离,美洲印第安人与亚洲人分离)之间的裂变,是我们可以接受并怀着良心接受的强大程式化模型。 今天,我们面临着一个更加难以理解的世界,古朴和全新世的混合物散布着整个场景。 世界人口的很大一部分(例如 印度)似乎是在不到10,000年前合并的非常不同的人群之间混合产生的副产品。 在过去的3,000年中,撒哈拉以南非洲地区的大部分地区在文化上和在基因上都进行了彻底的重塑。 现在有大量证据表明,在过去的5,000年中,东部非洲经历了“回迁”(尽管长期以来,单亲血统表明了这一点)。 人类离开非洲伊甸园的简单故事不再可行,因为非洲并不是每个人都适合的伊甸园,现代非洲人自己也感受到了欧亚迁徙事件的印记,以及广泛的内部民间流浪。

最后,我想说,可能最有遗传价值的人可能是 姆布蒂P格米人 刚果东部。 我怀疑,班图人的扩张和所有非洲人的欧亚后裔迁徙对他们的影响最小。 至少我希望。

* 伦巴 津巴布韦的历史很可能是过去2,000年在南部非洲发生的事情的线索之一。

 
• 类别: 科学 •标签: 人类学, 人类遗传学, 人类基因组学 

信用: 3年2013月5日的Sci Transl Med:第192卷。 第五期,第192页,第86页。 10.1126ra3006338,科学。 翻译中DOI:XNUMX / scitranslmed.XNUMX

就在我入睡之前,一位读者给我发送了一封电子邮件,其中指出了尼克·韦德(Nick Wade)的一本书。 纽约时报, 基因侦探发现如何自然抵抗霍乱。 这是关于 科学转化医学, 霍乱地方性恒河三角洲孟加拉国人口的自然选择。 作者使用“多种信号的复合”(CMS)测试以确定自然选择的基因组区域(寻找较长时间) 单倍型,高频衍生等位基因,以及具有 高跨人口频率差异)。 结果并不令人惊讶,我出生在孟加拉国,我可以证明这是细菌恐惧症的噩梦。 坦白地说,这是论文的次要和次要方面。 首先让我们引用韦德的治疗方法:

作为测试自然选择的必要先决条件,研究人员研究了孟加拉人口的种族构成,发现他们是印度人口,其中东亚基因的掺混率为9%, 可能是中国人。 根据统计计算,这种混合物几乎恰好发生在52代之前,或者大约在公元500年,假设每代29年。 印度的古普塔帝国此时正在衰落,但尚不清楚与东亚人的通婚是通过贸易还是征服进行的。 “我们现在可以回到历史学家那里,看看接下来发生了什么,”卡尔森博士说。

但是有时科学在传播中会出现混乱。 他们在报纸上怎么说? 同样,相关部分:

我们估计,印度和东亚人口之间的混合发生在52±2代前(一代= 29岁)…或大约在公元500年,这是基于连锁不平衡(LD)的指数下降以及使用ROLLOFF分析的距离得出的。合适的年龄估算大致对应于印度古普塔帝国的崩溃,中国唐朝的崛起以及孟加拉在单一统治者下(公元590年至625年)的短暂统一。 尽管可以使用其他历史记录,例如连续混合或多次混合事件,但单事件模型显示出非常适合我们的数据,并且我们没有发现对非常古老的流量的统计支持……使用基于最大似然的祖先估计软件ADMIXTURE( 32),我们在BEB中发现了9.3±2.6%的东亚血统。

如果您阅读了本文的其余部分,则可以看到Wade在哪里可以得到这种混合是“可能是中文”的想法,但是我认为它不会从文字或补充中跳出来。 也许他是从被引用的第一作者那里得到的。 我不知道。 这项工作的人口史组成部分对于理解通过疾病进行的选择并不是必不可少的,但是,当允许这种混淆出现时,问题在于它将成为巩固的传统智慧。 我以前已经看到过这种情况,因为可随意使用的线条具有持久性和扩散性。 此外,当遗传学家走出假定知识的狭窄领域时,这也使遗传学家显得肤浅。

实际上 这些补品清楚地表明了这些东亚人在孟加拉祖传基因库中的地位。 在K = 5时,您看到出现了一个类似马来人的祖先成分,并且孟加拉语的所有东亚祖先都被分配给了这个祖先。 您还可以将汉人和新加坡的华人数据集分为日文和马来文组成部分。 新加坡的华人更像马来人。 这是完全可以预料的,因为新加坡华裔人口不成比例地来自福建西南地区,其中少数是客家(据说是华南地区的北部移植),还有拥有马来血统的海峡巴巴华人。 汉族数据集来自HapMap,北京样本偏北。 总而言之,现代孟加拉语的东亚血统几乎可以肯定是由与东南亚亲缘关系最密切的一个群体衍生的, 不能,中文.

我长期以来一直对此感到怀疑,因为我有两个不相干的孟加拉人(我的父母)的基因型。 我已经说过了 before。 我对东亚航段的长度进行了一些初步调查,确实发现了大约1,000年前的混合事件,因此我可以相信ROLLOFF结果。 但是,将它们与不同的人群进行比较,很明显,东亚人血统对于他们两个人来说都是东南亚人。 这是我15分钟前使用133,000个LD修剪的SNP生成的MDS:

Chamar是北方邦(孟加拉北部和西部)的低种姓群体。 您会注意到我的父母(“ RazibFam”)都向 南部东亚团体。 完全不奇怪。 不管您如何分析结果,这都会跳出来(第二个维度从另一个东南亚群体中淘汰了一些近交个体)。

因此,假设发生一个混合事件(或主要事件),那么什么是好故事? 东孟加拉邦一直处于遥远的边缘 阿里亚瓦尔塔,是北印度平原的文化核心。 玛加达(Magadha)是比哈尔邦(Bihar)古普塔帝国(Gupta Empire)的心脏地带,长期以来是一片行军之地。 像中国西北部西安地区一样,玛加达人经常是古典伊斯兰前印度大政体的所在地,尽管(或也许是因为?)它与印度北部更广泛的印度-阿里扬文化有着密切的联系。上恒河平原。 随着Magadha的垮台,孟加拉国在诸如Pala之类的王朝时期崛起,在第一个千年后期,Indo-Aryan社会的疆界迅速向外和向东扩展。 但我怀疑孟加拉东部是空的。 很有可能是在某些时候从东南亚赶来的大刀阔斧的农业家。 这是 这些 我相信他们沉迷于孟加拉社会 在toto。

 

受影响和未受影响的兄弟姐妹纯合运行的插图
信用: 智障与单纯性自闭症的纯合性增加有关

一般认为,近交对复杂的动物有一些负面的生物学影响。 隐性疾病是最直接的。 隐性疾病越罕见,该疾病的患者就越来越多地成为亲戚之间配对的产物(其原因很简单,因为以纯合子以有害方式表达的极其罕见的等位基因不太可能在纯合子中聚集在一起。无关的人)。 但是,当涉及到近亲个体的性状时,大多数人都不会想到隐性疾病, 电影中的男孩 拯救 通常是更吸引人的形象(与某些演员声称的小男孩没有任何条件相反)。

有些人对近亲繁殖诸如智力之类的特质所产生的后果感到好奇。 这里的科学文献有些混乱。 但是,如果两个具有平均智力的人结对并成为其堂兄,那么他们的后代智商似乎将比其他情况低0-5点,这一切似乎都是平等的。 这就是说,我的意思是,您在文献中可以找到的研究建议,在校正其他变量时,表型水平上的近亲抑郁大于0(有效果)但小于5(不是) 大,小于特征值标准偏差的1/3)。 据推测,对于近亲繁殖的更高水平,后果将更加可怕。

但是,不是由近亲繁殖的遗传同质性又如何呢? 回想一下最近 拉尔夫与合作社 论文从经验上表明,人们之间可能有许多遗传上的相关性网络,而人们可能认为这是绝对不相关的。 任何使用23andMe的人都有足够的证据,因为与您的基因片段匹配的“亲戚”开始出现。 如果您过去有个人的血统,那么您经常会有另一种血统。 这意味着来自同一个人的DNA片段可能会“聚在一起”并形成纯合嵌段。 对于近亲而言,这是如何发生的很简单。 如果您的父母是表兄弟姐妹,他们将共享一对祖父母,而这些祖父母中的每一个都有两条短暂的血统。 但是,这种相同的动态也以稀释的形式适用于那些在您家谱中更远的人。 您可能在血统书上完全是纯血统的,但由于偶然因素,您仍然具有纯合性。

一份新的论文 联合会 在未受影响的父母,未受影响的后代和受影响的后代的数据集中比较纯合运行的水平。 特别是作者拥有参与自闭症研究的数千个家庭的数据集。 受影响的兄弟姐妹被诊断出患有自闭症,而父母和未受影响的兄弟姐妹则没有这种情况。 除了自闭症外,受影响兄弟姐妹的智力也各不相同。 此实验设计很有用,因为您正在比较遗传上共享很多但表型不同的兄弟姐妹。 您必须校正较少的混杂物,因为它们的遗传背景重叠并且它们的环境高度相关。

当然,兄弟姐妹在遗传上是相似的,它们不是重复的。 兄弟姐妹的预期关系为50%,但是此值存在差异,并且显然存在遗传差异,且两者之间的关系不相关。 在这项研究中,作者专注于纯合子运行(ROH),这很可能是由于祖先在多个实例中的某个遥远时间跨整个宗族出现的缘故。 它们对严重ROH阻滞的最低阈值相对较短,为2,500 kb(负责ROH阻滞的普通祖先的2,500 kb的预期值为约1,000年)。 最重要的发现是,极低的智商影响兄弟姐妹(<70,过去被称为“弱智”)的ROH> 1.32 kb(2,500倍)(p = 0.03)。 他们没有发现> 70的统计学显着差异。 作者对数据进行了一系列操作,切片和切块。 我对这些特别的细节并不特别感兴趣。

相反,我很高兴现在将高密度SNP芯片应用于这类大规模的基于家庭的研究, 可以更恰当地评估兄弟姐妹之间的生物学差异。 就兄弟姐妹的遗传遗传而言,它们之间存在很大的随机性。 我的两个兄弟姐妹的血统只有41%相同(而预期的是50%)。 不仅如此,我知道ROH的频率在兄弟姐妹之间也是随机变化的。 他们跨我的。 如果数量 从头 每位个体的显着影响点突变大约为30个左右,然后兄弟姐妹队列之间的再次变异很可能是显着且值得注意的。

近亲抑郁或纯合性的表型后果等问题直到最近才成为理论问题,或在诸如 果蝇。 那个时代快要结束了。 高覆盖范围的全基因组测序将允许对同胞队列进行精确而有力的比较,并且随着整个国家的“全力以赴”,数据的膨胀将变得非常棒。 我想人们会发现自己可能不满意的事情,但最终人们必须直面事实。

附录: 相反,在这种情况下,您似乎会看到 远亲抑郁。 在全基因组范围内,我愿意打赌,与其说是近亲繁殖,倒不如说是个问题。 不,我对冰岛关系更密切的人的生育力似乎不高感到不满意。

 

拉齐布的女儿的血统


F1,对拉齐布r = 0.5

全基因组关联 他们的方法论哲学很简单。 您采用具有相同遗传背景(即种族同质)的病例(受影响)和对照(不受影响),并寻找在两个合并人群之间差异很大的等位基因。 从视觉上看,具有较高比值比的风险等位基因通过 曼哈顿地块。 但请注意以下条款:种族同质的研究人群。 在实践中,这意味着白人欧洲人,在较小程度上意味着东亚人和非裔美国人(最后一个原因是美国的生物医学工业联合体执行了许多GWAS,而美国则是一个多元化的国家)。 看着 族群消除了由于人口分层而可能获得的许多误报。 基本上,由于群体的历史而在群体之间不同的等位基因可能会在群体本身在所关注特征的倾向(例如,黑人与白人的高血压)不同时产生关联。


但这引出了一个问题: GWAS的通用性如何,因此可以跨种族移植? 对于像我这样的人来说,这不是一个微不足道的问题,因为南亚人由于自然原因而往往被忽视(在西方,我们中可能没有这种人,在第三世界国家中,为这类事情提供资金是不可行的)南亚人住)。 不仅对南亚人的研究不足,而且在推定人群中我们往往有较大的遗传距离,所以我什至不确定来自HapMap古吉拉特邦样本的GWAS是否适用于我(南亚族裔之间的遗传距离实际上是大于欧洲人与某些西亚人之间的距离)。 然后是混合遗产人群的问题。 真的有可能吗 各种F1组合的GWAS的未来,更不用说回交了 雷科·艾尔斯沃思(Reiko Aylesworth)?

幸运的是,从我的立场看来,今天大多数GWAS的报道 ,那恭喜你, 跨种族携带,所以我们不必重新发明每个轮子。 有些证据很清楚地看到了新的 公共科学遗传学 纸, GWAS结果的高跨种族可复制性暗示常见的因果变量。 这是摘要:

描述和识别增加复杂疾病风险的遗传变异仍然是人类遗传学的重点,并且是个性化医学新兴领域的基础。 在过去的六年中,GWAS改变了该领域,发现了数百个疾病位点。 但是,只有少数例外,尚未发现产生由GWAS揭示的关联的因果变体,并且它们在人群中共享的频率和程度仍然未知。 在这里,我们对GWAS结果进行了全面比较,目的是试图了解因果变体的性质。 通过检查针对欧洲,东亚和非洲祖先的人进行的28种疾病的GWAS结果,我们得出结论,很大一部分关联是由常见的因果变异引起的,这些变异应映射相对接近的相关标记。 我们的结果表明,GWAS发现的许多疾病风险变体在欧亚大陆共有。

我想规定,我对此事的看法不仅仅取决于本文。 我也不相信 没有 疾病风险等位基因基因组结构中的区域异质性。 相反,作为一个先例,我现在要争辩说,当观察欧洲人对欧亚人的相对较大影响等位基因的比值比时,至少一个人不应过分怀疑将推论推导给其他人群。在论文中,作者报告说,当考虑到统计能力的差异(欧洲研究往往具有更大的样本量,因此可以捕获更多的变体),GWAS具有很好的可复制性。 另外,有可能某些不重复是由于GWAS专注于标记SNP,而不是因果SNP,并且即使因果是相关的,标记关联也无法跨人群移植。 请记住,当前利用SNP芯片进行的GWAS研究通常关注的是基因组区域,而不是特定的SNP。 这就是为什么在非编码区域中可能会收到较强的GWAS信号的原因。

当然,将有一些罕见的变体,这些变体的便携性不强,并且随着基因组学在人口样本规模和完整的全基因组分析方面的扩大,我们将探究私人等位基因。 但是直到那之前,会有各种各样效果大小不同的常见变体,而且当人们考虑到研究范围之外的人群时,就不必丢弃这些信息。 在查看赔率时, 23andMe 总是有一个警告:“欧洲人得到X。” 这不是企业所期望的。 就医疗行为而言,仍然需要谨慎。 但是,如果您不是欧洲人,那么如何认真对待在欧洲人中执行GWAS的问题? 如果您不是非洲人,我会说得很认真。 如果您是非洲人,我可能还是会说得很认真。

引文: Marigorta,Urko M.和Arcadi Navarro。 “ GWAS结果的高跨种族可复制性暗示了常见的因果变体。” PLoS Genetics 9.6(2013):e1003566。

 

今天,英国媒体对威廉王子的印第安血统blowing之以鼻。 这是一个代表性的标题: 亨特(Hunt)在古吉拉特邦(Gujarat)找一个远房堂兄,他与威廉王子(William Prince)有印度血统。 这里的科学很简单。 显然,一些英国研究人员发现了戴安娜·斯宾塞夫人的第三堂兄弟。 这些人像戴安娜(Diana)一样,是一个名叫伊丽莎·基沃克(Eliza Kewark)的女人的后代。 威廉的曾祖母,曾祖母,曾祖母是曾居住在印度的亚美尼亚人。 她还是苏格兰商人威廉的祖先西奥多·福布斯(Theodore Forbes)的管家。 在某个时候,他派遣了这个女人的孩子去英国接受教育,威廉的祖先在那里嫁给了英国本土血统。 由于戴安娜的堂兄弟姐妹与她共享相同的母系 根据定义,它们共享mtDNA谱系。 碰巧这些人携带haplgroup R30b, 仅在南亚发现的罕见血统。 但这还不是全部。 戴安娜(Diana)的表亲也是南亚人的0.3%和0.8% 在他们的常染色体上。 这两个事实的交叉确实使我相信威廉的家谱祖先艾丽莎·基沃克(Eliza Kewark)确实具有南亚血统(即使在长期居住在印度的亚美尼亚人或帕西斯人等具有种族概念的群体中,这也不令人感到意外)。 但请注意,我说的是家谱祖先。


观察戴安娜(Diana)的两个堂兄的祖先的巨大差异,这大概来自于伊丽莎(Eliza Kewark)(尽管总有这些片段来自不同南亚祖先的机会,但是通常跨越这两个南亚祖先的南亚mtDNA匹配降低了得到答案的可能性在这种情况下)。 超过八代的机会 基因片段从祖先传给后代 是小. 戴安娜(Diana)的表亲比伊丽莎·科沃克(Eliza Kewark)落后七代,因此传承下来并不是完全不可行的。 但是威廉八岁时处于边界,他可能没有任何段(实际上,戴安娜可能没有任何段)。 当然,我确实注意到他们的mtDNA可能会被遗传,因为那没有机会。 您有母亲的mtDNA。 但是人们可以争论,核中不存在的mtDNA是否真的算作祖先。 我相信可遗传的材料是可遗传的材料。 假设血统是按照他们的记录记载的,我承认我们知道威廉有可能患有南亚mtDNA。 但我们最肯定不知道他是否有任何南亚常染色体DNA.

但是最后这有多重要? 人们将按自己的意愿去做。 但是,有一个重要方面需要注意: 这似乎是该公司的另一个实例 不列颠DNA 大肆宣传基因发现,以增加他们的形象。 您会看到他们网站的屏幕截图显示,他们正在宣传有关William祖先的故事,并且他们还声称他们正在提供世界上最先进的遗传祖先测试。 首先,我必须观察他们的 价格点 第二,如果他们要获得世界上最先进的测试,那么他们实际上应该与其他服务进行逐点比较,而他们似乎并没有这样做。

也许更重要的是,现在这件衣服 有一个 的历史 被抓 坦率地煽动炒作。 我不会为任何人的生计或财务上的成功感到遗憾, 但是科学家确实有一个隐含和显式的荣誉码。 吉姆·威尔逊(Jim Wilson)参与其中 在一些有趣的工作中,这是我从他那里认识的。 但是第三次​​将是一种趋势,如果威尔逊很快被认为是“小报遗传学家”,而不是将严肃科学推广到更广泛公众的学者,那也不要感到惊讶。

英国首相,1812年至1827年

附录: 对于美国读者,我应该明确指出,英国上层阶级和士绅具有印度血统并不奇怪,因为他们中有许多人与英国拉吉有渊源。 这本书 白色食尸鬼 探索这一时期和人们的细节。 对于某些细节,记得罗伯特·詹金斯(Robert Jenkins),后来的利物浦勋爵(Lord Liverpool)和 英国首相任职十年1817-1827年,按血统是印度的1/8。 英国女演员 尼科莱特·谢里丹(Nicollette Sheridan) 也是印度的1/8。 最后,我的朋友 丹·麦克阿瑟(Dan MacArthur) 由于与上述个人相同的历史情况,显然具有南亚血统。 这在英国可能相当于“美国原住民血统”。

 

所有样品的MDS

诺亚·罗森伯格(Noah Rosenberg)的实验室已经淘汰了所有微卫星论文的母亲, 人类微卫星变异的综合基因组数据集中的种群结构。 在我看来,这是过去十年来他实验室中运用微卫星标记进行的所有工作的顶点,这些标记应用了他们开发的各种奇特的分析技术(例如Procrustes转换)。 需要注意的最大事情是,人类样本数量接近6,000个,有600多个位点。 计划 微卫星 变异和发散非常快(变异率10-4 而不是10-8与SNP一样)600个基因座足以区分人群。 由于这种快速突变,我对他们尝试使用确定的较小人类集探索人与黑猩猩差异的尝试有点怀疑,尽管那可能只是原理上的证明(如果标记进化得太快,它们可能不会告诉您太多有关非常深的分歧的有益信息)。

点击放大

阅读本文很明显,仅合并样本是一项巨大的壮举。 而且不仅仅是样本量,他们的人口覆盖率也很高(267)。 正如迪涅克斯所观察到的 微卫星有些“复古”,但请尝试使用整个基因组甚至SNP进行此类种群覆盖。 您可以达到N> 5,000,但是使用SNP时,重叠标记会开始迅速下降,直至达到 远不及 比此数量的微卫星提供更多信息。 Dienekes非常喜欢左侧的树,并且我上传了其中的一个较大版本以供您欣赏(如果您的浏览器将其缩小,则只需放大即可)。

但是上面的树在某种程度上说明了这种分析的局限性。 与其进行分析,不如进行分析,它实际上是更有用的数据集,您必须对其进行切片和切块,然后在更细的粒度上进行探索。 将所有样本汇总在一起,将大大减少信息量和难以理解的程度。 在创建大型数据集的聚合中,这已经很明显了,因为他们必须修剪非常大的子种群,这样才不会使结果不堪重负。 即使那样,对于熟悉数据的人来说,显而易见的问题也会浮出水面,尽管对于那些肤浅的阅读者而言,问题可能并不清楚。 南亚人中的古吉拉特语数据集在二维可视化图中与所有其他人群分开。 这是经常发生的事情,因为看起来古吉拉特人是从非常特殊的种姓中取样的,这增加了该地区种族的感知亲和力。 同样,合并所有人口并在二维图上表示它们,更是一种审美宣言,而不是内容丰富的可视化。 您必须括号内的人口才能看到增值结构。 最后,即使是粗略的观察也需要谨慎进行。 罗森伯格的实验室近十年来一直在说明埃塞俄比亚遗传多样性的衰退。 这是一个经典的结果,显示在研究生水平的人口遗传学课程中。 但是人类学和 遗传基因 告诉我们,埃塞俄比亚人是撒哈拉以南非洲人的复合人口 欧亚亲和力。 可以期望大多数读者知道这一点,但是如果有些人只是简单地将一般情节作为面值并将其洞察力应用于所有人群,就好像他们确实受到一系列创始人的影响一样,我不会感到惊讶(我的观点是埃塞俄比亚人是由于向后迁徙而合成的产物,遗传多样性的下降说明了从非洲迁出的普遍迁徙的逆转)。

总的来说,我发现这篇有趣的论文为理解人类遗传变异的背景打下了基础。 我要提供的唯一的最后警告是,微卫星是基因组的非典型区域,它们以中性方式快速进化。 这使它们非常适合于查明人口差异并从有限的标记集推断历史。 但是我认为人们应该对特定的新颖结果持谨慎态度,当我们拥有高密度SNP数据时,不要将其视为权威。

请注意: 他们已经 发布数据。 如果读者想对这些数据做与本文不同的事情, 树混合 可以处理微卫星。 另外,向他们发布该道具的道具 创用CC.

引文: Pemberton,Trevor J.,Michael DeGiorgio和Noah A. Rosenberg。 “关于人类微卫星变异的全面基因组数据集中的人口结构。” G3:基因| 基因组| 遗传学3.5(2013):891-907。

 

弗朗西斯·高尔顿爵士

现代进化遗传学的起源源于20世纪初左右的一系列学术辩论。 威尔·普罗旺斯(Will Provines) 理论群体遗传学的起源,虽然是 弗朗西斯高尔顿 也会做得很好。 简而言之,发生的事情是,在此期间,查尔斯·达尔文的继承人之间就继承的性质发生了冲突(据我所知,达尔文留下了一个混乱的问题)。 一方面,你周围有一个年轻的小圈子 威廉·贝特森,是格里尔·孟德尔(Gregor Mendel)关于通过基因抽象实现离散和微粒继承的思想的拥护者。 反对他们的是查尔斯·达尔文表弟的助手 弗朗西斯高尔顿,由数学家领导 卡尔皮尔森和生物学家 沃尔特·韦尔登。 这所“生物学家”学校关注连续特征和达尔文渐进主义,可以说是定量遗传学的先驱。 他们对“加尔顿主义”观点的支持有些讽刺意味,因为高尔顿本人并非没有同情离散的继承模型的!

威廉·贝特森

最终,科学与真理胜出。 受过生物特征识别传统培训的年轻学者屡次叛逃到孟德尔阵营(例如 查尔斯·达文波特)。 最终,现代统计学和进化生物学的奠基人之一的RA Fisher在他的开创性论文中融合了这两种传统 孟德尔遗传假设的亲戚之间的相关性。 为什么孟德尔主义不会破坏经典的达尔文主义理论的直觉很简单(当然,某些最初的孟德尔主义者确实相信这是违反的!)。 许多对性状有中度到较小影响的离散基因可以通过 中心极限定理。 实际上,传统的遗传方法通常很难感知具有六个以上重要基因座的性状,而不仅仅是定量的和连续的(考虑色素沉着,我们通过基因组方法知道色素沉着在人群中会发生变化,这主要是由于六个隔离基因左右)。

注意这里 关于DNA我还没说一句话。 这是因为40年前,人们才知道DNA是遗传遗传的基础,科学家通过孟德尔过程对遗传的本质有了很好的了解。 从根本上说,该基因是一个抽象单元,是一种经过操作的分析元件,使我们可以清晰地跟踪和预测各代人的变异模式。 碰巧的是,该基因通过生物分子DNA的序列在物质上被实例化。 这个非常重要。 因为我们知道现代遗传学的物质基础,所以它是一门比经济学更基础的科学(经济学仍然陷入“生物时代”!)。

“后基因组时代”基于对DNA序列和结构形式的遗传学物质基础的工业规模分析。 但是,我们不应该将DNA,具体的基础与经典的孟德尔主义混为一谈。 对材料和混凝土的关注不仅限于遗传学。 在2000年代中期,认知神经科学功能磁共振成像研究风靡一时,被认为比经典的认知科学对“思维方式”的理解更具科学性和说服力。 由于严重的方法问题,在功能磁共振成像“科学”衰退之后,我们只能依靠不太性感的心理抽象,这些抽象可能不只是简单地归结为物质理解,而是具有提供信息的可赎回质量。 。

这使我进入了有关大规模队列中与教育相关的SNP的最新论文, 126,559人的GWAS识别与教育程度相关的遗传变异。 您还应该阅读随附的 常见问题。 最重要的是,作者令人信服地确定了三个SNP,以解释其庞大数据集中受教育程度变化的0.02%。 通过关联将所有SNP合并在一起,可以得到解释的〜2%的变异。 这并不特别令人惊讶。 几年前,这篇论文的一位作者写道 报道最多的具有一般智力的遗传协会可能是假阳性。 那些与 更长的记忆 在2000年代初期,人类遗传学领域的一位科学家曾警告过我这个问题。 2007年,越来越多精通统计的朋友开始警告我。那时我开始告诫那些认为基因组学会揭示导致智力正常变异的变异的人,因为似乎我们可能需要等待比实际更长的时间我曾预料到。 正如上述论文中所建议的那样,以前的工作强烈暗示了这一点。 智力的遗传结构是一种特征,其正常范围内性状的变异受种群中无数个影响较小的等位基因控制。 否则,经典的遗传技术可能已经能够更加确定地检测基因座的数量。 如果你读 人口遗传学 您会注意到,事实上,遗传学家确实使用经典的杂交技术和谱系来汇聚大约正确数量的基因座,以解释60年前欧洲和非洲色素沉着的差异!

我的朋友们 人们一直在争辩说,这里的小效应大小证实了这种观点,即智力差异主要是环境的影响。 这是一个复杂的问题,首先我想将讨论限制在发达的西方国家。 具有讽刺意味的是 智力是最重要的 遗传 其中最特权的。 遗传性是指基因控制的性状变异的组成部分。 当您消除环境变异(即剥夺)时,就会留下遗传变异。 在家庭内部,兄弟姐妹之间的智商差异很大。 相关性约为0.5。 还不错,但是还不算高。 当然,有些人可能会认为我现在要谈论双胞胎研究。 一点也不! 虽然与似乎喜欢从事渎职行为的科学记者相反 板岩的布莱恩·帕尔默(Brian Palmer) 似乎认为经典技术已在很大程度上得到了基因组学的验证,这是通过观察 无关的个人 已经确定了一些最有说服力的情报遗传力证据。 上述研究的主要作者之一也是上一个链接的作者,这并非巧合。 即使人们可以自信地认识到评估一个性状变异的具体物质位点的困难也没有矛盾。 推断 该协会。 DNA之前有遗传学。 即使没有特定的SNP,也具有遗传力。

另外,我想向变化的“环境”部分添加一个警告。 由于技术原因,该环境成分实际上可能包括相对固定的生物学变量。 我想到了基因与基因的相互作用或发展的随机性。 尽管很难或不可能从父母与后代的关系中进行预测,但它们并不像从贫困儿童的环境中去除铅那样简单。 我自己的猜想是,全兄弟姐妹之间智力的巨大差异告诉我们很多有关“环境”变异的难于控制和引导的性质。

最后,我想指出 即使是很小的效应位点也不是小事。 作者在常见问题解答中提到了这一点,但我想更清楚一点, 遗传效应小并不妨碍药物开发:

考虑一下胆固醇水平这样的特征。 已经对该特性进行了大规模的全基因组关联研究,识别出大量的基因座,效果不大。 这些基因座之一是HMGCR,其编码为 HMG-CoA还原酶,是胆固醇合成中的重要分子。 鉴定出的等位基因使胆固醇水平提高了0.1个标准差,这意味着基因检测基本上没有能力预测胆固醇水平。 按照《新闻周刊》的逻辑,任何针对HMGCR的药物都没有机会成为重磅炸弹。

任何医生都知道我要怎么做:目前世界上最畅销的药物之一是 他汀类药物抑制HMGCR(的基因产物)的活性。 当然,他汀类药物已经被发明出来,所以这是一个令人毛骨悚然的例子,但是我的猜测是,在整个全基因组关联研究数据中还有数十个这样的例子正在等待发现。 找出哪些GWAS命中目标有望成为药物目标,将需要时间,精力和很多运气。 我认为,这是Decode的主要课程(这并不是一个令人惊讶的课程)–药物开发真的很难

附录: 我的大多数朋友都具有生物学的本科背景,并且拥有一定的定量遗传学,似乎猜测智商的遗传力为0.0到0.20。 这太低了。 但是知道这一点甚至重要吗? 我碰巧认为,评估配偶的前景时,准确地了解遗传遗传可能很有用……。

引文: Rietveld,Cornelius A.等。 “ GWAS 126,559个人识别出与教育程度相关的遗传变异。” 科学(纽约,纽约)(2013)。

 

克里斯托弗·哥伦布

几年前 有一个小的争议 当一些进化的基因组学家报道说,他们通过重新组合保存在现代人群中很久以来保存下来的片段,重建了波多黎各已灭绝的塔伊诺人的基因组。 争议与以下事实有关:今天有些人声称自己是 泰诺,因此,他们不是绝种。 尽管该争议最终结束了,但这些方法仍然存在,并继续得到使用。 现在,一些带给您的人一起创造了一些工作,这些工作使用基因组学重建了加勒比海和内地的近期人口历史。 更好的是,它是完全开放的访问权限,因为它位于arXiv上, 重建加勒比地区的人口遗传史 (请参阅 Haldane's Sieve的评论 以及,由老小我开始。) 尽管作者汇集了各种数据集(例如,HapMap,POPRES,HGDP),但重点是上面地图中突出显示的人口。

结果中的许多新颖见解始于他们观察到的一个独特的“拉丁美洲”人口遗传集群,在加勒比海人口中与欧洲有着很强的亲和力。 这在他们的ADMIXTURE分析中清晰可见。 他们所做的是汇集各种人口,并运行一种方法,将每个人的祖先分解为K个祖先人口的组合。 如果合并的人口是清晰且截然不同的,则结果将是清晰而截然不同的。 例如,如果您有50个芬兰人和50个尼日利亚人并将其合并,并以K = 2运行ADMIXTURE,则SNP的数量很少(10,000个绰绰有余),所有芬兰人和尼日利亚人将分为两个不同的祖先这些人口根据这些基于模型的聚类。 但是,必须始终记住,尽管这些方法可以映射到现实中,并让我们对数据集内的变化有所了解, K本身是人工构造。 因此,例如,已知HGDP玛雅人种群具有不平凡的欧洲基因流。 如果您使用这种玛雅人作为“美国原住民”参考,那么您将低估混合人群中的原住民血统,因为您的参考原住民已经偏向欧洲人(如果您没有适当的选择,这显然是一个主要问题。参考,因为它已灭绝,例如与Taino一起灭绝)。

有了这些警告性的初步建议,这些结果又如何了? 如您所见,许多加勒比人口是各个大陆“父母”人口的直接组合。 这在K = 3时很明显,其中绿色=非洲,红色=欧洲,蓝色=本地(请注意,正如我所说,玛雅人具有一定的欧洲血统)。 通过查看种群内的个体差异,您已经可以获得有关混合物性质的一些见解。 在墨西哥,欧洲人与本地人的比例范围很广,尽管在此数据集中没有“纯粹”的人。 此外,整个人口中非洲血统的数量很少,但相对均匀。 尽管非洲人的意识不是现代墨西哥民族认同的主要内容,但非洲血统的人却是西班牙殖民事业的重要组成部分(请参见 帝国:西班牙如何成为世界强国,1492-1763年)。 在某些地区,例如韦拉克鲁斯(Veracruz),仍然有明显的非洲血统的人,但在墨西哥的许多地方,这些人已婚,其身体特征被稀释到看不见的地步。

加勒比海沿岸的局势更为复杂。 在这些情况下,被埋没的是土著而不是非洲的祖先。 基因组学已经“重新发现”了这一祖先,在某种程度上,许多学者此前一直怀疑现代波多黎各人和多米尼加人继承了塔伊诺人祖先的很大一部分的可能性。 在波多黎各和多米尼加共和国,有关的问题是非洲和欧洲血统的比例很大,其中古巴是这种现象的最极端例子。 特别是在古巴发生的事情是,从西班牙移民的浪潮较晚,因此一些现代白古巴人受掺混物的影响要比其他加勒比海地区少得多(请记住,直到1898年古巴还是西班牙的一部分)。 在海地,情况发生了逆转,在18世纪末和19世纪初的革命中有种族色彩,白人被驱逐(只剩下一小部分混血阶级)。

但是,事情真的变得有趣的是K = 8。 黑色成分是欧洲伊比利亚式元素,与拉丁美洲人(包括玛雅人)不同。 正如您在此PCA上看到的那样,拉丁裔元素与伊比利亚人口有关,因为他们从加勒比海人口中占据了欧洲部分,并利用它们来充实祖先的分布。 有几种解释方法。 二烯 他认为这可能只是几百年前伊比利亚原始人口的一个功能,与当代人口有所不同。 例如,与其他新世界表亲相比,当代西班牙人显然比其他> 1600的欧洲人更容易受到基因流的影响。 另一个可能性是,从西班牙的某个特定区域进行了极端采样,而这种采样是如何作为其自己的集群分解出来的。 例如,我知道有不成比例的移民来自安达卢西亚和Extramadura。 但是这里的模式并没有向我暗示这种可能性(黑点应该更偏南了,我想如果它们来自那两个省)。

相反,他们似乎赞成的解释是,由于瓶颈,该元素已偏离祖先群体。 这在人种学上是不可行的; 西班牙殖民实验的早期特征是 事实上的 一夫多妻制。 许多冒险家的生活与18世纪后期东印度公司的白人大公们的生活一样。 有人认为,这一普遍存在的普通法一夫多妻制时期已经影响了这样的事实,即传统上非婚生子女是非婚生子女。 在拉丁美洲非常普遍。 作者偏爱瓶颈模型的原因之一是,拉丁裔元素与伊比利亚元素之间的遗传距离相当高。 在漂移/瓶颈使等位基因频率特别迅速地偏离的情况下,这通常很常见。 不仅如此,在拉丁美洲的海洋中,这种趋势最为明显,与许多庞大而庞大的大陆特许经营权相比,许多拉美岛屿的后续移民相对较少。

23andMe祖先分解给1/4亚洲人的朋友

作者探索人口历史的另一种方式是查看 祖先的长度分布。 这是如何工作的很简单。 第一代杂种的每个亲代的祖先长度都不会中断,但随后的一代将开始发生碎片化,因为重组会通过后代将长的相同的长块分开。 您可以在左侧的图中看到这一点,由于减数分裂重组事件,我的一位亚洲祖父母的朋友在欧洲和亚洲血统之间交替出现。 从混合开始的时间越长,随着重组将长块切开并重组祖先成分,块将变得越来越小。 通过查看长度的分布和长度的混合,作者可以构建人口的人口历史。 简而言之,似乎许多欧洲血统都很快出现了,但很早就定居了。。 这与这一时期由于一夫多妻制所证实的欧洲男性的高生殖产量保持一致。

对非洲血统执行了相同的方法,作者发现了一个有趣的结果。 似乎在早期,大多数加勒比黑奴来自撒哈拉以南非洲的最西端,从塞内加尔河到现代加纳。 从贝宁湾(Benin Bight)到赤道(Equator),在较长的土地上后来显示出与东部人口的亲和力。 我不十分了解奴隶制的历史,无法证实或否认这一发现的现实,但它说明了基因组学与广泛的采样策略相结合的力量。 更相关的是,我怀疑基因组学的作用是将幅度分配给已知的动力学。

最后,作者还推断出加勒比海人口中本地混合物的各种关系。 他们证实了一些证据表明,从南到北迁移到中美洲和加勒比海地区,并且还证实了从现在到现在之间的特定的民族语言联系。 事实上的 灭绝的加勒比人口和南美洲大陆。 这些结果中的一些早已被提出,但是缺乏历史文献使得推论难以理解。 基因组学无法解决这些争论,但它们为我们提供了启示。

总体而言,这是一个有趣的研究,因为我认为这是对基因组学将要使用的历史人口统计问题的测试。 长期以来,许多生态学家和系统进化论者都拥有“遗传学作为工具”的思想流派,现在您将拥有一个“基因组学作为工具”,与许多其他领域的人们并肩而立。 加勒比和拉丁美洲的人口是垂头丧气的果实,因为西班牙和葡萄牙的殖民实验得到了充分的证明,并且来源人口非常不同(因此很容易从噪声中挑选出信号)。 但是,在同一时期,还有其他一些历史问题也很有趣。 在 阿尔比恩的种子 大卫·哈克特·费舍尔(David Hackett Fisher)描述了四种有助于美化这个国家文化的英裔美国人的风俗习惯。 这些, 20,000-1620年间,约有1640名清教徒抵达 并在700,000年成为约1970的祖先。尽管20,000并不是一个瓶颈(实际上,他们来自英格兰的不同地区),但我很好奇这些人是否仍然可以辨别为“ Old Americans”的一部分基因组数据。 这只是在不久的将来可以解决的众多可能问题之一。

: 的arXiv:1306.0558
 

引文: 电晕,埃里克等。 “在全球人类关系和移民背景下对疾病遗传基础的分析。” PLoS Genetics 9.5(2013):e1003447。

上图是从一篇论文中 公共科学遗传学, 全球人际关系和移民背景下疾病的遗传基础分析。 作者合成了人类基因组学的两个不同领域。 首先,有生物医学重点 全基因组关联研究 以及他们试图识别风险的方式 等位基因 对于某些疾病。 在某些情况下,这些风险等位基因非常 渗透剂,因为特定状态极有可能预测疾病表型。 但是在大多数情况下,由于2型糖尿病等高复杂性状的发生,收率升高或降低。 第二,进化基因组学领域试图重建系统进化史和种群遗传史,以便在适当的背景下构筑当代的变异模式。 在以下情况下,这是多么重要或令人感兴趣的是显而易见的 疟疾抗性基因。 由于平行的环境压力,在多个种群中已经产生了赋予抗性的等位基因。 这些种群之间的亲缘关系应该有助于您预测种群之间突变的相似性。 同时,人口遗传学理论可以为您提供关于 多种改编.

目的是为了加深对疾病发作性质的了解,并可能更有效地针对个人风险。 在图中的上方,您可以看到两种有趣的模式:2型糖尿病等位基因的风险与血统的关系以及与XNUMX型糖尿病等位基因的风险有关。 从头 突变或独立的选择性事件。 系统发育树代表了从HGDP中的> 600,0000个SNP推断出的真实关系 数据集。 风险等位基因是从文献中剔除的,并针对个人和人群进行了计算。 然后将实际人口风险与在这种特殊的系统树和正常的遗传随机漂移过程中可能发生的风险模型进行比较(请参阅 方法 有关血腥的细节!)。 您所看到的是系统发育关系(非洲人口转向更高的风险)和独立事件(皮马印第安人转向更高的风险),其中糖尿病的风险更高(红色转向)。

这种分析有各种各样的缺点。 作者受到研究中风险等位基因的限制,这肯定远没有彻底或详尽。 此外,在某些地区,他们的人口覆盖率很薄,导致在特定情况下甚至无法从其模型中榨取权力的能力也有所下降。 但让您大吃一惊的是,从高度多基因疾病(如2型糖尿病)中的风险等位基因推断出的模式甚至无法追踪您在现实世界中看到的情况。 许多南亚团体有 非常 2型糖尿病的高风险。 碰巧这些人群不在HGDP样本中。 实际上,有两位流行病学家提出了相当有见地的批评 在本文的评论中。 他们提出了许多在细节上浮现在脑海的要点。 但是他们以一种让我大吃一惊的方式结束了:

最后, 人们已经讨论了避免基于遗传风险对人群进行污名化的需要。不难想像基于该出版物的媒体公告“非洲人群中发现的糖尿病遗传风险”。 不久前,人们也对情报提出了类似的要求。 并非所有的猜测都是中立的。

碰巧的是,我来自代谢疾病风险很高的人群。 我不知道是否对这个事实感到羞耻,但我很高兴医疗专业人员开始意识到差异风险,并超越了对人的健康的粗略一统天下的理解。 由于我们分配脂肪的方式(针对相同的风险状况,我们必须更瘦一些,才能为美国人提供的BMI值对南亚人而言不太合适)。 再说一次,我不知道这是否有污名化, 但这是真实的。

因此,尽管我对以上论文中的方法存在真正的担忧, 我相信这些分析是更广泛答案的重要组成部分。 我们现在生活在抗生素革命和对细菌理论的理解时代。 这些是公共卫生投资的巨大回报。 在短期内,人类健康和预期寿命的增长将通过增加而处于边缘。 尽管我一直怀有各种怀疑态度,但最初都试图弄清人口历史与疾病之间的关系,但必须从某个地方开始。

引文: 电晕,埃里克,等。 “在全球人类关系和移民背景下对疾病遗传基础的分析。” PLoS遗传学9.5(2013):e1003447

 

信用: 阿尔博扎格罗斯


西藏的遗传学和历史吸引了许多人。 老实说,这里的主要原因是海拔。 青藏高原一直是生物和文化适应极端条件的人口的堡垒。 自然地,这意味着藏族有大量的人口遗传学,因为低氧是高海拔生活的副作用,这极大地影响了健身。 我有 讨论 文件 在这个主题 before。 考虑到在ASHG 2012上的传闻,我将来可能会更多地谈论它。

但是要了解自然选择对种群的影响的特征,牢记系统发育背景通常非常重要。 我的意思是说,进化过程发生在历史上,而那些历史事件决定了现象随后的过程。 具体而言,要了解西藏人如何适应高海拔地区,就必须了解他们与谁有关系,以及他们的长期历史是什么。 里面有纸 分子生物学与进化 试图做到这一点, 青藏高原现代人类的旧石器时代殖民和新石器时代扩展的遗传证据:

藏族生活在世界上最高的高原上,他们目前的人口规模接近5万,其中大多数生活在3,500米以上的海拔高度。 因此,青藏高原是人类历史文化和生物学研究的重要领域。 然而,青藏高原殖民化的时间顺序仍然是人类史前尚未解决的问题。 为了重现青藏高原现代人类的史前殖民时期和人口统计历史, 我们系统地从青藏高原整个地区的6,109个地理种群中采样了41名藏族个体,并分析了父系(n = 2,354)和母系(n = 6,109)谱系以及全基因组SNP标记(n = 50)在藏族人群中。 我们发现,现代人类进入青藏高原有两种截然不同的主要史前迁徙。 第一次迁徙以约30,000万年前的古代藏族遗传特征为标志,这表明现代人类对青藏高原的最初人为发生在旧石器时代而不是新石器时代。 我们还发现了藏人和汉族人之间相对年轻(仅7万至10岁)共享Y染色体和线粒体DNA单倍型的证据,这表明在新石器时代初期出现了第二次移民潮。 总体而言,遗传数据表明,自上古石器时代初期青藏高原最初定殖,最后冰川期结束之前,西藏人已经适应了高原环境,随后人口迅速膨胀,同时建立了农业和牛。新石器时代早期高原上的牧民主义。

我认为需要强调的两个主要重点是:

1)大量的mtDNA样本量和较小程度的Y染色体线性

2)西藏人是到达高原超过10,000年的农民的复合体,而狩猎采集者的历史可追溯至旧石器时代

引文: 蔡晓云等。 “人类在Y染色体揭示的最后一次冰河极大期期间通过瓶颈从东南亚迁移到东亚。” PloS one 6.8(2011):e24282。

这篇论文有很多困扰我的问题。 我认为这是对他们论文的最广泛的解释,但是在细节上,我比起初时更加怀疑,困惑和好奇。 另外,我还要补充一点,我与在ASHG 2012上发表过这篇论文的海报的人进行了交谈,尽管我不知道他们是否是作者。 他们看起来不错,但也不一定完全专注于他们正在探索的问题,而不是获得大量样本并对其应用标准方法。 说到这,跳出来的第一件事就是他们的样本偏向今天的西藏自治区。 但是从历史上看,藏族一直居住到四川。 仅有50%的藏族人居住在自治区,但他们的样本中有90%以上来自这一地区。 就探索适应海拔高度而言,这很好,但是我想,如果您要进行系统地理学,则需要更好的地理覆盖范围。

但这只是一个未成年人。 本文的大部分内容由Y和mtDNA单体组的洗衣清单以及合并时间组成。 一些结果对我很有说服力。 有一些Y谱系表现出“星状”系统发育,通常意味着最近种群的快速增长。 作者使用其他方法推断,在引进农业超过10,000年前,人口确实在增加。 出于先前的理由,没有充分的理由对此发现表示怀疑。 尽管如此,进行钻探仍会造成很大的混乱,而且我不确定合并时间和系统发育实际上是否意味着作者所认为的意思。

例如,这是本文介绍的一种标准分析方法:

我们确定了新石器时代早期在父系(Y染色体D3a-P47和O3a3c1-M117)和母系(M9a1a和M9a1b1)(10-7 kya)谱系中最近种群扩展的分子特征(表1)。 对藏族和汉族之间的单倍型共享和分歧时间的详细分析表明,高原上的新石器时代人口的增长很可能是由于最早的新石器时代汉族农业人员的散布导致了大约10 kya在现在的中国西北地区。

O3a3c1-M117的出现频率约为30%,并且与中文(如上所示)相关。 这与其他最近的研究相吻合,这意味着藏人和中国人之间是相对较近的共同祖先。 通过混合种群将为您提供两个极端之间的平均结果,可以将此结果与旧石器时代根的存在相协调。 我的问题是,我怀疑汉人存在于10,000年前,就像我怀疑希腊人存在于10,000年前一样。

引文: 蔡晓云等。 “人类在Y染色体揭示的最后一次冰河极大期期间通过瓶颈从东南亚迁移到东亚。” PloS one 6.8(2011):e24282。

快速 文献检索 得出这样的事实,即M117是模态的,特别是居住在中国南部和东南亚北部的非汉族。 我不是在这里建议苗族向藏人介绍M117。 相反,我建议我们最好谨慎一点,前提是在给定地区有任何书面记录之前,我们已经知道遗传单倍群的种族分布有6,500年。! 对我来说,有一个推定的事实 汉藏语 一组语言强烈地表明了> 10,000年的多样化,而不是大约10,000年前的汉族存在。 历史记录很清楚,大约3,000年前的长江(现在是华北和华南之间的非正式分界线)是汉族在人口统计学上占主导地位的区域的边界。 即便如此,在华北平原上显然仍然有“野蛮人”的腰包! 正如我们所理解的那样,大约10,000年BP的农业扩张是汉人,这根本不符合基本合理性的考验。 东北亚的汉族在人口和文化上占主导地位是近3,000年的现象,可能是最慷慨的4,000年(华南在后汉王朝灭亡后大约在公元200年左右,尤其是唐朝时期被中国化) 600-950 AD)。

由于这些不合时宜的假设以及当代单倍频率的偶然推断又回到了古代的地理人口分布,因此很多争论都是令人发指的。 古代DNA突显了这种危险在欧洲的存在,这应该更新我们这种分析的稳健性的先验。 例如,作者对Y染色体谱系缺乏结构以及它们在西藏各地的深度聚结时间感到好奇。 为什么这是一个问题? 因为如果这些Y染色体世系是旧石器时代的,那么分支上的深层会聚也应对应于地理差异。 但是他们没有。 对我来说,最简单的解释是,过去一万年来,人口大量流动。随着农业的开放,青藏高原地区的人口急剧分化。 尽管从现有的分布推断出古代的地理联系,但这却带来了一个问题,因为它打开了迁徙的可能性,并带来了巨大的遗传人口变化。

总的来说,我会说这篇文章很有趣并且很有用,但是您应该仔细阅读它,不要太在意作者的推论。 这些推论基于可能基于错误基础的假设。

附录: 而且,如文中所述,PCA图上的“空白”并不一定意味着长期孤立。 这可能仅仅是由于采样不足造成的。 看上面。 有许多这样的不受支持的断言。 但是,我想补充一点,作者在拉萨市内发现了大量“异国”单倍群,这与我们对西藏文化历史的了解相吻合。 实际上,藏传佛教受南亚(尤其是孟加拉)佛教绝种的影响,而不是中国佛教的影响。 尽管喜马拉雅边界的人口激增似乎是从高地到低地,但也有例外。 这些例外往往在拉萨发现。

引文: 蔡晓云等。 “人类在Y染色体揭示的最后一次冰河极大期期间通过瓶颈从东南亚迁移到东亚。” PloS one 6.8(2011):e24282。

 

拜占庭皇帝里奥(Leo)与儿子君士坦丁四世(Constantine IV)一起“占领了卡扎尔(Khazar)”。 信用: 克氏菌属


在过去的一年左右的时间里,我一直在质疑我对伊兰·埃拉伊克(Eran Elhaik)关于欧洲犹太人的遗传特征的预印本的看法。 坦率地说,我发现其中一些结论有些奇怪,但是我认为事情会被清理以供发表。 好吧,已经有一段时间了: 犹太欧洲祖先的缺失环节:对比莱茵兰和哈萨克人的假说。 但一些 报告 in 犹太日报 使提交人及其批评者备受关注。 原因是,从作者的名字可以看出,作者对Ashkenazi犹太人的Khazarian起源模型持立场(赞成)。 这是一个非遗传接管 地流,我基本上同意其主旨。

无论如何,仍然存在许多纸张问题。 真的,一切都在这里开始和结束:

替代人群的选择

根据先前的研究(Levy-Coffman 2005; Kopelman等人2009; Atzmon等人2010; Behar等人2010),由于古老的犹太人和卡扎尔人被打败,而他们的遗骸尚未被排序,当代中东部和高加索地区的人口被用来替代。 巴勒斯坦人被认为是原始犹太人,因为他们被假定与犹太人有着相似的语言,种族和地理背景,并被证明与欧洲犹太人有着相同的血统(Bonne´-Tamir和Adam 1992; Nebel等人,2000; Atzmon等人,2010; Behar等人,2010)。 同样,高加索格鲁吉亚人和亚美尼亚人也被认为是原始哈萨克人,因为他们被认为与哈扎尔人来自同一遗传群体(Polak 1951; Dvornik 1962; Brook 2006)。

Elhaik的方法和数据集都是合法的。 但是这场比赛的结果已经由于他如何定义游戏规则而被放弃了。 有合理的理由认为 与现代巴勒斯坦人相比,现代亚美尼亚人与罗马上古的犹太人甚至波斯时代的希伯来人之间的遗传关系可能更紧密。 主要的两个是现代巴勒斯坦人具有非洲血统,以及后伊斯兰阿拉伯血统。 两者似乎都不是琐碎的。

有关更多旧帖子, Ashkenazi犹太人可能不是卡扎尔人的后裔, 会做。

引文: 埃尔海克,伊兰。 “犹太欧洲祖先的缺失环节:对比莱茵兰和哈萨克人的假说。” 基因组生物学与进化5.1(2013):61-74。

 

信用: 坎贝尔(Campbell),卡塔琳娜(Catarina D.)和埃文·埃希勒(Evan E.Eichler)。 “人类种系突变的特性和发生率。” 遗传学趋势(2013年)。

我们生活在一个伟大的时代。直到最近,人口遗传学中的关键参数(例如突变率)仍必须被推断和假定,尽管它们是进行更复杂推断的基础。 现在,对于人类(人类仅仅是个开始!),我们推断出的大部分内容都将以更直接的方式进行评估。 卡特琳娜·坎贝尔(Caterina Campbell)和埃文·艾希勒(Even Eichler)在 遗传学趋势 它将对目前的领域进行调查, 人类种系突变的特性和发生率。 请注意,使用血统书分析低位10的突变率有一个粗略的收敛-8 范围。 另外,似乎确实有不成比例的新突变通过精子通过父系传承。 这应该会增加我们对年长父亲的适度担忧(这在片中重申了一些警告)。 最后,作者认为这些结果是 地板 对于突变率,部分是由于与推断出的“进化率”更高的长期冲突。 这很重要,因为要推断谱系之间的最后一个共同祖先,突变率的值显然很关键。


对我而言,显而易见的“杀手级应用”源自对突变的理解 根据血统的增加对血统进行分析 从头 突变。 理论上讲,有了整个系谱的准确而准确的覆盖,您就可以对一组胚胎进行植入前的筛选,并准确选择您从祖父母代中获得的突变分数最低的那些。 这不是火箭科学,而是简单的比较和计数。 自发性流产率约为50%,为人类许多可行的后代可以携带的突变设定了下限(大多数非整倍体被中止),但似乎我们可以将下限设定得更高。

 
• 类别: 科学 •标签: 进化, 进化遗传学, 人类遗传学, 突变 

因为 安吉丽娜·朱莉(Angelina Jolie)的 启示 无数的遗传学 案件再次成为新闻。 如果你不知道我在说什么, 查一下。 由于拥有这项专利,Myriad可以为测试收取数千美元的费用,否则它会便宜很多(而且如果没有健康保险,很多人都无法接受)。 我的问题很简单: 如果您是遗传学家,您认为Myriad的职位是否有效? 我问的原因是,我认识许多遗传学家,并且我知道许多遗传学家都读过我,而且我在Twitter上关注了许多遗传学家,但是我从未见过有人愿意捍卫Myriad的合理性并通过气味测试。 如果您是这些遗传学家之一,请发表评论,因为我实在很好奇。

我参加了关于ASHG的无数案件的讨论,我必须说这全是法律,没有科学。 科学是令人困惑和可笑的。 小组成员本人翻了个白眼,并对审理此案的法官的乱七八糟的表达表示辞职。 有一个经典的“两种文化”问题。

 

不要忘记意大利的深层建筑!
信用: 丽塔·莫尔纳(Rita Molnar)

我没有太多时间写博客的标准道歉,但我认为最重要的是我至少要注意 彼得·拉尔夫(Peter Ralph)博士和格雷厄姆·库普(Graham Coop)博士的 关于按血统划分的人群和欧洲人口和历史的论文以其最终形式出版于 公共科学图书馆生物学, 欧洲最近遗传祖先的地理。 大约一年以来,我已经熟悉这些结果的概述,并且坦率地说 我还在消化它们。 媒体的炒作会来来去去,带有“所有欧洲人都相关”的真实标题,但在某种程度上却是琐碎的标题,但是对人群的相关性进行这类遗传研究的后果将持续很长时间。 至少他们应该是。

但是在我继续讨论之前,如果您发现论文本身有点令人生畏(尽管文本的主体使我对某些统计遗传学具有极高的可读性),请参见 卡尔·齐默(Carl Zimmer) 缩合。 有了这样的结果,可能会造成混淆,因此请注意,格雷厄姆·库普(Graham Coop)一直在卡尔的博客上(以及其他地方)发表评论,您可以随时向他发送关于 Twitter)。 此外,他的可读性很强 常见问题 出去。 Coop博士在Twitter上告诉我,明天甚至还会有更新! 我特别注意到本文的一个方面是,在许多民族中,任何两个人之间相对最短但可检测到的区段(〜10 cM)不会成为近期家谱相似性的证据,而是更深的历史过程。

至于我之前对本文的暗示: 罗马帝国的每一个对人口统计学和社会问题感兴趣的历史学家都需要阅读这类著作。 原因是来自意大利的特定结果,该结果似乎显示出许多深厚的当地人口结构。 这与相对同质的其他欧洲国家形成鲜明对比,就斯拉夫民族而言,这些国家具有国际性。 尽管对意大利人进行了数十年的遗传工作(由于LL Cavalli-Sforza),但这是第一部凸显这种相对于其他欧洲人的特殊性的工作。 这是因为正如Ralph&Coop所指出的,其他遗传分化措施(例如,利用厚密度SNP芯片的PCA)往往会吸收更深的历史和史前事件。 相比之下,Ralph&Coop专注于从共同祖先作为一个单元继承的基因组片段,其可检测的完整性通过重组在整个世代中迅速衰减。 尽管这种专注于继承段的技术功能强大,但它的时间深度也很浅。

我将在作者关于意大利的讨论中引用作者的话:

除了意大利人彼此之间以及与其他欧洲人共有的极少数遗传共同祖先之外,我们还发现意大利内部存在着重要的现代子结构(即图2),该子结构早于大多数共同祖先,并估计了大多数共同祖先。意大利和其他人口之间的共同祖先已有大约2,300年的历史(图S16)。 还记得大多数人口在与意大利人共享的街区数量方面没有显示子结构,这意味着其他人口与意大利共享的共同祖先早于这些其他人口中的划分。 这表明意大利境内存在大量的旧下层建筑,人口众多,其强大程度足以使意大利境内的不同群体与其他不同的现代国家所拥有的近代血统几乎一样, 在迁移期间未均质化的子结构。 这些模式也可能部分反映 意大利境内的地理隔离以及来自不同来源的意大利定居的悠久历史。

后者的想法是经典的,意大利人在罗马时期被移民取代,特别是从东地中海。 关于在诸如罗马之类的地方希腊名字泛滥的文字和文字证据被证明支持此案。 我对这些数据持怀疑态度,因为奴隶和城市无产阶级的古代生育率通常很低,而城市无论如何都可能是人口沉没的地方。 相反,我怀疑东方对现代意大利人遗传的主要影响来自希腊殖民时期。 麦格纳·格拉西亚(Magna Graecia),因为尽管他们的文明以城市为中心,但希腊人的确从事农业。

相反, 我倾向于意大利是 自成一格 罗马沦陷后在欧洲大陆,尽管人口回归,但由于人口密度高,它保持了当地的地区特色。 家谱在其他后罗马地区(伊比利亚,法国和英国)的广大范围内的广泛融合可能反映了社会的瓦解,人口崩溃和局部干扰。 这种假设的真正检验是这些方法何时扩展到世界其他地区,尤其是地中海南部。 埃及和黎凡特应该表现出更多的意大利风格,因为在这些地区没有古代的深层破裂。

关于本文还有更多要说的。 但是我觉得这是来自意大利的结果,拇指酸痛伸出来,值得引起注意。 Ralph&Coop建议需要与人类学家和历史学家合作。 的确如此。

引文: 拉尔夫·P(Ralph P),合作社G(合作社G)(2013)欧洲最近的遗传祖先地理。 PLoS Biol 11(5):e1001555。 doi:10.1371 / journal.pbio.1001555

 

信用: USDA

几年前,我相当专心于产妇的胎儿健康问题。 我特别担心 妊娠糖尿病 与我的妻子有关,因为我来自一个种族群体,在这类问题中的风险较高,而您在混血婚姻中的影响似乎 加成 (即,与怀孕相关的某些危险因素不同,母亲的种族并不是唯一相关的变量)。 这是嵌入在 更广泛的代谢疾病 表现出种族差异。 早期的 致力于全基因组选择 在人类中产生的结果是,与代谢相关的基因组区域内适应信号的富集程度很高,因此这并不令人惊讶。 人类是一个地理上分散的物种,居住在各种各样的环境中,因此,如果进化是一个重要的历史过程,那么自然选择将影响人口中表型的分布。

上个月的一篇论文 遗传学趋势 更加准确地强调了自然选择在特定情况下如何在生活史环境中起作用。 死亡有多种方式,一种到达方式:选择在怀孕期间的行为方式:

在考虑影响人类进化的选择性力量时,不应低估怀孕对健康的重要性。 尽管特定的死亡率因素可能只会影响一部分人口, 出生是所有个人都必须经过的渠道。 人类怀孕对母亲提出了特殊的精力,身体和免疫学要求,以适应胎儿的需求,这使妇女在这段时间中更容易受到伤害。 在这里,我们研究了孕妇的新陈代谢失衡,传染病,缺氧和营养水平如何对妇女及其未出生的后代施加选择性压力。 下一代测序正在揭示众多正在选择的候选基因,这为进一步研究选择与妊娠之间的关系提供了机会。 考虑到要了解人类最近对世界各地独特饮食和环境的适应能力,这种关系很重要。


如果摘要不清楚,则逻辑非常简单。 从进化的意义上说,在生命的早期提高适应性的适应比在生命的后期提高适应性的适应要有益得多。 看起来像是后期改编, 绝经实际上,通常将其解释为女性可以通过这种方式来提高女儿后代的身体素质。 换句话说,尽管该机制表现得很晚,但进化 目标 仍然是年轻的个体。

信用: 汉密尔顿1966

左图,从 1966年WD Hamilton的论文,说明了 生殖价值 在一生中(曲线基于台湾数据,在这种情况下假设人口恒定)。 高峰在〜20,然后在50岁左右下降到大约零。因此,对于女性而言,生命的后半期是我们标记为更年期的生理变化发生的时间,这并不奇怪,因为女性会舍弃低下的直接生殖通过补充女儿的资源间接增加后代的适应能力的价值。

遗传学趋势 论文的作者集中于妊娠糖尿病(GDM),先兆子痫(妊娠高血压),神经管缺陷,缺氧和各种传染病。 当谈到由于叶酸缺乏(以及相反的维生素D缺乏)引起的神经管缺陷时,这项工作似乎是对 妮娜·雅布隆基(Nina Jablonksi) 肤色变化的起源模型。 海拔高度适应问题可能是最直接的情况,因为低氧无疑会导致更高的胎儿和产妇死亡率。 正如作者所指出的,关于传染病 令人惊讶的是,很少有关于流行病(例如流感)影响的深入研究。 在这个地区,经历了成千上万的“大众社会”和农业的人口已有数年之久,这在本质上可能与那些曾经是猎人采集者的地区有很大不同。

妊娠糖尿病和先兆子痫是我特别感兴趣的疾病。 下表列出了这种情况的大致轮廓:

作者指出,“日本人饮食中对盐不敏感的现象很普遍:摄入盐量最多(20.6克/天)的妇女比摄入盐最少的妇女(8克/天)没有更多的高血压……相比之下,世界卫生组织建议成人每日盐摄入量少于5克。” 在我看来,这确实是一个重要的数据,考虑到我们社会中关于 盐的消费水平。 如果您来自遗传背景,可以降低高血压的风险,那么由于粗暴的指导方针对您自己的先验者视而不见,因此减少食盐可能会使您失去很多用途。

关于妊娠糖尿病的统计数据,这个数字相当明显。 从对英国样本的研究中可以看出,特别是孟加拉国比其他南亚人似乎更有可能患上新陈代谢疾病。 这里的问题是原因是直接的经典意义上的遗传,还是风险增加是表观遗传学,环境和常规遗传学的复杂结合。 让我在这里请作者发言:

相比之下,在纽约市队列中,中南亚地区的GDM发生率更高(14.3%),孟加拉国最高,为21.2%[19]。 传统上,孟加拉国人食用大量鱼类,这是一种低血糖食品。 大米,由于很少的加工而具有中等的血糖指数; 最后,在非裔美国人中,GDM的发生率为36%,处于中等水平……这与他们的混合血统以及西非人口(大多数美国非裔美国人的血统)的混合消费相一致。美国人

首先, 我在数据中没有看到太多证据表明,非洲裔美国人有很多血统可以从食用牛奶的人群(例如富拉尼)中获得。 因此,我不知道为什么在文本中引入了这一点(那里有大量的非裔美国人数据集)。 非裔美国人的非欧洲血统似乎来自沿海的农业学家,从塞内加尔到尼日利亚的约鲁巴土地,遍布整个领土。 第二,作为 由亨利·哈彭丁(Henry Harpending)建议 在推断出南亚人患有代谢性疾病之前,在进化的时间尺度上,他们接触的精制淀粉一定不如北欧人那么多,因此需要更多研究人类粮食生产的人类学家的投入。 直到大约5,000年前,农业才进入斯堪的纳维亚半岛,所以似乎无法推测整个大约10,000年的中东起源农业形成了北欧基因组(除非北欧人大多来自那些原始的中东人,这似乎不太可能)。 其次,孟加拉大部分地区的广泛种植是相对较新的(过去约3,000年), 但遗传学清楚地表明,大多数变化不是由于狩猎采集者采用农业,而是由于农民从西方迁徙 (尽管某些遗传学暗示东方人口具有非同寻常的混合;但这是带来稻米的那些)。 到那时,南亚可能没有专职的狩猎采集者,这与同样从事园艺的刀耕火种的人群相反。

事实是,南亚人比非裔美国人患糖尿病的几率更高,这向我表明,这不是农业采用和谷物加工程度的简单说法(西非农业的强度往往较低,饮食和营养成分比南亚谷物协会更多样化)。 如果要坚持一种标准的遗传学说法,那么代谢性疾病可能是一种更加令人困惑的副作用,与食品生产没有直接关系。 或者,可能是时候看看环境的协变量了。 与东亚美食不同,南亚的烹饪传统确实提供了相当丰富的甜点。 在近现代时期,这将是罕见的享受,但是今天的消费水平却更高。 由于我对南亚人的代谢疾病的意识,当我看到同族人食用精制糖的食物时,我会感到不高兴(在我在西方或发达国家进行的任何调查中,南亚人的肥胖症都比东亚人多非西方社会,例如新加坡)。 归根结底,我对南亚人聚集狩猎者(例如澳大利亚原住民也有类似问题)的想法深表怀疑,这是由于农业的后期采用或缺乏加工(碾磨)的多样化饮食。

相关新闻: 卡尔·齐默 也谈到了这篇论文。 像往常一样出色。

 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”