髓: 自然选择是一种快速而肮脏的操作员。 当受到新环境的影响时,它会迅速做出反应,带来好与坏。 成功适应的关键不是完美,而是要比其他选择更好。 这可能意味着许多当代疾病是过去进化遗传妥协的副作用。
上图是从 最近的一篇文章 刚出来的 分子生物学与进化, 克罗恩病和IBD5的遗传搭便车。 您可能听说过 克罗恩病 以前,有成千上万的美国人为此受苦。 这是一个 炎症性肠病,甚至对非常年轻的人来说也可能使人衰弱。 患病率也 人口差异很大。 为什么? 它可能是环境中的某种事物(例如,不同的饮食)或遗传易感性,或者是某种组合。 上图旨在说明的是克罗恩氏病与农业生活方式的扩大之间的相关性。
但不要过分兴奋 古人! 这个故事有很多动人的部分,我需要重新开始。 您从父母那里继承的成千上万个基因被嵌入基因组中,并在一组序列中排列,一个接一个。 一方面,出于概念化进化动力学(例如自然选择或随机遗传漂移)的目的,将重点放在单个基因上是有用的。 它有能力说明一些基本原理和基本原理。 但是有时您需要采取更概要的观点,并在更广泛的背景下研究基因。 在这篇文章中,我将避免分子或统计学 上位性,基因与基因的相互作用。 相反,让我们只考虑基因组的静态情况,其中基因是物理具体实体,它们以特定的空间关系嵌入到其他基因中,位于遗传密码的上游或下游。 这些基因的物理或统计关联可以通过连锁形成事实上的超基因,并且它们的变体结合形成 单倍型,跨小段基因组的标记序列。 但是请记住,这些关联是由 基因重组,它将物理序列撕裂并播种到相反的DNA链上。
这就是我们 认为 发生了在目前的5到10万年前之间,有一个人携带了一个显性的基因突变,这种突变允许乳糖酶持续产生直至成年。 乳糖耐受性仅需要一个拷贝的乳糖酶持续等位基因。 这就是为什么像丹麦这样的持久性等位基因以80-90%的比例存在的人群具有普遍耐受性的原因。 根据 哈迪-温伯格平衡 隐性性状的表达频率为1-4%(次要等位基因的频率的平方)。 回到具有突变体拷贝的个体,如果人们认为乳糖酶持久性将是非常有益的(这不难想象),那么该突变体的频率将迅速上升。 它会“扫荡”整个人口。 因为它具有主要的表达方式,所以原始突变体的一半孩子会表达该性状并携带等位基因,而另一半则不会。 在几代人中,由于积极的选择和通婚,一个原始副本可以在种群中快速复制。
但是,不仅是功能相关的遗传变异会扩散。 乳糖酶持久性等位基因将嵌入其所在的DNA链序列中的许多其他遗传变异体中。 随着乳糖酶持续性等位基因频率的快速上升 选择性扫描 它的邻居会 搭便车 沿着。 搭便车的程度取决于与肯定选择的变式的距离和扫掠的速度,而扫掠的速度本身可能取决于选择的强度。 所有这些共同解释了很长的单倍型 LCT 在北欧人中: 5至10万年前,携带乳糖酶持续等位基因的个体的相对较大的基因组片段由于适应新条件而非常迅速地提高了频率。 在某些北欧人群中,特定个体的功能相关变异不仅是选择的目标,几乎席卷了固定对象,而且许多邻近变异的频率也随与聚焦变异的距离成正比而增加。 换句话说,在这种情况下,自然选择大约是其中的一个特定功能单元 LCT,但副作用是,它也重组了北欧人整个人口基因组结构的整个范围。
这与克罗恩病和农业有什么关系? 克罗恩氏病可能是 LCT 从基因组的角度讲故事,而这种改变的触发因素可能是农业。 在继续之前,请允许我发布论文摘要:
IBD5(炎症性肠病5)是250号染色体上的5 kb单倍型,与欧洲人患克罗恩氏病的风险增加有关。 OCTN1基因位于IBD5的中央,编码抗氧化剂麦角硫氨酸(ET)的转运蛋白。 OCTN503的1F变体与IBD5密切相关,是一种功能增强突变,可增加ET的吸收。 尽管503F被认为是可能导致IBD5克罗恩氏病易感性的变异体,但除统计学上的关联外,几乎没有证据支持它在疾病因果关系中的作用。 我们假设503F是欧洲人最近才适应的一个高频率流行病,而IBD5上的疾病关联不是由IRF503或IL1基因中的5F本身引起的,而是由一个或多个附近的搭便车变异引起的。 为了测试最近在503F等位基因上出现阳性选择的证据,我们采用了iHS统计数据,该统计数据在欧洲人口中很重要。为了评估疾病变异搭便车的假说,我们对高密度微阵列数据进行了单倍型相关性测试。 1868年克罗恩病病例和5550个对照的样本。 我们发现在OCTN503和IRF1或IL1之间具有重组断裂点的5F单倍型与疾病无关...相反,我们观察到这三个基因之间没有重组的503F单倍型与强疾病关联... -导致IRF1或IL5发生突变。 为了进一步评估这些候选疾病基因,我们从健康个体和克罗恩氏病患者的下消化道活检组织中获得了表达数据。 我们观察到克罗恩病患者中IRF72的基因表达增加了1%(p = 0.0006),而OCTN1的表达没有显着差异……。
都是一口但是,让我们在这里回顾一下。 IBD5是250千碱基单倍型,与克罗恩病有关。 很大一部分相关的标志物似乎也与患病个体相关。 这并不意味着整个部分与克罗恩病有因果关系。 但是,有两个基因被列为可能的候选基因, IRF1 和 IL5。 最后,还有另一个基因, OCTN1在统计学上与克罗恩氏病相关,但缺乏生物学上的合理联系。 相反,它似乎对氨基酸的吸收有作用 麦角硫因,与的503F等位基因 OCTN1 导致在此过程中获得功能。 有趣的是,作者观察到 OCTN1 恰好位于单倍型的中间。 换句话说,您可以想到基因组上游和下游的基因组 OCTN1 作为该基因的两个翅膀或边缘延伸穿过单倍型。
IBD5单倍型是更广阔的领域。 IRF1, IL5及 OCTN1 是嵌入在此景观中的一般功能。 503F是一个特殊功能,因为它具有 OCTN1。 克罗恩氏病是另一种现象,与这种基因组状况有关,但属于不同的类别或类别。 它尤其与具有5F等位基因的IBD503单倍型相关。 本文的主要目的是逗弄所有这些众多的关联。 作者发现,就生物化学而言,克罗恩氏病的症状与503F等位基因无关,只要该等位基因与已知的CRF风险变异无关。 IRF1 和 IL5。 在这些情况下,基因重组破坏了将503F与这两个基因的风险等位基因结合的关联。 这样,在这种情况下,基因组景观的架构就掩盖了更具体的因果链,从而导致克罗恩氏病的风险增加。
所以发生了什么事? 作者认为503F等位基因在过去的某个时候被选择性地偏爱,而侧翼是克罗恩病风险升高的Crohn变体。 IRF1 和 IL5。 万物平等,最好不要患此病,但万物不平等。 如果对目标503F施加足够强大的选择压力,那么将其作为带有一些有害等位基因的“总包装”的事实的负面影响就无关紧要了。 在足够长的进化时间内,有害的等位基因将通过负选择进行纯化,因为重组确实会破坏关联, 但是有很多现实,包括在起点和终点之间。
为了推断503F是自然选择的目标,作者使用了基于单倍型的测试来检测这种现象, 卫生系统。 该测试倾向于检测中游的选择性扫频,或者由于平衡动态而不会转移到注视的扫频。 这暗示着作为选择目标的等位基因充其量往往趋于适度的频率,事实就是如此。 以下是补充资料,列出了具有所选等位基因百分比的人群列表(某些重复项是因为他们采样了不同的数据集):
菌群数 | N = 503f个等位基因 | N = 503L等位基因 | 503f的百分比 |
撒丁岛 | 40 | 16 | 71% |
托斯卡纳 | 9 | 7 | 56% |
图尔库 | 11 | 9 | 55% |
巴斯克 | 23 | 23 | 50% |
阿迪吉 | 15 | 17 | 47% |
奥卡迪亚人 | 15 | 17 | 47% |
意大利语 | 12 | 16 | 43% |
犹他州 | 40 | 56 | 42% |
法语 | 24 | 34 | 41% |
库奥皮奥 | 8 | 12 | 40% |
托斯卡纳 | 23 | 35 | 40% |
极 | 7 | 13 | 35% |
德鲁兹 | 27 | 67 | 29% |
俄语 | 13 | 35 | 27% |
维吾尔族 | 5 | 15 | 25% |
Terekli-Mektab(达格斯塔尼) | 13 | 43 | 23% |
马克兰尼 | 11 | 39 | 22% |
o路支 | 10 | 40 | 20% |
莫扎比 | 12 | 48 | 20% |
巴勒斯坦的 | 19 | 83 | 19% |
卡拉什 | 8 | 42 | 16% |
帕坦 | 8 | 42 | 16% |
库巴奇(达格斯塔尼) | 7 | 39 | 15% |
婆罗门新木 | 4 | 26 | 13% |
婆罗门 | 5 | 33 | 13% |
哈扎拉 | 6 | 42 | 13% |
布鲁修 | 6 | 44 | 12% |
婆罗门·维迪卡(Brahmin Vydika) | 5 | 41 | 11% |
信德 | 5 | 43 | 10% |
贝都因人 | 10 | 88 | 10% |
婆罗辉 | 5 | 45 | 10% |
班图南非 | 1 | 15 | 6% |
红宝石 | 3 | 47 | 6% |
锡伯 | 1 | 17 | 6% |
达ur尔 | 1 | 19 | 5% |
拉hu | 1 | 19 | 5% |
Tu | 1 | 19 | 5% |
Yi | 1 | 19 | 5% |
柬埔寨 | 1 | 21 | 5% |
姆布蒂(Mbuti Pygmy) | 2 | 74 | 3% |
姆布蒂(Mbuti Pygmy) | 2 | 74 | 3% |
姆布蒂(Mbuti Pygmy) | 2 | 74 | 3% |
姆布蒂(Mbuti Pygmy) | 2 | 74 | 3% |
曼登卡 | 1 | 47 | 2% |
本田多拉 | 1 | 51 | 2% |
伊鲁拉 | 1 | 59 | 2% |
比亚卡·皮格米 | 1 | 69 | 1% |
功(San) | 0 | 22 | 0% |
阿鲁尔 | 0 | 16 | 0% |
班图肯尼亚 | 0 | 22 | 0% |
比亚卡·皮格米(Biaka Pygmy) | 0 | 10 | 0% |
柬埔寨 | 0 | 10 | 0% |
中文 | 0 | 16 | 0% |
通过 | 0 | 20 | 0% |
有 | 0 | 70 | 0% |
汉族 | 0 | 18 | 0% |
喝骂 | 0 | 42 | 0% |
赫镇 | 0 | 20 | 0% |
日文 | 0 | 62 | 0% |
日文 | 0 | 38 | 0% |
高棉柬埔寨语 | 0 | 8 | 0% |
马拉西亚语 | 0 | 12 | 0% |
姆布蒂侏儒 | 0 | 30 | 0% |
美拉尼西亚 | 0 | 44 | 0% |
苗 | 0 | 18 | 0% |
蒙古 | 0 | 20 | 0% |
南德 | 0 | 36 | 0% |
纳西 | 0 | 20 | 0% |
鄂伦春 | 0 | 20 | 0% |
巴布亚 | 0 | 34 | 0% |
佩迪(北索托) | 0 | 22 | 0% |
圣 | 0 | 14 | 0% |
她 | 0 | 20 | 0% |
索托 | 0 | 10 | 0% |
南方汉语 | 0 | 8 | 0% |
台湾 | 0 | 6 | 0% |
特松加 | 0 | 12 | 0% |
茨瓦纳语 | 0 | 14 | 0% |
土家族 | 0 | 20 | 0% |
越南语 | 0 | 18 | 0% |
科萨 | 0 | 4 | 0% |
约鲁巴语 | 0 | 50 | 0% |
祖鲁(国语) | 0 | 18 | 0% |
从这些数据中,作者推断出503F等位基因的选择是因为它增强了HXNUMXO的转运。 麦角硫因,这是许多植物性食品所缺乏的,随着新石器时代革命的到来,这种食品就显得尤为突出。 换句话说,克罗恩氏病是适应农业单一栽培带来的营养缺乏的副产品。 该论文似乎面临的主要问题是,许多长期从事农业生产的中东人口的503F等位基因频率不高。 这并不意味着这里提出的选择性模型是不可能的,但是,它确实表明,如果这是一个合理的适应,那么中东人口必须具有自己独特的变体。
我认为这是一篇很棒的论文,尽管我对结论并不自信。 农业显然是对人类基因组的主要选择压力之一。 即使2000年代中期的某些自然选择的初步测试未能成立,因为它们往往会使真实的自然选择目标与假阳性混为一谈,但我相当有信心,与农业有某种联系的基因将会在功能约束和自适应雕刻方面得到丰富。
引文: 乍得·霍夫(Chad D. Kazima Bulayeva,Tatum S. Simonson,Lynn B. Jorde和Stephen L. Guthery Crohn病以及IBD5上的遗传搭便车,Mol Biol Evol, doi:10.1093 / molbev / msr151.