Unz评论•另类媒体选择$
美国主流媒体大都排除了有趣,重要和有争议的观点
通过电子邮件将此页面发送给其他人

 记住我的信息



=>
作者 筛选?
拉齐布汗
没有发现
 玩笑基因表达博客
/
2014年ASHG

书签 全部切换变革理论添加到图书馆从图书馆中删除 • B
显示评论下一个新评论下一个新回复了解更多
回复同意/不同意/等等 更多... This Commenter This Thread Hide Thread Display All Comments
同意不同意谢谢LOL轮唱
这些按钮可将您的公开协议,异议,感谢,LOL或巨魔与所选注释一起注册。 仅对最近使用“记住我的信息”复选框保存姓名和电子邮件的频繁评论者可用,并且在任何八个小时的时间内也只能使用三次。
忽略评论者 关注评论者

显然是由我的兴趣所染。

常见的欧亚Y染色体单倍群的快速辐射发生的时间明显晚于从非洲迁出的时间。 爱沙尼亚基因组学中心国际联合会M.Järve 爱沙尼亚塔尔图大学爱沙尼亚生物中心和进化生物学系。

非洲以外的人类遗传多样性较低,这通常归因于非洲以外地区最近出现的瓶颈以及随后世界其他地区的迅速殖民化。 男性特定Y染色体的先前研究表明,在非非洲人群中常见的单倍群都合并为少数共享的祖传世系,其分支顺序仅得到部分了解。 我们使用475条高覆盖率的完整Y染色体序列,包括此处新报告的317条,我们根据覆盖率分析,可映射性和序列类别在Y染色体中选择了可靠区域。 基于这些数据,我们改进了Y染色体单倍群树,应用系统进化方法建立了非非洲Y染色体单倍群的分支顺序和分裂的时间动态。 与分隔非洲和非非洲多样性的分支的长度相比,区分非洲以外的大陆和次大陆差异的内部分支通常较短,这与欧亚大陆和大洋洲迅速初期定殖的模式是一致的。 在非洲和非非洲单倍群分裂后[90 KYA(95%CI:87-94 KYA)],南亚和东南亚单倍群H,S,M和C的分化直到大约43 KYA才开始。 N和R单倍群广泛分布于东北亚和西北欧亚人口中,随后开始显着多样化[分别为17 KYA(95%CI:16-19 KYA)和26 KYA(95%CI:25-28 KYA)]。 不同地理区域的许多主要系统发生群似乎起源于50 KYA左右的时期。

使用长读序列辅助定相来推断混合族群中的祖先分配。 门德斯(FL Mendez)1,SS Shringarpure1,莫雷诺(A. Moreno)1,ER马丁2,ML Cuccaro2,CD Bustamante1 1)斯坦福大学遗传学系,加利福尼亚斯坦福; 2)佛罗里达大学迈阿密大学遗传流行病学和统计遗传学中心。

单个染色体的正确相位重建对于许多遗传分析都很重要,包括推断混合过程中的人口统计学参数。 混合是先前分化种群杂交的结果。 混合个体的染色体由可单独追溯到祖先种群之一的区段组成。 这些染色体片段的丰度和长度分布为混合过程提供了关键信息。 但是,要正确推断其长短和血统,就需要对混合个体的数据进行定相。 可以使用孟德尔变体分离规则或使用依赖于种群数据的统计方法来执行相重建。 另外,分子定相(在同一染色体序列中观察到不同的多态性)可提供相的直接证据。 以这种方式,可以使用分子定相方法(如长读测序)来扩展置信定相的范围。 我们模拟长时间读取的序列数据,并探索分子定相对染色体片段祖先分配的准确性,片段边界的定义以及整体掺混物推断带来的改进。 然后,我们使用来自5个拉丁裔个体的基因型信息,包括具有长期阅读序列信息的10个个体,以及欧洲,非洲和美洲原住民血统的三个单倍型参考面板,来评估分子阶段对混合物推断的影响过程。

基于线性混合模型的外加剂映射。 布朗·T·桑顿 生物统计学,华盛顿大学,华盛顿州西雅图市。

最近混合人群中的遗传研究可以提供有关导致疾病的新危险因素的宝贵见解。 种群混合产生了先前分离的祖先种群的组合基因组,这些种群可能由于自然选择和遗传漂移而具有可辨别的等位基因频率差异。 可以使用混合作图法鉴定出性状种族差异背后的基因,以及根据祖先显示出不同风险的基因。 与在更多种族同质的人群中进行的研究相比,掺混物作图可能具有更大的检测某些遗传变异的能力。 作为用于全基因组关联研究的工具,线性混合模型已获得广泛关注。 通过直接考虑包括隐秘相关性和种群分层在内的依赖性来源,已证明混合模型方法可以防止结构化样本中的虚假关联,这是遗传关联研究中的常见陷阱。 我们提出了一种线性混合模型方法,用于在种群结构和隐藏的相关性存在下进行掺和映射。 我们使用基于全基因组SNP数据的本地祖先估计来实现此方法。 在妇女健康倡议研究的非裔美国人队列中,我们应用该方法来分析与白细胞计数和C反应蛋白表型的遗传关联。 我们证明,我们提出的用于线性映射的线性混合模型方法相对于广泛使用的线性映射方法提供了实质性的改进。

印度古混合气的遗传证据。 巴苏(A. Basu),达斯(D.Das),达斯(S.Das),比斯瓦斯(N.Biswas) 印度卡利亚尼国家生物医学基因组学研究所。

比较高覆盖率的Denisova和尼安德特人的全基因组序列,发现与当今所有非非洲人口都有显着的混合。 据报道,在印度中部使用了微刀片工具,但在当今的南亚人中,没有经过遗传研究检查过的古混合物。 我们从4个当今印度人的全基因组序列数据中报告了古混合的第一个证据。 四个人位于二维主成分图的末端,总结了来自印度不同地理位置的237个语言,种族差异人群中的20个印度人的基因组差异之现存; 被排序。 他们的人口身份是Onge,Jamatia,Panniya和Birhore。 与欧亚人相比,所有个体的Denisova外加剂(D-Statistic 1.6-1.99)略有过量,外加剂的证据从Jamatia(1.6)增加到Onge(1.99)。 与尼安德特人相比,也观察到了类似的模式。 我们的发现显示了当今不同人群中的古混合物的证据,而不仅限于邻近的考古学证据,表明了广泛的混合物。

千人基因组计划中的人口统计学和选择性交配模式是来自美洲的混杂人群。 肯尼(EE Kenny)1,5,6,7,C。Gignoux2,S. Baharian3,穆沙拉夫(S. Musharoff)2,B. Maples2,S。Shingarpure2,A。Auton4,CD Bustamante2,S。Gravel3,AR Martin2,1000个基因组联盟 1)纽约州伊坎山西奈伊坎医学院遗传学系; 2)加利福尼亚州斯坦福大学医学院遗传学系; 3)加拿大蒙特利尔麦吉尔大学人类遗传学系; 4)纽约州阿尔伯特·爱因斯坦医学院遗传学系; 5)纽约州西奈山伊坎医学院个性化医学研究所; 6)纽约州伊坎市伊坎医学院统计遗传学中心; 7)纽约州伊坎山伊坎医学院基因组学和多尺度生物学研究所。

3个基因组计划的第1000阶段发布包括来自全球2,535个人群的26个个体的基因型和序列数据。 其中包括来自美洲的六个人口,这些人口具有美洲原住民,欧洲和西非血统。 我们已经确定了这六个人口中的混合比例,包括来自巴巴多斯(ACB)的非洲加勒比海地区,来自西南美国(ASW)的非裔美国人,麦德林(CLM)的哥伦比亚人,利马(PEL)的秘鲁人,来自利马(PEL)的墨西哥人洛杉矶(MXL)和波多黎各(PUR)的波多黎各人。 我们显示出在所有六个人口中都存在美洲原住民,欧洲和非洲血统,尤其是,我们确定了六个拥有超过20%美洲原住民血统的ASW个人。 这些人中的欧洲人看起来最类似于北欧血统,而不是西班牙裔/拉丁美洲人中经常看到的西班牙血统。 在ACB,PEL,PUR,CLM和MXL人群中,与常染色体相比,我们发现在X染色体上有过多的美洲原住民和欧洲血统,这表明这些人群中存在非随机交配的历史。 我们还推断出了本地祖先区域(LAT),从而确定了跨染色体的祖先的单倍型特定片段。 我们评估了我们的道听书的准确性,并在所有人群中的非洲,欧洲和美洲原住民道中显示了> 0.99,> 0.98和> 0.97的准确性。 通过对祖先族长的分布进行建模,我们推断出从美洲新移民到第3阶段的两个人口ACB和PEL的迁移时间。 我们估计,PEL与加勒比和整个南美北部的其他西班牙裔/拉丁美洲裔群体相比,与欧洲和非洲个体的混血最近得多,这与已知的迁徙模式一致。 这些分析使我们对“ 1000基因组计划”中的人口历史和混合人群中的迁徙模式有了更深入的了解。

 

美国个人的次大陆地方血统推断。 BK枫木1,2,JK伯恩斯3,JM Granka3,诺托(K. Noto)3,S. Shringarpure1,ML木匠1,MJ理发师3,柯蒂斯4,NM Myres4,CA球3,KG Chahine4,CD Bustamante1 1)遗传学,斯坦福大学,加利福尼亚州斯坦福; 2)斯坦福大学生物医学信息学,加州斯坦福; 3)AncestryDNA LLC,加利福尼亚州旧金山; 4)AncestryDNA LLC,美国犹他州普罗沃。

美国是一连串的移民潮之一,其中包括来自众多不同来源人口的移民。 这种“熔炉”过程已导致当前大多数美国居民进行基因混合。 了解这种复杂的遗传多样性对种群遗传学领域非常重要,因此对其进行解释对于医学遗传学至关重要。 已经开发了许多方法来执行本地祖先推断(LAI),其中估计了每个基因组位点的祖先,但是这些方法中的大多数仅在大陆混合水平上才是准确的(例如具有非洲和欧洲祖先的非裔美国人) 。 由于邻近人群的分化程度通常较低,因此次大陆LAI通常更困难。 在这项研究中,我们使用了LAI方法RFMix,该方法已被证明在次大陆水平上表现良好(例如,北欧和南欧血统的混合物)。 将RFMix植入具有已知来源的样本参考面板,然后迭代地从更大的测试样本集合中学习。 更大的参考面板和测试样本数量可大大提高该方法的性能。 在这里,我们使用了2,000多个来自Ancestry.com的单一来源参考样本和1000个基因组,以及超过100,000个具有混合起源的研究同意的客户样本,以训练该模型对具有混合欧洲血统的个人进行推理。 我们将来自RFMix的全基因组祖先估计值与谱系进行比较。 使用谱系数据作为真值集,我们可以调整RFMix的性能。 然后,我们将RFMix的性能与常用祖先估计方法ADMIXTURE在监督模式下运行的结果进行比较,该方法以与RFMix相同的初始单一来源参考面板进行操作。 我们还使用单一来源的样本创建具有已知本地血统模式的合成混合样本,以评估RFMix调用混合欧洲人中各个细分受众群的准确性。 最后,我们将训练有素的RFMix版本应用于美国国立衰老研究院的健康与退休研究数据。 我们将本数据与最近的美国人口普查数据进行比较的县级次大陆血统估计的地理摘要。 我们发现有很好的证据证明某些地区的人口规模精细,这些地区显示出特定祖先的财富(例如,波士顿及其周边的爱尔兰祖先和中西部各州的斯堪的纳维亚祖先)。

使用近似贝叶斯计算推断日本的人口历史。 CD Quinto1,KR Veeramah2,AE Woerner3,MF锤子3 1)美国亚利桑那州图森市亚利桑那大学遗传学研究生跨学科计划; 2)美国纽约州石溪市石溪大学生态与进化系; 3)美国亚利桑那州图森市亚利桑那大学生物技术系亚利桑那研究实验室。

分化种群之间的基因交换(称为混合物)已被越来越多地证明是人类历史上的重要过程。 美洲西班牙裔人口的形成是这种现象最著名的例子之一。 另一个重要但鲜为人知的例子是现代日语的起源。 已知在日本史前时期至少发生过两次不同的移民。 第一次历史至少发生在一万年前,并建立了乔蒙文化,这种文化的特点是半固定的狩猎者-采集者生活方式和最早的陶瓷用途之一。 然后,大约10,000年前,第二次向群岛的迁移带来了水稻农业和铁业,并建立了弥生文化。 属于这两种文化的人的混合被认为是现代日本人口的祖先。 尽管考古记录提供了弥生人到达日本的时间的信息,但混合过程的动态仍不清楚。 先前针对线粒体DNA和Y染色体的遗传研究支持了现代日本人口起源的混合模型。 虽然全基因组数据已用于调查此问题,但目前尚无任何研究可以推断出描述混合过程动力学的参数。 造成这种情况的部分原因是,在利用全基因组阵列时,显式的种群遗传建模存在问题,因为在SNP的选择中存在潜在的确定性偏差。 为了解决这些问题,我们对来自日本群岛和东亚人群的2,300个样本中的500,000个SNP进行了基因分型。 然后,我们尝试通过使用全基因组测序数据来近似用于确定SNP的发现样本来纠正确定性偏倚。 我们利用来自不同人群的SNP基因型来确定日本样本中的祖先块。 这些块的分布提供了有关混合时间和比例的见解,并且该信息用于近似贝叶斯计算分析中以推断其他关键的人口统计参数,例如发散时间,迁移率和人口规模。

汉族,日本和韩国人口中人口结构,散度和混合的精细比较研究。 1王Y11钟Y2 1)中国科学院计算研究所合作伙伴计算生物学研究所,人口基因组学,上海,中国上海; 2)天主教大学医学院微生物学系,基因组多态性综合研究中心,韩国首尔市cho草区137-701。

在东亚,人类的起源和传播仍然知之甚少,值得商de。 作为东亚的主要种族,汉族,日本人和韩国人在特征,语言和文化上有许多相似之处。 然而,这三个种群之间的遗传关系,发散时间和随后的基因流动还没有得到很好的研究或定量估计。 在这里,我们进行了超过900,000个单核苷酸多态性(SNP)的全基因组研究,并评估了182个无关的汉族,90个日本人和100个韩国人的人口结构,并与代表663个世界人口的8个人进行了比较。 我们的分析表明,汉族,日本人和韩国人的基因组成不同,可以根据全基因组数据或从全基因组SNP中筛选出的祖先信息标记(AIM)进行区分,这表明它们已被分离出来。相当长的时间。 有趣的是,人口结构完全符合这三个人口的地理分布,这表明地理是导致人口分化的重要因素。 我们确定了北/南混合气的谱线,这与按距离隔离(IBD)或北/南迁移的情景或两者均符合。 我们认为,IBD效应和迁移都可能导致这种模式。 另一方面,我们的分析揭示了混合模式,这种混合模式是在人口最初分裂后发生的。 我们进一步估计了这三个人群之间的基因流动。 我们得出的结论是,当今汉人,日本人和朝鲜人的遗传结构是由共同的起源,随后的基因流动和局部适应共同形成的。 我们的结果使人们对东亚的遗传关系和种群历史有了更深入的了解。

对常染色体和Y染色体DNA的分析表明,后冰河时期西亚人口是从北部中东人口衍生而来的。 扎鲁阿(P. Zalloua)1,2,F。Utro3,哈伯(M. Haber)1,帕里达(L. Parida)3,E. Matisoo-Smith34,D。Platt3 1)黎巴嫩贝鲁特研究生院基因组实验室; 2)哈佛大学公共卫生学院,美国马萨诸塞州波士顿; 3)纽约约克敦Hgts的IBMTJ沃森研究中心; 4)奥塔哥大学,但尼丁9054,新西兰。

对西亚人(格鲁吉亚人,亚美尼亚人,土耳其人,叙利亚人,黎巴嫩人,约旦人,沙特阿拉伯人,也门人,科威特人)的Y DNA J和E单倍群的分析表明,扩展主要来自北部(土耳其,乔治亚州,亚美尼亚)沿着底格里斯-南伯爵山脉向南行驶的人与沿着黎凡特海岸向南行驶的人之间。 我们试图通过揭示沙特阿拉伯和也门与土耳其,叙利亚和亚美尼亚之间早于后世的人口差异时间,来确定南方变异是代表独立冰期避难所内的演变,还是由Y染色体数据所提示的同一北方避难所演变而来。冰川扩张。 我们使用IRIS来计算从格鲁吉亚人,亚美尼亚人,土耳其人,叙利亚人,黎巴嫩人,约旦人,沙特阿拉伯人和也门人以及成对的FST(基于估计的时间)得出的成对对象之间应用的最新最近祖先的时间。 我们将这些结果与原始SNP计数和从这些计数中获得的成对FST进行了对比。 我们应用了MDS和层次聚类来识别地理信息关系,并观察到了从北到南梯度的清晰模式。 在中东西部地区,我们的研究结果表明,人口分化的日期与上一次冰川期扩张之后的时期一致,随后在存在混合物的情况下,人口收缩到了肥沃的新月。 我们的估计显示,南北向分化时间约为24,800-18,200 ya,恰好在上一个冰期时期。 但是,标志着这种转移的J1 / J2单倍群分裂的时间可追溯到31kya左右的最后冰川期。 这些结果使常染色体基因组的遗传分化比J1 / J2分裂新近。 进入欧洲的扩张记录比进入非洲的扩张记录要近一些,信号显示出与特定中东地区的联系,这表明了对近来贸易的影响。

南美安第斯地区的人口基因组学。 JR洪堡1,莫雷诺·埃斯特拉达(A. Moreno-Estrada)1,CR Gignoux1,E。Sanchez-Rodriguez2,BA Pons-Estel3,E。Acevedo4,JM库乔4,P。Miranda5,L。Catoggio6,马加西亚7,G。Berbotto8,A。Babini9,H。Scherbarth10,S。Toloza11,M。Alarcon-Riquelme2,CD Bustamante1 1)美国加利福尼亚州斯坦福市,斯坦福大学遗传学系; 2)西班牙格拉纳达大学基因组和肿瘤研究中心(GENYO); 3)阿根廷罗萨里奥Sanatorio Parque; 4)秘鲁利马国家医院Guillermo Almenara Irigoyen; 5)智利大学的Facultad Medicina Occidente,智利圣地亚哥,智利; 6)阿根廷布宜诺斯艾利斯Italiano医院; 7)HIGA将军圣马丁,阿根廷拉普拉塔; 8)阿根廷伊万贝隆医院,格拉纳德罗·贝戈里亚; 9)阿根廷科尔多瓦Italiano deCórdoba医院; 10)阿根廷马德普拉塔的HIGA Oscar E.Alende; 11)阿根廷卡塔马卡地区圣胡安·包蒂斯塔(Inter Juanal San Juan Bautista)医院。

南美大陆经历了多次移民和混合事件。 在这里,我们使用在Illumina SNP阵列上进行基因分型的551名来自哥伦比亚,厄瓜多尔,秘鲁,智利和阿根廷的个体检查了安第斯地区的遗传历史。 将这些数据与“ 1000个基因组计划”和“人口参考小组”(POPRES)的个体相结合,我们发现混合个体具有不同程度的美洲原住民和欧洲血统。 我们使用ADMIXTURE和主成分分析(PCA)来研究混合的南美个体的遗传祖先。 我们显示,与其他混合南美样本相比,秘鲁个体平均拥有较高的美洲原住民血统,而阿根廷个体平均具有最高的欧洲血统。 我们还发现,在南美个人中,安第斯土著群体占美国原住民血统的比例最大。 另一方面,在混合个体中,欧洲血统的比例最大,来自南欧和伊比利亚半岛。 我们的目标是通过对混合基因组应用祖先特定的PCA和管道长度分析,估计参与南美混合物的祖先成分的特定时间和次大陆起源。

利用多个群体的等位基因频率,从DNA序列数据中快速进行个人祖先推断。 利比格(O. Libiger)1,3,V.班萨尔1,2 1)斯克里普斯转化科学研究所,加利福尼亚州拉荷亚; 2)加利福尼亚大学圣地亚哥分校,加利福尼亚大学圣地亚哥分校儿科; 3)MD Revolution,加利福尼亚州圣地亚哥。

从遗传数据估计个人血统有助于分析疾病关联性研究,了解人类历史和解释个人基因组变异。 我们描述了一种快速的方法,用于估计已知参考人群对个体遗传祖先的相对贡献。 我们的方法利用BFGS优化算法,利用参考人群的等位基因频率和个体基因型或序列数据来获得总体掺和比例的最大似然估计。 它通过使用基因型可能性而不是基因型来解决序列数据中存在的基因型的不确定性。 与以前的方法不同,我们的方法不需要外部参考小组提供单独的基因型数据,并且可以利用从均质人群和混合人群的分析中估算出的等位基因频率。 仿真研究和将该方法应用于真实数据集的结果表明,该方法比ADMIXTURE快8-10倍,并且具有可比的准确性。 使用来自1000个基因组计划的数据,我们证明了我们的方法可以使用外显子组或低覆盖率序列数据来估计混合个体的全基因组平均血统。 最后,我们证明了我们的方法可用于使用合并的序列数据来估计混合物比例,从而使其成为利用DNA合并的基于序列的关联研究中控制种群分层的有价值的工具。

人口增长如何影响连锁不平衡。 罗杰斯 犹他大学,人类学,盐湖城,犹他州。

“ LD曲线”将核苷酸位点对之间的连锁不平衡(LD)与沿染色体分开它们的距离相关。 它用于定位疾病基因并寻找适应性进化。 但这也回应了人口规模的历史。 本研究描述了有关人口历史影响的新理论结果。 当人口规模扩大时,LD曲线会变得越来越陡峭,人口规模出现瓶颈后,这种影响尤为明显。 当人口减少时,LD曲线会上升,但保持相对平坦。 随着LD向新的平衡方向收敛,其时间路径可能不是单调的。 例如,在经历了一段增长之后,它下降到一个较低的值,然后又上升到新的平衡状态。 对于不同的LD统计,这些变化以不同的速率发生。 对于σ的估计,它们特别慢d2,因此可以推断出古代人口史。 对于欧洲人口而言,这些结果表明了人口增长的历史。

最近混和人口中的连锁不平衡结构。 张华,郑建荣,格兰特(B.Grant) 美国国立卫生研究院酒精滥用和酒精中毒国家研究所,马里兰州罗克维尔。

人们发现,与非洲的地理距离越远,人口中的连锁不平衡(LD)越强,这反映了非洲人类历史的起源。 相对于推断的祖先群体,近来的混合群体(例如非裔美国人和拉美裔美国人)更可能具有更多的遗传变异。 但是,对这些混合种群中连锁不平衡的模式还没有很好的研究。 在这里,我们对来自659,184个Hapmap924种群的11个无关样本和来自Karitiana种群的3个样本(来自巴西的美国原住民,来自人类基因组多样性计划)的24个单核苷酸多态性(SNP)进行连锁不平衡分析。 非裔美国人(ASW)的基因组血统来自非洲和欧洲,平均非洲血统为77.3%,欧洲血统为20.0%。 西班牙裔美国人(MXL)的平均血统为欧洲血统的45.5%,美国土著血统的42.9%,东亚血统的4.9%和非洲血统的4.4%。 在这两个混合种群中,整个基因组中基于SNP的单倍型杂合子的平均值大于其主要推断祖先种群的平均值。 我们进一步使用r2 各个距离类别中所有可能的SNP对之间的距离,作为LD的度量,并且还关注具有r的SNP对的比例2 大于0.8。 这两个混合种群均显示中等LD(如r2 和SNP对与r的比例2> 0.8),与他们的两个主要祖先推断人群相比。 LD的范围(r2)在短距离课程中,非洲裔美国人(ASW)与非洲人口(YRI)的距离更近,而非洲裔美国人(ASW)的LD值更可能与欧洲人(CEU)相似,增加距离等级。 LD的量(r2)在拉美裔美国人(MXL)中表现出相似的模式,但在所有距离级别中,它都更接近于欧洲裔美国人(CEU)。 混合人群中LD结构的发现有助于更好地了解人类的进化以及混合人群中遗传关联研究的设计。

使用连锁不平衡来完善人口加速增长的估计。 M·雷佩尔1,卡尔森1,佐尔纳(S.Zöllner)1,2,BRIDGES联盟 1)密歇根大学密歇根州安阿伯分校生物统计学系; 2)密歇根大学密西根州安娜堡市精神病学系。

正确建模种群的有效规模对于准确推断突变和迁移率以及选择压力的强度至关重要。 在人类中,几项大型测序研究为我们提供了一个新的洞察力,使我们能够了解一个基因组,该基因组的特征是存在极其罕见的遗传变异,这与最近大规模种群增长的历史一致。 这些大型测序研究为我们提供了前所未有的解决方案,可用于区分近期增长模型。 为了改进传统的推理方法,我们提出了一种新的基于似然的方法,该方法结合了成对2,除了站点频谱以外,一种衡量连锁不平衡的方法。 我们观察到,在短遗传距离上,成对r2 是祖先树枝长度变化的函数,因此包含有关站点频谱中缺少的祖先种群大小的信息,这仅是平均总祖先树枝长度的函数。 通过仿真,我们表明,对于大样本,包含成对r2 相对于仅依赖站点频谱的方法,该方法提高了最近增长的人口中人口统计学推断的准确性。 我们量化样本量的增加如何增加有关近期人口统计学的推论准确性,并放大我们的方法相对于传统方法的改进。 最后,我们将我们的方法应用于来自约4,000个欧洲祖先个体的全基因组序列数据中被定义为中性的区域,这些个体作为BRIDGES财团的一部分进行了测序。 该数据集具有符合我们目的的理想功能; 提供大量样本和非编码遗传区域,没有正在进行选择的证据,仅外显子组或功能测序项目无法获得的混合物。 我们使用蒙特卡洛方法来估计一系列实际增长模型下观察到的数据的可能性,这些模型包括那些连续增长,加速增长,快于指数增长的模型。 利用我们的数据,我们可以同时推断出从中提取样本的欧洲人群的突变率μ和加速生长的速率。

巴西人群的法医表型分析:SLC24A5和ASIP是皮肤,眼睛和头发颜色的表型预测基因。 弗里·贡萨尔维斯(F. Lima),FA Lima,C。Fridman 巴西圣保罗大学圣保罗大学法律医学,道德与职业学系。

色素沉着在人类中是一个非常可变和复杂的特征,它是由环境因素,年龄,疾病,药物,激素,暴露于紫外线辐射以及遗传因素(包括色素沉着基因)之间的相互作用所决定的。 这些基因中的许多基因及其变体与同质人群的皮肤,眼睛和头发颜色的表型多样性有关。 SLC24A5,TYR,MC1R,SLC45A2,ASIP,OCA2和HERC2基因因其在色素沉着过程中的重要作用而引人注目。 利用遗传信息进行表型预测,在许多国家中有利于法医领域,因为它可以从生物样本中推断出身体特征,从而进行刑事调查。 这项研究的目的是评估来自24个来自巴西的混血人口样本中TYR,ASIP,SLC5A45和SLC2A350基因的多态性,目的是在几种情况下将这些数据用于法医遗传学案例研究。 志愿者回答了一份问卷,他们自我报告了自己的皮肤,眼睛和头发的颜色,日晒敏感性和生活方式。 除SLC24A5和ASIP外,未观察到明显的结果。 rs1426654和rs6058017在SLC24A5(OR 32.88 p <0.0001)和ASIP(OR 8.68 p <0.007)中的多态纯合等位基因显示出与更白皙的皮肤最强的关联。 此外,SLC24A5中的多态性纯合等位基因与浅色(绿色)(OR 9.82 – p <0.0001),金发(OR 50.14 – p <0.0001)以及对日光的敏感性增加(OR 7.86 – p << 0.0002)。 我们的数据表明,SLC24A5和ASIP基因中的多态性等位基因(A)与浅色色素沉着的特征有关,而祖先等位基因(G)与较暗的性状有关。 我们的发现证实了先前发表的有关欧洲和非洲人群研究的数据。 色素沉着基因与皮肤,眼睛和头发的颜色之间的这些联系表明,有可能利用个人的分子信息来访问其表型特征,并利用所获得的信息来尝试进行法医调查。 作为该项目的一部分,正在进行其他分析,该项目评估了600个样品,以检查巴西人群中表型色素沉着与上述基因的可能关联。 财务支持:FAPESP(2012 / 02043-6),LIM 40 / HCFMUSP和法律医学,道德与职业卫生部– FMUSP。

产妇年龄效应和人类线粒体DNA遗传中的严重种系瓶颈。 苏先生1,B。Rebolledo-Jaramillo2,N。Stoler2,JA McElhoe3,狄金斯(B. Dickins)4,D。布兰肯伯格2,T。Korneliussen5,F. Chiaromonte6,尼尔森(R. Nielsen)5,MM荷兰3,保罗7,A。Nekrutenko2,KD Makova1 1)美国宾夕法尼亚州立大学生物系; 2)美国宾夕法尼亚州立大学生物化学与分子生物学系; 3)美国宾夕法尼亚州立大学法医学计划; 4)英国诺丁汉特伦特大学科学技术学院; 5)美国加州大学伯克利分校整合生物学系; 6)美国宾夕法尼亚州立大学统计系; 7)美国宾夕法尼亚州立大学医学院儿科。

mtDNA疾病的表现取决于异质性的频率(个体中存在多个等位基因),但由于缺乏卵子发生过程中mtDNA瓶颈大小的数据,因此无法轻易预测其跨代传播。 对于有害的异质性,严重的瓶颈可能会突然将母亲的良性(低)频率转变为孩子的致病(高)频率。 在这里,我们对欧洲血统的39对健康母子对的血液和颊部mtDNA进行了异质性传播的高分辨率研究(共156个样本,每个样本的〜20,000x /位点测序)。 平均而言,每个个体携带一个异质性,八分之一的个体携带一个致病性异质性,次要等位基因频率≥1%。 我们观察到世代之间频繁发生剧烈的异质频率转换,并估计瓶颈的大小只有29-35 mtDNA分子。 令人惊讶的是,我们发现孩子的异质性数量与受精时的母体年龄之间呈正相关,这很可能归因于卵母细胞的衰老。 考虑到异质性,我们估计mtDNA种系突变率是1.3×10-8个突变/位点/年-低于以前的家系研究,但与系统发育研究一致,因此解决了长期存在的争议,并为mtDNA的使用提供了信息。约会进化事件。 这项研究利用液滴数字PCR(ddPCR)来验证异质性并确认从头突变。 这些结果对于预测引起疾病的mtDNA变异的传播并阐明线粒体基因组进化动力学具有深远的意义。

对人类携带的隐性致死突变的平均数量的估计。 高志1,瓦格纳2,3,史蒂芬斯(M. Stephens)2,4,C。Ober1,2,5,M。Przeworski6,7 1)遗传学,基因组学和系统生物学委员会; 2)人类遗传学系; 3)儿科; 4)统计部门; 5)伊利诺伊州芝加哥大学芝加哥大学妇产科; 6)生物科学系; 7)纽约州哥伦比亚大学系统生物学系。

近亲繁殖对人类健康的影响主要取决于个体携带的隐性有害突变的数量和严重性。 在人类中,对每个个体隐性突变负担的估算是基于近亲和非近亲夫妇之间的比较,一种混淆了社会经济和遗传影响的方法,或者是基于携带者筛选因其他原因而导致的致病性突变,尤其是高度不完整的致病突变目录。 为了规避这些局限性,我们试图通过着重确定孟德尔疾病确诊和已知谱系的创始人人群中的隐性致死性疾病来估计负担的下限。 通过考虑人群中公认的所有常染色体隐性遗传致死性疾病并模拟沿系谱的等位基因传播,我们估计每个单倍体人类基因组平均携带约一个常染色体隐性遗传等位基因,导致纯合子出生时或出生后出现严重疾病。 与以前的估计相比,我们的结果表明,致命的隐性突变构成了人类隐性有害突变总负担的很大一部分。

使用隐藏的相关性推断变异率。 PF帕拉马拉(PF Palamara)1,2,3,P。威尔顿4,M.弗罗默5,6,G。基洛夫7,麦卡罗尔(S. McCarroll)3,6,8,P。Sklar5,9,欧文(M. Owen)7,珀塞尔(S. Purcell)5,6,10,奥多诺万(M. O'Donovan)7,J。Wakeley4,I. Pe'er11,12 1)美国马萨诸塞州波士顿市哈佛大学公共卫生学院生物统计学系; 2)美国马萨诸塞州波士顿市哈佛大学公共卫生学院流行病学系; 3)美国马萨诸塞州波士顿市,哈佛大学和麻省理工学院医学和人口遗传学专业; 4)哈佛大学生物与进化生物学系,美国马萨诸塞州波士顿; 5)美国纽约州西奈山伊坎医学院精神病学系精神病基因组学以及基因组学和多尺度生物学研究所; 6)美国马萨诸塞州波士顿市哈佛大学和麻省理工学院斯坦利精神病学研究中心; 7)英国卡迪夫大学心理医学与临床神经科学研究所神经精神遗传学与基因组医学研究委员会中心; 8)美国马萨诸塞州波士顿哈佛医学院遗传学系; 9)美国纽约州西奈山伊坎医学院的弗里德曼脑研究所; 10)美国马萨诸塞州波士顿麻省总医院精神与神经发育遗传学分析和转化遗传学部门; 11)美国纽约哥伦比亚大学医学中心计算生物学与生物信息学中心; 12)哥伦比亚大学计算机科学系,纽约,纽约。

可靠地估计现代人类的突变率对我们对人口历史的理解有几个含义(Scally和Durbin,《自然评论遗传学》 2012年)。 然而,最近发现在下一代家庭测序中使用从头突变获得的突变率估计与从化石证据中得出的系统发育突变率不同,从而推动了新分析方法的发展。 我们描述了一种基于人口中据称无关亲戚的测序数据共享中相同后裔(IBD)片段共享的推断突变率的方法。 使用合并理论,对于SMC和SMC'模型下的任意人口统计设置,我们得出的IBD片段上突变事件的分布的理论结果要长于指定的厘摩阈值,且分布不限。 利用共享IBD单倍体的长度和年龄之间的关系,我们设计了一种方法来估计基因型错误率和突变率。 与基于家族的新型突变分析相比,基于隐藏相关性的拟议方法显着提高了统计能力。 尽管事实上IBD区域藏有最近几十到几百代的事件,但是尽管据称无关的个体之间通过长(例如> 1cM)IBD片段共享的基因组比例通常很小,但仍会发生这种功率增加的情况。 。 此外,在基于三人的研究中对新突变的分析仅限于通过已知的血统关系传播的基因组区域,而当获得准确分阶段的数据时,可以在所有不相关对的二次方更大的一组IBD段上分析突变事件个人。 我们使用合成数据集针对各种人口统计学场景验证了所提出的方法,并分析了来自最近的精神分裂症患者外显子组测序研究(Fromer等人,Nature 1246)的2014个三阶段无关个体的突变率。

在古代人类中,数百个共同的“缺失”在现代人群中是多态的。 D.拉德克1,23,S。Sunyaev1,2 1)马萨诸塞州波士顿市哈佛医学院; 2)马萨诸塞州波士顿的布莱根妇女医院; 3)杰克逊基因组医学实验室,康涅狄格州法明顿。

相对于遥远的人类素和其他灵长类动物,了解现代人类的遗传独特性是人类进化基因组学的主要目标之一。 最近,有了尼安德特人和德尼索娃的高覆盖率序列数据,现在有可能更精确地确定引起现代人类独特性的特定基因座。 尽管许多区别性变异可能是由于单核苷酸变异,但基因组结构变异也可能起着至关重要的作用。 结构变体可以是有效的表型塑造力,尤其是对于不平衡事件(例如缺失),因为它们可以改变阅读框并消除调控元件空间。 分析整个古老基因组的序列读取深度,我们发现了尼安德特人和德尼索娃的数百个“缺失”区域(包括许多共有的缺失),这些区域在现代人群中是多态的。 一些共享的缺失与基因重叠,并且作为一组的共享的缺失在现代人群中具有明显更高的等位基因频率。 因为这些缺失在现代人类中是多态的,所以它们可能代表现代人类特定的插入区域,在古老人类谱系中丢失的区域,或者在现代和古老人群中都是多态的缺失。

果蝇和人类低氧适应的收敛机制。 贾哈(AR Jha)1,2,3,D.周4,5,CD布朗1,2,GG·哈达德(GG Haddad)4,5,克雷特曼1,2,3,KP白色1,2,3 1)芝加哥大学基因组和系统生物学研究所; 2)美国芝加哥大学人类遗传学系; 3)美国芝加哥大学生态与进化系; 4)美国加利福尼亚大学圣地亚哥分校,加利福尼亚大学圣地亚哥分校呼吸内科儿科; 5)拉迪儿童医院,美国加利福尼亚州圣地亚哥。

耐低氧(缺氧)的能力是一种高度多基因但机械上保守的性状,对人类健康和进化都具有重要意义。 然而,关于进化的群体中参与低氧适应的遗传机制的多样性知之甚少。 我们使用果蝇果蝇的实验进化和全基因组测序来研究自然变异在适应缺氧中的作用。 使用广义线性混合模型,我们确定了约4000个单核苷酸多态性的三个独立进化的耐缺氧群体和常氧对照之间的显着等位基因频率差异。 这些变体中的许多都聚集在66个不同的基因组区域中,代表了我们种群中的远距离联系。 这些区域富含与代谢过程相关的基因,并包含在耐缺氧人群和常氧人群中差异表达的基因。 与开放气管系统发育和缺口信号通路相关的其他基因也显示了方向选择的证据。 敲除少数候选基因的基因表达显示出严重缺氧时存活率显着提高,表明它们在缺氧适应中的功能相关性。 使用来自三个高海拔人群(夏尔巴人,藏族和埃塞俄比亚人)的全基因组基因分型数据,我们显示,苍蝇中正在选择的基因的人类直系同源基因也在所有三个高海拔人群中处于正选择状态。 因此,比较基因组学方法(例如我们在这里采用的方法)可以有效地揭示潜在的进化古代特征的基因和途径,这些特征已经保存了数百万年。

使用时间非均匀扩散方程的数值解来评估最近人类人口统计学对频谱的影响。 科克(E. Koch)1,J。Novembre2 1)伊利诺伊州芝加哥市生态与进化大学系; 2)伊利诺伊州芝加哥市人类遗传学大学系。

最近人口统计学历史上的差异似乎是观察到的人类遗传多样性水平的重要驱动力。 最近的关注特别集中在经过非洲瓶颈的人群中如何降低杂合度和多态性位点,这些位点成比例地更可能是非同义词或预计会造成破坏。 这些结果表明有害变化的频谱差异也是由人口统计历史的变化引起的。 为了更详细地研究这些现象,我们在泊松随机场模型下对等位基因频谱的时间非均匀扩散方程执行数值解。 这使我们能够有效地检查在大量可能的人类人口统计数据和选择性效应分布下,频谱是如何随时间变化的。 我们还能够根据产生变异的年龄轻松地对今天观察到的变异进行分层。 使用这些工具,我们演示了自然选择和人口统计学产生观察到的模式的能力,并评估了人口瓶颈,近期增长率和选择效力变化对不同变体类型的丰度的相对影响。 结果强调了人类频谱如何远离平衡,并且更清楚地说明了频率在不同的时间尺度上如何受到人类主要人口事件的影响。 例如,在非洲以外的人群中,瓶颈仍然对频谱产生了影响,即使最近的增长事件导致稀有变种的大量涌入也是如此。 我们量化这些影响,并讨论其对解释人类遗传变异模式的重要性。 。

南部非洲的皮肤色素沉着的遗传结构≠Khomani San。 马丁1,JM Granka2,CR Gignoux1林先生3,乌伦(C. Uren)4,M。Möller4,CJ Welyly4,吉德·基德(JM Kidd)5,MW费尔德曼2,EG Hoal4,CD Bustamante1,BM Henn1,3 1)斯坦福大学遗传学系,加州斯坦福; 2)斯坦福大学生物科学系,加利福尼亚州斯坦福,94305; 3)纽约州立大学石溪分校生态与进化部,纽约11794; 4)南非泰格堡斯泰伦博斯大学分子生物学与人类遗传学系; 5)密歇根大学人类遗传学系,密西根州安娜堡。

皮肤色素沉着是全球人类中最可识别的表型之一,但它的高度遗传基础已首先在北欧,亚洲和非裔美国人人群中进行了研究。 欧亚色素沉着等位基因是基因组中分化程度最高的变异体之一,表明对浅色皮肤色素沉着的选择强烈。 在非洲最南端的喀拉哈里沙漠(Kalahari Desert)的KhoeSan狩猎者和采集者中也观察到了浅色的皮肤色素沉着。 KhoeSan的狩猎采集者是最古老的人群之一,据信在100,000年前已与其他人群分离,并保持了非同寻常的遗传多样性水平。 尚不清楚浅色的皮肤色素沉着代表会聚的进化还是祖先的人类表型。 我们收集了来自卡拉哈里(Kalahari)≠Khomani San的136个人的人种学信息,色素沉着表型和基因型数据。 为了了解浅色皮肤色素沉着的遗传基础,我们还对83≠Khomani San个体进行了外显子组测序,从而获得了较高的覆盖率,从而生成了1000个基因组计划之外最大的非洲土著外显子组数据集。 在这项研究中,≠Khomani的人与欧洲人的混合比例平均为11.5%,与班图人的混合比例为10.9%。 欧洲血统显着增白皮肤,解释了13.3%的色素沉着差异,班图血统显着使皮肤变黑,解释了平均16.1%的色素沉着差异。 我们估计色素沉着是高度可遗传的(h2 = 0.887±0.188标准误差),并且发现大多数遗传力可以由50个已知的色素沉着基因解释(平均0.527±0.310或64.1%)。 在控制了与欧洲和说班图语的人群的混合后,线性混合模型GWAS方法无法识别与色素沉着显着相关的变异。 但是,色素沉着基因是≠Khomani San和欧洲人或班图人之间最广泛地区分的基因之一,将分化与关联数据汇总在一起可以提高检测影响所选性状的变异的能力。 我们在包括经典OCA2和MITF在内的多个规范色素沉着基因中,在≠Khomani与欧洲和班图人之间找到了高度分化的变异体。 我们的结果强调了各种人群研究的优势,可以解释受人类进化历史影响的表型变异。

协会研究证实,两个OCA2多态性与东亚人群的正常皮肤色素沉着变化有关。 E. Parra,K.Eaton,P.Kavanagh,M.Edwards,S.Krithika 部门人类学,多伦多大学,多伦多,加拿大。

过去十年见证了我们对欧洲人群正常皮肤色素沉着变异的遗传结构的理解方面的巨大进步。 但是,东亚人口的证据更为有限。 最近,我们进行了一项研究,旨在确定东亚血统人群中色素沉着候选基因中阳性选择的假定特征。 基于显示东亚选择特征的基因列表,我们基于1 /等位基因频率信息(例如东亚和非东亚人群之间的频率差异)2 /潜在功能效应(例如Polyphen,SIFT和CADD分数)和3 /保守度(例如GERP ++分数)。 所选的SNP包括LYST基因中的3个标记(rs3754234,rs7522053和rs4659610),MLPH基因中的一个标记(rs2292881),OPRM2基因中的1个标记(rs1799971和rs6917661),EGFR基因中的一个标记(rs2227983)。 ),BNC4基因中的2个标记(rs9406647,rs3739714,rs10756778和rs10962591),TH基因(rs4930046)中的一个标记,OCA3基因中的2个标记(rs1800414,rs74653330和rs7497270),TRPM1基因的一个标记(rs3809578) )和MC2R基因中的1个标记(rs33932559和rs885479)。 我们评估了这些多态性与使用DSM II比色计定量测量的皮肤色素沉着的关联,该样本包含452个东亚血统个体。 OCA2基因中的两个先前描述的非同义多态性rs1800414(His615Arg)和rs74653330(Ala481Thr)与该样品中的黑色素水平密切相关。 在加性模型下,编码精氨酸的常见rs1800414 G等位基因与黑色素水平降低0.9个单位相关。 编码苏氨酸的rs74653330 A等位基因在东亚的出现频率较低(在我们的样本中约为3%),并且对黑素水平的影响要比rs1800414(减少1.3个黑素单位)强。 对于任何其他变体,均未观察到与皮肤色素沉着的显着关联。

携带功能变体Val92Met的单倍型的穴居人起源 MC1R 在现代人类中。 丁磊1胡Y1徐S2,王C1李华1张R1严S1王杰11,2 1)复旦大学生命科学学院,遗传工程国家重点实验室和当代人类学教育部重点实验室,上海; 2)中国科学院上海生物科学研究所(SIBS)CAS-MPG合作伙伴计算生物学研究所,上海

肤色是现代人类最明显和最重要的表型之一。 黑色素细胞刺激激素及其受体在调节肤色方面起着重要作用。 在这里,我们提供了包含黑素细胞刺激激素受体基因的尼安德特人基因渗入的证据 MC1R。 尼安德特人渗入的单倍型与阿尔泰尼安德特人103.3 KYA不同,后者早于解剖学上现代的人类-尼安德特人的分歧。 我们进一步发现,所有推定的尼安德特人基因渗入型单倍型均携带Val92Met变异体,这是一种功能丧失的变异体。 MC1R 与多种皮肤病学特征有关,包括皮肤颜色和光老化。 在欧洲人中,尼安德特人渗入的频率较低(约5%),在东亚大陆中则为中度(约30%),而在台湾原住民中则较高(60-70%)。 由于推定的尼安德特人(Neanderthal)渐渗单倍型携带功能丧失型变体,可能会改变 MC1R 并且与肤色相关的多个特征有关,我们推测这种尼安德特人(Neanderthal)渗入与先前报道的尼安德特人(Neanderthal)渗入在 透明质酸2可能在现代欧亚人对日照强度的局部适应中发挥了重要作用。

全基因组测序揭示了安第斯山脉对高海拔地区的适应性。 M·马齐奥1,2,K。Slivinski3,MC Yee4,库克(T. Cooke)5,CD Bustamante5,G。Bailliet1,CM Bravi1,2,EE肯尼3,4,6,7,8 1)阿根廷布宜诺斯艾利斯拉普拉塔市国立调查研究中心和技术中心; 2)阿根廷拉普拉塔国立大学自然科学与博物馆学院; 3)纽约西奈山伊坎医学院的查尔斯·布朗夫曼个性化医学研究所; 4)Dinneny Lab。 华盛顿卡内基研究所。 加州植物生物学系; 5)斯坦福大学医学院,加利福尼亚; 6)纽约西奈山伊坎医学院遗传与基因组科学系; 7)纽约西奈山伊坎医学院统计遗传学中心; 8)纽约西奈山伊坎医学院基因组学和多尺度生物学研究所。

人们对人类适应多种环境感兴趣,包括找到有利于压力如缺氧的表型的遗传基础。 我们有初步的Illumina外显子组阵列数据,这些数据来自阿根廷的Humahuaca地区(海拔约43米)的安第斯山脉高海拔村庄的2500个人,以及来自阿根廷塔尔塔加尔附近低地人口的11个人(少于500)使用Admixture软件估算,所有这些都具有超过90%的美国原住民血统。 目前,我们正在对来自这些人群中每一个的10个人的完整基因组进行测序,以寻找新的特定人群变异。 我们将使用人口分支统计(PBS)来识别高地人(Andean)和低地人(Chaqueños)之间的高度差异化基因组区域。 我们将根据有关藏族,埃塞俄比亚人和其他安第斯族人口适应低氧的相关工作,讨论扫描结果。

干扰素3/干扰素4 该地区显示出针对亚洲人群的近期积极选择的证据。 GL Wojcik,CD Bustamante 加利福尼亚州斯坦福市斯坦福医学院遗传学系。

丙型肝炎病毒(HCV)是全球性的健康负担,长期感染130-150亿人,每年因HCV相关性肝病导致350,000-500,000例死亡。 发现HCV后二十五年,没有疫苗,而且大部分人的治疗仍然无效。 在不同遗传背景的个体之间观察到临床结果的异质性,例如病毒的自发清除以及治疗后的持续病毒学应答(SVR)。 先前的遗传研究已经确定了干扰素λ3和λ4中的单核苷酸多态性(SNP)(干扰素3/干扰素4)(rs12979860)与临床结局密切相关。 尽管rs12979860(C)的衍生和有利等位基因在全球范围内存在,但其频率在非洲大陆中最低(34-49%),在亚洲人口中最高(89-96%),因此在大陆上有很大差异。 为了确定这些差异是否是由于选择性压力造成的,分析了来自3个基因组计划(TGP)的​​第1000阶段发布的数据,以针对特定人群进行选择。 衍生等位基因频率(DAF),F st,对来自欧洲,非洲,亚洲和美洲的人群的核苷酸多样性(π)和单倍型结构进行了检查和比较。 大约5 kb(kb)的区域 干扰素3/干扰素4 在亚洲人群中显示出核苷酸多样性降低,DAF高和单倍型纯合性增加。 在美洲原住民人群中未发现这种模式,这表明最近有针对亚洲的积极选择。 HCV(或可能是相关祖传病毒)的历史选择性压力可能已将有利的rs12979860等位基因推向了固定位置。 然而,尽管有这种适应性,亚洲目前仍具有与HCV相关的高发病率和高得多的死亡率,这表明该病毒进一步进化。 因此,亚洲人群中临床结局的差异也可能是由于非干扰素3/干扰素4 遗传变异。 需要进一步的研究来确定其他遗传关联,以更好地了解HCV与人类免疫系统的相互作用。

使用1000个高覆盖率,阿尔茨海默氏症特异的全基因组序列进行全基因组范围的自然选择扫描。 埃伯特1,史密斯1,T。道森1,格罗斯曼2,诺顿(M. Norton)3,J。Tschanz3,R。Munger4,C。Corcoran5,P.里奇1,J。Kauwe1,ADNI 1)犹他州普罗沃杨百翰大学生物系; 2)马萨诸塞州剑桥市麻省理工学院和哈佛大学广泛研究所; 3)犹他州洛根的犹他州立大学家庭消费者与人类发展系; 4)犹他州洛根的犹他州立大学营养,营养学和食品科学系; 5)犹他州洛根的犹他州立大学数学与统计系。

自然选择研究影响了基因研究,也影响了我们对人类适应性的理解,包括抗疟疾,皮肤色素沉着等。 最近,Grossman等人。 通过使用1000个基因组数据进行全基因组选择扫描,发现了对细菌反应和特定人类表型的适应性-识别了没有已知的适应性表型特征的特定适应性突变。 这种扫描方法成功地将研究类型从假设驱动的研究转变为产生假设的研究。 尽管全基因组扫描成功,但存在潜在的局限性:(1)1000个基因组数据只有179个全基因组序列; (2)序列覆盖率低(2-6倍平均覆盖率); (3)1000个基因组数据的基因型可能不准确,原因是覆盖率低,并且没有使用现代的“联合调用”算法对它们进行基因分型。 我们正在执行更新的分析,包括1000多个阿尔茨海默氏症特异的全基因组序列,平均覆盖率为37倍。 我们的数据集包括152个阿尔茨海默氏病(AD)病例和211个“超级对照”。 “超级对照”是4岁以上的APOEε75阳性个体,没有AD症状。 使用我们的大型,高覆盖率数据集,我们将探索更大的样本量和更深的覆盖范围是否揭示了之前未发现的基因座。 我们还将探讨在已知与AD相关的基因座处于选择状态的前提下,使用特定于AD的数据集是否会增强与AD相关的选择信号。 这样,AD可能是原本有益的基因型相互矛盾的多效作用的结果。 在使用GATK的HaplotypeCaller联合调用所有样本后,我们将使用多信号复合(CMS)算法对我们的数据集执行全基因组范围的自然选择扫描,以识别正在选择的特定基因座。 将这些结果与Grossman等人的先前结果进行比较,以确定是否有任何新的基因座显示出选择的证据,以及是否消除了先前确定的区域(潜在的假阳性)。 根据已知的疾病关联和功能注释,将检查先前和新发现的基因座是否具有潜在的AD暗示。 排名靠前的候选人将使用关联测试进行测试。 自然选择研究揭示了观察到的表型的重要遗传文物。 许多与AD相关的基因正在选择中,并且可能还有其他未发现的与AD相关的基因。

美拉尼西亚种群中色素沉着候选基因多样性的进化历史。 诺顿(H. Norton),埃伦(E.Werren) 俄亥俄州辛辛那提大学,辛辛那提大学人类学系。

皮肤,头发和眼睛的色素沉着是由多个基因座决定的复杂表型特征。 人们认为皮肤的色素沉着是响应强烈水平的紫外线(UVR)强度变化而在强烈的自然选择下演变而成的一种特性。 较浅的肤色在人类进化史上已经进化了多次,但尚不清楚在许多高UVR人群中观察到的较暗肤色是否也是进化趋同的结果(暗示正向选择可能有利于特定人群的突变)或相反,是否通过纯化选择在高UVR人群中维持了与肤色较深相关的祖先变体。 为了解决这个问题,我们比较了美拉尼西亚种群中多个色素沉着候选基因的DNA序列变异与在1000个基因组计划中测序的欧洲,东亚和非洲种群中观察到的变异。 包括三岛基因的田岛D(TD)的站点频谱摘要, 知识产权协会, OCA2TYRP1,并不表示在美拉尼西亚人中,这些基因中的任何一个都被阳性选择作为靶点(知识产权协会 TD = 0.037, OCA2 TD = -0.85,TYRP1 TD = -0.55)。 除了一个新的单倍型 OCA2 在〜10%的频率处观察到的基因座,几乎没有证据表明美拉尼西亚人在这些基因座上表现出任何高频种群特异性单倍型,这表明如果在美拉尼西亚人中发生了对高UVR条件的独立适应,则其他色素沉着基因座是负责任的。 但是,也几乎没有证据表明美拉尼西亚人在这些基因座上与非洲人相似,如果美拉尼西亚人与其他高UVR种群共享祖先的单倍型,人们可能会期望:成对F ST 美拉尼西亚人和非洲人之间针对此处检查的色素沉着基因的估计范围为0.043-0.443,而美拉尼西亚人的单倍型大多数是非洲人,欧洲人和东亚人之间共有的常见单倍型。 我们在人类色素沉着变化的进化模型的背景下,并考虑到美拉尼西亚种群的历史,探索了色素沉着基因座的这些序列变异和种群间差异的模式。

基于单倍型模式的纯化选择强度的推断。 D.奥尔特加·德尔·维奇约1,KE Lohmueller1,2,J。Novembre3 1)加利福尼亚大学洛杉矶分校生物信息学跨学科计划; 2)加利福尼亚大学洛杉矶分校生态与进化生物学系; 3)伊利诺伊州芝加哥大学人类遗传学系。

纯化选择的强度是人群遗传多样性水平的核心因素,对于表征特征以了解疾病特征的预期遗传结构非常重要。 最近对大量样本进行的测序研究表明,在人类群体中,罕见与常见变体之间的非同义变体比例更高。 这一发现表明,自然选择对这种变异起作用,使它们在种群中处于较低的频率。 为了估计纯化选择的强度,我们开发了一种方法,该方法使用携带稀有变异单倍体之间的成对单倍体同一性的长度。 与以前的方法不同,我们的方法以等位基因的当前频率为条件,并且是基于这样的直觉,即进行纯化选择的等位基因平均比中性等位基因年轻,因此在变异携带者中应具有更高的平均单倍性。 为了获得成对单倍型同一性长度上的概率分布,一个人需要执行两次积分:一次积分在所有可能的等位基因频率轨迹上,另一次积分在所有成对合并时间上给出给定的等位基因频率轨迹。 可能的等位基因频率轨迹在空间上的积分是使用快速重要性采样算法完成的,而在合并时间上的积分是使用解析解决方案完成的。 使用不同选择系数下单倍型长度的概率,我们可以计算单个变体或一组变体的选择系数的可能性。 我们使用模拟来测试该方法在不同人口场景(例如恒定的人口规模和欧洲人口增长的现实模型)下估计选择系数的准确性如何。 在近期人口增长的情况下,具有相同选择系数的变体很难与中性变体区分开。 这些方法将应用于在202个个体中测序的14,002个药物靶基因集(Nelson等,2012,《科学》),以鉴定哪些基因最可能具有可能易患疾病的破坏性变异。

使用三个高覆盖度基因组来突出显示高度分化的区域,这些基因组分别来自一组全球人口。 帕加尼1,2,3,T。Kivisild1 1)英国剑桥大学剑桥大学生物人类学系; 2)惠康信托桑格研究所,英国辛克顿CB10 1SA; 3)意大利博洛尼亚大学生物地质与环境科学系分子人类学实验室。

随着测序成本的稳定下降,几个国际项目不久将提供来自全球数百个人口的2-4个高覆盖度基因组。 尽管这些资源可用于完善所研究人群的人口历史记录,但对于检测这些人群的分化特征(可能是自然选择所致),几乎无济于事。 迄今为止可用的选择扫描方法确实集中在各种基因组成分(SNP,单倍型,LD区段)上,但依赖于基因组频率而不是完整的序列信息。 在这里,我们展示了仅使用来自两个种群(CEU和YRI)的三个基因组分析的前1%基因区域如何包含使用25个基因组计划的5个低覆盖率个体获得的前160%FST候选者的多达1000%。 将来自每个选定群体的三个基因组组合成三对,并基于群体之间的平均成对差异计算FST。 在所有pop10000-pop50000基因组对上的1或2 bp的滑动窗口上计算平均FST。 选择显示最高分化的顶部1%窗口,并检查其基因含量。 通过FST扫描基于1785个低覆盖率个体(作为金标准)鉴定的160个基因中,在YRI-CEU对的前98%439bp窗口中包含的1个基因中发现了50000个。 用卡方检验发现此2.4倍的富集显着(p = 10-19)。 黄金标准的经验排名性质不允许对我们新开发的方法的假阳性率进行正式评估。 但是,使用10000和50000 bp窗口检索到的顶部基因之间的重叠表明,在高级FST信号中存在大量富集。 综上所述,基于每个种群三个基因组的拟议方法能够在从传统方法中发现的推定自然选择下检索至少25%的基因。 正在进行的功率评估还将告知进一步降低假阳性率所需的每个人群高覆盖基因组的最佳数量。 鉴于小样本量带来的局限性,这些令人鼓舞的结果使我们的方法适用于新测序的人群(预计将于2014年XNUMX月中旬在SMBE会议期间发布)。

在全世界的人口中搜寻柔和的选择性扫除。 ZA Szpiech1,RH埃尔南德斯(RH Hernandez)1,2,3 1)加州大学旧金山分校旧金山分校; 2)加利福尼亚大学旧金山分校人类遗传研究所3)加利福尼亚大学旧金山分校,定量生物科学研究所(QB3)。

关于近代人类进化中自然选择的力量和方式的争论很多。 对于经典的硬扫描尤其如此,在此期间,自适应等位基因会迅速将单个单倍型拖到高频。 适应性的替代模型涉及软扫频,从而将多个单倍型带到高频(即,当先前分离的中性或略有有害的等位基因在新环境中变得适应性强时)。 现有的基于单倍型的测试(例如通过跟踪单倍型纯合性的衰退来扫描阳性选择的综合单倍型评分(iHS))在假定阳性选择区域将由单个单倍型主导的前提下工作。 但是,预计iHS将在软扫描下失去电源。 在这里,我们从iHS和果蝇种群遗传学的最新研究中获得启发,开发出一种统计数据,旨在通过跟踪多个单倍型从核心基因座脱离的纯合性衰减来检测最近的软扫描。 我们在人类人口统计学的多种现实模型下,通过严格的模拟评估我们的统计数据。 我们发现,与iHS相比,它具有检测硬扫描和软扫描的强大功能,并具有增强的功能。 特别是,对于固定的选择系数,我们的模拟表明,我们具有检测非洲人口中的软扫荡的最大能力,而迄今为止,对这些人口的软扫荡还没有进行充分的研究。 我们将此统计数据和iHS应用于来自1,728个基因组计划的20个不相关个体的大型人类基因型数据集,该个体跨越1000个全球人口。 根据我们的统计数据确定的许多地区并未被iHS识别,特别是在非洲人口中。 这表明软扫在人类近代进化中可能起重要作用。

在melanocortin-3受体基因位点的自然选择。 一吉内 日本神奈川县镰仓市吉内医学糖尿病研究所,糖尿病与药物学系。

肥胖与2型糖尿病,代谢综合征,高血压,中风和心血管疾病显着相关。 肥胖症在世界范围内的流行率正在稳步上升。 肥胖是高度遗传的疾病,会引起严重的健康问题。 在传统的盛宴和饥荒周期中,与肥胖相关的基因的自然选择将是重要的,因为这些基因控制体重和脂肪水平。 人类对食物供应,生活方式和地理环境变化的适应可能影响了与葡萄糖,脂质,碳水化合物和能量代谢相关的基因的选择。 melanocortin-3受体(MC3R)基因是肥胖相关基因之一,并且MC3R突变已显示与肥胖相关。 MC3R缺陷小鼠表现出增加的脂肪量。 在这里,我们旨在揭示MC3R基因位点选择的证据。 我们使用HapMap群体数据执行了三步方法来检测MC3R基因位点的选择。 我们使用赖特氏F统计量作为种群分化的量度,使用远程单倍型检验来测试扩展单倍型,并使用集成单倍评分测试来检测MC3R基因位点的选择。 我们通过综合单倍型评分测试在非洲人口中观察到了MC3R基因位点的自然选择。 这一发现为MC3R基因位点的自然选择提供了证据。 肥胖相关基因的适应性进化有待进一步发现。

在中美洲天花相关基因中的正选择。 OA加西亚1,K。Arslanian2,D。Whorf1,M。Shriver3,LG摩尔4,T。Brutsaert5,比格汉姆(AW Bigham)1 1)密歇根大学密西根州安阿伯市人类学系; 2)耶鲁大学人类学系,康涅狄格州纽黑文; 3)宾夕法尼亚州立大学宾夕法尼亚州立大学人类学系; 4)科罗拉多州奥罗拉市科罗拉多大学妇产科; 5)纽约州锡拉丘兹市雪城大学运动科学系。

在中美洲殖民化期间,死亡的主要原因之一是新型传染病的引入。 天花是最致命的传染病之一。 因此,研究天花感染和免疫反应相关基因中自然选择的特征不仅为我们进化的过去提供了一个窗口,而且还是一种确定现代传染病宿主因素的特别有吸引力的策略。 为了表征中美洲人群中的宿主危险因素,我们询问了使用Affymetrix 906,600基因分型阵列检测的6.0个SNP,以鉴定231个免疫反应基因中的自然选择。 我们的人口包括:中美洲:25名玛雅人和14名纳瓦人,来自墨西哥的Mixtec和Tlapanec讲者,安第斯族:25名来自玻利维亚的Aymara和24名来自秘鲁的Quechua。 此外,我们使用了来自60个北欧血统的欧洲人和来自中国和日本的90个东亚人的可用数据。 我们应用了三种统计检验来确定自然选择的特征:位点特定分支长度(LSBL),杂合度比率的自然对数(lnRH)和田岛D。此外,我们使用两种单倍型文本分析了部分扫描和硬扫描:整合单倍型评分(iHS)和跨群体扩展单倍型纯合性(XP-EHH)。 我们根据经验分布确定了统计显着性。 在我们进行正面选择的最强结果中,有 CD74, ZAP-70伊克ZF1 在东亚人和欧美人的比较中,中美洲人在5%和1%的水平上进行的所有统计测试中均具有显着意义。 此外,与安第斯人口相比,它们在统计上具有显着意义。 CD74 是主要的组织相容性复杂类II(MHC II)不变链。 研究表明 CD74的蛋白质可作为细胞因子MIF(一种关键的免疫反应因子)的受体。 ZAP-70 T细胞信号传导是T细胞信号通路不可或缺的一部分,从而调节适应性免疫应答。 多项研究表明 CD74ZAP-70 要关联的表达式。 伊克ZF1 作为调节自身免疫性疾病的主要手段,目前已作为调节造血功能的一部分进行了研究。 这项研究的结果将通过精确定位中美洲人群中传染病易感性和耐药性的候选基因,为未来的研究提供帮助。

选择和人口减少导致东亚尼安德特人血统的数量超过欧洲人口。 1,K。Lohmueller1,2 1)加州大学洛杉矶分校,生态与进化生物学; 2)加利福尼亚大学洛杉矶分校,生物信息学跨学科计划。

了解现代人类的尼安德特人血统可能为不同人群的进化提供重要的见解。 据信,尼安德特人与欧洲和亚洲人口的混合比与非洲人口的混合要大得多。 此外,最近的研究表明,相对于欧洲人,东亚人的尼安德特人等位基因频率更高。 提出了几种假设来解释这种差异。 一种假设认为,在现代欧洲人和东亚人祖先的人口中只有一个混合事件,而许多尼安德特人等位基因在现代人类中是弱毒的。 由于历史上东亚人的人口规模小于欧洲人,因此从东亚人口中剔除尼安德特人等位基因可能需要进行净化选择,从而导致东亚人中尼安德特人血统的比例更高。 在这里,我们使用实时人口遗传模拟来检验该假设。 这些模拟包括从数据估计的欧洲和东亚人口历史的合理模型,以及尼安德特人等位基因在人类中的适应性影响模型,其中包括不同的优势情景和选择系数的分布。 从两个人口中的尼安德特人血统数量相同开始,我们发现欧洲人与东亚人之间的人口规模差异以及纯化选择不能导致观察到的东亚人中尼安德特人血统数量增加。 此外,当在两个种群中以相同的初始尼安德特人血统初始数量开始时,仅现实的种群规模变化不足以相对于另一种群降低或增加一个人中的尼安德特人血统。 必须通过其他一些过程来解释观测到的数据,例如尼安德特人混合物向东亚人群中的另一波浪潮。

亚洲多样性项目:对亚洲人口的人口结构和当地适应状况的调查。 X.刘1,23,怀俄明州1,TH Ong1,西蒙斯(C. Simmons)4,P。Suriyaphol5,S. Tongisma6,何保BP7,N.加藤8,YY Teo1,9 1)新加坡国立大学Saw Swee Hock公共卫生学院; 2)新加坡国立大学国立大学研究生院; 3)中国科学院马克斯·普朗克人口基因组独立研究组和中国科学院上海生物科学研究所马克斯·普朗克学会计算生物学合作伙伴研究所,中国上海; 4)越南胡志明市热带疾病医院牛津大学临床研究室; 5)泰国曼谷玛希顿大学生物信息学和数据管理研究部; 6)泰国Pathumtani国家基因工程和生物技术中心基因组研究所; 7)马来西亚Teknologi MARA大学(UiTM)医学院医学分子生物技术研究所(IMMB),马来西亚雪兰莪Sg Buloh; 8)日本东京国立全球健康与医学中心研究所基因诊断与治疗学系; 9)新加坡国立大学统计与应用概率系。

作为地球上最大的大陆,亚洲拥有全世界60%以上的人口。 亚洲人口中存在着巨大的遗传多样性。 HUGO泛亚SNP联盟为亚洲人口提供了宝贵的遗传资源,并对亚洲人口的遗传多样性和人口历史进行了详尽的调查。 但是,SNPs的稀疏覆盖使得难以进行自然适应性的分析。 在这项研究中,我们收集了来自亚洲46个人群的密集基因分型数据。 在各种基因分型平台上对来自东亚,中亚,东南亚和南亚的4093多名个体进行了基因分型。 进行主成分分析(PCA)和混合分析以阐明ADP人群的种群结构。 研究发现,地理因素在塑造亚洲人口的人口结构中起着重要作用; ADP人口进一步分为东亚,中亚,东南亚和南亚亚组。 我们使用iHS,XP-EHH和haploPS对ADP群体中的阳性选择信号进行了全基因组扫描。 在669个ADP人群中共检测到46个候选选择区域。 对选择信号进行了PCA分析,以调查46个种群中选择信号的共享程度。 发现通过选择信号对种群进行聚类类似于从种群结构分析中推断出的聚类。 东亚和东南亚群体共享最多的选择信号。 而南亚族群则具有与其他亚洲人口不同的选择信号。 对于由多个种群共享的选择信号,我们研究了选择的起源, 即。 选择要么起源于共同祖先的单个突变,然后是后续的基因流,要么是趋同进化的结果,其中选择与多个突变事件分开出现。 通过计算单倍型相似性指数研究阳性选择信号的起源。 单体型相似性指数确定了36个趋同进化的选择区域,其中大多数涉及东南亚的原住民。

的多效作用 爱达V370A 维吾尔族混合人口中。 彭鹏1李健1,谭健2,3杨Y2,3关元4张L4焦Y4,P。Sabeti5,61,2,3,S.王1 1)中国科学院上海生物科学研究所CAS-MPG计算生物学合作伙伴研究所,上海; 2)复旦大学生命科学学院和生物医学研究所,现代人类学教育部重点实验室,上海; 3)中国医学科学院卫生科学研究所,江苏省台州市; 4)新疆医科大学基础医学院生物化学系,新疆乌鲁木齐; 5)美国剑桥哈佛大学和麻省理工学院; 6)生物与进化生物学系系统生物学中心。

人类Ectodysplasin受体的适应性变体, 爱达V370A,显示了最近从全基因组扫描中阳性选择的最强信号之一。 在转基因小鼠和人类中,发现 爱达V370A 影响外胚层相关的表型,包括头发的厚度和形状,活动的汗腺密度和牙齿的形成。 但是,以前的人类研究都是基于东亚人群,其中祖先等位基因370V的频率很低。 遗传模型是否尚无定论。 爱达V370A 是加性的还是显性的。 功率不足是由于370V纯合子的存在率低,这使得探索大范围可能受到影响的外胚层相关表型不切实际。 在这项研究中,我们利用东亚和欧洲维吾尔族之间的混合种群研究多效性和遗传模型。 爱达V370A。 通过检查一系列与表皮有关的表型和 爱达V370A 294个维吾尔族样本中的基因型,我们复制了先前在门牙铲铲中的关联发现(P= 5.76×10-12)和直发度(P= 3.37×10-03),并进一步确认该关联正在遵循加性遗传模型。 我们还发现 爱达V370A 与新表型相关,包括更高的总汗腺密度(P= 0.03)和三角形的耳垂(P= 2.05×10-04)。 通过揭示更多的多效性 爱达V370A 并确认其遗传模型后,我们的研究可为动物的适应性进化提供更完整的图景 爱达V370A 在人类历史上。

一个隐藏的马尔可夫框架,用于估计硬扫描的选择时间。 史密斯1,史蒂芬斯(M. Stephens)2,M。Przeworski3,G。Coop4,J。Novembre2 1)伊利诺伊州芝加哥大学芝加哥大学生态与进化系; 2)伊利诺伊州芝加哥大学芝加哥大学人类遗传学系; 3)纽约州哥伦比亚大学生物科学系; 4)加州大学戴维斯分校进化与生态系,加州戴维斯。

遍及全球的扩散已导致人类占据了广泛的生态栖息地。 自然选择似乎在这一过程中发挥了作用,因为当前的方法已经确定了一些最近进行了选择性扫描的良好支持的基因座。 在某些情况下,将选择时机的估计值与历史/考古记录中的事件进行比较可以更清楚地了解推动人口适应的生态环境。 例如,朝着乳制品生产的文化转变与乳糖酶持久性等位基因选择时机之间的重叠,有助于评估观察到的选择性清除的可能原因。 结果,对推断阳性选择的等位基因的年龄的方法有很大的兴趣。 等位基因年龄估算的关键原理是由于重组和突变,选择性扫描的特征以每代恒定的速率衰减。 当前估计选择性扫描年龄的方法要么依赖于对所选单倍型长度的启发式估计,要么采用基于模拟的框架来识别产生完整数据观察摘要统计的年龄分布。 实际上,这些估计的置信区间很大。 在这里,我们提供了推断所选等位基因的祖先单倍型和该单倍型的重组断点的方法,以便提供更精确的等位基因年龄估计。 我们使用隐藏的马尔可夫模型框架执行此操作,该框架使我们能够在重组断点中的不确定性上进行整合。 该框架独特地使用祖先单倍型的当前长度分布和衍生突变的数量来估计自发生扫描以来的世代数。 单元型长度和衍生突变的联合使用增加了观察到的事件的总数,并为年龄估计提供了更窄的置信区间。 使用此联合评估器对模拟数据进行评估,从95到400代的扫描年龄的评估中,有500%的分位数在真实值的35代之内。 而仅基于衍生突变或单倍型长度的估计就可以从真实值获得约95代的70%的分位数。 未来的应用将重新考虑北欧人对乳糖酶持久性,欧洲和亚洲人皮肤色素沉着等位基因以及非洲G6PD基因座抗疟疾的选择时间。

混合后非洲裔美国人对阳性选择信号的基因组范围调查。 王宏1蔡Y2,王X3,B. Tayo4,你。 布罗克尔5哈尼斯(C. Hanis)6,卡迪亚(S. Kardia)7,S. Redline8,库珀(R. Cooper)4,唐华2朱X1 1)凯斯西储大学的流行病学和生物统计学系,俄亥俄州克利夫兰; 2)斯坦福大学遗传学系,加利福尼亚斯坦福; 3)纽约州石溪市石溪大学预防医学,生物医学信息学和应用数学与统计学系; 4)伊利诺伊州梅伍德,洛约拉大学医学中心公共卫生科学系; 5)威斯康星州威斯康星医学院人类与分子遗传学中心,威斯康星州; 6)6位于德克萨斯州休斯顿的德克萨斯大学健康科学中心流行病学,人类遗传学和环境科学系; 7)密歇根大学密西根州安娜堡市流行病学系; 8)美国马萨诸塞州波士顿哈佛医学院医学院。

在诸如非裔美国人这样的混合人口中,当地基因组区域中祖先的过高或不足可能表明自然选择。 我们扫描了三个大型非裔美国人队列,共20,153人,但未能识别出全基因组范围内明显过量或不足的信号。 我们表明,未能识别出任何重要的选择信号可归因于测试的估计方差,该方差包括两个部分:由于采样误差引起的方差和由于遗传随机漂移引起的方差。 当样本量增加时,由于遗传随机漂移而导致的方差比例会增加。 因此,基于检查本地祖先过剩的测试效率不高,并且在增加样本数量时其功效不会增加。 我们还表明,不同队列之间的本地祖先的高度相关性是由于历史重组和遗传随机漂移。 假设非洲裔美国人已经混合了8到12代,我们估计有效人口为32,000到48,000。

在大多数现代人类人口统计历史中,科伊桑族人的狩猎采集者数量一直是最多的。 HL。 金1,2,拉坦(A. Ratan)2GH。 佩里3,A.黑山4,5,米勒(W. Miller)2,SC。 舒斯特1,2 1)新加坡南洋理工大学新加坡环境生命科学工程中心; 2)美国宾夕法尼亚州立大学,比较基因组学和生物信息学中心; 3)美国宾夕法尼亚州宾夕法尼亚州立大学人类学系; 4)美国俄亥俄州立大学地理系; 5)Unesp的Campus do Litoral Paulista –巴西Unista Estadual Paulista。

我们对来自卡拉哈里沙漠的420名Khoisan狩猎采集者和也来自南部非洲的一名讲班图语的农业个体的完整基因组序列进行了高精度测序。 与来自全球490个个体的100K SNP基因分型数据集进行比较,混合分析显示,我们来自Ju /'hoansi组(北Khoisan)的Khoisan基因组中有150个与非Khoisan种群没有或仅有很少的混合,这使我们能够评估早期的人口统计学历史人类的物种。 对我们完整的基因组序列以及八个非Khoisan人的基因组序列进行了人口基因组分析,以推断其有效种群数量,并证明Ju /'hoansi种群保持了较大的有效种群数量,并且是所有这些人群中最孤立的人群。其他人口,因为最早的人口是在约120至30万年前的科伊桑人和其他人口之间分裂的(kya)。 相反,所有其他人口,包括讲班图语的祖传农业专家(就人口普查规模而言,目前是非洲最大的人口),已经经历了严重的瓶颈,其遗传多样性的一半以上(从80到100 kya)丧失了。 根据古气候记录和模式,中西部非洲变得更干燥,而南部非洲的降水增加了约XNUMX-XNUMX kya。 我们假设这些气候差异可能与非洲人口中祖先人口历史的差异有关。

卡拉什(Kalash)从巴基斯坦分离出来。 Q.阿尤布1,帕加尼(L. Pagani)1,2,梅萨维拉(M. Mezzavilla)1,3,泰勒·史密斯(C. Tyler-Smith)1 1)英国欣克斯顿惠康基金会基因组校区惠康信托桑格研究所; 2)英国剑桥大学生物人类学系; 3)母婴健康研究所-IRCCS“ BurloGarofolo”-意大利的里雅斯特的里雅斯特大学的里雅斯特。

卡拉什(Kalash)代表着一个神秘的孤立人群,他们在当今巴基斯坦的兴都库什山脉生活了几个世纪。 Macedon亚历山大三世入侵该地区后,以前的单亲(Y和线粒体)DNA标记没有为其声称的希腊血统提供任何支持,常染色体位点的分析提供了强大的遗传瓶颈的证据。 为了进一步了解其起源和人口统计学,我们在IlluminaHumanOmni23 BeadChip上对2.5个无关的Kalash样本进行了基因分型,并在Illumina Hi-Seq 2000上以高覆盖率对男性个体进行了测序。与邻近人群的比较证实了基于对650,000个常见单核苷酸进行基因分型的结果中心练习曲多态人类基因(CEPH)人类基因组多样性计划(HGDP)细胞系专家组的卡拉什(Kalash)样本中的多态性但是,正如Hellenthal等人最近所建议的那样,我们没有观察到混合的证据。 据估计,卡拉什族和目前居住在该地区的其他人口(也说印欧语)之间的平均分歧时间为11.8(10.6 -12.6)KYA。 自从分裂以来,卡拉什很少或几乎没有来自其地理邻近地区的基因流,并且长期有效种群数量维持在较低水平(2,247-2,780)。 他们可能代表了一些最早进入印度次大陆的移民。

从大样本基因组变异数据可识别和有效推断种群大小历史和基因座特异性突变率。 巴斯卡(A. Bhaskar)1,2,王永兴3,YS Song1,2,3,4 1)加利福尼亚大学伯克利分校西蒙斯计算理论研究所,加利福尼亚; 2)加利福尼亚大学伯克利分校,电气工程和计算机科学系; 3)加利福尼亚大学伯克利分校,加利福尼亚大学统计系; 4)加州大学伯克利分校整合生物学系,加利福尼亚州伯克利。

与先前推断的人类历史人口模型的预测相比,最近的几项大规模人类遗传学研究发现大量稀有变异。 一个被广泛引用的解释是,这种多态性模式表明了近代人类历史上爆炸性和加速的人​​口增长。 使用位点频谱(SFS),即一组序列中遗传变异的摘要,该序列将隔离位点作为突变等位基因频率的函数,我们开发了一种有效的方法来推断最近的人口统计学,可以扩展到涉及数十个样本的样本或成千上万的人。 使用合并下预期SFS的分析结果,并利用自动区分技术,我们开发了一种非常有效的算法,可以根据样本等位基因频率的分布推断历史有效种群大小的分段指数模型。 我们的方法比以前的基于频谱的人口统计学推断方法快几个数量级,并且还可以准确地估计特定于基因座的突变率。 我们表明,我们的方法可以准确地推断出快速指数增长的多个最近时期,这种信号很难用小样本量来获取。 我们将我们的方法应用于最近的11,000个欧洲个体的大样本外显子组测序数据集,并发现最近1.5代中每代370%的近代指数快速增长的证据。 我们还将研究此推理问题的统计可识别性方面。 最近显示,对于任意数量的样本量,非常不同的人口统计学人口统计信息可以生成相同的SFS。 尽管从原则上讲,这种不可识别性问题给统计推断带来了棘手的挑战,但这些反例中涉及的种群规模函数在生物学上可能是不现实的。 我们重新审视了这个问题,并显示了当人口规模为时,即使是中等规模的样本的SFS也会唯一地决定人口人口统计学 分段定义 每个部分都属于某些具有生物学动机的功能。 在群体基因组推论中通常采用的分段恒定,分段指数和分段广义指数模型中,我们为样本量提供了明确的值,足以从SFS识别人口统计学模型。

根据序列数据,在全球人群中以及全球人群之间的血统片段进行身份识别。 SR布朗宁1,BL勃朗宁1,2 1)华盛顿大学华盛顿大学生物统计学系; 2)华盛顿大学华盛顿大学医学遗传学系医学系。

人群内部和人群之间的个体按血统划分的身份(IBD)细分提供了有关人口历史记录关键方面的信息,例如有效的人口规模和迁移率。
序列数据为IBD分析带来了机遇和挑战。 序列数据比SNP阵列数据具有更多信息,从而提高了准确检测较小IBD片段的能力,从而获得了有关人口历史记录的更高水平的信息。 另一方面,低覆盖率序列数据具有较高的错误率,而SNP阵列数据通常非常准确。
我们最近开发了两种IBD片段检测方法:精制IBD和IBDseq。 精制IBD是专为SNP阵列数据设计的基于单倍频率的方法,而IBDseq是专为低覆盖序列数据设计的基于等位基因-频率的方法。 两种方法都是在同质种群的样本中开发的。 在异质环境中使用基于频率的方法时,我们期望子群体中假阳性IBD的发生率增加。
在分析来自全球人群的序列数据时,我们使用1000个基因组计划数据和模拟数据来研究IBDseq和精致IBD方法的性能。 我们发现,基于等位基因频率的IBDseq方法由于人群异质性而遭受假阳性检测到的IBD区段的比率增加,而基于单体型频率的精致IBD方法的影响则小得多。 我们开发了一种策略,使用多次运行的IBD精炼和填充相邻检测段之间的小间隙的过程,以恢复几乎完整的大IBD段,同时具有强大的检测短段的能力。 我们的方法可在1000个基因组项目数据中进行强大的IBD检测。

马来西亚半岛人类遗传结构,混合史和当地适应性的种群基因组景观。 邓邓1,B。Hoh21傅河1,菲普斯(M. Phipps)3李S4,A。Nur-Shafawati5哈特·哈廷(W. Hatin)6,伊斯梅尔(E. Ismail)7,S。Mokhtar24,B. Zilfalil5,马歇尔(C. Marshall)8,S。Scherer8,9,F. Al-Mulla10徐S1 1)中国科学院马克斯·普朗克人口基因组学独立研究组和中国科学院上海生物科学研究所马克斯·普朗克学会(CAS-MPG)计算生物学合作伙伴研究所(PICB); 2)马来西亚马拉加理工大学Universita Teknologi MARA医学院医学分子生物技术研究所,马来西亚雪兰莪双溪毛糯47000; 3)莫纳什大学杰弗里·谢亚医学与健康科学学院(双威校区),马来西亚雪兰莪46150; 4)复旦大学生命科学学院和生物医学研究所,教育部当代人类学重点实验室,上海200433; 5)马来西亚大学医学院医学部儿科,马来西亚吉兰丹16150; 6)马来西亚大学医学院人类基因组中心,马来西亚吉兰丹16150; 7)马来西亚科技大学生物科学与生物技术学院,马来西亚班吉43600; 8)加拿大安大略省多伦多市儿童病医院应用基因组学中心; 9)加拿大多伦多大学麦克劳克林中心和分子遗传学系; 10)科威特大学医学院病理学系,科威特Safat 13110。

马来西亚半岛是一个战略性地区,可能在亚洲最初的人口迁移和随后的人类迁徙中发挥了重要作用。 但是,居住在该地区的人类尤其是土著人口的遗传多样性和历史仍然知之甚少。 在这里,我们进行了全基因组研究,使用了马来西亚四个主要族裔群体(MEG;马来人,原始马来人,Senoi和Negrito)的900,000个单核苷酸多态性(SNP),并对17个全球人口进行了比较。 我们的数据显示,马来西亚半岛具有更大的遗传多样性,这与其作为亚洲早期和近期人类迁徙的接触区所起的作用相对应。 但是,每个单独的Orang Asli(土著)群体多样性较少,有效人口规模较小(Ne),而不是欧洲或东亚人口,这表明这些群体的某些持续时间基本上是孤立的。 从基因上讲,所有四个MEG与亚洲人口相比在遗传上都比其他大陆群体更为相似,MEG与东亚人口(12,000至6,000年前)之间的分歧时间也比东亚人与欧洲人之间的分歧时间短得多。 因此,尽管马来西亚Orang Asli族群具有明显不同的特征,但它们可能与其他亚洲族群有着共同的起源。 然而,我们发现了从非亚洲人到MEGs最近的基因流动的痕迹。 最后,在与MEG中的免疫反应,人类身高,皮肤色素沉着,头发和面部形态以及血压相关的一批基因中检测到自然选择特征。 著名的例子包括 同步3 这与所有Orang Asli组的人的身高有关,这是一个与身高相关的基因(PNPT1)和两个与血压有关的基因(CDH13PAX5)。 我们得出的结论是,漫长的隔离期,随后的基因流和局部适应共同塑造了MEG的遗传结构,这项研究为东南亚的人口和人类迁徙历史提供了见识。

当前意大利人口中的后裔共享身份揭示了有关近期人口历史的新细节。 菲奥里托(G. Fiorito)1,2,迪加塔诺(C. Di Gaetano)1,2罗莎(F. Rosa)1,瓜拉雷拉(S. Guarrera)1,2,帕尔迪尼(B. Pardini)1,A。Piazza1,2,G。Matullo1,2 1)人类遗传学基金会,意大利都灵都灵; 2)意大利都灵都灵大学医学系。

最近,通过来自大型队列的高分辨率基因组数据和用于IBD检测的新颖算法,可以推断出后代(IBD)的同一性。 这种方法可以更详细地检查种群的遗传结构,并获得有关最近人口统计事件(例如瓶颈和迁徙)的信息。 这项研究旨在表征意大利人口中的遗传变异性。 我们提供有关301个不相关的意大利个体的IBD共享之间的关系的分析结果,这些个体的基因型约为2.5万个单核苷酸多态性(SNP)。 每个样本都有明确的地理起源(来自同一地理区域的四个祖父母)。 由于意大利人口的共同祖先,我们将注意力集中在长期和相对较新的共享IBD人群上。 通过使用主成分分析(PCA)和祖先估计,我们确定撒丁岛是意大利境内的遗传异常值。 此外,在奥斯塔山谷人口中仍可检测到一定程度的分化。 对于这11个亚人群中的每一个,我们在人群之间和人群之间发现了数量最多的共享IBD区段,这表明按距离隔离。 与预期的一样,内部IBD区块数量最多的样本是撒丁岛,其次是奥斯塔山谷,托斯卡纳和西西里岛。 我们还评估了共享的IBD段与地理距离之间的关系。 与预期相反,对于更长(最近)的块,IBD随距离的衰减并不陡峭。 这样的结果表明,由于意大利境内的几次移民潮和/或居住在意大利的大量人口,这种交流一直在进行。 我们最终证明,增加的IBD共享区域丰富了结构变异和与自然选择有关的基因座,并且我们强调了共享的IBD单倍型与撒丁岛和意大利半岛发生的人口统计学事件之间的关系。 总之,我们的结果表明,研究人群之间共享的IBD片段是一种有用的方法,可以检测有关相对较近的人群历史的新颖细节。

人,丹尼索瓦人和尼安德特人之间的血统身份。 霍克赖特(S. Hochreiter),波维希尔(G. Povysil) 约翰内斯·开普勒大学林茨生物信息学研究所,奥地利林茨。

我们分析了人类,尼安德特人和Denisovans之间通过血统(IBD)细分所分享的非常短的身份,从而获得了有关其人口历史的新见解。 较短的IBD分段可以很早地传达有关事件的信息,这是因为较短的IBD分段会假定它们年龄较大。 通过下一代测序(NGS)可以鉴定短的IBD片段,该测序可提供较高的变异密度并报告所有频率的变异。 直到最近,才提出HapFABIA作为检测NGS数据中非常短的IBD片段的第一种方法。 HapFABIA利用罕见的变体来识别错误发现率低的IBD片段。 我们将HapFABIA应用于1000个基因组计划的全基因组测序数据,以鉴定在群体内和群体之间共享的IBD区段。 一些IBD区段与人类和其他灵长类动物的重建祖先基因组共享。 这些片段用稀有变体标记,因此某些稀有变体必须非常旧。 其他IBD段也很古老,因为它们与尼安德特人(Niandertals)或丹尼索瓦人(Denisovans)共享,这说明它们的长度较短。 Denisova基因组与亚洲人共有的IBD片段最匹配。 这些片段中的许多片段仅在亚洲人中发现,并且比其他大陆种群和Denisova基因组之间共享的片段更长。 因此,我们可以证实登尼奥斯范人从非洲迁出非洲后对他们的祖先有渗入。 尽管与尼安德特人匹配的IBD人群最常由亚洲人共享,但欧洲人也比其他人群拥有更多的份额。 同样,许多尼安德特人匹配的IBD片段仅在亚洲人中发现,而欧洲人共有的尼安德特人匹配的IBD片段也经常在其他人群中发现。 亚洲人或欧洲人共享的尼安德特人匹配的IBD片段比非洲人中观察到的更长。 这暗示了从尼安德特人到亚洲人和欧洲人离开非洲后的祖先的基因流动。 有趣的是,在非洲人中主要观察到许多与尼安德特人或杰尼索娃相匹配的IBD片段-其中有些甚至是排他性的。 非洲人和尼安德特人或Denisovans之间共享的IBD片段非常短,因此我们认为它们很老。 这可能表明这些部分起源于人类,尼安德特人和丹尼索瓦人的祖先,并在非洲人中幸存下来。

使用SNP频谱探索人口的详细人口历史。 X.刘,Y.-X. 福 德克萨斯州休斯顿的德克萨斯大学健康科学中心公共卫生学院人类遗传学中心。

利用遗传信息推断人类人口历史可以阐明史前重要的进化事件,例如人口瓶颈,扩张,迁徙和混合等。 它也是许多人口遗传学分析的基础,因为人口统计历史是塑造DNA序列多态性模式的最重要力量之一。 我们开发了一种新颖的无模型方法,称为阶梯图,该方法可使用SNP频谱推断出随时间推移的详细人口规模变化。 对于参考基因组尚不可用的物种,该方法可以应用于低覆盖率序列数据,合并序列数据甚至是无参考序列的数据。 这种方法的另一个优点是能够处理数百个个体的全基因组序列。 通过广泛的模拟,我们将我们的方法与基于成对的顺序马尔可夫聚结(PSMC)框架的Li和Durbin方法进行了比较,结果表明,在推断近期人口规模变化方面,我们的方法优于PSMC方法。 我们将我们的方法应用于1000个基因组计划的10个非混合种群(CEU,GBR,TSI,FIN,CHB,CHS,JPT,YRI和LWK)的基因组,并显示了从500至XNUMX万年前(kya)。 结果支持了许多关于人口统计历史的主流观点,与此同时,还产生了一些有趣的观察,值得进一步和更仔细的研究。

3,000人的外显子组测序揭示了东亚和欧洲人口在近期人口统计历史上的差异。 柯·洛穆勒(KE Lohmueller)1,何先生2,3李Y3,金。1孙中山4张X4,X.金3,克里斯蒂安森(K. Kristiansen)3,5,汉森(T. Hansen)6,7王杰3,O。Pedersen7,8,9,埃·韦尔塔·桑切斯10,尼尔森(R. Nielsen)5,10 1)美国加州大学洛杉矶分校,生态与进化生物学; 2)爱荷华州爱荷华州立大学生物信息学与计算生物学专业; 3)深圳华大基因研究院,中国深圳; 4)安徽医科大学附属第一医院皮肤科,安徽合肥; 5)哥本哈根大学生物系,丹麦哥本哈根; 6)南丹麦大学健康科学学院,丹麦欧登塞; 7)丹麦哥本哈根大学,诺和诺德基础代谢研究基金会中心; 8)丹麦奥尔胡斯奥尔胡斯大学健康科学学院; 9)哥本哈根大学生物医学科学研究所,丹麦哥本哈根,丹麦; 10)加州大学伯克利分校,整合生物学。

在成千上万的个体中进行的遗传变异研究发现,在过去的10,000年中,欧洲和非裔美国人的种群数量急剧增长。 其他大陆人口(例如东亚人)最近的增长幅度却很少受到关注。 为了更多地了解东亚最近的人口历史,在这里我们分析了来自中国安徽省的1,449名汉族个体和丹麦的1,449名高覆盖率外显子组测序数据。 我们使用站点频谱估算了最近的人口统计历史记录。 我们发现,目前汉族的有效人数比丹麦人口估计的有效人数大约大四倍。 因此,尽管先前对常见变异的研究表明,东亚人口的历史有效规模相对于欧洲人口历史较小,但我们对近期有效人口规模的估计显示出与普查人口规模相反的模式和趋势。 接下来,我们描述当前有效人口规模的估计值与人口普查规模之间的关系。 汉族人口的普查规模(过去4年)与最近有效规模之比显着高于丹麦人口(P<2×10-4)。 这种差异可以通过汉族人口与丹麦人口相比在生殖成功方面更大的差异来解释。 另外,这一结果可能是由于比汉族人口更多地迁移到丹麦人口中。 尽管人们知道有效的人口规模小于人口普查规模,但在这里我们证明,即使考虑了人口规模的变化,这种差异的程度也会随人口的不同而变化。 最后,我们研究了汉族和丹麦人群中有害变异的模式。 我们发现,在汉族样本中非同义的私人变体的比例(67.6%)高于丹麦样本(64.6%; P<10-10),这与最近的种群增长相一致,即选择中没有足够的时间将弱毒突变输入到种群中。 我们的研究提供了对近期人口历史的首次分析,并探索了东亚人口中性和有害的罕见变种。

全球人口中1000个基因组的遗传多样性表示分析。 陆德旭 中国上海,计算生物学合作研究所。

1000基因组计划(1KG)旨在提供人类基因组序列变异的深层表征,通过设计预期旨在提供有关人类遗传变异的综合资源。 通过对2,500个人进行测序,预计1KG可以覆盖全球大多数人类遗传多样性。 但是,评估1KG数据在多大程度上代表每个地区的人类遗传多样性将是很有趣的,这将有助于深入了解1KG的功能,并为进一步测序项目和研究设计的区域性工作提供指导。 在这项研究中,我们使用基于全基因组单核苷酸多态性(SNP)数据的种群结构分析,使用来自1个代表3,831个全球人口样品的个体的全基因组数据,检查并评估了140KG样品的遗传多样性覆盖率。 我们证明了1KG在亚洲,特别是在东南亚没有足够的人类遗传多样性覆盖率。 因此,我们建议考虑以1KG为单位更好地覆盖东南亚人口,或者启动区域性工作以提供亚洲人类遗传多样性的更全面的特征,这对于将来的进化和医学研究均至关重要。

可视化遗传变异的地理分布。 JH Marcus,J.Novembre 伊利诺伊州芝加哥大学芝加哥大学人类遗传学系。

除了其潜在的表型效应或频率之外,任何遗传变异的核心特征之一就是其地理分布。 遗传变异的地理分布可以阐明该变异最初出现的位置,其生存和传播的种群,进而帮助我们了解迁移和自然选择的历史模式。 总的来说,遗传变异的地理分布可以帮助解释种群之间的时间关系(例如基因流水平和发散水平)。 对于具有较大影响的变体,它还可以帮助我们了解空间变化的表型的地理分布。 由于这些原因,对遗传图谱进行目视检查是遗传研究中的普遍做法。 在这里,我们开发了一系列可重复使用的交互式可视化工具,以阐明遗传变异的地理分布。 我们专门解决了这种可视化的几个不平凡的挑战。 特别是,如何表示由于样本大小可变而导致的等位基因频率不确定性的不均匀水平; 如何用> 10,000个人的数据表示结果,其中等位基因频率可以在4个数量级上变化; 如何显示人口密集采样的全球区域的数据; 以及如何快速访问大样本中的频率数据。 为应对这些挑战,我们实现了灵活的REST API,可轻松访问大规模公共基因组数据集中的等位基因频率和样本量数据。 基于此API,我们开发了一个基于Web的浏览器,名为遗传变异地理(GGV)浏览器,用于可视化遗传变异的地理分布。 GGV浏览器迅速提供了分布在全球人口中的等位基因频率图。 GGV浏览器通过允许更多的交互功能,罕见变化的新表示形式以及在等位基因频率估计中纳入不确定性,建立在诸如HGDP选择浏览器之类的过去工具的基础上。 作为辅助设备,我们还开发了一种研究可视化工具包,其中包括一种用于显示联合站点频谱中的高Fst离群SNP的方法以及常用PCA图形的交互式版本。 我们希望GGV浏览器将成为探索种群遗传数据的有价值的研究和教育工具。

在尼安德特人沙漠中寻找人类的绿洲。 B.维诺特,JM。 关键 华盛顿大学华盛顿州西雅图市基因组科学系。

随着解剖学上的现代人迁出非洲,他们在欧亚大陆遇到了尼安德特人,并且发生了低水平的杂交,因此每个非非洲人的基因组中大约有2%是从尼安德特人的祖先那里继承下来的。 最近,我们开发了一种方法来鉴定当代个体中尚存的尼安德特人血统,并回收了现代非非洲人口中存在的600 Mb的尼安德特人基因组[1]。 存活的尼安德特人序列的图谱显示整个基因组具有明显的异质性,我们鉴定了许多几乎完全没有尼安德特人序列的“尼安德特人序列的沙漠”。 这些基因组区域特别受关注,因为它们界定了可能赋予人类独特特征的序列。 例如,最大的尼安德特人沙漠是15号染色体上的7Mb区域,以FOXP2基因为中心,该基因先前与语音和语言有关。 在这里,我们通过分析在地理上多样化的个体的扩展样本中幸存的古遗物序列,对尼安德特人沙漠进行了详细描述。 我们已经开发出一种正式的统计测试,以识别尼安德特人血统显着耗尽的基因组区域,并进行了广泛的模拟,以推断对这些尼安德特人沙漠进行纯化的强度。 此外,我们利用广泛的生物信息学分析叠加了异质功能基因组学数据,以识别候选因果变体。 这些分析为人类基因组区域提供了重要的新见识,这些区域具有在现代解剖学人类进化中起关键作用的序列,并暗示负责肌肉,骨骼和大脑发育的调控序列是人与尼安德特人之间的关键差异。[1] Vernot和Akey,《科学》,2014年。

英国的人口结构:在UK3,621K队列项目中,使用全基因组测序对10个样本进行了稀有变异分析。 沃尔特1,S。Metrustry2,E。Zeggini1,Y。Memari1,闵敏3黄洁1,M. Cocca4,S。Schiffels1,I。Mathieson5,D。Lawson6,N。Soranzo1,UK10K联合会群组 1)英国欣克斯顿惠康信托桑格研究所人类遗传学; 2)英国伦敦金斯学院双胞胎研究与遗传流行病学; 3)英国布里斯托大学MRC CAiTE中心; 4)意大利的里雅斯特大学母婴健康研究所-IRCCS“ Burlo Garofolo”-特里斯特; 5)哈佛医学院,美国马萨诸塞州波士顿02115; 6)英国布里斯托大学数学学院海尔布隆学院。

人口结构是基于常见变体的关联研究的一个很好表征的潜在混杂因素,但是鲜为人知的变体的结构模式及其对关联研究的影响却鲜为人知。 UK10K项目的研究小组对来自英国两个大样本人群的近7个个体(TwinsUK,N = 4,000和Avon父母与子女纵向研究()的近1,754个个体)进行了低读深度(中位数〜1,867倍)的全基因组测序。 (ALSPAC),N = 61),对稀有和常见的遗传变异与一组42种具有生物医学意义的重要定量表型之间的关联进行了全面探索。 这两个研究队列的人口统计学特征显着不同,ALSPAC参与者来自英国西南部的地理限制区域(布里斯托尔),而TwinsUK参与者出生于英国的不同地区。 经过严格的质量控制步骤后,该数据集包含3.5名研究参与者的18,000万个SNP,3,621万个INDEL和大约31个大缺失。 在这里,我们通过关注1,139对双胞胎中0.1种共有的“核心”表型以及整个英国的可用出生地数据,来描述稀有变异体中地理分层的程度。 我们使用欧氏距离度量,区域网格和广义加性模型(GAM)对纬度和纵向数据进行建模,并分别对不同次要等位基因频率的单核苷酸变体进行建模。 我们进一步在这些地理位置对基因型和表型数据的相关性进行了建模,并将它们与模拟数据集进行了比较。 最后,我们应用了Mantel检验来分析在给定距离指标的情况下基因型和表型关系的重要性。 总体而言,这些分析表明,非常罕见的等位基因具有中等程度的遗传结构(MAF = 0.3-XNUMX%),但是这种结构与表型变异无关,并且不太可能引起复杂定量表型和相关性研究的严重关注。在英国罕见的变化。

对单个细胞的基因组进行测序。 P. Ribaux,C.Borel,F.Santoni,E.Falconnet,SE Antonarakis 瑞士日内瓦大学日内瓦医学院遗传学系。

全基因组扩增和下一代测序技术的进步使研究体细胞结构和核苷酸变异达到单细胞分辨率成为可能。 我们研究的最终目标是(i)识别与疾病相关的体细胞突变,以及(ii)揭示单个癌细胞中低丰度DNA变异的程度,以奠定肿瘤进化的基础。 由于检测和分析单个细胞之间基因组异质性的技术挑战,我们首先分析了培养物中的单个细胞并测试了我们实验工作流程的稳健性。 我们选择了K562细胞(一种人类永生的骨髓性白血病细胞系)和F-T21(一种人类主要的Trisomy 21成纤维细胞系)。 我们使用C1单细胞自动制备系统(Fluidigm)捕获了数百个单个细胞,并生成了高质量的单个扩增DNA。 到目前为止,已对96个条码化的全外显子库序列进行了深度覆盖(PE,100bp)测序。 使用内部分析管道生成变体调用(CNV和SNV)。 在这里,我们将讨论扩增的均匀性,外显子组的可检测比例以及DNA污染的水平。 通过比较单个细胞和大量细胞数据集,我们将基于杂合SNV评估每个每个单细胞外显子组等位基因缺失的百分比。 高质量的单细胞基因组序列将大大增强体细胞基因组疾病的遗传分析。 世邦魏理仕和公关贡献均等。

单卵双胞胎对:CNV和序列一致性。 A.阿卜杜拉维1,E。Ehli2,JJ霍滕加1,Z。Weber2,H。Mbarek1,G。Willemsen1,T. van Beijsterveldt1,A。Brooks3,JJ Hudziak4,PF沙利文5,欧洲法院法官德格斯1叶K6,PE渣lag7,GE Davies2,DI Boomsma1 1)荷兰阿姆斯特丹大学VU University Biology,Biological Psychology; 2)美国南卡罗来纳州苏福尔斯市的Avera McKennan医院和大学健康中心Avera人类遗传研究所; 3)新泽西州立大学罗格斯分校遗传学系,美国新泽西州皮斯卡塔维4)美国佛蒙特州伯灵顿佛蒙特大学医学院5)美国北卡罗来纳州教堂山北卡罗来纳大学遗传学系; 6)美国密苏里州圣路易斯华盛顿大学医学院基因组研究所; 7)分子流行病学,莱顿大学医学中心,荷兰莱顿。

单卵(MZ)双胞胎在概念上具有相同的基因,使它们成为研究体细胞突变的有益对象。 拷贝数变异(CNV)是遗传变异的主要部分,具有相对较高的突变率,并且与疾病(如自闭症和精神分裂症)的易感性有关。 我们对约1,100 MZ双胞胎中的双胞胎后新生CNV(即双胞胎不共享)进行了全基因组调查,这些双胞胎已通过多种性状反复表型化,其中很大一部分具有基因可获得的表达和甲基化数据。 使用Affymetrix 1,097微阵列,从外周血样本(主要在成人中)或颊上皮(主要在儿童中)的DNA中测量了6.0个MZ双胞胎的CNV。 全基因组测序是从13个MZ双胞胎对及其父母的血样中进行的DNA进行的(12倍覆盖率– Illumina,另外2个双胞胎对用完全基因组学进行了测序)。 我们发现总共有153个> 100 kb的双链从头重新测序CNV,其中大多数位于相同的不稳定基因组区域(15q11.2)。 根据原始强度信号在视觉上与两种算法进行的CNV调用之间的吻合程度,首先从15q11.2中选择了13个从头进行的CNV,以进行第一批qPCR验证实验。 在同一对双胞胎中,用qPCR验证了15个双胞胎新生CNV中的11.2个。 这对XNUMX岁的双胞胎没有表现出明显的表型差异。 XNUMXqXNUMX中剩余的从头算起的CNV在老年双胞胎中发现的频率更高,这表明我们正在捕获真实信号。 使用微阵列数据检测到的大的从头算起的CNV在具有全基因组序列数据的子样本中不存在。 我们确实希望全基因组序列数据能够使我们搜索较小的从头CNV,而微阵列数据无法检测到它们。

超越1000基因组计划。 L. Clarke,H.Zheng-Bradley,A.Datta,I.Streeter,D.Richardson,P.Flicek,1000个基因组协会 脊椎动物基因组学,欧洲分子生物学实验室–欧洲生物信息学研究所(EMBL-EBI),惠康基金会基因组校区,英国剑桥欣克斯顿。

1000个基因组计划提供了人类变异的基本参考目录,拥有超过60万个变异位点,范围从单核苷酸多态性到结构变异事件(包括倒位和重复)。 还提供了来自欧洲,非洲,东亚,南亚和美洲的2535个不同人群的26个个体的全球等位基因频率和基因型,这使许多其他项目能够更好地解释其结果。 1000个基因组数据集的主要用途包括用于从外显子组或基于阵列的基因型创建全基因组变异集的插补面板; 作为罕见疾病或癌症测序项目中“正常”或共有变异的过滤器; 并探讨人口统计和人口选择。 1000基因组计划现已接近尾声。 在这里,我们描述了维护资源的计划,以通过为1000个基因组计划资源提供长期支持来确保其仍然是当今有价值的数据集。 例如,我们将继续托管FTP站点(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp)和项目网站(http://www.1000genomes.org) 确保社区可以访问有关该项目的原始数据和文档。 我们还将创建一个稳定版本的1000 Genomes Browser(http://browser.1000genomes.org) 根据项目的最终发布日期。 基于项目的基于Ensembl的特定浏览器将尽快显示所有1000个基因组变体,并将使用人类参考基因组的GRCh37组件。 我们还将维护现有工具,并酌情合并新工具,以使用户能够轻松访问所需的数据。 我们最受欢迎的工具是数据切片器(Data Slicer),它允许用户选择我们的比对(BAM)和变异(VCF)文件的基因组子部分,从而仅下载他们需要的文件片段;以及变异模式查找器(Variation Pattern Finder),它使用户能够发现基因组特定区域中共享变异的模式。 其他工具包括VCF到PED转换器,它允许用户从远程托管的VCF文件生成PLINK格式文件,以及最近推出的等位基因频率计算器,它将从我们的VCF文件中批量计算特定亚群的等位基因频率。

在孤立人群中进行下一代协会研究。 齐吉尼(E. Zeggini)1,L。Southam1,2,K。Panoutsopoulou1,K. Hatzikotoulas1,GRS里奇1,A.-E. 法玛基3,I。Tachmazidou1,A。Matchan1,NW雷纳1,2,J。Schwartzentruber1,I. Ntalla3,E。Tsafantakis4,M. Karaleftheri5,G。Dedoussis3,A。Gilly1 1)英国欣克斯顿惠康信托桑格研究所; 2)英国牛津大学惠康人类遗传学信任中心; 3)雅典Harokopio大学,希腊雅典; 4)希腊Anogia Anogia医疗中心; 5)希腊Echinos的Echinos医疗中心。

孤立的种群具有独特的特征,可以利用这些特征来提高遗传关联研究的能力。 在创始人群体中,遗传漂移可以将与性状相关的等位基因驱动到更高的频率,从而可以识别具有较小发现集的稀有变异关联。 我们从希腊的两个偏远人群中收集了样本(HELlenic孤立队列研究):希腊北部的波马克村庄(HELIC-Pomak); 和克里特岛上的Mylopotamos村庄(HELIC-MANOLIS)。 所有样本(n〜3000)都具有有关人体测量学,心脏代谢,生化,血液学和饮食相关性状,Illumina OmniExpress和外显子组芯片平台的基因型等各种信息,并且正在以低深度对全基因组进行测序。 使用来自1(HELIC-MANOLIS)个人的995x WGS数据,我们证明了超过80%的真实低频(0.01 在整个MAF谱图中,0.05%和次要等位基因一致性> 60%。 我们复制了已知的关联匹配,从而为用于低深度WGS变体调用的强大处理管道提供了概念验证。 使用基因型数据,我们发现0.001%的受试者在分离物中至少有一个“代孕父母”,而远亲希腊人口中只有0.01%。 在MANOLIS队列中,我们观察到错义变体的丰富程度,这些变体的频率已经漂移了> 40倍。 我们之前已经报道了MANOLIS中0.001个个体的脂性状特征与APOC95基因的功能性变体相关。 在欧洲普通人群中检测此病所需的等效样本大小为90。 在Pomak队列中,我们在chr80p1的变体上发现了新的关联,这些关联显示等位基因频率大幅增加(从希腊普通人群中的5%到分离株中的3%)具有血液学特征,例如平均红细胞体积(rs1267,beta) = -67,000,p = 11×15.4-29)。 在世界人口中检测到它们需要十三倍的样本量。 我们展示了通过研究特征鲜明的创始人群体可以带来的巨大功率增益。

外显子组基因分型数据的混合图谱显示15q21.2-22.3地区具有非裔美国人的瘢痕loid风险。 KS Tsosie1,2,DR Velez Edwards1,3,4,5,威廉姆斯(SM Williams)6,爱德华兹(TL Edwards)1,2,3,4,罗素(SB Russell)1,7 1)田纳西州纳什维尔范德比尔特大学人类遗传学中心; 2)田纳西州纳什维尔市范德比尔特大学医学系流行病学系; 3)范德比尔特流行病学中心; 4)医学与公共卫生研究所; 5)田纳西州纳什维尔市范德比尔特大学妇产科; 6)新罕布什尔州汉诺威,达特茅斯大学,盖瑟尔医学院遗传学系; 7)田纳西州纳什维尔市范德比尔特大学医学系皮肤科。

瘢痕loid(MIM 148100)是一种良性皮肤纤维化肿瘤,没有有效的临床疗法,对最近非洲血统的人们的影响大约是白种人后裔的20倍。 在非洲人群中,患病率增高的可能相关的纤维增生性疾病包括高血压,肾硬化,过敏性疾病和子宫纤维瘤。 家族聚集和地理亚人群之间的祖先风险差异强烈表明,非洲祖先,瘢痕loid和纤维增生性疾病风险之间存在遗传关联。 在非洲血统的受试者中,尚未有关于全基因组瘢痕loid风险的全基因组研究。 我们用外显子组阵列在478名非洲裔美国人(AA:122例,356个对照)中进行了混合作图(AM)和整个外显子组关联,以识别与瘢痕loid风险相关的AM峰下的本地血统和SNP基因型区域。 结果: 在chr15q21.2-22.3上观察到与AM发现的瘢痕loid最相关。 该5Mb区域包括 NEDD4,先前曾被GWAS牵连到日语中的瘢痕loid形成,后来被中文证实。 尽管我们的研究名义上通过AM和基因型关联复制了这一发现,但在AM峰下观察到了最显着的SNP基因型关联。 MYO1E (rs747722,优势比[OR] = 4.41,95%置信区间[CI] = 2.29-8.50, p= 9.07×10-6)。 对所有常见基因型关联的扫描还确定了 MYO7A (rs35641839,OR = 4.71,95%CI = 2.38-9.32, p= 8.34×10-6)在chr11q13.5。 GWAS将chr15q21.2-22.3地区与AA的高血压,欧洲人的哮喘以及芬兰队列中的动脉粥样硬化联系起来,为常见的遗传因素提供了证据。 检查来自瘢痕loid和正常疤痕的成纤维细胞的早期微阵列数据,其中包括本研究的一些受试者,也暗示了chr15q21.2-22.3是瘢痕loid的致病区域,其表达增加。 MYO1E 瘢痕loid中的疤痕与正常疤痕相比。 尤其, MYO1E 已显示出它是侵染体的关键成分,是参与基质降解和侵袭的结构,因此可能在瘢痕loid表型中具有功能性作用。 总结 这项研究是首次使用AM和外显子组阵列关联分析来探索AA中瘢痕loid的遗传学。 在表达数据的支持下,我们的发现进一步阐明了chr15q21.2-22.3上潜在区域在AA,日本和中国人群中瘢痕loid的发病风险中的作用。

487例社区获得性肺炎患者的外显子组测序。 KS Elliott1,A。Ndungu1,TC Mills1,AL Rautanen1,P。Hutton2,加拉德2,A。Gordon3,CM Hinds4,M。Lathrop5,AVS希尔1,SJ查普曼1 1)英国牛津大学牛津大学惠康人类遗传学信任中心; 2)英国牛津约翰·拉德克利夫医院重症监护室; 3)麻醉学,疼痛医学和重症监护室,帝国理工学院,英国伦敦; 4)英国伦敦玛丽皇后大学威廉·哈维研究所,英国EC1M 6BQ; 5)麦吉尔大学-魁北克魁北克创新中心,加拿大蒙特利尔。

呼吸道感染是造成全球疾病负担的最大因素,每年,肺炎导致超过5.8万儿童死亡。 丹麦收养儿童的一项研究证明了传染病的主要遗传成分,如果他们的亲生父母中的一位因感染而过早死亡,则该传染病导致死亡的风险增加了487倍。 严重的细菌性疾病可能会施加巨大的选择性压力,从而导致发现相对较新的起源的稀有易感性变体。 为了鉴定此类变体,进行了外显子组测序研究。 来自重症社区获得性肺炎(CAP)的重症监护病房的270名英国成年人的DNA样本被收集为重症患者败血症死亡的遗传预测因子研究的一部分(败血症的基因组学进展[GAinS])。 与UK10K ALSPAC对照数据集相比,对135,392个CAP样本的发现队列进行了败血症敏感性分析。 应用严格的质量控制标准后,鉴定出43个变体。 其中,有3.6个达到了ExWAS显着的关联阈值(p <10 x XNUMX-7)和其他63个变体提示(p <1 X 10-4)。 其余217位CAP患者的外显子组正在作为复制数据集与UK10K TWINSUK对照数据集进行分析。 还分析了败血症的结果表型,以在28个合并的CAP人群中ICU入院后487天死亡率进行了测量(死亡n = 237,幸存者n = 237,未知n = 13)。 在对败血症结果的单变体分析中,鉴定出七个达到ExWAS显着性阈值的变体,包括已知与血栓形成有关的两个相关基因的变体。 正在执行具有罕见有害变体的折叠方法来检测以基因为中心的关联。 鉴定新颖的,有效的遗传变异可能会大大扩展当前对脓毒症生物学的认识,并可能具有临床应用。

 
• 类别: 科学 •标签: 2014年ASHG 

二烯 发布了一些摘要。 我会在那里。

 
•标签: 2014年ASHG, 其他 
拉齐布汗
关于拉齐卜·汗

“我拥有生物学和生物化学学位,对遗传学,历史和哲学充满热情,虾是我最喜欢的食物。如果您想了解更多信息,请访问http://www.razib.com上的链接”