由于 拉尔夫与合作社 关于欧洲IBD模式的论文,我一直热衷于了解关于意大利的发现。 回想一下,如果您愿意的话,作者在那篇论文中指出: 意大利尤其是欧洲国家的人口结构深厚。 血统网络将许多欧洲国家和地区联系在一起,而在意大利,深远的地区差异似乎可以追溯到古代。 此外,最近 撒丁岛 在欧洲人民的民族起源中,可能已成为特别有用的信息已成为人们关注的焦点。 直到最近,我对HGDP数据集中的撒丁岛样本的效用还是持怀疑态度。 毕竟,它是一个孤立的岛屿,也许受有效人口规模低的特点的影响。 好吧,事实证明,可能是现代撒丁岛人 是最好的近似 我们今天到大约5,000年前的南欧人了。
一份新的论文 PLoS ONE的 有大量的意大利人,并运用标准技术来确定人口结构。 从全基因组数据对意大利人口中的遗传结构进行概述:
尽管人们普遍认为欧洲在遗传水平上是同质的,但高通量基因分型技术的进步已解决了几个梯度,这些梯度以很高的精度定义了不同的地理区域。 当分别考虑北欧和南欧组时,存在明显的遗传差异。 国家内部的遗传差异也很明显,尤其是在芬兰,而在较小程度上,在其他欧洲人口中也是如此。 在这里,我们展示了使用125,799名具有广泛地理覆盖范围的意大利人的1,014个全基因组范围内的单核苷酸多态性(SNP)数据进行的首次分析。 我们使用主成分分析和基于模型的个人血统分析表明,撒丁岛的当前种群可以与意大利本土和西西里岛进行明显的遗传区分,并且在当前的意大利半岛种群中可以检测到一定程度的遗传分化。 FST的成对统计,意大利北部和南部的北欧和犹他州居民之间,北欧和西欧血统之间的比例大约为0.001,而在北部和犹他州的居民之间大约为0.002。 意大利人群还显示出良好的遗传亚结构,强调了基因组通货膨胀(撒丁岛与意大利北部= 3.040,意大利北部与CEU = 1.427),警告在关联研究中隐藏的亲缘关系和人群亚结构的混杂效应。
SNP 的数量对于他们尝试的任务来说是相当好的。 我个人的经验是,对于 ADMIXTURE 或 PCA 之类的聚类算法,如果您正在查看国内差异,那么您的收益递减 > 100,000。 而且样本量相当大,尽管作者承认他们本可以对意大利中部进行更密集的覆盖。 对于意大利,他们汇集了大量数据集,包括来自生物医学研究的数据。 自然,他们也吸收了 HGDP 和 HapMap 意大利人。
在某些方法论上,PCA确实很难阅读。 我不确定标签是否正确(请参见图1在此处进行检查)。 因此,我只报告ADMIXTURE结果。 我看了看方法,这里确实有一些顾虑。 我不清楚他们是否多次运行ADMIXTURE K 2至10。 现实情况是你应该。 这是因为ADMIXTURE对种子参数的值敏感(您应将其更改为默认值,并允许它根据计算机时间以伪随机方式生成),并且在进行统计检查(例如交叉验证)时,值本身可以不同的运行! 我的意思是,一次ADMIXTURE可能会告诉您K = 4是最佳拟合,但是另一次可能会告诉您K = 6是最佳拟合。 这是发生在我身上。 我曾经运行过一个设置为K = 20 20次的数据,并且交叉验证值本身在各个运行之间表现出相当大的差异,具体取决于K(尽管有些K看起来值非常稳定,所以我对此很有信心) K的合适性)。
另外,有一段话让我有些好奇,因为作者对本文所使用的聚类技术的理解程度有多清晰,以及它告诉我们什么(不告诉我们):
平均 北欧血统的外加剂比例 当前撒丁岛人口中的比例为14.3%,有些人的北欧血统很低(5人的36个人中少于268%(占样本的13%))。
我要小心地将北欧人中的情态成分标记为“北欧人的祖先”。 我已经在与之相关的足够多的主题上发表了文章,以说明生成与真实生物世界几乎没有对应关系的统计伪像是多么容易。 如果您有两个在遗传上非常不同的种群,并且几乎立即聚集在一个不相交的派系中,那是一回事。 例如,非洲人和欧洲人。 但是,当您在欧洲内部出现差异时,并且这些集群并非以排他性的方式分布时,应该警惕将它们归类为实际人口。 “北欧模式集群”可能不会脱口而出,但是它具有精确且不虚假的优势。
那么结果如何呢? 不足为奇,我邀请您仔细阅读这些数字并亲自阅读补充资料。 我确实注意到,在这些结果中,意大利人内部迁移的证据非常明显。 地理起源在北部的人经常与南方人聚在一起(即,南部集群),但是起源在南部的人却很少与北方人聚在一起。 在20世纪,从意大利南部到都灵等北部城市的移民大量涌入,而墨索里尼则鼓励南部人迁移到 东北德语区。 相反,很少有北方人向南。 简而言之,意大利北部的许多人都有离开意大利南部的祖父母或曾祖父母。 离开意大利北部的祖父母或曾祖父母很少(尽管他们确实存在,但我实际上遇到了一个年轻人,他的母亲是那不勒斯人,父母来自威尼托)。 另外,我很好奇撒丁岛人似乎表现出一定程度的遗传同质性。 由于撒丁岛的历史,在迦太基,罗马和故意破坏统治下,这使许多人感到惊讶。 我对发生的事情有一个简单的解释:撒丁岛的海岸是疟疾。 撒丁岛的现代人口是土著山区居民的后裔,这些山区居民定期重新居住在沿海城市。
我想指出的是,如果您查看ADMIXTURE的运行情况,则莫扎比人的撒丁岛模态成分几乎与意大利大陆人一样多。 这并不意味着相等的遗传距离。 莫扎比支配星团的距离更大。 但是,这确实向我暗示,可能是在铜器时代,西地中海地区被撒丁岛式的人口所统治,后来撒丁岛人被新移民所取代。
最后,我不知道从哪里获得这些数据。 真可惜,因为它太大了。 但是我特别指出了某些数据的生物医学起源,因为我怀疑这将使其难以进入公共领域。
很有意思。
“我的意思是,ADMIXTURE 的一次运行可能会告诉您 K = 4 是最合适的,但另一次运行可能会告诉您 K = 6 是最合适的”。
你可能是对的,但是看看图 S6 中的各种 K 值,它们对于意大利来说都大致相同,大部分变化发生在小的黎凡特切片和看起来更像是噪音而不是信息的东西,对吧? 我完全同意在没有至少进行更广泛的测试的情况下不将集群具体化为“真实种群”。
“地理起源在北方的人经常与南方人聚在一起(即南方集群),但起源在南方的人似乎很少与北方人聚在一起”。
也许是最有趣的。 阅读您的评论后,我的第一个想法是:“等等,如果他们混合在一起,他们将不再显示为南方人,而是显示为意大利中部或介于两者之间的其他任何人,意大利北部必须有真正的南意大利社区,以保持整体亲和力”。
幸运的是图。 S2 显示了皮埃蒙特、威尼托等官方地区的相同图表,比三方 NCS 部门更小、更精确。 我们看到了什么? 只有来自皮埃蒙特和利古里亚(而不是伦巴第大区、威尼托大区,甚至 Val d'Aosta 的小阿尔卑斯地区)的人才会这样做。 他们聚集在意大利南部、意大利中部(这里也有一个伦巴多人,但太特殊了),甚至还有“混血的撒丁岛人”(那些倾向于大陆基因构成的撒丁岛人)。
会不会只有利古里亚,我们可能会想到热那亚水手和贸易关系,但皮埃蒙特? 这两个地区唯一的共同点是,它们都是历史记载的利古雷斯族裔的领土,该族裔也延伸到罗纳河以东的法国东南部,可能是相对于凯尔特人前进的“山区避难所”人口。
这比你的“意大利内部移民”的概念最有趣也可能更正确,除非我们当然认为利古里亚人是来自南方的移民或类似的东西。 我找不到比古代利古里亚链接更好的解释了。
......“可能是在铜器时代,地中海西部主要由类似撒丁岛的人口主导,后来被新移民取代和同化”。
北非人有大约 30% 的 mtDNA 和大约 10% 的 Y-DNA 可能来自伊比利亚,当然还有西欧。 常染色体分析也赋予它们强大的伊比利亚成分。 我认为这应该是旧石器时代,因为我们知道柏柏尔人(利布、努米德斯、毛里人)至少从 5800 年前(古埃及出现)开始就统治着埃及以西的北非,并且可能从新石器时代(卡普西亚新石器时代)甚至旧石器时代晚期(早期的卡普斯文化)。 在阿拉伯人入侵之前没有其他浪潮(除了更多的局部影响,主要限于突尼斯的部分地区:腓尼基人、罗马人、汪达尔人),因此伊比利亚(西欧欧洲)的底物应该是新石器时代之前的,因为有明显的 E1b 主导(非洲亚非)波在它上面。
顺便说一句,有人看过科西嘉人的 DNA 吗? 我知道这是一个较小的岛屿,没有撒丁岛那样独特的语言,而是说比萨语,或者可能是托斯卡纳方言(意见不同)。 也就是说,从本文的 S2 来看,撒丁岛的加卢尔人(他们或多或少会说科西嘉方言)在基因上与岛上其他地区非常相似,甚至没有很多“混合”的外表个人。 科西嘉语的词典中似乎确实保留了一些前印欧语单词。 所以我认为科西嘉人与撒丁岛人相似的可能性相当高,如果不是那么极端的话。
顺便说一句,有人看过科西嘉人的 DNA 吗? 我知道这是一个较小的岛屿,没有撒丁岛那样独特的语言,而是说比萨语,或者可能是托斯卡纳方言(意见不同)。 也就是说,从本文中看 S2,撒丁岛的加卢尔人(他们或多或少讲科西嘉方言)在基因上与岛上其他地区非常相似,甚至没有很多“混合”的外表个人。 科西嘉语的词典中似乎确实保留了一些前印欧语单词。 所以我认为科西嘉人与撒丁岛人相似的可能性相当高,如果不是那么极端的话。
出于同样的原因,科西嘉人是我多年来一直期待看到其整体常染色体遗传结果的第一大人群之一,但不知何故,似乎没有人群遗传学家对它们感兴趣,至少不像你和我那样多。
贸易关系也许但皮埃蒙特?
我有朋友住在皮埃蒙特。 我去过都灵。 它由来自意大利南部的工人大量定居,包括西西里岛。 这是众所周知的
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=6&cad=rja&ved=0CEoQFjAF&url=http%3A%2F%2Funinomade.org%2Fwp%2Fwp-content%2Fuploads%2F2012%2F05%2FNordisti-contro-Sudisti.-Internal-Migration-and-Racism-in-Turin-Europe-1950s-and-1960s.pdf&ei=tRpSUNDADYe6iwLE7YCwDQ&usg=AFQjCNEqm5hGnduxqh2wFZfDYJGb1Rcw6g&sig2=1sZQyW2VgdYYG1OdN8B-YQ
“我想指出,如果你看一下 ADMIXTURE 跑步,莫扎比特人的撒丁岛模态成分几乎与意大利大陆人一样多。 这并不意味着相同的遗传距离。 Mozabite 占主导地位的集群具有更高的距离。 但是,这确实向我表明,在铜器时代,地中海西部可能由类似撒丁岛的人口所主导,后来被新移民取代和同化。”
只是为了把这些点联系起来,莫扎比特人是生活在阿尔及利亚南部(位于北撒哈拉沙漠)的柏柏尔族。 反过来,柏柏尔人是土著撒哈拉人,他们传统上是牧民,他们的土著语言是亚非语系中的主要语系之一。 虽然他们的生活方式与阿拉伯牧民的生活方式相似,但他们的土著语言(直到 8 世纪引入阿拉伯语之后的某个时间才使用)和遗传学非常不同。 它们对北非的狩猎采集者显示出相当大的遗传连续性。 12,000 年前。
这意味着对西北部非洲柏柏尔人的遗传祖先贡献,来自于印欧扩张之前的新石器时代人,他们与撒丁岛人有共同的起源,无论是穿过直布罗陀海峡还是通过埃及和/或北非海岸.
考虑到(1)存在一些其他 Y-DNA(例如某些进化枝Y-DNA hg E 在南欧),(2)mtDNA 在西班牙和西北部之间来回联系(例如 mtDNA 单倍群 V),以及(3)在北非和西亚高地之间缺乏强烈的类似撒丁岛的信号(安纳托利亚、高加索和伊朗)。
鉴于北非缺乏类似巴斯克的语言(常见于与征服和超级国家统治有关的遗传祖先贡献的情况),以及莫扎比特人缺乏大量 Y-DNA 单倍群 G 或单倍群 R1b,我的猜测是与直布罗陀海峡之间的贸易有关的铜器时代新娘交换很可能是莫萨比特人中类似撒丁岛的遗传成分的来源。
虽然罗马帝国扩展到北非,提供了一种潜在的基因交换方式,但在这个时代与柏柏尔人进行基因交换的可能性似乎较小,因为柏柏尔人在基因上与意大利人(罗马帝国的核心)没有足够的相似性,不足以成为一个好人适合那个。
#4 那是最近的迁移,没有当地祖父母的人,在任何半严肃的基因采样过程中都不会被考虑在内,对吧?
即使在抽样过程中存在这样的错误,为什么在皮埃蒙特和利古里亚,而不是在你的文章(米兰)中正确提到的更加工业和移民的伦巴第大区,作为工业发展和移民的中心(或者也艾米利亚-罗马涅和威尼托)? 不应该有这种区别,但还是有的。
当然,迁移可能来自 300 或 500 或 2000 年前,但我无法在整个历史时期内理解它。 诚然,在史前时期(可能除了 Cardium Pottery Neolithic),但那是一个更模糊的区域。
@2 卡尔,@3 Onur,
我的大女儿部分是科西嘉人——实际上是 1/2 爱尔兰人、1/8 布列塔尼人、1/8 诺曼底人、1/8 伦巴第人、1/8 科西嘉人,在大多数分析中,她的布列塔尼人和诺曼底人似乎与爱尔兰人合并某种普通的英国人,而她的伦巴第(瑞士边境,科莫湖)和科西嘉人则给人某种意大利南部的味道。 所以通过消除过程,科西嘉元素必须看起来像塞浦路斯人或其他东西?!
以下是她的 Dodecad K12B 结果:
单:
[1,] “French_D” “4.7444”
[2,] “法语” “5.2463”
[3,]“混合_日耳曼语_D”“6.8205”
[4,] “Kent_1KG” “8.3709”
[5,] “Dutch_D” “8.5303”
[6,] “English_D” “9.0515”
[7,] “CEU30” “9.057”
[8,] “康沃尔_1KG” “9.7711”
[9,] “British_D” “10.4655”
[10,] “British_Isles_D” “10.5988”
混合模式:
[1,] “21.6% C_Italian_D + 78.4% English_D” “0.4769”
[2,] “16.9% S_Italian_Sicilian_D + 83.1% Kent_1KG” “0.511”
[3,] “22% 希腊语_D + 78% 英国_D” “0.5131”
[4,] “16.9% 西西里_D + 83.1% 肯特_1KG” “0.5201”
[5,] “23.6% O_Italian_D + 76.4% Kent_1KG” “0.5405”
[6,] “21.6% C_Italian_D + 78.4% CEU30” “0.577”
[7,] “75% 英语_D + 25% O_Italian_D” “0.686”
[8,] “82% 英语_D + 18% S_Italian_Sicilian_D” “0.7213”
[9,] “18% 西西里语_D + 82% 英语_D” “0.7215”
[10,] “20.3% C_Italian_D + 79.7% Kent_1KG” “0.7479”
而 HarappaWorld 的她如下:
单:
[1,] “french_hgdp_28” “3.1544”
[2,]“utahn-white_1000genomes_100”“7.8712”
[3,] “british_1000genomes_99” “9.1146”
[4,] “n-european_xing_25” “9.4165”
[5,] “utahn-white_hapmap_18” “9.6669”
[6,] “hungarian_behar_19” “11.1076”
[7,] “orcadian_hgdp_15” “11.9383”
[8,] “slovenian_xing_25” “13.0643”
[9,] “spaniard_behar_12” “15.0464”
[10,] “西班牙人_1000基因组_98” “16.143”
混合模式:
[1,] “73.1% british_1000genomes_99 + 26.9% tuscan_hapmap_102” “0.8487”
[2,] “73.4% british_1000genomes_99 + 26.6% tuscan_hgdp_8” “0.8647”
[3,] “73.8% british_1000genomes_99 + 26.2% tuscan_1000genomes_11” “0.9465”
[4,] “67.5% orcadian_hgdp_15 + 32.5% tuscan_hapmap_102” “1.0734”
[5,] “39.6% italian_hgdp_13 + 60.4% orcadian_hgdp_15” “1.175”
[6,] “67.8% orcadian_hgdp_15 + 32.2% tuscan_hgdp_8” “1.2094”
[7,] “30% 意大利语_hgdp_13 + 70% utahn-white_1000genomes_100” “1.2255”
[8,] “68.3% orcadian_hgdp_15 + 31.7% tuscan_1000genomes_11” “1.3501”
[9,] “66.8% 英国_1000基因组_99 + 33.2% 意大利_hgdp_13” “1.4398”
[10,] “90.3% french_hgdp_28 + 9.7% mordovian_yunusbayev_15” “1.4592”
当然,古代托斯卡纳人(又名伊特鲁里亚人)在过去殖民科西嘉岛东海岸。
#6,好点。 需要思考。
我的大女儿部分是科西嘉人——实际上是 1/2 爱尔兰人、1/8 布列塔尼人、1/8 诺曼底人、1/8 伦巴第人、1/8 科西嘉人,在大多数分析中,她的布列塔尼人和诺曼底人似乎与爱尔兰人合并某种普通的英国人,而她的伦巴第(瑞士边境,科莫湖)和科西嘉人则给人某种意大利南部的味道。 所以通过消除过程,科西嘉元素必须看起来像塞浦路斯人或其他东西?!
Conroy, 1/8 在她的案例中太低了,无法对科西嘉人的遗传学做出很好的推断,因为她的其他血统也来自高加索人群,因此无法辨别她基因组的哪些部分来自科西嘉人的祖先信心(由于我们不了解科西嘉人的整体常染色体遗传,这使情况变得更糟,所以这里有一个恶性循环)。
@PCConroy
MLDP 的科里斯坎人占 85% 的意大利北部和 15% 的撒丁岛人,他们与西西里人或塞浦路斯人几乎没有关系。他们实际上是 R1b U152 分支中比例最高的人之一
我想知道这与 Lynn 的关于北方人和南方人之间意大利智商差异的论文如何解决。 即使他的研究令人怀疑,也很高兴看到更多数据。
看 http://racialreality.blogspot.com/2010/03/richard-lynn-on-italian-iq.html