那里有很多遗传数据。 许多帝国实验室 data 可以下载。 此外, 马丁·西科拉(Martin Sikora) 在他们最近的论文中给了我一个带有许多古老基因型的谱系文件(由于从众多覆盖范围广泛的大序列文件中提取基因型需要花费一些时间和精力,因此备受赞赏)。 我将两者合并在一起。 但是无论出于何种原因,Reich数据集都没有包含来自1000个基因组的南印度样本的任何数据。 既然有了这些,我决定加一堆。 这些是泰勒古语和泰米尔语的演讲者,既不是婆罗门,也不是预定的种姓和部落(对于那些好奇的人, 维拉玛 在PCA上很好地映射到我从1000个基因组中剔除的“南印度人”。
你可以下载它 点击此处。 这是一个200 MB的tarball。 在里面 链接格式。 我做了一个较小的等位基因频率滤除0.05,并将其降至385,000个SNP。 请注意: 这些数据在个体层面上的质量差异很大。 许多古代样本缺少很多位置,因此在分析它们时要记住这一点(例如,如果运行PCA,显然某些维度显然只是古代样本以系统的方式丢失了许多标记)。 最后,数据中存在非人类的外群。 例如,如果在不进行子集的情况下运行PC分析,则PC 1会将Marmoset与人类分开,其他灵长类动物和远古样本将填补这一空白。 如果您留在古代人口中,其中许多人的素质将比普通人低得多。
以下是按人口和规模划分的样本。 大多数标签来自Haak等人。 数据集。 显然,它们有点特质,但我认为您可以弄清楚。 请注意,.fam文件的“家庭ID”列中包含人口标签。 我手动将它们添加到不存在的地方(例如,Willslev数据和1000个基因组中没有它们,因此在适当的地方添加了它们)。
团队 | N |
印度 | 136 |
约鲁巴语 | 70 |
土耳其语 | 56 |
西班牙语 | 53 |
德鲁兹 | 39 |
Palestinia | 38 |
有 | 33 |
巴斯克 | 29 |
日文 | 29 |
撒丁岛 | 27 |
贝都因人 | 25 |
法语 | 25 |
乌尔基 | 25 |
布鲁修 | 23 |
楚科奇 | 23 |
爱斯基摩 | 22 |
俄语 | 22 |
图巴拉 | 22 |
婆罗辉 | 21 |
莫扎比 | 21 |
o路支 | 20 |
比亚卡 | 20 |
希腊语 | 20 |
匈牙利 | 20 |
马克兰尼 | 20 |
红宝石 | 20 |
贝都因人 | 19 |
帕坦 | 19 |
Yukagir | 19 |
埃及的 | 18 |
卡拉什 | 18 |
玛雅 | 18 |
信德 | 18 |
阿迪吉 | 17 |
曼登卡 | 17 |
贝尔_烧杯 | 15 |
网易网 | 15 |
Yamnaya | 15 |
哈扎拉 | 14 |
巴布亚 | 14 |
皮马 | 14 |
匈牙利加姆 | 13 |
奥卡迪亚人 | 13 |
索马里 | 13 |
AA | 12 |
贝加莫 | 12 |
北日耳曼语 | 12 |
卡里蒂亚娜 | 12 |
LBK_EN | 12 |
马赛 | 12 |
有线软件 | 11 |
霍马尼 | 11 |
ana山 | 11 |
挪威语 | 11 |
西西里岛 | 11 |
瑞典斯科格 | 11 |
朋友 | 10 |
亚美尼亚 | 10 |
巴尔卡尔 | 10 |
白俄罗斯 | 10 |
布干维尔 | 10 |
保加利亚语 | 10 |
楚瓦什 | 10 |
克罗地亚 | 10 |
捷克 | 10 |
通过 | 10 |
英语 | 10 |
爱沙尼亚语 | 10 |
甚至 | 10 |
格鲁吉亚语 | 10 |
汉_中国 | 10 |
卡尔梅克 | 10 |
sun田 | 10 |
立陶宛 | 10 |
姆布蒂 | 10 |
苗 | 10 |
混音 | 10 |
混合技术 | 10 |
莫尔多维亚 | 10 |
北奥塞 | 10 |
塞尔库普 | 10 |
她 | 10 |
泰国人 | 10 |
Tu | 10 |
土家族 | 10 |
图维尼安 | 10 |
维吾尔族 | 10 |
乌兹别克 | 10 |
Yi | 10 |
萨波蒂克 | 10 |
阿布哈斯式 | 9 |
泰雅 | 9 |
车臣 | 9 |
达ur尔 | 9 |
伊朗人 | 9 |
约旦人 | 9 |
科里亚克 | 9 |
吉尔吉斯 | 9 |
列金 | 9 |
利比亚犹太人 | 9 |
纳西 | 9 |
野井井 | 9 |
鄂伦春 | 9 |
乌克兰语 | 9 |
班图萨 | 8 |
柬埔寨 | 8 |
塞 | 8 |
惠山 | 8 |
赫镇 | 8 |
伊朗的 | 8 |
金 | 8 |
库米克 | 8 |
拉hu | 8 |
黎巴嫩 | 8 |
露雅 | 8 |
罗 | 8 |
马耳他语 | 8 |
曼西 | 8 |
闷得 | 8 |
旁遮普 | 8 |
沙特 | 8 |
苏瑞 | 8 |
叙利亚的 | 8 |
塔吉克_波米 | 8 |
突尼斯人 | 8 |
托斯卡纳 | 8 |
也门_J | 8 |
阿留申 | 7 |
阿尔及利亚的 | 7 |
阿尔泰人 | 7 |
德系 | 7 |
孟加拉语 | 7 |
玻利维亚 | 7 |
埃塞俄比亚 | 7 |
芬兰 | 7 |
法语_搜 | 7 |
格鲁吉亚 | 7 |
卡拉苏克 | 7 |
莫塔拉_HG | 7 |
突尼斯人_J | 7 |
土库曼 | 7 |
锡伯 | 7 |
阿尔巴尼亚人 | 6 |
班图肯尼亚 | 6 |
冈比亚 | 6 |
匈牙利_瓦蒂亚 | 6 |
伊拉克犹太人 | 6 |
伊特尔门 | 6 |
韩语 | 6 |
蒙古 | 6 |
摩洛哥_J | 6 |
撒哈拉维 | 6 |
也门 | 6 |
阿法纳西耶沃(Afanasievo) | 5 |
亚美尼亚_LBA | 5 |
科钦_犹太人 | 5 |
古吉拉特邦 | 5 |
古吉拉特邦 | 5 |
古吉拉特语 | 5 |
古吉拉特语 | 5 |
哈扎 | 5 |
Ju_hoan_No | 5 |
M土耳其语_J | 5 |
克丘亚语 | 5 |
西班牙语_否 | 5 |
安德罗诺沃 | 4 |
基库尤族 | 4 |
皮亚波科 | 4 |
俄罗斯_铁_时代 | 4 |
苏格兰的 | 4 |
新达斯塔 | 4 |
西班牙_EN | 4 |
西班牙_MN | 4 |
特林吉特 | 4 |
亚美尼亚_MBA | 3 |
澳大利亚人 | 3 |
巴尔伯格 | 3 |
本济格罗德 | 3 |
达托格 | 3 |
多尔甘 | 3 |
土耳其文_J | 3 |
匈牙利_马洛斯 | 3 |
意大利_雷梅德洛 | 3 |
梅若夫斯卡娅 | 3 |
瑞典_北欧_BA | 3 |
阿萨巴斯坎 | 2 |
博托库多 | 2 |
金丝雀_Isl | 2 |
丹麦_北欧_BA | 2 |
丹麦_北欧_LN | 2 |
格陵兰 | 2 |
中间人 | 2 |
尼夫赫 | 2 |
奥科涅沃 | 2 |
俄罗斯_LBA | 2 |
瑞典_北欧_LN | 2 |
AG2 | 1 |
阿尔伯斯泰特 | 1 |
阿留申 | 1 |
阿尔泰山 | 1 |
古德 | 1 |
古代_Ne | 1 |
伯尼克 | 1 |
黑猩猩 | 1 |
克洛维斯 | 1 |
德尼索万 | 1 |
丹麦_北欧_LBA | 1 |
丹麦_北欧_MN_B | 1 |
EBA | 1 |
埃斯佩斯泰特 | 1 |
德国_BA | 1 |
大猩猩 | 1 |
哈尔伯斯塔德 | 1 |
HG19参考 | 1 |
匈牙利_MBA | 1 |
冰人 | 1 |
意大利语_所以 | 1 |
卡累利阿_HG | 1 |
卡斯多夫 | 1 |
哈萨克斯坦_Sintashta | 1 |
科斯滕基14 | 1 |
拉布拉纳1号 | 1 |
晚多塞特 | 1 |
LBKT_EN | 1 |
立陶宛_LBA | 1 |
洛斯堡 | 1 |
MA1 | 1 |
猕猴 | 1 |
狨 | 1 |
梅兹迈斯凯(Mezmaiskay) | 1 |
黑山共和国 | 1 |
黑山共和国_LBA | 1 |
红毛猩猩 | 1 |
RR | 1 |
萨米_WGA | 1 |
萨马拉_HG | 1 |
萨卡 | 1 |
西班牙_EN_r | 1 |
Starcevo_E | 1 |
斯图加特 | 1 |
瑞典_战斧 | 1 |
瑞典_Battle_AxeNordic_LN | 1 |
瑞典_铁_年龄 | 1 |
勒 | 1 |
乌斯季伊希姆 | 1 |
温迪娅 | 1 |