Article title:40,000-Year-Old Individual from Asia Provides Insight into Early Population Structure in Eurasia
期刊:Current Biology
发表时间:2017
影响因子:10.900
通讯作者:Janet Kelso, Qiaomei Fu
In Brief:研究表明,在北京附近发现的一个40kya田园洞人(Tianyuan cave)的基因组与欧洲人(无论是过去还是现在)相比,与亚洲人更加的相似。他与35kya年前的欧洲人以及来自一些南美洲人群的个体的相似性表明亚洲人口结构的持续性,一直持续到美洲殖民时期。(1kya=1000)
Highlight:
1)在四万年前,在欧亚大陆上,至少有四个现代人类的亚群已经建立。
2)与过去或者现在的欧洲人相比,田园洞人与亚洲人的关系更大
3)然而,他与欧洲的所有早期人类并不一样
4)他与一些南美洲人的遗传相似性表明了早期的亚洲人口结构
Summary
在距今至少45000年前,从解剖学(anatomically)上讲,现代人类已经遍布欧亚大陆。但是关于这些早期人群是怎样分离的以及他们是否对后来的人类做出了贡献或者是代表了在今天没有留下后代(descendants)的早期的现代人向欧亚大陆的扩张。对来自于欧亚大陆西部(Western Eurasia)和西伯利亚(Siberia)地区的几个古老的人的个体的全基因组数据的分析显示这些个体里的一部分与现在的欧洲人(present-day Europeans)有关系,而另一部分则对现在的欧洲人的形成没有贡献。由于欧亚大陆东部旧石器时代(Paleolithic)晚期(Upper)人口对现在的人类的贡献及其与其他早期欧亚人的关系尚不清楚,作者对来自中国的一个距今40000年前的田园洞人进行了全基因组数据分析来研究古人和现代人之间的关系。作者发现与欧洲人相比她似乎于现在的和古代的东亚人的关系比较近,但是他与一个35000年前的欧洲人的等位基因的共享率要高于其他古代的欧洲人,这表明早期欧洲人和早期亚洲人之间的分离(separation)并不是单一的人口分离(a single population split)。作者同样发现与其他地方的美洲原住人群(Native American)相比,田园洞人与南美洲(South America)的一些美洲原著人群共享了更多的等位基因,这为亚洲人群的结构提供了进一步的支持,并且表明这种情况从40000年前一直持续(persisted)到美洲殖民时期。作者对田园洞人的研究突出了欧洲大陆早期人类种群的复杂迁移和细分 。
Result and DIscussion
由于在田园洞人所产生的DNA文库里微生物序列的比例很高,因此作者使用了寡核苷酸探针(oligonucleotide probes)杂交(hybridization)的方法来富集携带了370万个单核苷酸多态性(SNP)的人类DNA片段(可能是翻译成富集了370万个单核苷酸多态性(SNP))。作者将捕获到的序列与人类参考基因组hg19进行比对,捕获到的序列覆盖了2228374个位点,平均覆盖度为2.98倍。作者为每个位点绘制了一个随机序列来代表田园洞人的基因组,并将起与已经发表的古代和现代的人类的数据合并。在对古现代人类进行测序时,重要的是考虑到现代人类DNA的污染( contamination)。作者先前的研究表明这些文库中的DNA具有特有的胞嘧啶(cytosine)脱氨(deamination)模式,这15个文库中人类的mtDNA(线粒体基因组)的污染范围为0.2%至1.5%。为了估计捕获到的数据的核污染(nucler contamination),作者使用了一种利用(take advantage of)田园洞人是男性(male)的事实,因此他只携带(carry)了一个X染色体。假设X染色体上的多态性位点是由于污染(due to contamination)而不是测序错误,作者估计文库中的核污染的范围为0.01%-1.92%。
先前的田园洞人的21号染色体已经表明,与现在欧洲人相比,田园洞人与现在的亚洲人共享更多的等位基因。经过放f3(Tianyuan, X; Mbuti)统计分析作者同样发现田园洞人与现在的东欧亚人、大洋洲人以及美洲的原著居民共享的等位基因比与其他现在的人类要共享的多。然而现在欧洲人被发现携带了一种遗传成分,这种遗传成分的群体(a Basal Eurasian population)在他们种群内互相分离之前就已经与其他的非非洲人分离了。仅使用现在的欧洲人来进行分析可能会使田园洞人看起来与现在的亚洲人关系更加密切。因此作者又将田园洞人与没有基础欧亚血统证据(Basal Eurasian ancestry)的并且与其所处的时期基本相似的古代欧洲人(Kostenki14, GoyetQ116-1, and Vestonice16)进行了比较。田园洞人与古代和现在的东亚和东南亚人有着更多的等位基因,以及与古代的或者是现在的欧洲人相比田园洞人与古代的和现在的美洲原著民有着更高的基因位点共享率(Figure 2A)。作者还发现古代和现代的东亚和东南亚人与美洲原住民这两者之间的关系比他们分别与田园洞人之间的关系要更加密切(Figure 2B)。总的来说,作者的结果表明,田园洞人与一个祖先种群有关,而这个祖先(ancestral)种群促成了所有具有亚洲血统(ancestry)的近期种群。同样的,田园洞人的年龄也表明欧洲和亚洲的遗传分离可能早于40000年前。基于突变率从新生突变(de novo mutations)估计的欧洲和亚洲群体的分离时间为40000-80000年前的结果一致。
当与一些其他的来自欧亚大陆的旧石器时代晚期的早段时间(early Upper Paleolithic)的个体的数据整合后,结果显示在35000年前的欧亚大陆上,就已经存在着几个不同的种群了。Kostenki14 是37000年前的代表性种群之一,为现在欧洲人的形成提供了遗传血统。田园洞人则是第二个代表性的种群,为现在的东亚人和东南亚人有所贡献。并且45000年前的Ust’-Ishim和40000年前的Oase1作为一个或多个的附加种群的代表对于现在人的形成没有明显的(detectedly)贡献,以及推断出(infer)的对现在的欧洲人和古代近东(Near East)个体有一定贡献的基础欧亚人群(Basal Eurasian population),因此在35000年前,至少有四个( a minimum of four )种群在欧亚大陆共存(coexisted)。对欧亚大陆西部的旧石器时代晚期的个体的分析中,一个来自于比利时(Belgium)的35000年前的个体GoyetQ116-1 ,与其他欧亚大陆西部的个体相比,GoyetQ116-1与田园洞人共享了更多的等位基因(f3(Tianyuan,)GoyetQ116-1; Mbuti) = 0.23, Figure 1B and Table S2A; D(GoyetQ116-1, Vestonice16; Tianyuan, Mbuti) > 0 , Figures 2C and S2A and Tables S3A and S3B)。此外, GoyetQ116-1和田园洞人种群之间的混合(admixture )提高了将这些种群相互关联的树的适合性。与其他古代的欧洲人相比,田园洞人和GoyetQ116-1共享的等位基因过多。当作者将分析限制在脱氨基序列片段(deaminated sequence fragments)以及将潜在的脱氨基碱基排除后,结果表明来自于现代人的DNA污染和通过胞嘧啶脱氨基所导致的核苷酸错误不能解释这种等位基因共享。作者也没有发现任何证据表明田园洞人和GoyetQ116-1之间的相似性是由于测序错误、数据处理中的假阳性以及参考偏差(reference bias)造成的.
值得注意的是,与GoyetQ116-1相关的古欧洲人,例如来自西班牙的(Spain)的19000年前 El Miron个体,与其他古欧洲人个体相比,与田园洞人共享的等位基因并不多。现在的东亚或者东南亚人群与GoyetQ116-1共享的等位基因并没有明显高于其他古代西方欧亚人(Figure 2C)。GoyetQ116-1携带了单倍体群(haplogroup)M的线粒体基因组(mitochondrial genome),由M衍生(M-derived)的单倍体群可以在现在的东部欧亚人群、大洋洲和美洲原著民中发现,但是在欧洲群体中几乎完全不存在。这些结果表明,尽管田园洞人和GoyetQ116-1存在地理差距(geographical distance ),但他们可能共享一个祖先群体,但他们的祖先与迄今为止分析的(analyzed to date)其他旧石器时代晚期的欧亚人没有祖先关系(血统贡献 contribute ancestry )。欧亚大陆东部和西部之间的其他的一些比较新的联系(younger connections)也被发现了。Lipson和Reich发现24000年前的Mal’ta1和来自西伯利亚(Siberia)西部的16500年前的AfontovaGora3和几个来自欧亚大陆西部的7000年到14000年之间的几个个体表现出了与东亚和东南亚Ami相关的一个群体的基因流证据。作者还观察到欧洲东部的狩猎采集者(hunter-gatherer) Karelia,就像古代西伯利亚人(Siberians)和西部的欧亚人一样,与显示出了亚洲基因流动的证据。并且作者也发现这个模式发生在了更多的东亚或者东南亚的人群里,而不仅仅是在Ami中。之前的人口统计(demographic)推断(infer)研究已经推断出了现在的欧洲人和亚洲人的祖先之间的非零迁移水平。使用田园洞人,作者直观的展示出了较近的欧洲人和亚洲人祖先的种群分离( separation of populations)是一个复杂的过程,可能涉及到种群地理分离(geographic separation)之后的亚结构祖先种群和基因流。
现在的亚洲人携带了包括尼安德特人(Neanderthal)和丹尼索瓦人(Denisovan)两者的血统。作者发现田园洞人携带的尼安德特人的DNA与其他旧石器时代晚期的欧亚人一样多(~4%-5%),高于现代人所携带的尼安德特人的DNA(~1-2%)。这与自从渗入以来起作用的净化选择减少了现今基因组中尼安德特人DNA的数量的假说相一致(is consistent with)。没有在田园洞人基因组中检测到大洋洲( Oceanian)人群中观察到的丹尼索瓦人的血统水平。然而,由于检测低水平的丹尼索瓦人的基因混入的技术限制(insufficient power),我们不能排除田园洞人携带了来自丹尼索瓦人的DNA,其水平与现在的亚洲大陆(mainland Asians)人相似。尽管从形态学(morphological )上表明有来自古老(archaic)种群的混入,作者也没有检测到假定的古代群体(putative archaic groups)的基因混入。
大多数的亚洲人和美洲原住民都与田园洞人共享了相似的等位基因。然而,三个南美种群--在巴西(Brazil )的Surui and Karitiana和在阿根廷北部(northern Argentina )以及玻利维亚南部(northern Argentina )的Chane,与其他的美洲原住民群体相比,他们田园洞人共享了更多的等位基因。两个亚马逊(Amazonian)种群最近显示与现在的巴布亚(Papuan)和安达曼人(Andamanese Onge)共享的等位基因要多于其他的美洲原住民,表明至少有两个种群为在美洲南部和中部的美洲原住民贡献了血统。一个来自北美的12000年前的个体与田园洞人共享的等位基因的数目并没有多余其他的美洲原住民。 Surui and Chane显示与田园洞人共享了最高水平的等位基因(D(Surui/Chane, Mixe, Tianyuan, Mbuti) = 0.02, Z > 3; Table S2J),高于或类似于与巴布亚或安达曼人共享的等位基因的水平。使用对准确人口历史不确定性稳健的分析,作者发现亚马逊人群可以被描述为其他美洲原住民群体和和与田园洞人、巴布亚人或者是安达曼人有关的祖先人群的9%-15%的混合体(SE 4%-10%)。尽管SE比较高,但作者注意到亚马逊人一直被建模为其他美洲原住民和田园洞人、巴布亚人或安达曼人的混合体。所有分析中的混合比例估计值也相似,表明田园洞人与亚马逊人之间的关系与已经报道的巴布亚人和亚马逊人以及安达曼人和亚马逊人之间的关系相似。
作者还研究了一个将田园洞人与其他古代个体和现代种群联系起来的模型,使用了一个基本模型包括阿尔泰尼安德特人(Altai Neanderthal),丹尼索瓦人,Ust’-Ishim和来自Mallick的Kostenki14等。作者将田园洞人、Mal’ta1和现在的Ami,Mixe,Surui以及巴布亚人都加了进去。因为现在的欧洲人口最近的祖先来自一个不为人知的基础欧亚人口,作者使用了Kostenki14来代表欧洲人,Kostenki14最近被证明没有基础欧亚血统。需要注意的是,这个模型不太可能反映出真是的人口关系,因为他无法对许多人口(demographic)特征进行建模,例如人口结构或者是持续的迁移。然而,有趣的是,在这个简单的模型里,作者发现所有的三个南美群体不仅可以被建模为与其他美洲原著居民共享祖先,还可以与田园洞人和巴布亚人相关的人口共享祖先(Figure 3D)。事实上,田园洞人在40000年前是生活中在亚洲大陆的,他与一些南美群体之间存在比较强的亲缘关系(affinities)或者是与已经发现的巴布亚人或安达曼人的亲缘关系更近,则表明一个与田园洞人相关以及与巴布亚人或安达曼人相关的种群曾在东亚广泛的分布过。这个群体或其他的与这个群体相关的亚洲群体至少在美洲殖民之前一直持续存在,并对一些美洲原著民的基因组做出了贡献。
作者的结果表明与无论是古代还是现代的欧洲人,田园洞人与古代和现在的东亚和东南亚人的关系更加密切。为了检测田园洞人是否来自于当今的东亚或者东南亚人群的一个直系祖先,作者修改了Rasmussen等人中描述的直系祖先测试,以解决测序数据的低覆盖度、污染和测序错误等。作者发现田园洞人并非来自于现在东亚或者东南亚的任何群体的直系祖先群体(c > 0 , c = 0 rejected with p < 0.00001 for every comparison in Table 1),而是属于从对现在的东亚或者是东南亚人群有贡献的群体中分离出来的一个群体。这与他与35000年前的GoyetQ116-1 和一些南美人口的独特的联系(unique ties)是一致的,而这些联系在当今的东亚和东南亚人中是看不到的。
田园洞人的基因组和在欧洲的与其同时期的个体的基因组表明亚洲和欧洲群体在至少40000年前就已经开始分离了。在那个时间,欧亚大陆的现代人群体不仅被细分为现在亚洲人和欧洲人的祖先,而且还有检测不到对现代人群有贡献的人群。田园洞人和在欧洲的一个35000年前的个体以及现在的位于南美地区的美洲原住民群体进一步的强调了亚结构和人群联系是欧亚大陆人口历史的特征。
Method Details
Library Preparation
在这之前的研究中就已经生成了34个来自田园洞人(股骨)的DNA文库,作者是从中挑选了15个具有较高覆盖度以及较低的线粒体DNA污染的文库,这些文库里所有的双链的适配器上都携带有4个碱基对的“clean-room key”序列(5‘-GTCT-3’),这个序列是仅用于古DNA的(测序文库的两端需要不同的接头,一般叫P5或P7,建库的目的就是为了在每个DNA片段的两端加上这两个接头)。用尿嘧啶DNA糖基化酶(UDG)和核酸内切酶处理文库,如S12中“ds UDG所述”。(UDG是一种从DNA分子内部去除尿嘧啶的酶,但不影响分子末端的一部分尿嘧啶,尿嘧啶残基作为胞嘧啶残基脱氨基的结果出现在DNA分子的末端特别普遍)
In-solution capture of nuclear DNA
由于这些文库中人类DNA含量尽在0.013%-0.031%之间,我们将文库与四个之前描述的寡核苷酸探针板分布进行杂交,富集到了71044176个片段(大于等于35bp),共携带了约370万个SNP。对富集到的文库使用HiSeq2500平台进行双端测序(2X76bp)。随后对识别序列和尾部的适配器进行修建后,将正向和反向序列合并为最小重叠11个碱基对的片段。使用BWA将测序序列比对到人类的参考基因组hg19上(使用的参数为 -n 0.01 and –l 16500)。我们移除了具有相同起始和结束位置的重复片段,保持了平均碱基质量最高的片段
DNA contamination and preparation for analysis
线粒体DNA估计的污染大约为0.2%-1.5%。作者通过对X染色体上多态性位点的测试得出了第二个污染的估计值,因为这个田园洞人是男性,因此他只携带了一个X染色体,假设X染色体上的多态性位点是由于污染(due to contamination)而不是测序错误,作者估计文库中的核污染的范围为0.01%-1.92%。对于每个文库,作者鉴定到在多态性位点上至少两个reads的SNPs的覆盖度大于或等于100X。测序或者是比对错误这些因素可能会导致对于突变位点的识别错误,所以作者使用了ANGSD通过使用来自同一reads的信息来生成污染估计,以计算局部比对和测序错误率。为了确定这些用于分析的基因组区域和特定的reads的错误率,作者提取了与每个被定义的SNP相邻的5bp,并计算了每个偏离参考基因组的核苷酸部分,并估计了总误差范围为0.04%–0.52%,并将其纳入了ANGSD提供的概率模型。
我们通过随机采样一个覆盖每个包含SNP位点的片段来对等位基因评分,只要碱基质量>20,就忽略每个片段的前两个和后两个碱基。在3.7M的四个SNP面板中,作者的大多数分析使用的是前三个面板(2.2M),一个分析用的是面板4。下面将进一步描述田园洞人的测序reads如何直接用于直系血统的测试。
Dataset
SGDP,全称Simons Genome Diversity Project,西蒙基因组多样性计划,是比较有名的人类基因组项目之一。SGDP的样本与HGDP、千人基因组(1KGP)相比,虽然样本数量更少但样本种类更多,也相对更有代表性,其民族种类覆盖了世界绝大多数地区。作者使用的就是SGDP的这个数据集,大多数的分析侧重于32个东亚和东南亚和美洲原住民样本,并且根据需要使用了一些其他的现在人群样本。在测试直系祖先(direct ancestry)的过程中,作者还使用了1000 基因组计划的数据集以及黑猩猩(chimpanzee)的参考基因组(panTro2),作者还使用了31名古现代人样本和两个覆盖率大于0.05的古人类,在列表S1中展示了。 如上文所述对等位基因进行评分,或如其他地方所述进行基因分型。小于5000的个体的数据被汇集在这,其他所有的古老的数据也已经被汇集。作者使用所有的位点或只使用转换进行分析,差异如下:
Quantification and Statistical analysis
f-statistics
所有的现在人和古人类都用ADMIXTOOLS来分析,特别是qp3Pop(f3-statistic) and qpDstat (D-statistic),使用a block jackknife (significance cut-off of jZj>3 where Z = estimated value divided by the s.e.)来计算标准误差(s.e.)。对于qpDstat,作者使用的默认选项‘‘f4mode: NO.’’。
作者使用外群f3-statistic, f3(Source1, Source2; Target),来测量与一个目标人群也就是外群相比的两个人群之间的遗传漂变。较大的值表明两个群体之间共享的遗传漂变更大,这可能反映了这两个群体之间更密切的关系。作者使用了f3(TY, X; Mbuti),其中X指的是各种古代个体和现在的人群。 (Table S2A; Figure 1)
ABBA BABA test(也称为D统计),为偏离严格的分叉进化历史提供了简单而有力的统计测试。因此,它们经常使用它研究SNP基因组层面的基因渗入。在D统计中,D(P1, P2; P3, Outgroup),当D大于0的时候表明P1和P3共享的等位基因要多于P2和P3共享的,当D小于0的时候表明P2和P3共享的等位基因要多于P1和P3共享的。当D=0(|Z|<3)表明P1和P3共享的等位基因类似于P2和P3共享的。一个单个的D统计分析仅能比较P1和P3,P2和P3之间共享的等位基因的相对数目,但不能比较P1和P2。因此,需要将每个群体依次置于P3的位置,以寻找两个群体之间共享的等位基因一致的模式。作者使用与田园洞个体相关的D-统计数据如下:
1、与古代欧亚大陆(EUR)和东亚大陆(EAS)的比较
作者发现 D(EUR, EAS; TY, Mbuti)<0 【TY和EAS > TY和EUR】, D(TY, EUR; EAS, Mbuti)>0 【TY和EAS > EAS和EUR】and D(TY, EAS; EUR, Mbuti) 0 (Tables S2Bi–S3Biii),其中D(TY, EAS;EUR, Mbuti)<0 (Table S2Biii)主要发生在最近的欧亚大陆(和现在的欧洲人),这与现在讨论的现在的亚洲人和欧洲人共享共同的祖先一致。古亚洲个体( (ANCEAS = DevilsGate1, Chokhopani1/Mebrak/Samdzong; Table S1D))也表现出了相似的模式。在Table S2Biii中,除了标红的几个|Z|>2以外,所有的转换的结果都相似。田园洞人与亚洲群体以及与其年代相当(>29000年)的相关的古欧亚大陆个体共享更多的等位基因,这证实了他在 遗传上与亚洲人群最为相似。
2、与亚洲人的比较
作者发现D(TY, EAS; EAS, Mbuti)<0 and D(EAS, EAS; TY, Mbuti)~0 (Tables S2Biv and S2Bv)。维吾尔族(Uygur)、柬埔寨人( Cambodians)和土族人(Tu)的偏差与最近的基因流一致。作者在ANCEAS中发现了类似的结果(Tables S2Ci–S2Ciii),说明他们和东亚人群形成了一个关于田园洞个体的分支。所有位点的颠换的结果相似。
3、与美洲原住民(AMER,古美洲原住民是Anzick-1)
作者发现D(TY, AMER; EAS, Mbuti)<0, D(TY, EAS; AMER, Mbuti)<0 and D(EAS, AMER; TY, Mbuti) 0 (Tables S2Di–S2Diii),表明东亚人群和美洲原住民相对于田园洞个体彼此形成了一个分支,但是东亚人群与田园洞人群共享的成分要多于美洲原住民与田园洞人群共享的,这与美洲原住民有第二个祖先成分,而且这个祖先对于亚洲人群来说属于一个外群的结果是一致的。当仅使用颠换的时候,除了Anzick-1在D(EAS, Anzick-1; TY, Mbuti)中Z值从3.2-3.4转变成了1.7之外,其余的结果都相似。很难确定显著性的损失是由于脱氨引起的误差还是统计能力的损失。Surui和Chane的不同结果与后来的分析一致。
作者同样也发现D(EUR, AMER; TY, Mbuti)<0, D(TY, EUR; AMER, Mbuti) 0 for all but Mal’ta1 and Karelia where D < 0, and D(TY,AMER; EUR, Mbuti) 0 (Tables S2Div–S2Dvi)。这些结果与AMER拥有古代北欧血统的结论一致,以Mal’ta1为代表,同样的在Karelia个体中也有发现,从而与有欧洲血统的个体存在共享的联系。颠换的结果大多数一致(|Z|>2.6,除了 D(TY, AMER; EUR, Mbuti)),而 Kostenki14,Vestonice16, ElMiron and Villabruna的结果不显著 (|Z|>1.6, Table S2Dvi)。
4、与美洲原住民的比较
在一种模式下,所有的AMER的祖先都是在一次浪潮中进入美洲的,我们预计他们与田园洞人的距离会相等。除了可能拥有更多的欧亚大陆西部的基因流的Mixtec以及Surui和Chane,作者发现D(TY, AMER; AMER, Mbuti)<0 and D(AMER, AMER; TY, Mbuti)~0 (Tables S2Dvii–S2Dviii),表明田园洞人与同样可能存在欧亚大陆西部基因流的Mixe和Quechua之间存在联系。对于颠换,结果是相似的(|Z|>2.8), 除了D(Anzick-1, Mixe; Tianyuan, Mbuti)>0 (Z = 3.1),但我们在其他地方没有观察到类似的模式。
5、与Onge和Papuan大的比较
当Onge与古欧亚大陆人群比较的时候,结果与东亚大陆人群是比较相似的,但是与东亚大陆人群相比,Onge与田园洞人之间的联系要少一些 (Table S2F)。当巴布亚人不在P3位置时,巴布亚人的结果是有偏好性的,因为丹尼索瓦人的基因流在巴布亚人中约4%–6%,但是D(TY, EUR; Papuan, Mbuti)>0 (Z1, Table S2F),表明这表明巴布亚人和田园洞人与其他古代欧亚人有联系。
6、进一步探索南美联系的比较
就像在参考文献8里的样子,作者使用了D(Amazonians = Surui/Karitiana, Central Americans; P3, Chimp),有许多不同的人类群体作为P3,并在表S2E中列出了最高的D统计量。与中美洲人相比,田园洞人与亚马逊人的等位基因共享的更多,though we fail to reject D(Karitiana, Mixe; Tianyuan, Mbuti/Chimp) = 0 (Table S2E)。巴布亚人也呈现出了与亚马逊人共享的等位基因要多于美洲中部人,但是Onge并没有表现出这种情况 (Table S2E),这与之前的研究结果不同,也许是因为我们使用了一个不同的数据集,拥有较少的Onge个体。当仅使用颠换时,如图S2E中D统计中的显著性会降低,但田园洞个人和巴布亚人仍然位列十大最高D统计之列。亚马逊人与田园洞人和巴布亚人之间都呈现出了比较强的联系。
作者将上述结果扩展到D(AMER, AMER; P3, Mbuti/Chimp),对于P3,作者关注的是田园洞人、巴布亚人和Onge,同样也考虑了东亚大陆人群和 Chokhopani1个体(Table S2H)。一些东亚大陆人群/巴布亚人/Onge与 Surui 和 Karitiana之间共享的等位基因的数目要多于 与Quechua共享的等位基因的数目,但 Quechua样本显示可能存在潜在的混合,尽管与Mixtec不同,但是这里的D统计分析没有一致的结果表明它与其他美洲原住民不同。相对于Mixe,Surui人与田园洞人和巴布亚人存在联系,但他们并没有显示与东亚大陆人群存在联系(Table S2H)。
7、探索与GoyetQ116-1联系的比较
将田园洞人(ANCEUR = Ust’-Ishim, Oase1, Kostenki14,GoyetQ116-1)与同时期的古欧亚大陆人以及更加年轻的古欧亚大陆人(X)进行比较,D(TY, X; ANCEUR, Mbuti), D(TY, ANCEUR; X, Mbuti) and D(ANCEUR, X;TY, Mbuti)很大程度上显示了预期的关系,这取决于个人是否拥有欧洲或更古老的(Oase1)血统,除了 D(GoyetQ116-1, X; TY, Mbuti)总是正数(Table S3A, ‘Z3’)。
为了检验GoyetQ116-1的准确性,作者测试了GoyetQ116-1和田园洞个体相关的古DNA(aDNA)损伤的共有的错误,DNA污染,或者是数据处理,而不是过去的人口统计。为了避免是由于古DNA损伤而不是来自古代个体的实际的等位基因而导致的胞嘧啶脱氨基错误而产生的位点的不同,因此只限于颠换 (jZj>2.2, D value remains similar; Table S3Bii),从而发现了相似的结果。
限制使用受损的片段可以减少目前可能的DNA污染,因为它只合并显示aDNA损伤特征的测序DNA片段。田园洞文库经双链和尿嘧啶DNA糖基化酶的处理,这意味着不能执行损坏限制,但GoyetQ116-1文库是经过UDG(‘s UDG’)处理的单链或未经UDG(“s noUDG”)处理的双链,因此可以进行损伤限制。田园洞或 GoyetQ116-1 连接仍然使用损伤限制片段(Table S3Biii; Figure S2Aiii)。同样也发现D(Stuttgart, French/Sardinian; TY, Mbuti)~0 (Z = 2.8/0.8) ,而且相对于其他古代西欧亚人,还观察到东亚大陆和 GoyetQ116-1 之间与田园洞与 GoyetQ116-1 之间相比存在微弱的联系 (Figures 2C and S2A),因此结果与当前的污染不一致。
所有古代个体都经过了类似的处理,但只有GoyetQ116-1显示了田园洞人的联系,这使得信号不太可能是数据处理的产物。这个结果对于外群选择是可靠的,除非使用古老的个体(Tables S3Bi–S3Biii)。然而,(Table S4A)和田园洞个体与这些古老个体之间的细微差异可能掩盖了这一信号(Table S4A)。在田园洞和 GoyetQ116-1之间共享的古代混合比例并不能解释这一信号,因为没有观察到丹尼索瓦人或者是阿尔泰尼安德特人与田园洞个体或者 GoyetQ116-1共享的等位基因多于与其他同时期古欧亚大陆人共享的等位基因 (Tables S4A and S4B)。GoyetQ116-1和田园洞人在测序错误、参考偏差或者是GC含量等方面没有相关性可以来解释为什么这种联系只出现在了这两个个体中(Table S3G)。
D(GoyetQ116-1, Kostenki14; TY, EAS) 0,D(GoyetQ116-1, Vestonice16; TY, EAS)~0 (Tables S3Ci and S3Cii)。因此,目前尚不清楚田园洞人与 GoyetQ116-1之间的这种联系是否是特有的,或者是在GoyetQ116-1与东亚大陆之间也存在这种联系,但是由于东亚大陆祖先人群的稀释而非常的微弱。GoyetQ116-1可能显示与欧亚大陆人群存在比较微弱的联系,D(GoyetQ116-1, Vestonice16; AMER,Mbuti)更接近0 (Figure 2C)。很难确定哪些其他关系可能对东亚大陆人群和美洲原住民(AMER)产生影响,因为他们与与欧洲存在联系的距离现在比较近的个体或者人群存在复杂的关系。与与GoyetQ116-1关系最密切的个体相比,ElMiron,发现D(ElMiron, EUR; TY, Mbuti)~0,表明这种联系并没有延伸到她的身上。