Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
查看: 2893|回复: 63

FSI-G: 东部汉族人群27个Y-STRs和143个snp的法医特征及遗传分析 含1269例已分型STR

[复制链接]
发表于 2019-7-31 12:37 | 显示全部楼层 |阅读模式
本帖最后由 Ryan 于 2019-8-2 18:17 编辑

han.png
han2.png
han4.png han3.png



Highlights

•
High-resolution phylogeny based Han Chinese data for 27 Y-STRs and 143 Y-SNPs reported.
•
A high-resolution Y-SNP panel with the SNaPshot technology was constructed for Han Chinese population analysis.
•
Genetic differentiations between Northern and Southern Han Chinese observed.

突出了


•
本文报道了27个Y-STRs和143个Y-SNPs的高分辨率系统发育资料。
•
利用快照技术构建了一个高分辨率的Y-SNP面板,用于汉族人群分析。
•
观察到中国北方和南方汉族的遗传差异。

Abstract
Y-chromosome short tandem repeat (Y-STR) and Y-chromosome single nucleotide polymorphism (Y-SNP) frequency distributions provide resources for assessment of male population stratification among world-wide populations. Currently, the Y-STR Haplotype Reference Database (YHRD) contains numerous Y-chromosome haplotype profiles from various populations and countries around the world. However, for many of the recently discovered and already phylogenetically mapped Y-SNPs, the population data are scarce. Herein, the typing of 27 Y-STRs (Yfiler Plus) and 143 Y-SNPs (self-designed Y-SNP panel) was performed on 1269 unrelated males from 11 Han Chinese populations. Haplogroup O-M175 was the most predominant haplogroup in our Han Chinese data, ranging from 67.34% (Henan Han) to 93.16% (Guangdong Han). The highest haplogroup diversity (0.967056) was observed in Heilongjiang Han, with a discrimination capacity (DC) value of 0.3723. The number of alleles at single-copy loci varied from 2 for DYS391 (Guangdong Han) to 16 for DYS518 (Henan Han). For the majority of the populations (8/11), both the haplotype diversity and DC values are 1.0000. Furthermore, genetic differentiations were observed between Northern and Southern Han Chinese. These genetic differences were mainly reflected in haplogroup distribution and frequency, and they were confirmed by statistical analysis.


摘要


y染色体短串联重复序列(Y-STR)和y染色体单核苷酸多态性(Y-SNP)频率分布为评价世界范围内男性群体分层提供了资源。目前,Y-STR单倍型参考数据库(YHRD)包含了来自世界各地不同人群和国家的大量y染色体单倍型资料。然而,对于许多最近发现的和已经在系统遗传学上绘制的y - snp,种群数据是稀缺的。本文对来自11个汉族群体的1269名不相关男性进行了27份Y-STRs (Yfiler Plus)和143份Y-SNP (self-designed Y-SNP panel)的分型。单倍群O-M175在汉族人群中占主导地位,从67.34%(河南汉族)到93.16%(广东汉族)。黑龙江汉族单倍体多样性最高(0.967056),其判别能力(DC)值为0.3723。单拷贝位点等位基因数量从广东汉族DYS391的2个到河南汉族DYS518的16个不等。对于大多数种群(8/11),单倍型多样性和DC值均为1.0000。此外,还观察到中国北方和南方汉族之间的遗传差异。这些遗传差异主要体现在单倍群分布和频率上,并通过统计分析得到证实。

https://www.sciencedirect.com/science/article/pii/S1872497319300031


评分

4

查看全部评分

 楼主| 发表于 2019-8-1 09:46 | 显示全部楼层

 楼主| 发表于 2019-7-31 12:46 | 显示全部楼层
为加强对汉族人口结构的认识,利用Y-SNPs和Y-STRs进行了网络分析。得到的网络组合了相同单倍体的群,重建了系统发育的大部分预期特征(图4A)。例如将不同的单倍群O1a分组,在其姐妹单倍群O1b旁边,O1的两个亚支与O2结合,然后是n。随后,我们对单倍群分布与区域差异之间的关系进行了深入的探讨(图4A)(图4B)。尽管汉南北方有大量的共享单倍群,但Y单倍群分布的差异仍然值得注意,尤其是在O1单倍群中。在O1单倍群及其亚支的样本中,南方汉族约占80%,拥有大量北方汉族未发现的独特单倍群。在单倍群C、D和R中,我们还观察到一些特定的单倍群,这些单倍群局限于中国北方或南方汉族。这种特殊的分布与区域差异有关,将有助于探索群体间的遗传分化。为了揭示单倍体的详细分布,还使用Y-SNP和Y-STR数据为每个主要单倍体提供一个独立的网络(补充图S3)。这些网络分析帮助我们了解单倍群的内部关系。
 楼主| 发表于 2019-7-31 12:39 | 显示全部楼层

The haplotype distributions and haplogroup information of 27 Y-chromosomal STRs in Han Chinese population (N=1269).

27 Y-chromosomal STRs in Han Chinese population (N=1269).xlsx (623.47 KB, 下载次数: 102)
 楼主| 发表于 2019-7-31 12:43 | 显示全部楼层
本帖最后由 大凌河 于 2019-7-31 12:45 编辑

3.1。Y-chromosomal haplogroup分布

本研究建立了一个适合汉族人群的高分辨率系统发育树。数据集中观察到单倍群DE-M145、D-M174、C-M130、J-M304、G-M201、N-M231、O-M175、Q-M242和R-M207(图1),共检测到83个不同的终端单倍群,对应的单倍群频率如图2所示。完整的y染色体系统发育包括143个已鉴定的Y-SNPs,如图S1所示。单倍群O在我国汉族人群中占主导地位,从67.34%(河南汉族)到93.16%(广东汉族)。进一步细分后,O1a1a1a1-F78、o2a1c1a1a1a1a1a1 - f632、o2a2b1a1a1a1 - f438、O2a2b1a2a1-F46为较大的末端单倍群。除广西汉族(O1单倍群为48.67%,O2单倍群为35.40%)外,所有群体中O2- m122的出现频率均高于O1(本研究中又分为O1a-M119和O1b-P31)。广西汉族的频率分布与南方少数民族如黎族[23]的频率分布较为相似。单倍群C出现频率次之,约为3.23%(福建)至15.58%(河南)。其余样本稀疏分布于单倍群R、D和q中。基于143个Y-SNPs的面板,计算了11个种群的法医参数,如表1所示。单倍群多样性以黑龙江汉族最高(0.96706),DC值为0.3723

评分

1

查看全部评分

 楼主| 发表于 2019-7-31 12:44 | 显示全部楼层
3.3.1。主成分分析
为了解汉族群体父本遗传关系,采用基于Y染色体单倍群频率分布的主成分分析(PCA)(图3)和Y- str等位基因(补充图S2)来展示总体聚类模式。主成分分析结果以前两个主成分(PCs)的图表示。北方汉族之间的地理结构可见(包括人口从黑龙江、山东、山西、北京、河南在这项研究)和南部汉人(包括人口来自浙江、湖南、广西、福建、江西和广东在这项研究)显示了第二个电脑(图3)。北方汉族人群聚集紧密,和一个相对宽松的集群形成南方汉族人群。这表明南方汉族的遗传变异要大于北方汉族。这一差异可能是由历史和地理因素造成的,之前的报道也证实了这一点[29,30]。然而,在所有的种群中,广西汉族种群是一个离群的、分散的个体,远离主群。甘等人[31]认为,这种不一致是由于广西平华族是接受汉文化的本土少数民族形成的。虽然Nothnagel et al.[32]等人描述了17个Y-STRs在汉人南北地理轴线上的连续遗传梯度,但我们基于27个Y-STRs等位基因频率的PCA结果未能观察到这一连续序列(补充图S2)。这可能是由于不同的样本来源、样本大小和分析的STRs的数量造成的。

评分

1

查看全部评分

 楼主| 发表于 2019-7-31 12:48 | 显示全部楼层
本帖最后由 大凌河 于 2019-7-31 12:49 编辑

han5.png

3.4。汉民族与其他民族的比较
为了更好的了解汉族人群之间的关系,在34个Y-SNPs的基础上,对前人文献中的34个群体和1000个基因组项目进行了遗传比较(补充表S7)。由于在我们的研究中输入的一些y - snp在其他研究中没有输入(如[16,23]),因此必须汇集一些单倍群来进行这项分析。主成分分析结果(补充图S4)显示,右侧为南亚人群,左侧为东亚、东南亚和汉族人群。为了进一步揭示汉民族的遗传关系,还进行了南亚人以外的分析。结果(图5)显示,本研究中除广西汉族外的汉族人群分布在左上角。南汉和北汉分别聚居。其他来自东亚的人口与东南亚人混杂在一起。这些结果表明,汉族与东南亚人群和东亚其他人群的关系密切,这与之前的研究[13]一致。同时,我们注意到汉族人的遗传结构与东亚其他民族如日本人和韩国人略有不同。


Principal component analysis of Han Chinese population with 15 reference populations based on 34 Y-SNPs. (SX: Shanxi Han, SD: Shandong Han, BJ: Beijing Han, HeN: Henan Han, HLJ: Heilongjiang Han, JX: Jiangxi Han, HuN: Hunan Han, ZJ: Zhejiang Han, FJ: Fujian Han, GD: Guangdong Han, GX: Guangxi Han, CHS: Southern Han Chinese, CHB: Han Chinese in Beijing, China, CDX: Chinese Dai in Xishuangbanna, China, JPT: Japanese in Tokyo, Japan, KHV: Kinh in Ho Chi Minh city, vietnam).
 楼主| 发表于 2019-7-31 12:50 | 显示全部楼层
Population comparisons of the Han Chinese populations with the other 19 populations from the YHRD database were also conducted based on 27 Y-STRs (Supplementary Figure S5). The results revealed that Han Chinese had a close relationship with East Asian and Southeast Asian populations than South Asian, which was consistent with the result based on Y-SNPs. Genetic distance among Han Chinese was much smaller than among other ethnic minorities in China. This might be related to the relatively independent living environments of ethnic minorities.


在27个Y-STRs的基础上,对汉民族与YHRD数据库中其他19个民族的人口进行了比较(补充图S5)。结果表明,汉族与东亚和东南亚人群的关系比南亚人更为密切,这与基于Y-SNPs的结果一致。汉族的遗传距离远小于中国其他少数民族。这可能与少数民族相对独立的生存环境有关。
 楼主| 发表于 2019-7-31 12:51 | 显示全部楼层
在本研究中,我们调查了11个汉族群体中1269个不相关男性个体的Yfiler +单倍型和高分辨率Y染色体单倍群分布。所有数据均已提交至YHRD并收到登录号。这些数据为Y-STRs和y - snp提供了支持和进一步的资源,例如评估世界各地人口中男性人口的分层情况。在东汉群体中,存在着北方和南方汉族群体的遗传分化。为了进一步探索汉族的遗传结构,需要收集和研究大量的样本来填补地理上的采样空白。
发表于 2019-7-31 16:04 | 显示全部楼层
大凌河 发表于 2019-7-31 12:48
3.4。汉民族与其他民族的比较为了更好的了解汉族人群之间的关系,在34个Y-SNPs的基础上,对前人文献中 ...

广西汉族是哪里的样本?

南宁、桂林or梧州、玉林?
 楼主| 发表于 2019-7-31 16:41 | 显示全部楼层
本帖最后由 大凌河 于 2019-7-31 16:45 编辑
welson 发表于 2019-7-31 16:04
广西汉族是哪里的样本?

南宁、桂林or梧州、玉林?


经四川大学法医学研究所伦理委员会(K2015008)批准,从汉族人群中采集血样。所有参与者均提供知情同意。最后,共有1269个样本无关的中国男性个人收集了来自11个省份,包括浙江(N 97)、湖南(N  106)、广西(N 113)、福建(N 124)、江西(N = 110),广东(N  117)、黑龙江(N 94)、山东(N  96),山西(N  99),北京(N 114)、河南(N  199)。
----------------------------------------------------

具体采样地文章没说,至少我没看到
发表于 2019-7-31 22:19 | 显示全部楼层
本帖最后由 MNOPS 于 2019-7-31 22:23 编辑

虽然只分析了父系,但已经能看出南北汉族确实有明显差异,比如南方汉族的O1(包括O1a和O1b)要显著高于北方汉族。这个结论显然跟一些黄汗经常说的南方人父系完全被中原南下移民取代不一致。北方人群彼此高度类聚,而南方人群较为离散,显示出南方人群更多样,这跟之前常染研究得出的结论类似。

广西汉族是所有汉族中最离散的,这也跟常染研究的结论类似。我认为广西汉族可能大部分都是当地民族汉化,极少有来自北方的。
发表于 2019-7-31 22:26 | 显示全部楼层
本帖最后由 MNOPS 于 2019-7-31 22:27 编辑

当然这个研究只看父系,所以还是会有一些局限和不足之处。比如在6楼的那幅图,因为日韩有较高比例的O1b,所以日韩跟东南亚类聚。然而从常染方面看,则完全不是这么一回事。
发表于 2019-8-1 00:58 | 显示全部楼层
大凌河 发表于 2019-7-31 16:41
经四川大学法医学研究所伦理委员会(K2015008)批准,从汉族人群中采集血样。所有参与者均提供知情同意。 ...

广西样本如果是南宁汉族的话得出这个结论不奇怪,几十年前南宁只是一二十万人口的小城,城里人讲粤语,周边则是平话、壮话,现在城市扩容为200万人口大城市,老南宁人几乎被淹没了。

个人认为广西汉族起码得分三块甚至四块来研究,南宁,桂林,梧州/玉林,北海/钦州,南宁接近壮族,桂林接近湖南汉,梧州玉林可能更接近广府人,北海钦州可能接近湛江一带
发表于 2019-8-1 02:03 | 显示全部楼层
本帖最后由 MNOPS 于 2019-8-1 02:06 编辑
welson 发表于 2019-8-1 00:58
广西样本如果是南宁汉族的话得出这个结论不奇怪,几十年前南宁只是一二十万人口的小城,城里人讲粤语,周 ...


广西汉族整体是汉族中最偏南最离散的这个结论我认为不成问题,之前2017年由加州大学华裔基因学教授Charleston Chiang领衔的那份关于各地汉族人群的常染研究也得出了十分类似的结论。我也见过几个广西人的微基因样本,基本都有高比例的南少和东南亚成分。桂柳一带也许会稍微偏北一点,但不会很明显,跟湖南人还是有一定差异。

从整个岭南来看,粤西广西的常染比例是最接近的,都表现为较高比例的壮傣成分和较低比例的北汉成分。越往东北汉成分越高,粤东潮汕地区的北汉成分就已经跟福建差不多了。
发表于 2019-8-1 23:28 | 显示全部楼层
MNOPS 发表于 2019-8-1 02:03
广西汉族整体是汉族中最偏南最离散的这个结论我认为不成问题,之前2017年由加州大学华裔基因学教授Char ...

广西壮族的O2比例非常低,好像只有20%,比这篇文章中广西汉族低多了。所以我认为不能说广西汉族主要是由当地人汉化而成。而是说广西汉族里当地原住民有一个很高的比例。现代广西汉族血缘里原汉族成分和当地土著成分可能是差不多的。
发表于 2019-8-2 01:07 | 显示全部楼层
本帖最后由 MNOPS 于 2019-8-2 01:15 编辑
wolfgang 发表于 2019-8-1 23:28
广西壮族的O2比例非常低,好像只有20%,比这篇文章中广西汉族低多了。所以我认为不能说广西汉族主要是由当 ...


我没说广西汉族全都是由当地民族汉化来的,肯定或多或少还是有一些来自北方的成分。但总的来说,不论是从父系还是从常染来看,广西汉族含有大量壮傣血统有相当一部分是由当地民族汉化来的这个观点应该不成问题,文章中也明确表明“除广西汉族(O1单倍群为48.67%,O2单倍群为35.40%)外,所有群体中O2- m122的出现频率均高于O1(本研究中又分为O1a-M119和O1b-P31)。广西汉族的频率分布与南方少数民族如黎族[23]的频率分布较为相似”。另外O2(原O3)不代表就一定是由北人南下带来的,当地民族很可能也有一部分O2。

其实从周去非岭外代答就可以看出来,当年广南西路五民之中至少有三民都跟百越有关系,剩下的两民也不好说就一定没有百越血统。
发表于 2019-8-2 08:16 | 显示全部楼层


    河南与江西这两家相距不远的地区,在y类型方面的差异真的太明显了,一个是非O系已经超过30%,而另一个,则是O系差不多达到90%了,呵呵
发表于 2019-8-2 12:46 | 显示全部楼层
我觉得大家更应该多关注为什么o1从东北到南方的比例在中间塌陷.是原先O1是沿海分布,比例是线性变化的,后来被O2挤压到两侧的呢,还是后来其它情况造成的呢.东北地区古DNA的o1多吗?
发表于 2019-8-2 15:30 | 显示全部楼层
wolfgang 发表于 2019-8-1 23:28
广西壮族的O2比例非常低,好像只有20%,比这篇文章中广西汉族低多了。所以我认为不能说广西汉族主要是由当 ...

关键是这些样本能在多大程度上代表广西汉族,去过广西的都清楚桂东北、桂东南、桂西南等地的区别
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2019-11-17 23:51 , Processed in 0.100780 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表