返回列表 回复 发帖

A comprehensive map of genetic variation in Han Chinese

Charleston W. K. Chiang, Serghei Mangul, Christopher R. Robles, Warren W. Kretzschmar, Na Cai, Kenneth S. Kendler, Sriram Sankararam, Jonathan Flint



doi:

https://doi.org/10.1101/162982

Abstract



As are most non-European populations around the globe, the Han Chinese are relatively understudied in population and medical genetics studies. From

low-coverage whole-genome sequencing of 11,670 Han Chinese women


we present a catalog of 25,057,223 variants, including 548,401 novel variants that are seen at least 10 times in our dataset. Individuals from our study come from

19 out of 22 provinces across China

, allowing us to study population structure, genetic ancestry, and local adaptation in Han Chinese.

We identify previously unrecognized population structure along the East-West axis of China and report unique signals of admixture across geographical space, such as European influences among the Northwestern provinces of China

. Finally, we identified a number of highly differentiated loci, indicative of local adaptation in the Han Chinese. In particular, we detected extreme differentiation among the Han Chinese at MTHFR, ADH7, and FADS loci, suggesting that these loci may not be specifically selected in Tibetan and Inuit populations as previously suggested. On the other hand, we find that

Neandertal ancestry does not vary significantly across the provinces

, consistent with admixture prior to the dispersal of modern Han Chinese. Furthermore,

contrary to a previous report, Neandertal ancestry does not explain a significant amount of heritability in depression

. Our findings provide the largest genetic data set so far made available for Han Chinese and provide insights into the history and population structure of the world's largest ethnic group.




http://www.biorxiv.org/content/early/2017/07/13/162982

三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
1.7x全基因组数据的族源分析。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
北方人高度单一,甘肃陕西有西方血统,辽宁山东有东北亚血统。
O3a3c* (M134+, M117-)
一转眼,当年的青葱少年Sankararam已经开始做指导老师了,岁月如梭啊,呵呵
不过感觉这个预览版的描述有点杂乱,除了显示出Sankararam最拿手的建模水平,并没有说明白汉族的群体遗传学问题,倒像是一篇说得过去的哈佛医学院博士答辩论文而已。
人类的思辨往往是这样,面对一大堆通过各种新炫手段得来的数据,即便是第一接触人,并不一定能够明白其中的真正有价值的寓意~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
无论如何,都不失为全面揭开汉族群体遗传真实情况的一个不错的序幕~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
原文中:We did, however, identify nine CONVERGE individuals, primarily from
the Northeastern provinces, exhibiting affinity for 1000 Genomes JPT population in PCA analysis of merged CONVERGE and 1000 Genome East Asian dataset (Data not shown).
These 9 outliers are not otherwise obvious in PCA with CONVERGE alone, but when grouped we find in them evidence for admixture between Japanese
and primarily Northern Chinese [TABLE S4], consistent with possibly recent
admixture from Japan.

-------------------------------------------------------------

    会不会与当年日本遗孤有关?
(附维基词条介绍)
1950年,日本政府对中国东北的滞留者统计是26492人,直至1958年还有22187人。1959年日本政府公布《关于未归还者的特别措施法》(未帰還者に関する特別措置法施行令),将在中国没有任何消息的未归还者宣告为战时死亡,对家人发放三万日圆吊慰金,并取消其户籍。
日本厚生劳动省在1985年3月制定了一套针对遗华日侨的“身份担保人制度”,规定遗华日侨必须征得其日本亲族的同意才可以在日本居留。然而由于各种原因,许多人均拒绝做“身份担保人”。1989年,日本国会通过《入境管理及难民认定法》,限制遗华日侨归国时只有与日本人有血缘关系的嫡子才能够一同取得国籍,而那些被收养的遗华日侨的养子、继子则被排除在外。由于有十位不符合规定的日本残留妇女在回国后被扣留在日本机场,引起了日本国内民众的注意和不满。迫于国内压力,1995年日本政府实施了《中国残留邦人援助法》,国家将承担遗华日侨的回国事务。据日本厚生劳动省提供的资料,从昭和47年至平成7年(1972~1995年),赴日定居的残留孤儿有2171人,携带配偶和子女人数达7801人。
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
这是那篇文章里的PCA图表,我觉得比较符合我观察到的南相北相
南方民族就是南方民族,不需要有些别有用心的人给我们满世界找祖宗,一会儿说通古斯是南方人一会儿又说日韩是南方人,你们编故事编得累不累
这一组数据还是非常具有价值的:

Chr
Start (Mb)
Stop (Mb)
Locus Size
Lead SNP
P--‐value
Previously reported?
Notable Genes
Notable Phenotype






(Mb)








Associations














C1orf167, MTHFR,
Homocysteine
1
11.84
12.00
0.161
1:11856378
4.45E--‐11


CLCN6
levels
1
207.66
207.80
0.143
1:207694357
2.07E--‐08


CR1


3
75.59
75.76
0.163
3:75632610
9.59E--‐12






3
162.37
163.25
0.881
3:162732731
1.41E--‐14






6
29.72
30.47
0.747
6:29878687
5.26E--‐13
MHC, Liu et al.*, Suo et al.*
MHC region


6
31.31
31.35
0.04
6:31313972
1.53E--‐10
MHC, Liu et al.*, Suo et al.*
MHC region


6
32.68
32.68
0.001
6:32682207
1.16E--‐08
MHC, Liu et al.*, Suo et al.*
MHC region
















MYRF, TMEM258,
















FEN1, FADS1, FADS2,


11
61.52
61.69
0.176
11:61579463
7.80E--‐14
Suo et al.*
FADS3, RAB3IL1


13
99.60
99.77
0.17
13:99759875
2.02E--‐11
Suo et al.*
DOCK9, DOCK9--‐AS2


14
105.91
106.38
0.479
14:106134635
9.34E--‐32


IGH cluster
















PWRN2, PWRN3,


15
24.34
24.97
0.639
15:24341809
1.26E--‐22


PWRN1, NPAP1



19
54.74
54.80
0.057
19:54800371
2.80E--‐26
Hirayasu et al.
LILRB5, LILRB2, LILRA3


20
0.77
0.78
0.011
20:773680
1.09E--‐08





物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
其实我本人一直很关心与东亚人密切相关的豆腐related selective variant or variants~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
这是李辉教授若干年前提供的一份欧亚人群的variant频度数据一览表(原文一时找不到了,那位坛友如有,欢迎贴上来)


Table S1. Allele Frequencies of 68 AIMs of the Eurasian Populations(part1)

Gene

RS#


丹麦

匈牙利

芬兰

俄罗斯

阿迪盖

阿系犹太

撒玛利亚人

哈扎拉

汉特

WARS2

rs963171

WARS2 C_8013966

0.167

0.182

0.206

0.271

0.269

0.095

0.012

0.346

0.439

SFRS4

rs1994859

SFRS4 C_2558108

0.167

0.218

0.343

0.292

0.25

0.241

0.5

0.464

0.75

NECAP2

rs279025

NECAP2 C_8861049

0.206

0.331

0.333

0.365

0.222

0.278

0.138

0.412

0.52

IGSF4B,FY,hCG39431,hCG39425

rs12075

IGSF4B C_2493442

0.353

0.409

0.443

0.406

0.557

0.394

0.61

0.769

0.51

TMEM9

rs1404402

TMEM9 C_1942792

0.28

0.287

0.343

0.255

0.25

0.266

0.638

0.115

0.53

ANON01

rs2065160

ANON01 C_1648531

0.147

0.14

0.157

0.094

0.148

0.106

0.012

0.344

0.5

物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
本帖最后由 litis 于 2017-7-15 22:07 编辑

谢谢楼主的信息。这篇文章数据量很大,说服性很强,难得的。如果能做的更加精细就好了。 唯一不太好的就是采样,上海汉族同时接近广东汉族和甘肃汉族的结果很明显是移民影响。广东汉族也有好几个相对的“团”,对应从广府到潮汕到湖南甚至湖北。。很显然可能是把深圳居民算进去了。。浙江也有一点散而不聚。。

其他晚近移民较少的省都非常有价值,文章甚至还分出了汉族的东西轴,甘肃四川广东广西有西的极大值,江浙汉族有东的极大值,与经度对应非常好[local]2[/local]。这是以前文章做不到的精细度。
如果能规范一下采样,把上海广东浙江三省的新移民剔除,并且图片再清晰一点,就更有说服力了。
没啥事
本帖最后由 litis 于 2017-7-15 22:35 编辑

数据比以前看到的“符合想象”的多了。

排除开上面三个新移民干扰的地方,其他地方都不错。陕西比以前正常多了,和江苏非常明显分离开。陕南也能清晰看到相应的落入川北范围的个体。江西几乎处于南方各省聚类的中心,众星拱月,与江西长期作为南方汉族移民输出地的历史相符合。四川汉族以前在新加坡的文章中样本太少而且严重非线性分布也得到了一定解释。川北的确独占了一块PCA的区域(因为偏西所以全国没有其他样本和他们重合),南北程度应该和同纬度的苏南浙北汉族接近。另一块和粤北汉族聚在一起,显示出“湖广填四川”移民中的客家移民后裔(不过可能因为在成都靠近客语区而取了过大比重的样本)。还有一些重合湖南汉族的个体显示出湖南移民的影响。还有两个混入甘肃汉族的个体,我的个人猜测不是新移民就是九寨或者青川平武的部分本地汉族(不过那些地方人口很少)。
陕西也回归到正常了,陕南人也很清晰显示出来,大致落在川北汉族的区间。陕北也有表现,最北边的都是sw山西和几个sx陕北汉族。陕西和四川大概是省内不同地域汉族差异最大的省,四川大概在苏中-粤北范围内都有分布,陕西汉族分布区域大概是晋北和浙江都有分布。不过四川汉族文化因为新移民重塑而格外统一,陕西因为不同的地理区域和移民历史而三块地区迥异。
没啥事
匆忙之中漏了很重要的另一张表格:

Chr

Start (Mb)

Stop

Locus Size (Mb)

Lead SNP

P--‐value

Previously

Notable Genes

Notable Phenotype



(Mb)




reported?


Associations















ALG1L6P, FAM86DP,


3
75.45
75.95
0.504
3:75599989
3.11E--‐32


ENPP7P2, ZNF717


3
162.12
163.26
1.139
3:162446617
2.45E--‐40






4
9.77
10.42
0.651
4:10065873
3.33E--‐12


SLC2A9, WDR1














Suo et al.*,
ADH7
Upper aerodigestive tract












Grossman et al.*,


cancer
4
100.32
100.45
0.125
4:100332865
2.37E--‐08
Higasa et al.*,




5
144.22
144.29
0.068
5:144244236
2.15E--‐08






6
32.50
33.18
0.678
6:32632189
2.66E--‐17


HLA region
















PTPRN2, THAP5P1,


7
158.27
158.59
0.322
7:158366586
1.76E--‐12


NCAPG2, ESYT2
















CSMD1
Age of menarche;
8
3.16
3.32
0.164
8:3177530
5.96E--‐13




schizoprenia
9
1.54
1.84
0.299
9:1626977
1.45E--‐15






12
40.49
40.82
0.328

12:40586433

       
8.15E--‐09


LRRK2#, SLC2A13#
Inflammatory bowel disease,
















Parkinson Disease,
12
40.49
40.82
0.328
12:40586433
8.15E--‐09




Crohn’s Disease
14
106.07
106.16
0.088
14:106092003
7.79E--‐09


IGH cluster
















PWRN2, PWRN3,


15
24.35
24.82
0.472
15:24341825
5.48E--‐15


PWRN1, NPAP1


16
20.55
20.61
0.056
16:20599947
3.01E--‐08


ACSM2B
















NFAT5, NOB1,
Age of menarche














WWP2, SNORA62,


16
69.54
70.08
0.538
16:70070508
1.62E--‐09


CLEC18A, PDXDC2P


18
14.68
15.02
0.341
18:14696035
1.90E--‐10


ANKRD30B


19
54.74
54.80
0.057
19:54800371
1.19E--‐14
Hirayasu et al.
LILRB2, LILRA3
















HORMAD2

22
30.45
30.60
0.157
22:30599596
3.41E--‐10




T1D, inflammatory bowel
disease,
Crohn’s Disease


  相信大家都会对表中的 inflammatory bowel disease感兴趣,起码我就是这样。当然还有一些人更感兴趣,比如莱希博士~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
这是李辉教授若干年前提供的一份欧亚人群的variant频度数据一览表(原文一时找不到了,那位坛友如有,欢迎贴上来)


Table S1. Allele Frequencies of 68 AIMs of the Eurasian Populations(part1)GeneRS#
丹 ...
imvivi001 发表于 2017-7-15 13:13
终于找到了,居然是8年前李辉教授(彼时不知道是不是已经评上教授)与国际知名的分子遗传学学家Kidd教授(国际遗传医学方面著作颇丰,同时也是‘分子人类学出非洲论’的主要倡导者)联手的作品
Genetic Landscape of Eurasia and “Admixture” in Uyghurs

Hui Li, Kelly Cho, Judith R. Kidd, Kenneth K. Kidd
1Department of Genetics, Yale University School of Medicine, New Haven, CT 06520, USA
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
文中列出两类亚欧大陆的尼人,一类是‘高加索尼人(Mezmaiskaya,   in  purple) ’,这一类在欧洲与汉族之间更接近欧洲人;另一类是‘西伯利亚尼人或阿尔泰尼人 (Altai, dark blue) ’,则明显更接近汉族。  不过作者担心高加索Mezmaiskaya尼人可能因为低覆盖率或受污染而影响准确率。 至于文中提及的克罗地亚尼人 好像与阿尔泰尼人更接近,不明白是怎么回事?
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
本帖最后由 imvivi001 于 2017-7-19 19:31 编辑

从Fst看各省人群的‘亲疏关系’(下图数据为放大1万倍的数据)

Fst-各省-2017new.png
2017-7-19 19:31

.
很明显,广东、福建、重庆与江西的南方色彩非常鲜明,其中以广东为甚,可归为‘华南簇’。如果以湖北定为‘华中’的标杆,湖南则介于华中与华南之间。浙江与湖北差不多,但是江苏相对而言明显偏北,与其他‘六南人群’明显拉开了距离...
1

评分次数

物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
本帖最后由 imvivi001 于 2017-7-19 19:33 编辑

说明,上表的最顶端各省的中文简称,在右三漏掉了‘赣’,正确排序应该是“...浙、赣、湘、闽、粤”

1# 紫蔻

已经改过来了~
1

评分次数

  • 紫蔻

物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
本帖最后由 无诸王 于 2017-7-19 09:06 编辑
从Fst看各省人群的‘亲疏关系’(下图数据为放大1万倍的数据)

52318
.
很明显,广东、福建、重庆与江西的南方色彩非常鲜明,其中以广东为甚,可归为‘华南簇’。如果以湖北定为‘华中’的标杆,湖南则介于华中 ...
imvivi001 发表于 2017-7-19 06:48
这张fst图感觉比那张pca图更符合我的认知一些,不过那张pca贵在反应了东西差异
从Fst看各省人群的‘亲疏关系’(下图数据为放大1万倍的数据)

52318
.
…浙江与湖北差不多,但是江苏相对而言明显偏北,与其他‘六南人群’明显拉开了距离.
imvivi001 发表于 2017-7-19 06:48
.
        有一个情况需要说明,本文采样基本来自各省的大城市,内地基本是省会,所以江苏的偏北可能更多反映的是南京的情况~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
本帖最后由 litis 于 2017-7-19 18:47 编辑
.
        有一个情况需要说明,本文采样基本来自各省的大城市,内地基本是省会,所以江苏的偏北可能更多反映的是南京的情况~
imvivi001 发表于 2017-7-19 10:23
江苏如果是南京采样的数据的话,不会太偏北的吧。论坛里的南京朋友不知道怎样,毕竟江苏江北才是大头纬度要高不少。
川渝如果都是成渝主城采样的话,成都看起来和重庆平均几乎没有什么区别。而且成都偏南接近粤北的个体比重庆还更加密集,重庆似乎接近湖南的水平,但是成都采出来也有不少和江苏一样北的个体,方差拉的更大,但是个体不多。我感觉成都接近粤北的那一坨就是成都东南部客家移民影响的因素(成渝之间的地区闽粤移民应该不少),成都接近江苏的个体应该是川北在成都务工的人或者是老成都(看资料记载的话老成都城居民籍贯和郊区有显著区别)。
QQ截图20170719175139.png
2017-7-19 17:57

QQ截图20170719174741.png
2017-7-19 17:57
没啥事
返回列表
baidu
互联网 www.ranhaer.org