返回列表 回复 发帖

基因组水平是否可以找到东北地区蒙古和通古斯成分?

本帖最后由 Yungsiyebu 于 2018-1-7 15:41 编辑

基因组水平是否可以找到蒙古和通古斯成分?为考察这个问题,首先,plink提取HGDP数据中的呼伦贝尔蒙古、东北鄂伦春、赫哲族、达斡尔族,以及东北起源的锡伯族,并以汉族和西北白蒙古土族,以及一例非洲桑人作为reference对照组,制作成bed文件。然后,运行admixture,获取运算结果。R软件根据Q文件制作可视化图谱。

K=2时,可想而知,作为外群的桑人首先与人群区分。不做讨论。

K=3时,南北peak值,分别出现在部分鄂伦春、蒙古等北方样本,以及南汉样本。绝大多数的文献的运算深度通常就到这里,东北蒙古、通古斯族群只表现为不同程度的南北混合特征,内部结构不清晰。

此时的Fst,桑人与东方人的Fst值大约是东方人南北差异的8.4倍。非常粗略的估算,如果桑人与东亚人的分离年代在10万年左右,东方南北两支的遗传距离可能在1.2万年左右。
                                                                              
Fstdivergencesbetweenestimatedpopulations:

Pop0-OroqenPop1-San

Pop0-Oroqen



Pop1-San0.371


Pop2-Han0.0440.37

K=3 altaic.png

Altaic_Han_results.xlsx (21.88 KB)

新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
本帖最后由 Yungsiyebu 于 2018-1-7 15:40 编辑

当K=4时,peak在土族的始祖成分(pop3,白色)出现,R自动设置为白色与背景色一样,有些干扰。此时,呼伦贝尔蒙古和达斡尔族两个蒙古语族,也分别出现在30-50%和20-30%的类土族pop3,尽管部分样本很低或者缺失,而大半东北鄂伦春和赫哲族通古斯系样本的这种类土族pop3比例近于零,但有小一半出现10-30%不等的类土族pop3。锡伯族的情况特殊,尽管起源背景与东北兄弟赫哲族类似的,但基因组中有非常高比例的类土族pop3信号,比例45-63%。

此时,北方汉族变现为类南汉pop0和类土族pop3的混合,类土族pop3比例35-60%,而类鄂伦春pop2的比例非常低,0-6%。暗示,北方汉族来自蒙古系血统影响要明显高于通古斯系血统影响。请注意,现代人群比对请看相对值,绝对值需要有古dna标尺。

Fst值如下,新出现的土族pop3,与南汉pop和鄂伦春pop的Fst遗传距离分别为0.38和0.52,与K=3时的值是相吻合的,此时,土族约为26-38%的类鄂伦春pop和62-74%类南汉pop的混合。粗略折算,如果土族pop3确实代表一种始祖人群的话,他们可能与鄂伦春pop在1.3万年前分离,与南汉pop在1万年前分离。
                                                                                       
Fstdivergencesbetweenestimatedpopulations:

Pop0-Han.southPop1-SanPop2-Oroqen
Pop0-Han.south



Pop1-San0.374


Pop2-Oroqen0.0480.376

Pop3-Tu0.0380.3690.052
K=4 altaic.png
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
本帖最后由 Yungsiyebu 于 2018-1-7 15:41 编辑

K=5时,北汉的成分被分离出来,这样,剥离出北汉的成分后土族pop1的影响就更为清晰的呈现了。这种类土族pop1在汉族中多数样本缺失。

类土族pop4成分在东北的鄂伦春、赫哲族、达斡尔组中多数缺失仅有部分样本携带,而呼伦贝尔蒙古族中高达17-37%,但也有1例缺失。

锡伯族与东北亲族遗传结构差异巨大,类土族pop1从25-99%,但也有1例样本缺失。

Fst值:

                                                                                                
Fstdivergencesbetweenestimatedpopulations:

Pop0-Han.northPop1-SanPop2-Han.southPop3-Oroqen
Pop0-Han.north



Pop1-San0.375


Pop2-Han.south0.0410.377

Pop3-Oroqen0.0610.380.057
Pop4-Tu0.0520.3730.050.067
K=5 altaic.png
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
返回列表
baidu
互联网 www.ranhaer.org