返回列表 回复 发帖
780# 大昊
对,四十多个民族,K=12就远远不够用了,这种分析的原理应该依据的是相对距离,可以肯定的是成分共享的这几个群体在这个K值的时候还是接近的。
山不走到我这里来,我就到它那里去。
781# 剪径者 你说的也正确。
K值高了之后,土家族肯定是最接近汉族均值的。
各种资料来看都是这样。
本帖最后由 大昊 于 2018-6-15 16:21 编辑

在北汉方面,同时拥有汉族内最高的日本成分和藏族成分。
相对的,柬埔寨成分也是汉族里最低。

reich_nea_kor10_k12_副本.png
2018-6-15 16:15
也可以发现,土家族的各种成分的比例,最接近汉族均值
本帖最后由 Yungsiyebu 于 2018-6-15 18:22 编辑

继续探讨D43&D45两个南戈壁样本的可能族属。

在上边的分析中,D43主要表现为类纳西、类日本、类鄂伦春三种pop,这里我们仅录入纳西族、蒙古族和汉族来比对古代样本同三者之间的关系。

分别merge DA43、DA45与hgdp的纳西族、蒙古族和南北汉族样本。很有意思的结果是,一种未知的始祖成分即出现在蒙古族也出现在纳西族的部分样本中,且DA45以此种未知始祖成分近于纯粹,而DA45也为主成分。

D45&D43,R作图时,均复制10次便于肉眼观察。


新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
在北汉方面,同时拥有汉族内最高的日本成分和藏族成分。
相对的,柬埔寨成分也是汉族里最低。

57983也可以发现,土家族的各种成分的比例,最接近汉族均值
大昊 发表于 2018-6-15 16:15
K值跑深就可以看到明显的差异了,土家族有1/4左右的类苗族成分,可以明显区分于各地汉族。

新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
775# 豢龙氏
晚上抽时间到时候再详细说明一下


imvivi001 发表于 2018-6-15 13:39
.
具体说明如下:
标注2-汉代匈奴-D43-D45-EAN-EAS-2018大嘴.jpg
2018-6-16 00:43



可以看到,一直到K11,新石器贝加尔湖附近的游猎者(steppe组的最右边两组)依然是约九成的黄色的东亚EA成分,与汉代这两个古人(D43与D45 )的EA黄色比例是差不多的。
但是K值增加后,两个人群的东亚EA成分开始出现分化。新石器贝加尔湖附近的游猎者变成东亚灰色+东亚黄色,很明显是EAN为主(约七成)+EAS(约三成)。而这两个汉代古人依然是黄色,只能是EAS,而且是极高比例的EAS。说明什么?
我的看法,说明两点:1、进入新石器之后,‘南人’大规模北上,之前高比例西亚欧的MA1人群被极高比例的EA人群替代;2、到了汉代,较高EAS比例的东亚人群出现在北亚(D39\D43\D45),完全不同于之前的EAN人群;3、这两个疑似汉帝国将士的EAN比例与现在的北方汉族相比,现代北方汉族的EAN比例略有增加,说明汉晋之后,北方汉族的北方东亚成分增加了;4、代表匈奴的D39与现在蒙古族达斡尔族相比,其EAN与EAS比例非常接近,不过现代蒙古族的西亚欧成分是增加了。

当然,因为本组检测没有加入藏语人群,因此东亚常见的EAW成分无法得到精确的展示,依然与之前的多组专业团队的检测结果一样,混入到EAN与EAS两大类之中,从而无法看出这三个汉代古人的EAW比例,这无疑是有一些遗憾的。
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
780# 大昊
对,四十多个民族,K=12就远远不够用了,这种分析的原理应该依据的是相对距离,可以肯定的是成分共享的这几个群体在这个K值的时候还是接近的。
剪径者 发表于 2018-6-15 15:56
K升高到一定程度以后继续升高不一定更准,有时候还会降低,往往到了某个特定K值以后继续升高还会准一些,但相比这种提升,运算量提高带来的代价其实并无必要,具体多少K最合适其实可以根据likelihood曲线判断
北方就是北方,自称几千年南下的百濮獠MNOPS是装不了南方民族的
我也有点绕糊涂了,大家觉得如果不同人群A、B、C,在低K的时候主体同一成份,K升高的时候C变为另一种不同颜色的成份,AB依然一样,K更高的时候B又变为与A不同的成份,解释是:
1)A、B、C的源头是同一人群,后来由于 ...
剪径者 发表于 2018-6-15 08:30
有可能同源,C混合了部分AB没有的成分
北方就是北方,自称几千年南下的百濮獠MNOPS是装不了南方民族的
K升高到一定程度以后继续升高不一定更准,有时候还会降低,往往到了某个特定K值以后继续升高还会准一些,但相比这种提升,运算量提高带来的代价其实并无必要,具体多少K最合适其实可以根据likelihood曲线判断
Lep1dus 发表于 2018-6-16 13:46
K应该是指亚群体数目吧?admixture应该可以求出最优K值的。
山不走到我这里来,我就到它那里去。
780# 大昊
对,四十多个民族,K=12就远远不够用了,这种分析的原理应该依据的是相对距离,可以肯定的是成分共享的这几个群体在这个K值的时候还是接近的。
剪径者 发表于 2018-6-15 15:56
K应该是指亚群体数目吧?admixture应该可以求出最优K值的。
剪径者 发表于 2018-6-16 13:59
.

ADM算法(包括STRUCT、唐美女frappe以及英国人比较喜欢的cluster分析法)的K值即是指运算中所求的‘祖先成分类型数目’,判断基础是Fst值,最后可以渲染成大家喜闻乐见的色谱图。

K值未必是越高越好(理论上未必),尽管更高的K值会带来更多的视觉角度。如果只求基本上保证精准度与误差度,一般取K=15、16、17即可~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
返回列表
baidu
互联网 www.ranhaer.org