返回列表 回复 发帖

Admixture graph and Treemix of East Asians

Dataset infomation
dataset_info.jpg
1

评分次数

本帖最后由 yayul 于 2016-4-10 12:29 编辑

Admixture analysis K=3
Summary:
Convergedin21iterations(151.457sec)
Loglikelihood:-29643649.7
Fstdivergencesbetweenestimatedpopulations:
p0p1p2
p0
p10.044
p20.0330.047
k3_Ea_output_01.jpg
ea_k3_averaged.jpg
本帖最后由 yayul 于 2016-4-10 12:30 编辑

Admixture analysis K=5
Summary:
Convergedin75iterations(831.213sec)
Loglikelihood:-2.9E+07
Fstdivergencesbetweenestimatedpopulations:
tibetlahushe_daijapaneseyakut
tibet
lahu0.078
she_dai0.0390.08
japanese0.0310.0740.034
yakut0.0460.0960.0550.047
k5_ea_output_01.jpg
ea_k5_averaged.jpg
本帖最后由 yayul 于 2016-4-10 12:31 编辑

Admixture analysis K =7
Summary:
Convergedin44iterations(1418.25sec)
Loglikelihood:-29248647.2
Fstdivergencesbetweenestimatedpopulations:
japaneseYakuttibetcambodianlahuOrogenShe
japanese
Yakut0.049
tibet0.0330.049
cambodian0.0610.0820.065
lahu0.0840.1030.0850.098
Orogen0.0450.0440.0460.080.101
She0.0300.0540.0350.0580.0790.05
k7_ea_output_03.jpg
ea_k7_averaged.jpg
2

评分次数

Admixture K = 7 Indivisual level graph
K7_IND_OUTPUT.jpg
本帖最后由 yayul 于 2016-4-11 21:26 编辑

Treemix analysis  m =0
hgdp_tibet_m0.jpg
hgdp_tibet_m2.jpg
hgdp_tibet_resdualfit_m2.jpg
本帖最后由 yayul 于 2016-4-11 21:25 编辑

Treemix analysis  m = 6

Migration flow

1) Tibetan ===> Tu
2) Yakuts  ===> Mongola
3) Tibetan ===> Mongola
4) Dai    ===> Han
5) Naxi   ===> Lahu
6) Yakuts  ===> Tibetan
hgdp_tibet_m6.jpg
本帖最后由 yayul 于 2016-4-11 12:33 编辑

some treemix graphs including koreans

Migration flow

1)   Yakuts ===> Mongola
2)   Yakuts ===> Tu
3)   Yakuts ===> Xibo
4)   Dai   ===> Han
5)   Yizu  ===> Lahu
6)   (Jap,Kor) ===>  Hezhen
7)   Yakuts ===> (Yizu, Naxi)
8)   Yakuts ===> Cambodian
hgdp_kor5_m0.jpg
hgdpea_kor_treemix_m4.jpg
hgdpea_kor_treemix_m6.jpg
hgdp_kor5_m8.jpg
hgdp_kor5_m8_residualfit.jpg
welcome welcome,long time no see
O3a3c* (M134+, M117-)
本帖最后由 sahaliyan 于 2016-4-10 16:13 编辑

建议最好加上东部欧亚以外的族群作为control
另外拉祜比较有意思,似乎遗传距离和各种成分比较远,比如K=7的时候
Lahu和Japanese的遗传距离是0.084,Japanese遗传距离第二远的是与Cambodian的0.061,第三远的是与Yakut的0.049,第四远的是与Oroqen的0.045
Lahu和Yakut的遗传距离是0.103,而Yakut遗传距离第二远的是与Cambodian的0.082,第三远的是与She的0.054,作为西伯利亚民族的雅库特成分,其遗传距离和拉祜成分竟然比与柬埔寨成分还远!!
Lahu和tibet的遗传距离是0.085,而Tibet遗传距离第二远的是与Cambodian的0.065,第三远的是与Yakut的0.049
Lahu和Cambodia的遗传距离是0.098,而Cambodian遗传距离第二远的是与Yakut的0.082,第三远的是与Oroqen的0.080
Lahu和Oroqen的遗传距离是0.101,而Oroqen遗传距离第二远的是与She的0.05,第三远的是与Tibet的0.046
Lahu和She的遗传距离是0.079,而She的遗传距离第二远的是与Cambodian的0.058
不知道这到底是什么成分,Cambodian如果加上印度次大陆的样本作为control可能会析出一些来自印度次大陆的成分,析出之后再比较遗传距离可能更好一些
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
I think the sample of Ryukyu people should be added next time.
O3a3c* (M134+, M117-)
本帖最后由 MNOPS 于 2016-4-11 01:24 编辑
建议最好加上东部欧亚以外的族群作为control
另外拉祜比较有意思,似乎遗传距离和各种成分比较远,比如K=7的时候
Lahu和Japanese的遗传距离是0.084,Japanese遗传距离第二远的是与Cambodian的0.061,第三远的是与Y ...
sahaliyan 发表于 2016-4-10 15:35
拉祜族好像父系单倍群F2比较多,可能代表了西南或南亚的一种土著成分,跟东北亚距离较远
9# hercules Thanks for your hospitality! I have also learned much from your sharp and intelligent comments.
本帖最后由 yayul 于 2016-4-11 12:28 编辑

10# sahaliyan
The reason why there is no west-eurasian population in this analysis is kind of selective elimination. First, there have already been so many research papers and bloggers dealing with west and east eurasians altogether. Second, I'd like to look more closely into the relations among the east Asian populations. Since the genetic distance between east asian populations is too close, it brings about some decreasing resolution just adding west eurasian population to the analysis. Practically the direct influence from west eurasian populations is not so big in most of east asian populations. Selecting which west eurasian population is not easy and will get just increasing performance time.

On the Lahu, whenever including that population to the admixture analysis, some intriguing result comes out. I guess maybe they have some genetic heritages from old indigenous south-east asians before austro-asiatic or tiberto-burman arrival.
一直忙,此前我就想用plink把这组藏人的数据导入看看情况如何。
从这组跑出来的结果来看,果真peak在藏人的pop成分在汉族非常有限,与东北地区阿尔泰族群的比例接近,可见汉藏语族,在全血统分析看到的整体血统基础,是非常有限的。汉族还是以在南方族群,如苗占多数的成分为主。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
12# MNOPS
同意,拉祜族的藏族成分很低。可见藏族成分是在西北形成的,然后迁往西南。如果能有一些锡金,不丹小族群的对比,可能更容易看出藏族成分的内部比例。
15# Yungsiyebu
藏族成分本身肯定是一种混合成分,只是那种和南亚蒙古利亚成分融合的类西伯利亚成分已经很难找到她的原始族群了,不像西伯利亚还有nganassan这种近乎纯粹的西伯利亚族群。藏族成分在汉族中的比例,20% 多一点,倒是和Y染色体M117+D1+某些N在汉族中的比例很接近。
K=3的时候,日本常染成分是daizu成分占60%,藏族成分比雅库特成分还高。而日本最原始的土著,肯定是更接近雅库特而不是藏族的。日本雅库特成分,其实就是日本的土著成分的代替,只有15%,可见从大陆来的移民的血统优势是相当明显的。韩国可能也有类似的状况。日本现在的D2的比例,应该是进入文明时代后关东武士团扩张的结果。
从常染色体的证据来看,理论上的原始汉藏语族不似存在,汉族的汉藏化,就应当是一小股接近藏人的古藏缅语族人群迁入中原地区,带来了血统的的少量藏缅混合,其中,体现在父系血统的就是F5等标记,语言上,汉族划入汉藏语族非常尴尬,除了非常变浅的核心同源词之外,几乎毫无共性,不像藏缅语内部非常清晰的系统演化痕迹,更有意思的是,汉语的同源词实事上与藏语更近,这就更不能支持,古汉藏语族的假说。

另外,正如以甲骨文系统开始的古代汉语,在语法结构上与苗瑶相似,这一点与汉族与苗瑶常染色体上的高度同源性吻合。

总之,多方面证据,均暗示,古汉藏语族根本就不存在,存在的是一小股接近藏族的古藏缅语族迁入中原,使得汉语逐渐藏缅化。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
一直忙,此前我就想用plink把这组藏人的数据导入看看情况如何。
从这组跑出来的结果来看,果真peak在藏人的pop成分在汉族非常有限,与东北地区阿尔泰族群的比例接近,可见汉藏语族,在全血统分析看到的整体血统基础 ...
Yungsiyebu 发表于 2016-4-11 13:14
本帖没有给出K=2的图。K=2时应该相当于下图的情况。

从2楼K=3的图看,彝族和藏族是最接近的。从下图可见,K=2时彝族的南方成分占大多数。可推出藏族也是以南方成分为主。而2楼的K=3时只是南方成份分化为东西两部分。
1012221516e1ea249ba58daa73.png
返回列表
baidu
互联网 www.ranhaer.org