Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
楼主: wmch_928

关于欧亚草原数据分析的说明和其他问题

[复制链接]
发表于 2018-6-11 14:06 | 显示全部楼层
我说的是,那些认为未公开raw data的分析结果可信,而我分享了中间环节各类数据得出的结果,反倒一口咬定不可信,根本不验证数据。
Yungsiyebu 发表于 2018-6-11 13:59

你自己的人品败坏了,人家不相信你,你哭也没用。

比如前面那个讨论汉军,你拿齐家的颅骨数据来蒙骗。

你就是撒谎撒多了,人家不信任你了。
发表于 2018-6-11 14:07 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-11 14:09 编辑

其他内容等楼主的数据,不多论。

楼主把出来的这张pca是有价值的,Pca现实,三个被标记为匈奴的样本(2个南戈壁乱葬岗样本),介于蒙古族和金帐汗国样本(接近布里亚特)之间,显然,PCA结果非常北亚,与我跑出的1-3号染色体结果,介于呼伦比尔蒙古和雅库特之间的结果,相吻合。

发表于 2018-6-11 14:09 | 显示全部楼层
哪说的北亚接近?我说的是鄂尔多斯的早期匈奴人不是北亚种系,而是典型的东亚种系,以毛饮等组为代表。
Yungsiyebu 发表于 2018-6-11 14:04

看看,你自己说谎没办法圆谎了吧。

你先说乱葬坑的汉军体质接近毛庆沟。现在又说乱葬坑的汉军常染色体接近北亚。
发表于 2018-6-11 14:12 | 显示全部楼层
看看,你自己说谎没办法圆谎了吧。

你先说乱葬坑的汉军体质接近毛庆沟。现在又说乱葬坑的汉军常染色体接近北亚。
geoanth 发表于 2018-6-11 14:09


请看内容,根据gedmatch标号这个来路不明的2个数据,很东亚,我跑出的结果,1-3号染色体,跟文献PCA结果类似,介于现代蒙古和金帐汗样本(接近布里亚特)之间。
发表于 2018-6-11 14:14 | 显示全部楼层
其他内容等楼主的数据,不多论。

楼主把出来的这张pca是有价值的,Pca现实,三个被标记为匈奴的样本(2个南戈壁乱葬岗样本),介于蒙古族和金帐汗国样本(接近布里亚特)之间,显然,PCA结果非常北亚,与我跑出的 ...
Yungsiyebu 发表于 2018-6-11 14:07
这个是一种假象。,原文中所谓的东亚并没有汉族、傣族、日本这些人群,而只有蒙古族、鄂温克甚至一些极北的族群,如果加入真正的东亚样本,很可能就不一样了。
发表于 2018-6-11 14:18 | 显示全部楼层
请看内容,根据gedmatch标号这个来路不明的2个数据,很东亚,我跑出的结果,1-3号染色体,跟文献PCA结果类似,介于现代蒙古和金帐汗样本(接近布里亚特)之间。
Yungsiyebu 发表于 2018-6-11 14:12

你是否说过乱葬坑的二人(我说的汉军,你口里的匈奴)体质接近毛庆沟?

现在你是否说这二人常染色体接近北亚?

当初你鼓吹戎狄给华夏换血的时候,你说毛庆沟之类的戎狄是东亚体质。你来圆一下你的谎言,你口里的乱葬坑的二人(类北亚常染色体)为何有着毛庆沟的东亚体质?
发表于 2018-6-11 14:19 | 显示全部楼层
这个是一种假象。,原文中所谓的东亚并没有汉族、傣族、日本这些人群,而只有蒙古族、鄂温克甚至一些极北的族群,如果加入真正的东亚样本,很可能就不一样了。
zzzz 发表于 2018-6-11 14:14


别可能,自己加上算一算不就知道了,我做了分析1-3号染色体,的确远远偏离于东亚,而文献PCA的结果(介于现代蒙古和金帐汗国样本)相似,非常北亚。欢迎验证。
发表于 2018-6-11 14:23 | 显示全部楼层
本帖最后由 zzzz 于 2018-6-11 14:26 编辑
别可能,自己加上算一算不就知道了,我做了分析1-3号染色体,的确远远偏离于东亚,而文献PCA的结果(介于现代蒙古和金帐汗国样本)相似,非常北亚。欢迎验证。
Yungsiyebu 发表于 2018-6-11 14:19
问题是你的测试方法,从专业人士角度看,不及格啊。当然选择相信专业人士的说法。如果加入真正的东亚样本做参照,很可能图形表现为这两个样本和现代汉族人紧紧靠在一起。
发表于 2018-6-11 14:28 | 显示全部楼层
问题是你的测试方法,从专业人士角度看,不及格啊。当然选择相信专业人士的说法。如果加入真正的东亚样本做参照,很可能图形表现为这两个样本和现代汉族人紧紧靠在一起。
zzzz 发表于 2018-6-11 14:23


那你就等你专业人士的结果再讲话,我就不信一个文献中pca聚类特征介于现代蒙古和金帐汗国(类雅库特)的样本,他的E11结果能接近安徽汉族。

大家拭目以待。
 楼主| 发表于 2018-6-11 16:25 | 显示全部楼层
本帖最后由 wmch_928 于 2018-6-11 16:33 编辑


“再来看看137文中的PCA分析结果。值得注意的是,该文中所谓的东亚并没有汉族、傣族、日本这些人群,而只有蒙古族、鄂温克甚至一些极北的族群”

类聚只是假象,分析里都没有带这些东亚人群;即使如此,这个PCA也显示出DA43和DA45脱离北亚区间的趋向,君不见已经滑落到最东南角了。

#DA43的数据已发。
发表于 2018-6-11 16:32 | 显示全部楼层

“再来看看137文中的PCA分析结果。值得注意的是,该文中所谓的东亚并没有汉族、傣族、日本这些人群,而只有蒙古族、鄂温克甚至一些极北的族群”

类聚只是假象,分析里都没有带这些东亚人群;即使如此, ...
wmch_928 发表于 2018-6-11 16:25


你怎么知道三个标记为匈奴样本的具体编号?且,三个样本彼此非常聚类。不过,这意义不大,你安心跑数据。
 楼主| 发表于 2018-6-11 16:40 | 显示全部楼层
呵呵,看看K=13时Admixture的结果就知道谁跟谁更近了,选择性眼盲。
发表于 2018-6-11 18:49 | 显示全部楼层
结合下面两张图,基本可以确定这两个争议中的‘汉军将士’的绝对主成分是EAS而不是东亚北方民族比较高频的EAN,按照其比例来看,最接近现在的北方汉族。

另外,请大家不要忘记,现在的东亚北方民族(请注意与真正的北亚民族的区别)的第一主成分大多数也是EAS了(尽管某些北方民族中二者成分比例比较接近),说明什么? 说明进入新石器之后,南方民族对北方的贡献大大超过北方对南方的贡献(下面这张图显示,至迟至匈奴时期,这种趋势就已经开始了,看来《史记》的说法也是有一些道理的...)


wmch_928 发表于 2018-5-10 23:49


K7-匈奴-namazga-贝加尔湖新石器-南亚藏缅-大嘴2018.jpg
发表于 2018-6-11 19:22 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-11 19:30 编辑
发布在GitHub上的开源计划
###6.11  DA43的23me格式数据发布
wmch_928 发表于 2018-6-11 10:48


我比对了txt文档中的1号染色体数据,ystr.org推荐工具的rsid位点更多,提取匹配的位点,结果如附件1,结果是一致的。txt数据本身应当不是造成结果差异的原因。

我以wnch的txt文档提取1号染色体数据,与hgdp的蒙古、雅库特、汉族、傣族数据进行Merge,K=2,运行admixture,结果如附件2。我仍然得到一个非常北方的结果,明显不同于北汉。

是因为1-3号染色体与整体22条染色体有明显差异,还是什么原因,待全部数据跑完后核对。




类雅库特类傣族
Xiong
period
DA43_1_23andme0.5939580.406042
N.HanHGDP012960.1449590.855041
DaiHGDP013070.000010.99999
S.HanHGDP010240.0357490.964251
MongolaHGDP012230.3195180.680482
YakutHGDP009690.999990.00001
MongolaHGDP012260.6469260.353074

D43_chr1_yungsiyebu_wmch_928.txt

3.86 MB, 下载次数: 4

D43_1_23andme_Han_Dai_Mongol_Yakut_new_flip.2.txt

5.79 KB, 下载次数: 4

发表于 2018-6-11 19:59 | 显示全部楼层
我比对了txt文档中的1号染色体数据,ystr.org推荐工具的rsid位点更多,提取匹配的位点,结果如附件1,结果是一致的。txt数据本身应当不是造成结果差异的原因。

我以wnch的txt文档提取1号染色体数据,与hgdp的 ...
Yungsiyebu 发表于 2018-6-11 19:22
真要严谨的话,参与比对的其它参照样本,同样要按你的方法在你的电脑上跑一遍,但是这工作量太大。
发表于 2018-6-11 20:29 | 显示全部楼层
真要严谨的话,参与比对的其它参照样本,同样要按你的方法在你的电脑上跑一遍,但是这工作量太大。
zzzz 发表于 2018-6-11 19:59


参照样本就是文献的源文件Bam。

有服务器的话,可以直接跑bam源文件,不用切割,个人电脑大多要跑死。

wmch的这个txt应当不会有什么大问题,至少一号染色体的匹配位点是都吻合。可以从这里开始做后续分析,
发表于 2018-6-11 22:02 | 显示全部楼层
支持楼主,期待工具。。后者歪楼歪得蛮严重,楼主可以考虑另开一贴。
发表于 2018-6-11 22:28 | 显示全部楼层
用wmch提供的全组数据,同样与hgdp mongol yakut Han和Dai,merge后,admixture K=2,得到的结果,即非常高比例的类雅库特成分。具体,Q文件件附件1。



类雅库特类傣族
Xiong
period
DA43_1_23andme0.6037550.396245
N.HanHGDP012960.1438120.856188
DaiHGDP013070.000010.99999
MongolaHGDP012320.2546390.745361
S.HanHGDP010240.0338360.966164
YakutHGDP009690.999990.00001

DA43_23andme_Han_Dai_Mongol_Yakut.2.txt

5.79 KB, 下载次数: 5

发表于 2018-6-11 22:39 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-11 22:44 编辑

这样,可以基本肯定,大家用Bam源文件跑出来的txt文档rsid信息列表,应当彼此都没有问题,数据是吻合的。

接下来,wmch等用的是现成的计算器,这些计算器都是在admixture的P文件、Q文件基础上生成的。我的方式是,直接用最通用的生信科研工具admixture,merge了hgdp数据库的4个目标人群快速跑出来的结果。问题应当出在这里。

举个极端情况下的例子,比如我的数据跑跑非洲的计算器,也可以跑出结果。建议大家直接试试通用科研工具admixture。
2018-06-11 22-42-57 创建的截图.png
发表于 2018-6-11 23:06 | 显示全部楼层
请大家避免口水战,我亲自验证,wmch提供的txt文档与我们自己跑出来的1号染色体完全吻合,数据没有问题。问题出在这组数据用admixture跑出的结果和现成的基于Q和P文件的各类计算器结果不同。欢迎大家用专业的最通用的生信工具admixture做验证。 我也会尝试merge更多相关人群数据,做更多验证分析。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2018-10-19 08:21 , Processed in 0.143825 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表