Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
楼主: wmch_928

关于欧亚草原数据分析的说明和其他问题

[复制链接]
发表于 2018-6-12 00:00 | 显示全部楼层
请大家避免口水战,我亲自验证,wmch提供的txt文档与我们自己跑出来的1号染色体完全吻合,数据没有问题。问题出在这组数据用admixture跑出的结果和现成的基于Q和P文件的各类计算器结果不同。欢迎大家用专业的最通用的 ...
Yungsiyebu 发表于 2018-6-11 23:06

小云老师,你这句话的表述不太准确噢。应该是:你用你自认为比较专业的方式对元数据进行了处理,但是跑出来的结果与专业团队用同样的元数据经过专业的处理加工得到的结果很不一样,尽管目前不清楚为什么会有这么大的差异,但是的确是这样。

不过我目前为止更愿意相信专业团队发表在专业杂志上的结果~~
发表于 2018-6-12 00:13 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 00:15 编辑
小云老师,你这句话的表述不太准确噢。应该是:你用你自认为比较专业的方式对元数据进行了处理,但是跑出来的结果与专业团队用同样的元数据经过专业的处理加工得到的结果很不一样,尽管目前不清楚为什么会有这么大 ...
imvivi001 发表于 2018-6-12 00:00

欢迎验证。我的计算结果,基本与文献pca吻合,3个标记为匈奴样本都与蒙古族聚类。
发表于 2018-6-12 00:24 | 显示全部楼层
欢迎验证。我的计算结果,基本与文献pca吻合,3个标记为匈奴样本都与蒙古族聚类。
Yungsiyebu 发表于 2018-6-12 00:13

PCA在二维平面上不太精准,还是admixture分析比较原始与直观。
现在的问题是:为啥你的结果与专业团队公开发表的结果很不一样?

你要让我相信在你的小破笔记本上跑出来的结果,那你必须给我一个足够说服力的理由对不对?
发表于 2018-6-12 00:26 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 00:28 编辑
PCA在二维平面上不太精准,还是admixture分析比较原始与直观。
现在的问题是:为啥你的结果与专业团队公开发表的结果很不一样?

你要让我相信在你的小破笔记本上跑出来的结果,那你必须给我一个足够说服力的理 ...
imvivi001 发表于 2018-6-12 00:24

哪有专业团队用admixture?我用admixture跑出的结果与作者做的pca吻合,不吻合的是,那些用网友开发的E11、K12b等工具。
另外,admixture不会因为你从服务器移到个人电脑,结果就变得,这是很扯的话,无非计算速度快慢的问题。
发表于 2018-6-12 00:27 | 显示全部楼层
62# Yungsiyebu
噢。对了,你这里说的‘蒙古族’也要具体看是哪一类‘蒙古族’,现在选一个高度近似华北汉族的‘蒙古族’并不是十分困难~
发表于 2018-6-12 00:29 | 显示全部楼层
62# Yungsiyebu
噢。对了,你这里说的‘蒙古族’也要具体看是哪一类‘蒙古族’,现在选一个高度近似华北汉族的‘蒙古族’并不是十分困难~
imvivi001 发表于 2018-6-12 00:27
看图,与这三例匈奴标签样本最聚类的,还有布里亚特样本。另外,我劝你不下几十次了,不要这么空对空的码字浪费时间,有时间自己跑跑数据。
发表于 2018-6-12 00:29 | 显示全部楼层
哪有专业团队用admixture?我用admixture跑出的结果与作者做的pca吻合,不吻合的是,那些用网友开发的E11、K12b等工具。
Yungsiyebu 发表于 2018-6-12 00:26

请问我前面引用的难道不是作者团队的原图?


发表于 2018-6-12 00:31 | 显示全部楼层
哪有专业团队用admixture?我用admixture跑出的结果与作者做的pca吻合,不吻合的是,那些用网友开发的E11、K12b等工具。
另外,admixture不会因为你从服务器移到个人电脑,结果就变得,这是很扯的话,无非计算速度 ...
Yungsiyebu 发表于 2018-6-12 00:26
各种计算器都是经过大数据检验的.得!你跑下数据,直接宣告国内外的各种计算器破产了。没这么简单,还是再看看吧。
发表于 2018-6-12 00:33 | 显示全部楼层
请问我前面引用的难道不是作者团队的原图?



imvivi001 发表于 2018-6-12 00:29

说明什么,这里一个东亚ref都没有,有时间,自己跑跑数据。
发表于 2018-6-12 00:35 | 显示全部楼层
各种计算器都是经过大数据检验的.得!你跑下数据,直接宣告国内外的各种计算器破产了。没这么简单,还是再看看吧。
zzzz 发表于 2018-6-12 00:31

我从来没有看过任何一篇专业文献用这些业务工具验证准确性,admixture一直是古dna分析的最通用工具。
发表于 2018-6-12 00:38 | 显示全部楼层
69# Yungsiyebu
你真是七窍通了六窍,可是就是打不开学会看admixture图的窍门,这样的话,你纵使跑一万次运算程序那又有什么用呢? 俺真的为您捉急吖,呵呵
发表于 2018-6-12 00:41 | 显示全部楼层
69# Yungsiyebu
你真是七窍通了六窍,可是就是打不开学会看admixture图的窍门,这样的话,你纵使跑一万次运算程序那又有什么用呢? 俺真的为您捉急吖,呵呵
imvivi001 发表于 2018-6-12 00:38


兄弟,真的,不打算跑数据做验证,别没事跟我的帖,不回感觉这么密集的口水贴,不会看不起人,但回了,真是浪费时间。空对空,真没用。
发表于 2018-6-12 00:53 | 显示全部楼层
72# Yungsiyebu
你回不回我并不在乎,我只想告诉大家一个事实,那就是:著名的云谢部阁下(或永谢步或更准确的汉译可能是云需府,拉丁名字即Yungsiyebu者)只会一味地自我陶醉在一个小破笔记本上瞎跑一通程序,却一直学不会看懂一个专业团队发表在专业杂志上的admixture结果图,仅此而已~~
发表于 2018-6-12 01:04 | 显示全部楼层
更大的ref包,提取了hgdp中的全部美洲和蒙古人种样本。

K=2结果如下,D43样本的类美洲因素明显不同于北汉,而更接近东北地区各民族的水平,高达8%。Q文件中的具体样本数值见附件。

明天陆续出其他K值的结果,稍后更新。欢迎广大网友admixture验证运算结果。



类美洲类东方
DA43_23andmeXiongnu
period
0.0802520.919748
HGDP01356Tu0.0782810.921719
HGDP01346Naxi0.013960.98604
HGDP01326Lahu0.0040610.995939
HGDP01327She0.000010.99999
HGDP01316Dai0.000010.99999
HGDP01317Lahu0.000010.99999
HGDP01296Han0.0300860.969914
HGDP01307Dai0.000010.99999
HGDP01242Hezhen0.0712980.928702
HGDP01243Xibo0.1712310.828769
HGDP01222Daur0.0731150.926885
HGDP01223Mongola0.075330.92467
HGDP01198Miaozu0.000010.99999
HGDP01203Oroqen0.1109940.889006
HGDP01104Tujia0.000010.99999
HGDP01179Yizu0.0096430.990357
HGDP00969Yakut0.2645950.735405
HGDP00971Han0.000010.99999
HGDP00854Maya0.999990.00001
HGDP00721Cambodians0.0664650.933535
HGDP00747Japanese0.0080630.991937

DA43_eastAsian.2.txt

17.3 KB, 下载次数: 6

发表于 2018-6-12 01:19 | 显示全部楼层
更大的ref包,提取了hgdp中的全部美洲和蒙古人种样本。

K=2结果如下,D43样本的类美洲因素明显不同于北汉,而更接近东北地区各民族的水平,高达8%。Q文件中的具体样本数值见附件。

...
Yungsiyebu 发表于 2018-6-12 01:04

以子之矛 攻子之盾,何如?

类美洲类东方
DA43_23andmeXiongnu0.0802520.919748
period
HGDP01356Tu土族0.0782810.921719
HGDP01242Hezhen0.0712980.928702
HGDP01243Xibo0.1712310.828769
HGDP01222Daur0.0731150.926885
HGDP01223Mongola0.075330.92467
HGDP01203Oroqen0.1109940.889006



土族可不是什么‘东北民族’。另外,真正的东北民族鄂伦春人和锡伯族与您的43号‘匈奴’隔着‘十万八千里’呢,呵呵
发表于 2018-6-12 01:35 | 显示全部楼层
再来看看云需府同学的柬埔寨样品与他的43号‘匈奴古人’在美洲成分方面的距离:
类美洲类东方
DA43_23andmeXiongnu0.0802520.919748
period
HGDP01356Tu0.0782810.921719
HGDP01242Hezhen0.0712980.928702
HGDP01243Xibo0.1712310.828769
HGDP01222Daur0.0731150.926885
HGDP01223Mongola0.075330.92467
HGDP01203Oroqen0.1109940.889006
HGDP00721Cambodians0.0664650.933535


哎呀妈呀,地理位置相隔万里之遥的柬埔寨人,与云需府同学的‘匈奴古人’在美洲成分上,居然只相差0.0136,而这个‘匈奴古人’与近在咫尺的东北民族锡伯族,居然相差0.091! 足足相差快7倍了!!
这是咋回事儿呢?? 难道不足以对云需府同学的运算结果、以及他看图说话的基本逻辑解读能力产生一些联想么?
发表于 2018-6-12 09:58 | 显示全部楼层
K=5时,可能是问题所在,出现了很强的类拉祜族因素,类雅库特因素大幅降低。

此时,Fst值:

    Pop0    Pop1    Pop2    Pop3   
Pop0   
Pop1    0.051   
Pop2    0.075    0.057   
Pop3    0.116    0.117    0.137   
Pop4    0.219    0.218    0.236    0.196   



类雅库特类日本类拉祜族类玛雅类玛雅
DA43_23andmeXiongnu
period
0.0862610.5423530.3713660.000010.00001
HGDP01346Naxi0.0729240.6329950.2929830.0010880.00001
HGDP01347Tu0.1405370.6425830.1773590.000010.03951
HGDP01326Lahu0.0150340.2561120.7233920.0054520.00001
HGDP01327She0.000010.6031790.3967910.000010.00001
HGDP01296Han0.049120.7676820.1597720.000010.023416
HGDP01307Dai0.000010.3912840.6086860.000010.00001
HGDP01242Hezhen0.3637520.619990.0162380.000010.00001
HGDP01243Xibo0.3203070.4450530.1243950.000010.110235
HGDP01222Daur0.3534250.6465450.000010.000010.00001
HGDP01223Mongola0.2424160.6584890.0765490.000010.022536
HGDP01198Miaozu0.000010.598380.401590.000010.00001
HGDP01203Oroqen0.7324070.2675630.000010.000010.00001
HGDP01104Tujia0.0141230.7064780.2793790.000010.00001
HGDP01179Yizu0.0739920.6289260.2970570.0000160.00001
HGDP00969Yakut0.9190920.000010.0066260.000010.074262
HGDP00971Han0.0000120.7998280.200140.000010.00001
HGDP00854Maya0.000010.000010.000010.999960.00001
HGDP00721Cambodians0.0661490.0761170.7921210.000010.065603
 楼主| 发表于 2018-6-12 13:18 | 显示全部楼层
“匈奴or漢兵,傻傻分不清?”系列已全部上傳,接下來要幹其他正事了
发表于 2018-6-12 13:30 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-6-12 13:31 编辑
“匈奴or漢兵,傻傻分不清?”系列已全部上傳,接下來要幹其他正事了
wmch_928 发表于 2018-6-12 13:18


欢迎工作,鼓励。希望更多有服务器条件的朋友把bam到txt的数据跑出来,便于更多网友个人电脑做数据分析。

原因找到了,用商业公司的snp筛选一遍,我用这样的数据跑出的结果也的确与各种流行工具吻合。

欢迎大家试试未被商业公司位点影响的raw data与hgdp科研数据merge。
发表于 2018-6-13 08:15 | 显示全部楼层
K=5时,可能是问题所在,出现了很强的类拉祜族因素,类雅库特因素大幅降低。

此时,Fst值:  
Pop0    Pop1    Pop2    Pop3   
Pop0   
Pop1    0.051   
Pop2    0.075    0.057   
Pop3    0.116    0.117    0.137   
Pop4    0.219    0.218    0.236    0.196   



类雅库特类日本类拉祜族类玛雅类玛雅
DA43_23andmeXiongnu
period
0.08
...
Yungsiyebu 发表于 2018-6-12 09:58
.
  请小云同学先把表格整理写清楚标签名称 这些基本功做好了,再来发表您的宏篇大论吧
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2018-10-19 08:22 , Processed in 0.098767 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表