返回列表 回复 发帖

隔壁受降城俩人

DA43 和 DA45?   这俩人 老永只是拿 K2  K3 K4 去测算,然后 K5就说有问题,这样不正确吧?  我虽然是这方面的小白,但至少知道一个道理, K值越小,越区分不开实际遗传距离更近的不同人群   

以耶律兄的计算方式 K值 达到 5时  藏族,彝族 等西部民族才和 布里亚特 乌尔奇 这种北方民族 阿米 泰雅 等 南岛民族分离


K3 的时候  只能分离出  台湾南岛民族和 尼夫赫 楚科奇这些真正第一批东北亚土著基因,  也就是说, 这时候 泛阿尔泰和华夏  日韩 藏缅 苗瑶,这些都是区别不开的


K6的是后, 阿尔泰原始成分才出现, 泛阿尔泰(突蒙通)和 汉日韩苗畲等区分开


K7的时候  通古斯成分单独分离出来


K8的时候  壮傣成分才分离


K12的时候  日本成分才出现
1

评分次数

  • 强强

一针见血呀!
http://blog.sina.com.cn/aganmu;安德(嗨,前一个无辜被封):
http://blog.sina.com.cn/kilarler
这你就不明白了,你还是太实在,看不懂了吧,现在不是你说的问题,是要继续扯,换个问题继续扯,把问题复杂化,扯到大家都忘了当初最初的问题是什么时候,好全身而退啊。
问题肯定在ped/bed这些中间文件不同,我用他的bed,K=2时,也是跑出了偏东亚的数值。

所以,问题出在运算的admixture的bed数据不同。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
借这个帖子想问一下 懂这个计算的达人一个问题

耶律兄所说的 K值算到了 21   也 没能把 日韩第一主成分 和 汉苗畲分离  这是一个什么概念,我知道 这是K21时候,汉苗畲日韩之间仍然存在着混血, 但这个K21所对应的年代 是一个什么概念  有多近了
借这个帖子想问一下 懂这个计算的达人一个问题

耶律兄所说的 K值算到了 21   也 没能把 日韩第一主成分 和 汉苗畲分离  这是一个什么概念,我知道 这是K21时候,汉苗畲日韩之间仍然存在着混血, 但这个K21所对应 ...
红山人 发表于 2018-6-12 10:42
具体等看K=6的结果即可,古人基因组不是真数据,每个位点只有1-2reads,看到的纯合值都是,人为做出来的。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
具体等看K=6的结果即可,古人基因组不是真数据,每个位点只有1-2reads,看到的纯合值都是,人为做出来的。
Yungsiyebu 发表于 2018-6-12 10:45
你的回答不是我问的问题
你的回答不是我问的问题
红山人 发表于 2018-6-12 10:52
我给你发短消息了
你看看
多谢凌河兄
6# Yungsiyebu 戎狄体质检出北亚常染?情况不妙啊
原因找到,为什么同样源Bam导出的1号染色体数据,我的结果很东北亚,无诸王很东亚-东南亚,经拆解其bed文件,发现,原来,总共3万+snp与hgdp数据库吻合,结果,无诸王不知道什么筛选标准,只录入了其中1万+,我是全部录入。结果,我运行他筛选后的数据,的确是非常东亚。
原因找到,Bam源文件导出的数据中,在1号染色体有32,670个markers与hgdp数据库重合,我全部采用,少量问题位点remove,admixture上运行的总marker3超过3万+,而无诸王仅选择了其中13,371,不及总数的一半,不清楚标准是什么?

同一个样本的1号染色体数据,一个全部录入,一个选择了特定marker,分别与hgdp Yakut,Han,Dai,Mongola数据merge,并分别运行admixture,结果如下,与之前的运算吻合,我的全组marker结果非常接近东北地区各民族的类雅库特水平,而无诸王不知道基于什么筛选标准筛选后的数据,运算结果,的确与其自己运算结果吻合,非常东亚-东南亚。


无诸王具体选择的数据与全组1号染色体数据的比对,请见,DA43_1_compare.xlsx(云盘中),粗略扫了一眼,这些选择后的数据正确性应当没有问题。

链接: https://pan.baidu.com/s/1D5_oHBbxbxkmB7V12emWzA 密码: x9w3







类雅库特类傣族
Xiong
period
DA43_yungsiyebu0.556680.44332
han-dynasty
da43
da43_无诸王0.000010.99999
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
这就全明白了,根据流行公司的芯片位点筛选后的数据是造成结果的不同的原因,这就理解为什么流行的网友制作工具,与admixture结果如此不同,因为这些工具都是按基因公司筛选的snp跑的数据。同样的数据,1号染色体为例,3万+原始数据,admixture标注科研工具跑出来的非常北亚,但用基因公司位点筛出来位点,再跑admixture和直接用网友工具,结果类似,就变得非常东亚了。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
我推测,基因公司的芯片都是根据主流东亚人,中日韩设计的,拿不到或者无法参考西伯利亚北亚族群,所以,造成选择的位点都是可以特异性区分东亚人的snp,但对于北亚西伯利亚就很无助了。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
欢迎大家直接用标准科研工具,标准科研数据库hgdp等直接跑数据,不要受商业公司筛选位点和基于商业公司数据设计的网友各类小计算干扰。重新跑一下数据。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
原因找到,为什么同样源Bam导出的1号染色体数据,我的结果很东北亚,无诸王很东亚-东南亚,经拆解其bed文件,发现,原来,总共3万+snp与hgdp数据库吻合,结果,无诸王不知道什么筛选标准,只录入了其中1万+,我是全部 ...
Yungsiyebu 发表于 2018-6-12 13:19
这时候又不提K等于5的时候,da43样本明显与东北亚不同的事了?
本帖最后由 Yungsiyebu 于 2018-6-12 13:44 编辑
这时候又不提K等于5的时候,da43样本明显与东北亚不同的事了?
zzzz 发表于 2018-6-12 13:39
看更更深的K值即可,西南这些民族来源很复杂,原因可以看更深的值。数据还在跑,非常吃内存,我也很好奇,细分后,这些样本到底与东方各民族的关联如何,这是主要目的,别急。

当然,一事归一事,之所以,无诸王跑出的数据与我的差异这么大,原来是他们删除了超过一大半的原始数据,数据严重人为筛选,删除理由不详。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
Hurray,对云师更敬佩了!这似乎也对蒙古人种白令吉亚起源说很有帮助呀!楚人跟楚科奇、鲜卑、朝鲜、鲜虞有些关系(科里亚克——高阳氏——高夷——高丽),汉人接近东北亚是很正常的了。而且看起来,东南亚、东北亚保留了一些古亚洲成份,东亚却很突兀矗在中间,这又是从南西伯利亚南下的证据,只是年代太早,还是跟后来的南西伯利亚不搭界呀。
http://blog.sina.com.cn/aganmu;安德(嗨,前一个无辜被封):
http://blog.sina.com.cn/kilarler
Hurray,对云师更敬佩了!这似乎也对蒙古人种白令吉亚起源说很有帮助呀!楚人跟楚科奇、鲜卑、朝鲜、鲜虞有些关系(科里亚克——高阳氏——高夷——高丽),汉人接近东北亚是很正常的了。而且看起来,东南亚、东北亚 ...
癯鹤 发表于 2018-6-12 13:48
我比较较真的生信发烧友而已。欢迎大家就数据本身讨论问题。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
17# 癯鹤

东亚没什么突兀的就是位于东南亚和东北亚的中间,至于什么新老亚洲纯粹扯淡,李大仙应该出面为他当年的不实言论道歉。现在网络上乌烟瘴气很大一部分原因就是因为他和黄汗网络写手光速对新老亚洲这种不实且充满种族歧视意味言论的散播。
探究人类学真相,为南方民族发声
17# 癯鹤  

东亚没什么突兀的就是位于东南亚和东北亚的中间,至于什么新老亚洲纯粹扯淡,李大仙应该出面为他当年的不实言论道歉。现在网络上乌烟瘴气很大一部分原因就是因为他和黄汗网络写手光速对新老亚洲这种不 ...
MNOPS 发表于 2018-6-12 13:58
哦,我也是揭批利喙邪教的,没想到已经中毒不自知,谢谢解读!
http://blog.sina.com.cn/aganmu;安德(嗨,前一个无辜被封):
http://blog.sina.com.cn/kilarler
返回列表
baidu
互联网 www.ranhaer.org