Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
查看: 5341|回复: 9

Yfull对F155的分析结果?出现异常?

[复制链接]
发表于 2017-9-26 11:17 | 显示全部楼层 |阅读模式
Yfull刚刚更新至5.06,看了看新加入几个样本的分析结果似乎出现异常?

样本YF10745校正后的私有位点数竟然多达85个,将Y20928的年代推高到了7000年以上!超过了上游F155,F316的支系平均估年;导致Yfull直接将7000年作为F155,F316的估年。F438的估年因此也增加到8100年,而Yfull也直接用8100作为F5的年代(支系平均为7600年)。


实际上,F155下的其他新加入样本也出现了私有位点多的情况。FGC35831,目前估年也达到了3600年!不但远多于yfull原有F155样本的私有位点数目,也超过Yquanxu估计的数量。

这次F5下加入Yfull的其他几例Yquanxu样本也出现了私有位点偏多的情况,几个样本的私有位点数远多于原有样本和Yquanxu的估计;拉大了F5的年龄。

没有仔细看其他单倍群的情况。但貌似有例来自Yquanxu的F492也出现了类似情况,YF10657年代超过6000年。
发表于 2017-9-26 11:19 | 显示全部楼层
 楼主| 发表于 2017-9-26 11:41 | 显示全部楼层
可以参考这个帖子:http://www.ranhaer.com/redirect.php?tid=35957&goto=lastpost#lastpost
风虎云龙 发表于 2017-9-26 11:19

的确是不同来源的样本算出来的私有位点数不一样。之前有批ERR样本加入到F5的时候,我就注意到突变数比原有的BigY样本普遍偏多。

但我还是有些不明白你的说明哈。

就是说在40-50x的覆盖度下,Yfull要求突变点被覆盖3次。而在200x的覆盖度下,Yfull仍然采信了那些只被覆盖到3次的SNP;导致计算出的私有位点数偏多?

按理说,一个位点在BigY测试中被覆盖到了3次,跟在Yquanxu中被覆盖了3次,可信度是一样的吧。不会平均覆盖次数多,每次被读到的质量就降低了噻?

不晓得我说的对不对。
发表于 2017-9-26 11:52 | 显示全部楼层
这里说的是平均覆盖深度,一个产品的平均覆盖深度是30X,那么他出现3X以下覆盖的区间是不是会比平均200X覆盖深度的多。
举个例子,我们以3万元收入为标准,3万元以下的我们算成穷人,3万元以上的我们算完富人。A地区的平均收入是30万,B地区的平均收入是200万,那么AB两个地区哪个地区更容易出现富人,那个地区更容易出现穷人?
 楼主| 发表于 2017-9-26 13:05 | 显示全部楼层
本帖最后由 Tocharian_2 于 2017-9-26 14:35 编辑

看了一下我自己的结果,median depth coverage是52x,比一般的BigY样本高些。或许会导致私有位点数偏高。。。
前段时间把我的BAM文件交给了Yquanxu,看能不能得到不同的估年。
发表于 2017-9-26 15:49 | 显示全部楼层

标题

这种信息发布出来,说明yfull极不负责任,毫无质量控制的概念。
发表于 2017-9-27 15:55 | 显示全部楼层
关于这种Y全序信息网站,现在总要几个网站一起打开查,感觉很不方便。

ISOGG没有年龄计算,YFULL没有序列号,而且两边采用的位点编号还有的不一致,查起来麻烦,不知有无更好的方法。
发表于 2017-9-28 18:41 | 显示全部楼层
本帖最后由 L1FEBL00D 于 2017-9-28 19:37 编辑
Yfull刚刚更新至5.06,看了看新加入几个样本的分析结果似乎出现异常?

样本YF10745校正后的私有位点数竟然多达85个,将Y20928的年代推高到了7000年以上!超过了上游F155,F316的支系平均估年;导致Yfull直接将700 ...
Tocharian_2 发表于 2017-9-26 11:17

YF10657就是我~简单介绍一下自己的情况~

Yquanxu分析得出我在F492下用来计算年龄私有SNP22个,但其中有一个是23044100G->A,应该是和F140等价的CTS11270,在比对私有SNP时候漏掉了这个公共SNP,这样在yquanxu标准下我用来计算年龄的私有SNP应该是21个,计算出的年龄是3000多年,从结果上看基本认同这个年龄,因为和YFULL分析的其他样本比较接近

YFULL分析的我的样本用来计算年龄的SNP是38,但归类在Novels的实际是29,另外9个可能是归类在Known SNPs下的F492*,并没有理解其中的原理,这些不像应该用来参与计算的SNP,其中6个没有命名也没有地址,Y15395 / Z34316是D下的SNP,因此怀疑这9个SNP不应用来计算年龄

无标题.png


此外,在Novel SNPs下自己筛选出可以用来计算年龄的SNP实际上有33个,相比前面的29,少了4个,目前并不清楚YFULL因为什么原因或者规则去掉了这4个SNP,这4个SNP也不在List of novel SNPs not to be used to estimate agez中,可见YFULL对自己的算法还是有所保留

基本情况就是这样~另外我在复旦做的全序测试bam文件也已经拿到,会自己学着分析下~

评分

2

查看全部评分

发表于 2017-10-8 18:06 | 显示全部楼层
首先对Yfull这种不负责任的做法表示强烈抗议!同样的20928,计算的年龄一个是2千年以内,一个是一万二千年以上,一直没有给个说法和修正,不管什么原因,它玷污了神圣的分子人类学!希望给大家一个明确的说法。
 楼主| 发表于 2018-4-3 10:29 | 显示全部楼层
Yfull更新至6.02。对Yquanxu样本的估年问题,似已基本修正。
88.JPG
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2020-5-25 07:28 , Processed in 0.172213 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表