返回列表 回复 发帖
现在可见的测过全序的F316的有5个样本,其中共享F813的样本两个,分布是甘肃汉族的YCH14和北京NA18557,所以F316下游至少是分析出了一个下游支系F813,这个点刘姓样本是没有测过的。
风虎云龙 发表于 2014-12-14 10:55
5个全序只有F813这一个共享点?那就是说测过的这5个人的祖先在3千年前左右直接分开成4支-不知道你说的全序是测了多少bp的?复旦好像测的是5百万吧?
现在可见的测过全序的F316的有5个样本,其中共享F813的样本两个,分布是甘肃汉族的YCH14和北京NA18557,所以F316下游至少是分析出了一个下游支系F813,这个点刘姓样本是没有测过的。
风虎云龙 发表于 2014-12-14 10:55
查了一下,复旦是390万。
不知道除了YCH14,YCH19,YCH33,另外两个样本各自测出来几个F316下游的SNP?
复旦第一批是4 Mbp的范围,算不上是全序,因此获得的位点相对有限,很多大的支系下的树形构建肯定是不完整(三大簇的结构都需要调整) 。


在这个条件下,YCH14,YCH19,YCH33中发现的位点,除了是F316的等价位点就是private点(从第一版将F3298和F1129放到中通位点表中去筛选,到现在版的中通剔除了这两个点也能看出来这2个点是相当晚近或私人)。

千人组的测序范围要远大于复旦的第一批测试{从现在的研究看,测序范围(Length coverage)从大到小的依次是:千人组>Y Elite>Y Prime>>BIG Y>FUDAN>HGDP},千人组数据中只有NA18557样本是F316,从现在看该样本至少贡献出近50个F316的等价位点或下游位点,但仅发现其中的F813是与YCH14共享的。另外一个做过BIG Y的F316,由于数据未公开,暂时不清楚其与其他样本的关系,也就是说现在F316支系下,析出的至少有2人共享的支系就是F813。
从现在看该样本至少贡献出近50个F316的等价位点或下游位点,但仅发现其中的F813是与YCH14共享的。另外一个做过BIG Y的F316,由于数据未公开,暂时不清楚其与其他样本的关系,也就是说现在F316支系下,析出的至少有2人共享的支系就是F813
风虎云龙 发表于 2014-12-14 13:11
这个千人组的测试没有包括任何其他复旦获得的与F316等价的那8个点,但却测了F813,你知不知道这是为什么?
不知道千人组有没有给NA18557测过YCH14的那9个private点?
不知道你这是哪里的说法。

NA18557首先与YCH14,YCH19,YCH33共享复旦发现的F155、F201、F254、F276、F316、F440、F414、F541、F703九个位点,然后还发现了与上面九个位点等价的8个新位点。然后又与YCH14共享F813(这个可以定义成F316的下游第一个支系)。除此外,至少又贡献了34个F316的等价新位点或下游新位点。不存在你说的“千人组的测试没有包括任何其他复旦获得的与F316等价的那8个点,但却测了F813”的说法。
不知道你这是哪里的说法。

NA18557首先与YCH14,YCH19,YCH33共享复旦发现的F155、F201、F254、F276、F316、F440、F414、F541、F703九个位点,然后还发现了与上面九个位点等价的8个新位点。然后又与YCH14共享F813 ...
风虎云龙 发表于 2014-12-14 14:36
F316有将近20个等价位点是否很多?等价位点越多是不是意味着此单倍群的瓶颈期就越漫长?另复旦中通量中原放入F316下游的F3298与F1129两个位点,当时询问过博士,每个只对应一个样本,只是临时命名为Oα1a1和2,建议可忽略,可能意味着当时F316下游第1、2……等支系并未确定。
F316有将近20个等价位点是否很多?等价位点越多是不是意味着此单倍群的瓶颈期就越漫长?另复旦中通量中原放入F316下游的F3298与F1129两个位点,当时询问过博士,每个只对应一个样本,只是临时命名为Oα1a1和2,建议 ...
SNPEC 发表于 2014-12-14 15:35
等价位点越多就意味此单倍群的瓶颈期就越漫长,按照复旦第一次的测试的参数来看,F316有9个等价位点,这样就意味在爆发的时候,大约有2250年(9*250)间没有兄弟支系的后人存活下来(也当然有可能是此后到今的时间段内被慢慢剔除掉的)。

可能有点绕,举个不恰当的例子,也就像从汉朝初年开始到现在,你祖先繁衍大约70-100代人,到2014年的时候,其中的兄弟支系都没有成功保留下来男性后代,两千年来的父系家族只有你一人。
如果按照千人组的参数,F316也经历了大约1700年的瓶颈。
实际上,应该不存在等价位点这一说的,最初都是有先来后到之分,只是眼前没有兄弟支系进行区别,这样就产生了一大堆不知道时间先后,只知道作用相同的SNPs.

有些等价位点也可能是假象,随着测试样本的增多,可能会发现可以进行区隔的样本。
等价位点越多就意味此单倍群的瓶颈期就越漫长,按照复旦第一次的测试的参数来看,F316有9个等价位点,这样就意味在爆发的时候,大约有2250年(9*250)间没有兄弟支系的后人存活下来(也当然有可能是此后到今的时间 ...
风虎云龙 发表于 2014-12-14 16:11
理解你的意思。也可以理解为爆发的原因让这一支有幸传承了下来,也许在这一支爆发之前或之后时间内,是存在兄弟支系的,只有这一支有幸再次出现了超级祖父得以延续下来,其他兄弟支系在之前或者之后因为某些原因消失了。另这些所谓的等价位点是否可以理解为曾经是这一支与其他兄弟支系共享或者部分共享的SNP,是存在突变前后顺序的,而因为这些兄弟支系消失而无法排序?
如果按照千人组的参数,F316也经历了大约1700年的瓶颈。

...
风虎云龙 发表于 2014-12-14 16:14
如果只是1700年,再考虑到定义Oα1的位点只有F438,CTS8101两个,Oα1a也并不年轻啊,超过3000年了。


3000多年的F624+,内部STR已经很发散了。而F316+内部STR还聚合得很好。


估计还有很多F316的等价位点没有被发现。或许Oα1a更接近2000年,而不是3000。
复旦第一批是4 Mbp的范围,算不上是全序,因此获得的位点相对有限, ...
风虎云龙 发表于 2014-12-14 13:11
我看了一下我YFull里的Statistics,我的length coverage是13.64 Mbp, no call是12.01 Mbp。 还特别注明了一个比例,53.17%,正好是13.64/(13.64+12.01)。不太明白length coverage + no call有何意义?是Y-Chr的总长度?我记得总长度好像是60 Mbp啊。

另外还有reads=mapped reads=8.418 Mbp,这又是什么?
不知道你这是哪里的说法。

NA18557首先与YCH14,YCH19,YCH33共享复旦发现的F155、F201、F254、F276、F316、F440、F414、F541、F703九个位点,然后还发现了与上面九个位点等价的8个新位点。然后又与YCH14共享F813 ...
风虎云龙 发表于 2014-12-14 14:36
因为之前你说“千人组数据中只有NA18557样本是F316,从现在看该样本至少贡献出近50个F316的等价位点或下游位点,但仅发现其中的F813是与YCH14共享的”,我据此猜测是polyhedron确信那九个位点等价所以只推荐给千人组9个里面的F316一个位点。


但是你说千人组的F316只有1个样本,这跟你说的“还发现了与上面九个位点等价的8个新位点”明显是矛盾的。
如果只是1700年,再考虑到定义Oα1的位点只有F438,CTS8101两个,Oα1a也并不年轻啊,超过3000年了。


3000多年的F624+,内部STR已经很发散了。而F316+内部STR还聚合得很好。


估计还有很多F316的等价位点没 ...
Tocharian_2 发表于 2014-12-14 20:19
Oα1a的年龄,按照复旦的说法,Oα下各支系的星状扩张,支系的年龄并不比Oα差太多,比如Oα有5000年的话,Oα1a可能也有4000多年的年龄,只是此位点产生后,在此后相当长的时间内瓶颈,在距今2000-3000年的时候,超级祖父的出现,Oα1a有一次爆发,也就是所谓的“快星”。因此“F316+内部STR还聚合得很好”,我认为是和这次爆发有关。
Oα1a的年龄,按照复旦的说法,Oα下各支系的星状扩张,支系的年龄并不比Oα差太多,比如Oα有5000年的话,Oα1a可能也有4000多年的年龄,只是此位点产生后,在此后相当长的时间内瓶颈,在距今2000-3000年的时候, ...
SNPEC 发表于 2014-12-14 23:17
我所谓的支系年龄就是指支系扩张的年代。并不是一系列定义位点中最早那个点的年代。

凤虎说瓶颈期1700年,我的理解是在Oα1扩张后1700年Oα1a开始扩张。而Oα1目前所知的定义点只有2个,说明Oα1散开成各支系是发生在Oα爆发后很短的的时间。


如果上述信息准确,则Oα1a的扩张年代超过3000年。
F316的Y全测数据还是太少,时间的计算还是比较困难的,上面的1700年是参照NA18557的数据来说的。
如果SNPEC能尽早组织2个以上刘姓F316全测,能解决不少问题。
F316的Y全测数据还是太少,时间的计算还是比较困难的,上面的1700年是参照NA18557的数据来说的。
如果SNPEC能尽早组织2个以上刘姓F316全测,能解决不少问题。
风虎云龙 发表于 2014-12-14 23:46
我本人计划明年测Y全序,尽量说服其他人一块测。
NA18557首先与YCH14,YCH19,YCH33共享复旦发现的F155、F201、F254、F276、F316、F440、F414、F541、F703九个位点,然后还发现了与上面九个位点等价的8个新位点。然后又与YCH14共享F813(这个可以定义成F316的下游第一个支系)。除此外,至少又贡献了34个F316的等价新位点或下游新位点。不存在你说的“千人组的测试没有包括任何其他复旦获得的与F316等价的那8个点,但却测了F813”的说法。
风虎云龙 发表于 2014-12-14 14:36
千人组如果只有一个F316的样本,就不可能得出那52个新SNP里面哪个是F316的等价点哪个是下游点(这里的等价的意思当然只是对现有的检测结果而言)。你说的这个提出8个新的等价点的原文是怎么说的?因为千人组的coverage length已经是可能测到的极限的一半长了,所以据此算出的时间其实是没有什么疑问的了。你这里所说的8个等价位点的消息如果属实,那周汉两朝的皇族秘密就已经差不离了
8个新的等价点是FT根据另外一个F316个人测试者的BIG Y 结果以及GENO2.0的测试筛选出来的,这样说你能明白了吗?
千人组的数据很早前(2011年)就被Chris Tyler-Smith等以CTS进行命名并提交,基因地理项目就把收到的这些海量的SNPs放GENO2.0的测试进行全球筛选。这个做法有点类似复旦现在做的中通量测试,只是基因地理所使用的点更为庞大和系统。
8个新的等价点是FT根据另外一个F316个人测试者的BIG Y 结果以及GENO2.0的测试筛选出来的,这样说你能明白了吗?
风虎云龙 发表于 2014-12-15 10:37
原来这些点已经放到BIG Y和Geno2.0了。。。我只是想得到消息的原始来源,这里面可以挖掘的信息太丰富了。关于你说的“除此外,至少又贡献了34个F316的等价新位点或下游新位点”,能不能提供更具体的内容?
返回列表
baidu
互联网 www.ranhaer.org