返回列表 回复 发帖

标题

花了点精力整理了千人组、BIG Y、FGC、复旦等O3全测数据的SNP,画了O3—M122 SNPs演化树,画完看了看轮廓,基本可以确定O3三大簇扩张模板非常接近。在F11\F46\F5三大簇急速扩张的前夜,都经历了大约等同于爆发至今的 ...
风虎云龙 发表于 2015-2-9 12:50
只要有扩张就有瓶颈,未必要有恶劣的环境。这个图倒是很像我以前说的先梯度扩张再星状扩张。
O3a3c* (M134+, M117-)
只要有扩张就有瓶颈,未必要有恶劣的环境。这个图倒是很像我以前说的先梯度扩张再星状扩张。
hercules 发表于 2015-2-9 16:28
要看瓶颈的时间,比如N南北支分化之前的瓶颈就相当长,而K下的瓶颈就相当短,甚至都不能称为瓶颈,迅速分化为不同的支系,从这一点来看,K的分化地点环境还是不错的
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
只要有扩张就有瓶颈,未必要有恶劣的环境。这个图倒是很像我以前说的先梯度扩张再星状扩张。
hercules 发表于 2015-2-9 16:28
你这个只是对“瓶颈——>扩张”现象的描述,并没有解释造成瓶颈的原因。
F5的年龄在复旦首次测试的时候因为缺少CTS1642的数据而被低估了,CTS1642这个盘踞印度东北、孟加拉、缅甸、泰国、越南、两广的F5下的庞大支系的,对比阿尔法1到4,要拉高F5下游近10+个SNP。
风虎云龙 发表于 2015-2-9 15:29
怎么会因为缺少CTS1642,Oα的年龄就被低估了?根据现有的所有树形图,CTS1642和其它支系是同步分离的呀。

Hallast的样本中包含了CTS1642,F438还有2个Oα*。结论和复旦也类似。
怎么会因为缺少CTS1642,Oα的年龄就被低估了?根据现有的所有树形图,CTS1642和其它支系是同步分离的呀。

Hallast的样本中包含了CTS1642,F438还有2个Oα*。结论和复旦也类似。
Tocharian_2 发表于 2015-2-9 16:54
因为用SNP全测数据算年龄是要前后兼顾的,来个比喻:
一个人到某人家里做客,发现这家主人不在,只有主人的几个孩子在,其中甲8岁、乙10岁、丙12岁、丁14岁,就估计这家主人的年龄大概在14+20=34左右。

结果算完以后,来了个30岁的男人,原来是主人家的长子,主人年龄实际是30+20=50岁。

虽然不是很恰当。但是CTS1642下的全测数据比阿尔法1-4普遍多10+SNPs.
因为用SNP全测数据算年龄是要前后兼顾的,来个比喻:
一个人到某人家里做客,发现这家主人不在,只有主人的几个孩子在,其中甲8岁、乙10岁、丙12岁、丁14岁,就估计这家主人的年龄大概在14+20=34左右。

结果算完 ...
风虎云龙 发表于 2015-2-9 17:01
对。但问题就在于CTS1642,没有早于其它支系分出来啊。至少目前的树状图和你的分析都表明此。用你的列子来说就是几个孩子一样大。
不过,如果在同样测序长度下,CTS1642样本普遍比其它支系多10几个SNP。那确实奇怪。
看来还是没懂
这么说吧,假设:F5下的F438样本平均有17个SNP,Y8389下游24个,F3599下有19个、CTS5063下游20个。假定每100年产生一个SNP,用这四支计算F5的的年龄。

怎么计算呢?肯定不能用一支的SNP数去乘以100年呀,要算个平均吧,(17+24+19+20)/4*100=2000年。

但是后来发现一支CTS1642,他平均有30个SNP,这样加入他进行计算,年龄和和之前的相比是不是变大了200年?
对。但问题就在于CTS1642,没有早于其它支系分出来啊。至少目前的树状图和你的分析都表明此。用你的列子来说就是几个孩子一样大。
不过,如果在同样测序长度下,CTS1642样本普遍比其它支系多10几个SNP。那确实奇 ...
Tocharian_2 发表于 2015-2-9 17:04
同样测序长度下,不同支系间多十几个SNP是很正常的(你要不好理解SNP产生的原理,就可以想象成父子相传的代数,父子相传的代数多,自然产生SNP的数量就比父子相传代数少的支系多,数千年积累下来也不少了)。

实际上更早的支系有些甚至悬殊数百个SNP,比如这里面的F742支系要比M324支系少近200个SNP。
看来还是没懂
这么说吧,假设:F5下的F438样本平均有17个SNP,Y8389下游24个,F3599下有19个、CTS5063下游20个。假定每100年产生一个SNP,用这四支计算F5的的年龄。

怎么计算呢?肯定不能用一支的SNP ...
风虎云龙 发表于 2015-2-9 17:23
当前的全测每组只有十来二十个SNP吗,中通量就不止这些,如何确定哪些是private的并予以去除的呢
当前的全测每组只有几十个SNP吗
snelheid 发表于 2015-2-9 17:32
这个是我举例子在随便写的数字。
M122以下,现在每一个全测样本大约是400多个SNP。
这个是我举例子在随便写的数字。
M122以下,现在每一个全测样本大约是400多个SNP。
风虎云龙 发表于 2015-2-9 17:35
但现有树上包括一楼的树中都反映不出大部分SNP的位置,想来有一部分或因各种原因(如稳定性)被摒弃、被当作等价点而省略等等

另外这里的所谓Y全测也只是覆盖60Mbps中的一小部分所谓“有效”长度,不到总长度的一半吧,在这一小部分内部还会有筛选,不清楚他们是如何筛选的,或是有些已筛选且已放在under investigation里但还没公布,这也会导致数量不对称
这里说的全测一般是指非重组区大于10Mbps的数据,因为牵扯到千人组、FT、FGC和复旦,各家各不相同。
比较认同龙虎的观点,即O3目前最大的三大支系的最后一次瓶颈主要与全新世之后的那次大降温有关(大约在7.6~8.2ka BP,参见金章东团队的最新研究成果)。个人认为,这次大降温对进入全新世之后处于萌芽期的原始农业应该是一次毁灭性打击,换言之,之后的农业尤其是北方农业极有可能是受到大降温之后北上农业(包括秦岭南部北上)的影响而重新产生的,与前期的渔猎/游猎+萌芽期农业混合经济人群关系不大。与此对应,则是之前的北方人口急剧下降(其中包括南下人群,同时可以假设,前农业时期北方人群依然明显低于黄河或淮河以南) ,后来被缓慢逐批逐次北上的新农业人群漂变,其中比较幸运的比如北方型的P201*人群则一直傲立至今。
      就目前为止在东欧亚地区(包括近南亚地区)对大部分族群的抽样检测结果,其中O3的检测结果我估计可以覆盖绝大多数东欧亚O3支系以及次支系,其余暂时未能测出的支系,即使高达40%,我看也不会明显影响对目前O3-tree各支系年龄的推断(估计最终会继续推高年龄上浮10%)。
     个人感觉,应该加大对云贵川以及缅甸地区的检测覆盖面,这里应该是非常珍贵的东欧亚人类Y/mt染色体存留博物馆。
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...

标题

要看瓶颈的时间,比如N南北支分化之前的瓶颈就相当长,而K下的瓶颈就相当短,甚至都不能称为瓶颈,迅速分化为不同的支系,从这一点来看,K的分化地点环境还是不错的
sahaliyan 发表于 2015-2-9 16:34
我的意思是,瓶颈不是因为他们受了什么委屈,而是因为他们在路上。
O3a3c* (M134+, M117-)

标题

你这个只是对“瓶颈——>扩张”现象的描述,并没有解释造成瓶颈的原因。
风虎云龙 发表于 2015-2-9 16:46
我的意思是,瓶颈不是因为他们受了什么委屈,而是因为他们在路上。
O3a3c* (M134+, M117-)
我的意思是,瓶颈不是因为他们受了什么委屈,而是因为他们在路上。
hercules 发表于 2015-2-9 20:28
要看瓶颈的时间,比如K下有些支系甚至一二千年甚至不到就能分化为两个大的支系,以更古老时代的条件肯定是更差的,但是却能如此,说明K支系当时生活的环境是相对不错的。而如果说从支系诞生一直瓶颈了几千年,这个除了环境真找不出其他理由。虽然古代瓶颈是很常见的,但是也分不同的瓶颈,即使阿尔法,贝塔下面有些支系也是二叉,其实那还是瓶颈,只不过时间更短而已
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
...
就目前为止在东欧亚地区(包括近南亚地区)对大部分族群的抽样检测结果,其中O3的检测结果我估计可以覆盖绝大多数东欧亚O3支系以及次支系,其余暂时未能测出的支系,即使高达40%,我看也不会明显影响对目前O3-tree各支系年龄的推断(估计最终会继续推高年龄上浮10%)。
imvivi001 发表于 2015-2-9 20:14
想了一下,感觉还是要修正一下,目前测出的O3 hg可能只有全部hg的30%,因为目前参与测试的人数还是太少,尤其是某些人类博物馆地区如云贵川缅甸多山地区,如果加大对这些地区各族群的检测,应该可以发现大量人数稀少的珍稀型hg,正常情况,其数目会远多于现在已经测出的O3 hg数目。这样,三大主要支系的年龄可能要上浮15~20%
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
γ和α、β,在第一次扩张后,后来的发展还是有点不同。γ的支系再次爆发的时间较α、β间隔长,平静了好长一段时间(??大概两三千年??)而不像α、β不断有新的支系产生,虽然β下有几支二次爆发也隔段时间。
无善 发表于 2015-2-9 20:47
我记得伽马星占到伽马的小半成,不知道全测后有什么变化,伽马在新石器时期的支系还是相对更丰富一些,但是不如阿尔法丰富
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
问一下版主:复旦的1万元Y全序的覆盖长度比1000genome大吗?
24# Tocharian_2
Data from different sources have different NRY coverage, so current snp counts for various branches are not completely comparable.  
I think that the real age of alpha may be even older.
返回列表
baidu
互联网 www.ranhaer.org