返回列表 回复 发帖
F5的年龄在复旦首次测试的时候因为缺少CTS1642的数据而被低估了,CTS1642这个盘踞印度东北、孟加拉、缅甸、泰国、越南、两广的F5下的庞大支系的,对比阿尔法1到4,要拉高F5下游近10+个SNP。
风虎云龙 发表于 2015-2-9 15:29
怎么会因为缺少CTS1642,Oα的年龄就被低估了?根据现有的所有树形图,CTS1642和其它支系是同步分离的呀。

Hallast的样本中包含了CTS1642,F438还有2个Oα*。结论和复旦也类似。
怎么会因为缺少CTS1642,Oα的年龄就被低估了?根据现有的所有树形图,CTS1642和其它支系是同步分离的呀。

Hallast的样本中包含了CTS1642,F438还有2个Oα*。结论和复旦也类似。
Tocharian_2 发表于 2015-2-9 16:54
因为用SNP全测数据算年龄是要前后兼顾的,来个比喻:
一个人到某人家里做客,发现这家主人不在,只有主人的几个孩子在,其中甲8岁、乙10岁、丙12岁、丁14岁,就估计这家主人的年龄大概在14+20=34左右。

结果算完以后,来了个30岁的男人,原来是主人家的长子,主人年龄实际是30+20=50岁。

虽然不是很恰当。但是CTS1642下的全测数据比阿尔法1-4普遍多10+SNPs.
因为用SNP全测数据算年龄是要前后兼顾的,来个比喻:
一个人到某人家里做客,发现这家主人不在,只有主人的几个孩子在,其中甲8岁、乙10岁、丙12岁、丁14岁,就估计这家主人的年龄大概在14+20=34左右。

结果算完 ...
风虎云龙 发表于 2015-2-9 17:01
对。但问题就在于CTS1642,没有早于其它支系分出来啊。至少目前的树状图和你的分析都表明此。用你的列子来说就是几个孩子一样大。
不过,如果在同样测序长度下,CTS1642样本普遍比其它支系多10几个SNP。那确实奇怪。
看来还是没懂
这么说吧,假设:F5下的F438样本平均有17个SNP,Y8389下游24个,F3599下有19个、CTS5063下游20个。假定每100年产生一个SNP,用这四支计算F5的的年龄。

怎么计算呢?肯定不能用一支的SNP数去乘以100年呀,要算个平均吧,(17+24+19+20)/4*100=2000年。

但是后来发现一支CTS1642,他平均有30个SNP,这样加入他进行计算,年龄和和之前的相比是不是变大了200年?
对。但问题就在于CTS1642,没有早于其它支系分出来啊。至少目前的树状图和你的分析都表明此。用你的列子来说就是几个孩子一样大。
不过,如果在同样测序长度下,CTS1642样本普遍比其它支系多10几个SNP。那确实奇 ...
Tocharian_2 发表于 2015-2-9 17:04
同样测序长度下,不同支系间多十几个SNP是很正常的(你要不好理解SNP产生的原理,就可以想象成父子相传的代数,父子相传的代数多,自然产生SNP的数量就比父子相传代数少的支系多,数千年积累下来也不少了)。

实际上更早的支系有些甚至悬殊数百个SNP,比如这里面的F742支系要比M324支系少近200个SNP。
看来还是没懂
这么说吧,假设:F5下的F438样本平均有17个SNP,Y8389下游24个,F3599下有19个、CTS5063下游20个。假定每100年产生一个SNP,用这四支计算F5的的年龄。

怎么计算呢?肯定不能用一支的SNP ...
风虎云龙 发表于 2015-2-9 17:23
当前的全测每组只有十来二十个SNP吗,中通量就不止这些,如何确定哪些是private的并予以去除的呢
当前的全测每组只有几十个SNP吗
snelheid 发表于 2015-2-9 17:32
这个是我举例子在随便写的数字。
M122以下,现在每一个全测样本大约是400多个SNP。
这个是我举例子在随便写的数字。
M122以下,现在每一个全测样本大约是400多个SNP。
风虎云龙 发表于 2015-2-9 17:35
但现有树上包括一楼的树中都反映不出大部分SNP的位置,想来有一部分或因各种原因(如稳定性)被摒弃、被当作等价点而省略等等

另外这里的所谓Y全测也只是覆盖60Mbps中的一小部分所谓“有效”长度,不到总长度的一半吧,在这一小部分内部还会有筛选,不清楚他们是如何筛选的,或是有些已筛选且已放在under investigation里但还没公布,这也会导致数量不对称
这里说的全测一般是指非重组区大于10Mbps的数据,因为牵扯到千人组、FT、FGC和复旦,各家各不相同。
比较认同龙虎的观点,即O3目前最大的三大支系的最后一次瓶颈主要与全新世之后的那次大降温有关(大约在7.6~8.2ka BP,参见金章东团队的最新研究成果)。个人认为,这次大降温对进入全新世之后处于萌芽期的原始农业应该是一次毁灭性打击,换言之,之后的农业尤其是北方农业极有可能是受到大降温之后北上农业(包括秦岭南部北上)的影响而重新产生的,与前期的渔猎/游猎+萌芽期农业混合经济人群关系不大。与此对应,则是之前的北方人口急剧下降(其中包括南下人群,同时可以假设,前农业时期北方人群依然明显低于黄河或淮河以南) ,后来被缓慢逐批逐次北上的新农业人群漂变,其中比较幸运的比如北方型的P201*人群则一直傲立至今。
      就目前为止在东欧亚地区(包括近南亚地区)对大部分族群的抽样检测结果,其中O3的检测结果我估计可以覆盖绝大多数东欧亚O3支系以及次支系,其余暂时未能测出的支系,即使高达40%,我看也不会明显影响对目前O3-tree各支系年龄的推断(估计最终会继续推高年龄上浮10%)。
     个人感觉,应该加大对云贵川以及缅甸地区的检测覆盖面,这里应该是非常珍贵的东欧亚人类Y/mt染色体存留博物馆。
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...

标题

要看瓶颈的时间,比如N南北支分化之前的瓶颈就相当长,而K下的瓶颈就相当短,甚至都不能称为瓶颈,迅速分化为不同的支系,从这一点来看,K的分化地点环境还是不错的
sahaliyan 发表于 2015-2-9 16:34
我的意思是,瓶颈不是因为他们受了什么委屈,而是因为他们在路上。
O3a3c* (M134+, M117-)

标题

你这个只是对“瓶颈——>扩张”现象的描述,并没有解释造成瓶颈的原因。
风虎云龙 发表于 2015-2-9 16:46
我的意思是,瓶颈不是因为他们受了什么委屈,而是因为他们在路上。
O3a3c* (M134+, M117-)
...
就目前为止在东欧亚地区(包括近南亚地区)对大部分族群的抽样检测结果,其中O3的检测结果我估计可以覆盖绝大多数东欧亚O3支系以及次支系,其余暂时未能测出的支系,即使高达40%,我看也不会明显影响对目前O3-tree各支系年龄的推断(估计最终会继续推高年龄上浮10%)。
imvivi001 发表于 2015-2-9 20:14
想了一下,感觉还是要修正一下,目前测出的O3 hg可能只有全部hg的30%,因为目前参与测试的人数还是太少,尤其是某些人类博物馆地区如云贵川缅甸多山地区,如果加大对这些地区各族群的检测,应该可以发现大量人数稀少的珍稀型hg,正常情况,其数目会远多于现在已经测出的O3 hg数目。这样,三大主要支系的年龄可能要上浮15~20%
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
问一下版主:复旦的1万元Y全序的覆盖长度比1000genome大吗?
24# Tocharian_2
Data from different sources have different NRY coverage, so current snp counts for various branches are not completely comparable.  
I think that the real age of alpha may be even older.
感觉F11早于其他支系爆发的原因应该是此F11最早生活在华中地区,在大降温结束后第一个携带中南地区农业技术北上,获得了先发优势。
如大家所推测的,贾湖文化人群主频Y可能就是F11,大辛文化也极有可能,这个和考古发现和最新历史气象学的研究也比较吻合~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
问一下版主:复旦的1万元Y全序的覆盖长度比1000genome大吗?
张三 发表于 2015-2-10 00:04
Y全序的覆盖长度对比:千人组>Y Elite>Y Prime>BIG Y≈复旦Y全序>HGDP
Y全序的覆盖长度对比:千人组>Y Elite>Y Prime>BIG Y≈复旦Y全序>HGDP
风虎云龙 发表于 2015-2-10 12:18
复旦现在的全序好像是比原来写那篇40%中国人论文时的全序增加了很多的覆盖长度,难道现在还是比不上千人组的长度?
现在是多少bp呢? 我查了下,好像没有公开的数字。
等到国内可以google的时候,说不定就可以看到公开数据了~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
花了点精力整理了千人组、BIG Y、FGC、复旦等O3全测数据的SNP,画了O3—M122 SNPs演化树,画完看了看轮廓,基本可以确定O3三大簇扩张模板非常接近。在F11\F46\F5三大簇急速扩张的前夜,都经历了大约等同于爆发至今的 ...
风虎云龙 发表于 2015-2-9 12:50
你画的这个O3树看来是完全依据其各个分支的SNP的个数得出树枝长度的相对比例的,对吧?
考虑到不同分支的长度相差实在太大,(光是贝塔3的不同分支,最长的213,最短只有169),所以任何一种年龄的计算方法得出的结果都无法保证跟历史事实准确对应,要真实还原历史年份只有用古尸dna校准一途了,这是十年前尚未测过大覆盖率全序以前无法猜想到的,但这个事实估计也是复旦将来发大牛文的利好。
你前面说的一个现象“相同时间内代数越多产生的SNP就越多”不知道有没有实测数据的支持?看上去三大簇里面的大支普遍比小支积累了更多的SNP,三大簇相比O3下的其他小支系也是这种情况。如果你说的这个现象是真的,倒是可以从另一个侧面说明三大簇人口特别多的其中一个原因。
返回列表
baidu
互联网 www.ranhaer.org