返回列表 回复 发帖
你画的这个O3树看来是完全依据其各个分支的SNP的个数得出树枝长度的相对比例的,对吧?
考虑到不同分支的长度相差实在太大,(光是贝塔3的不同分支,最长的213,最短只有169),所以任何一种年龄的计算方法得出的结 ...
张三 发表于 2015-2-10 13:22
支系之间在5000年内能积累多个多少个新的SNP呢?

我们来推算一下,现在认为差不多每四代人就会产生一个新的SNP突变(10Mbp长度下的全测,薛阿姨做的全测是13代人积累3个SNP)。

SNP突变产生的实质不就是基于父子世代传递的时候拷贝错误吗?也就是父子传递的代数越多,积累的SNP突变自然也会多。

于是问题来了,父子传递的代间距在不同支系间是有很大差距的。以我的家族为例子,我们家族明以来的家谱(距今600年吧)是相当可靠的,同族聚居的村落,现在长房中年龄相仿的最小辈(平均26岁/代)和
最大辈(平均37岁/代)之间悬殊8世。这样他们两人之间估计至少有2个SNP的差异了。而且我们家族还不算极旺的家族,有些600年的家族的最快的平均代间距都能到22岁/代。

加上史前人类的生育年龄和支系间的盛衰参差不齐的情况,所以5000年内不同支系积累几十个SNP突变不算什么。
1

评分次数

任何一种年龄的计算方法得出的结果都无法保证跟历史事实准确对应,要真实还原历史年份只有用古尸dna校准一途了
张三 发表于 2015-2-10 13:22
即使是基于全序的对比做出来的年龄也只是参考,和真实年龄吻合与否,只能靠古人遗骸来进行校准了。但是全序的意义是能得出支系的相对年龄。
比如现在我们争议的三大簇年龄是在七千年还是在五千年,这个看来暂时没有答案。但是相对年龄的答案可以有。

基于我这个O3树,我计算出来的F5\F46\F11支系下平均积累的SNP分别是68\75\76。所以可以说年龄上大小依次是F11>F46>F5。

A、如果取66岁传递4代的(代间距22岁/代)话,F5\F46\F11的年龄分别是4488\4950\5016.

B、如果取80岁传递4代的(代间距27岁/代)话,F5\F46\F11的年龄分别是5440\6000\6080.

C、如果取100岁传递4代的(代间距33岁/代)话,F5\F46\F11的年龄分别是6800\7500\7600.
我同意风虎云龙的意见,事实就是如此。
古人寿命短,绝对不会达到33岁一代。估计平均25岁一代就很保守了。
楼上的咱们说的不是一码事。
fjnj讲的很有道理,不同测序方法覆盖度不同,所以把不同的数据放到一起比较,对年代估算来说,只有相对价值,绝对年代误差比较大。风虎云龙说的几次瓶颈事件,我觉得只有13000~9000年这次比较靠谱,其他几次在考古上都没有证据。磁山文化的年代,以前的数据都是不超过8000年的。在M117的问题上,可能小永真的是对的,M117主要是在北方和汉族中,另外就是西南的CTS1642,这个不排除是马家窑文化时代沿藏彝走廊南下的人群造成的。根据古DNA的结果,小永所引用的细石器文化的北迁的族群,现在来看,明显是以N系人群为主导的。N系人群是兴隆洼文化的主体。
这里面年龄的估算全部用的是千人组1期统一的数据,不存在覆盖上的差异。我说的参考YFull、FGC、复旦的数据,是因为他们对O系SNP有过系统的命名,方便在树上标注和比对,千人组的大量SNPs都还没被命名,尤其是终端的。

关于年龄问题,我已经反复表述,只能得到相对年龄和基于一定速率计算出的推测年龄,绝对年龄必须由古DNA来校正。
SNP系统发育树的另一个意义就是观察树形。对这个支系有了直观的了解,清楚支系发育中瓶颈、扩张的程度。至于三大簇爆发前的两次瓶颈成因,我只提供了一个我的思路。可以进一步讨论的地方很多,仁者见仁、智者见智。算是抛砖引玉、齐东芹献吧。
很早之前就有一个想法,认为滇缅东南岭南这一带的M117中很大一部分可能并不是历史时期汉人南迁所致,可能在先秦或更早时期由西北经藏彝走廊到滇缅孟,然后回护至桂粤闽一带的。现在看CTS1642比较符合。

现在有些初步想法,感觉F5下是早期汉人成份的支系可能只有阿尔法1、2和某些*。
支系之间在5000年内能积累多个多少个新的SNP呢?

我们来推算一下,现在认为差不多每四代人就会产生一个新的SNP突变(10Mbp长度下的全测,薛阿姨做的全测是13代人积累3个SNP)。

SNP突变产生的实质不就是基于 ...
风虎云龙 发表于 2015-2-10 14:07
看来你还是没明白我的疑问

谁都知道父子传递的代间距在不同支系间是有很大差距的,哪个村子里没有这种现象?问题恰恰是在有很大代间距的支系之间,“在相同的时间里,父子传递的代数越多的支系积累的SNP突变自然也会多。”这个猜想不是想当然就能拿来当事实的。

打个比方,甲部落有晚生晚育的习惯,1000年里只产生了30代;而乙部落相信早生贵子早得福,1000年里产生了60代。
我们是否可以断定:相对于第一代来说,乙部落的第60代子孙的SNP积累在统计意义上比甲部落的第30代多?

到底是由于父子传递的时候更容易发生拷贝错误,还是因为父亲年龄大自身细胞内更容易产生DNA的拷贝错误,从而把错误传给儿子?我印象中好像已经有研究数据了。结论跟你猜想的恰好相反。
54# 风虎云龙
Why using the phase 1, not the phase 3 vcf file?  The quality of data is much better in phase 3.
很早之前就有一个想法,认为滇缅东南岭南这一带的M117中很大一部分可能并不是历史时期汉人南迁所致,可能在先秦或更早时期由西北经藏彝走廊到滇缅孟,然后回护至桂粤闽一带的。现在看CTS1642比较符合。

现在有些初步想法,感觉F5下是早期汉人成份的支系可能只有阿尔法1、2和某些*。
风虎云龙 发表于 2015-2-10 23:26
不知道F444或是否也有類似的情形,當然F444是不是漢藏核心類型也未可得知。目前比較公認的是,M117之於漢藏語族,好比R1a1a-M17之於印歐語族。
Y染色體:O3 M134+ M117- 應屬F444+
mtDNA:D5a2
不知道F444或Oβ是否也有類似的情形
natsuya 发表于 2015-2-11 01:30
这个问题目前应当还没有明确的答案

A)

http://www.ranhaer.com/viewthread.php?tid=24647&page=1#pid334376

样本DYS19DYS389iDYS389bDYS390DYS391DYS392DYS393DYS437DYS438DYS439DYS448
广东罗姓15121823111212-1-111-1
闽西罗姓13121724101212-1-111-1
闽西谢姓1312182510121215101119
闽西张姓1312192410121215101119
闽西罗姓1312172410121215101119
闽西李姓1312182410121215101119
闽西罗姓1312172410121315101119
闽西刘姓1312172410121315101119
闽西刘姓1312172410121315101119


DYS456DYS458DYS635DYS439DYS385aDYS385bDYS426DYS388
-1-1-1-112131112
-1-1-1-112151112
-1-1-11212151112
-1-1-11212161112
-1-1-11212151112
-1-1-11212151112
-1-1-11212161112
-1-1-11212161112
-1-1-11212151112



VS

B) (印东北特里普里人65例样本,记得M117占半数左右,M134xM117占4/65)

http://www.ranhaer.com/viewthread.php?tid=15443&page=4#pid226824



A)B)两者的共同趋势是,相对于常见的ht:

DYS19 ↓   (取低值。 <=14)
DYS390 ↑ (取高值。>=24。虽然你也是24但其他两点不合,因此你本人的DYS390只是偶然巧合的概率大)
DYS385b ↓(取低值。<=15)

在常见17-STR中,390/385a/19/385b是突变低频度次于438/392/393/437/448的四个权重点,其中390几乎和448相当,因此上面这几个趋势可以将就着一看

目前的还有一系列其他问题没解决,如印度的M159与湖南、闽粤桂交汇处M159的关系,等等,这些小群未来有可能会为解开这些关键谜团提供线索,甚至为韩半岛地区与南亚语系M159有近亲关系的F1531等的来源之谜的解开提供线索,当前只是因几大机构不重视(比如复旦,基本就摊牌直言不测M159,至少迄今为止),所以还没走到那一步罢了
1

评分次数

这里还有其他几例DYS19 ↓  DYS390 ↑ 的,尚需以后高通结果来论证。

http://www.ranhaer.com/thread-29394-1-1.html

还有我在此贴中提到的僜人的疑似CTS5063等谜团,这几个问题迟早要解决的

54# 风虎云龙
Why using the phase 1, not the phase 3 vcf file?  The quality of data is much better in phase 3.
fjnj 发表于 2015-2-11 00:12
我使用的是千人组20130502释放的数据,查了下这次好像是属于phase 3。
到底是由于父子传递的时候更容易发生拷贝错误,还是因为父亲年龄大自身细胞内更容易产生DNA的拷贝错误,从而把错误传给儿子?我印象中好像已经有研究数据了。结论跟你猜想的恰好相反。
张三 发表于 2015-2-10 23:55
我们两个说的是两回事。我说的是“久走夜路必撞鬼”,你说的是“阳气不旺易撞鬼”。
拷贝的次数越多,产生拷贝错误的几率就越大,这个有疑问吗?
我们两个说的是两回事。我说的是“久走夜路必撞鬼”,你说的是“阳气不旺易撞鬼”。
风虎云龙 发表于 2015-2-11 09:40
你的原话 - “SNP突变产生的实质不就是基于父子世代传递的时候拷贝错误吗?也就是父子传递的代数越多,积累的SNP突变自然也会多。”

我就是直接针对你的这个论断提问的,这也能叫两回事?
拷贝的次数越多,产生拷贝错误的几率就越大,这个有疑问吗?
风虎云龙 发表于 2015-2-11 09:40
你还是没搞明白,父子传递的代数跟拷贝的次数是怎么联系在一起的。这个不是你能想当然的。
你的原话 - “SNP突变产生的实质不就是基于父子世代传递的时候拷贝错误吗?也就是父子传递的代数越多,积累的SNP突变自然也会多。”

我就是直接针对你的这个论断提问的,这也能叫两回事?

...
张三 发表于 2015-2-11 10:01
那听听你的解释?
那听听你的解释?
风虎云龙 发表于 2015-2-11 10:02


我不是问你了吗 ”不知道有没有实测数据的支持?“,结果你向我介绍一大堆你家族某些支系比另一些支系繁衍的代数更多的情况。。。


你自己回头仔细看看帖子吧。
"父子传递的代数跟拷贝的次数是怎么联系在一起的",我想听听你的解释?
张三说的大概是这样的新闻:

http://www.chinadaily.com.cn/hqgj/2008-10/08/content_7084946.htm

即突变的产生,主要不是来自于父子之间传递的过程,而是来自于父亲自身生殖细胞的分裂,生殖越晚,年龄越大,分裂的次数越多。所以SNPs越多,可能表明代间距越高,遗传代数越低。当然生得晚了,代数也少,这对M117各分支年龄到底是多少,可能还不是特别确定,需要研究男性生殖细胞分裂的具体年龄。突变多了,缺陷相对也多,但社会选择会消灭无法生存下去的,人类往这个方向进化

M117与汉藏的关系可能真和永谢布猜的差不多,这里有个佐证倒不是甲骨文和藏缅语言关系什么的,而是古汉语有明显的黏着语特征,能看出因格变化的特点,而再往南苗瑶壮侗南亚,印象中大都是孤立语,缅语好像也还有黏着语特征,所以假如M117是周人带来的,可能混入了很多说阿尔泰语言的戎狄成分

当然这也不能说M117或者汉藏确定和仰韶文化没关系了,和阿尔泰语系本身来源一样,完全有可能这种阿尔泰成分是通过相互接触产生的,所以可能还是要研究马家窑文化特别是和仰韶文化之间的关系,国内认为马家窑文化由仰韶文化发展而来还是大有人在

同样即使M117随周人进入中原,也不能认定O一分为二或者从北线进入的结论,从多样性角度,还是相信从南线进入更靠谱些
返回列表
baidu
互联网 www.ranhaer.org