返回列表 回复 发帖
感觉F11早于其他支系爆发的原因应该是此F11最早生活在华中地区,在大降温结束后第一个携带中南地区农业技术北上,获得了先发优势。
如大家所推测的,贾湖文化人群主频Y可能就是F11,大辛文化也极有可能,这个和考古发现和最新历史气象学的研究也比较吻合~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
问一下版主:复旦的1万元Y全序的覆盖长度比1000genome大吗?
张三 发表于 2015-2-10 00:04
Y全序的覆盖长度对比:千人组>Y Elite>Y Prime>BIG Y≈复旦Y全序>HGDP
Y全序的覆盖长度对比:千人组>Y Elite>Y Prime>BIG Y≈复旦Y全序>HGDP
风虎云龙 发表于 2015-2-10 12:18
复旦现在的全序好像是比原来写那篇40%中国人论文时的全序增加了很多的覆盖长度,难道现在还是比不上千人组的长度?
现在是多少bp呢? 我查了下,好像没有公开的数字。
等到国内可以google的时候,说不定就可以看到公开数据了~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
花了点精力整理了千人组、BIG Y、FGC、复旦等O3全测数据的SNP,画了O3—M122 SNPs演化树,画完看了看轮廓,基本可以确定O3三大簇扩张模板非常接近。在F11\F46\F5三大簇急速扩张的前夜,都经历了大约等同于爆发至今的 ...
风虎云龙 发表于 2015-2-9 12:50
你画的这个O3树看来是完全依据其各个分支的SNP的个数得出树枝长度的相对比例的,对吧?
考虑到不同分支的长度相差实在太大,(光是贝塔3的不同分支,最长的213,最短只有169),所以任何一种年龄的计算方法得出的结果都无法保证跟历史事实准确对应,要真实还原历史年份只有用古尸dna校准一途了,这是十年前尚未测过大覆盖率全序以前无法猜想到的,但这个事实估计也是复旦将来发大牛文的利好。
你前面说的一个现象“相同时间内代数越多产生的SNP就越多”不知道有没有实测数据的支持?看上去三大簇里面的大支普遍比小支积累了更多的SNP,三大簇相比O3下的其他小支系也是这种情况。如果你说的这个现象是真的,倒是可以从另一个侧面说明三大簇人口特别多的其中一个原因。
你画的这个O3树看来是完全依据其各个分支的SNP的个数得出树枝长度的相对比例的,对吧?
考虑到不同分支的长度相差实在太大,(光是贝塔3的不同分支,最长的213,最短只有169),所以任何一种年龄的计算方法得出的结 ...
张三 发表于 2015-2-10 13:22
支系之间在5000年内能积累多个多少个新的SNP呢?

我们来推算一下,现在认为差不多每四代人就会产生一个新的SNP突变(10Mbp长度下的全测,薛阿姨做的全测是13代人积累3个SNP)。

SNP突变产生的实质不就是基于父子世代传递的时候拷贝错误吗?也就是父子传递的代数越多,积累的SNP突变自然也会多。

于是问题来了,父子传递的代间距在不同支系间是有很大差距的。以我的家族为例子,我们家族明以来的家谱(距今600年吧)是相当可靠的,同族聚居的村落,现在长房中年龄相仿的最小辈(平均26岁/代)和
最大辈(平均37岁/代)之间悬殊8世。这样他们两人之间估计至少有2个SNP的差异了。而且我们家族还不算极旺的家族,有些600年的家族的最快的平均代间距都能到22岁/代。

加上史前人类的生育年龄和支系间的盛衰参差不齐的情况,所以5000年内不同支系积累几十个SNP突变不算什么。
1

评分次数

任何一种年龄的计算方法得出的结果都无法保证跟历史事实准确对应,要真实还原历史年份只有用古尸dna校准一途了
张三 发表于 2015-2-10 13:22
即使是基于全序的对比做出来的年龄也只是参考,和真实年龄吻合与否,只能靠古人遗骸来进行校准了。但是全序的意义是能得出支系的相对年龄。
比如现在我们争议的三大簇年龄是在七千年还是在五千年,这个看来暂时没有答案。但是相对年龄的答案可以有。

基于我这个O3树,我计算出来的F5\F46\F11支系下平均积累的SNP分别是68\75\76。所以可以说年龄上大小依次是F11>F46>F5。

A、如果取66岁传递4代的(代间距22岁/代)话,F5\F46\F11的年龄分别是4488\4950\5016.

B、如果取80岁传递4代的(代间距27岁/代)话,F5\F46\F11的年龄分别是5440\6000\6080.

C、如果取100岁传递4代的(代间距33岁/代)话,F5\F46\F11的年龄分别是6800\7500\7600.
我同意风虎云龙的意见,事实就是如此。
古人寿命短,绝对不会达到33岁一代。估计平均25岁一代就很保守了。
楼上的咱们说的不是一码事。
fjnj讲的很有道理,不同测序方法覆盖度不同,所以把不同的数据放到一起比较,对年代估算来说,只有相对价值,绝对年代误差比较大。风虎云龙说的几次瓶颈事件,我觉得只有13000~9000年这次比较靠谱,其他几次在考古上都没有证据。磁山文化的年代,以前的数据都是不超过8000年的。在M117的问题上,可能小永真的是对的,M117主要是在北方和汉族中,另外就是西南的CTS1642,这个不排除是马家窑文化时代沿藏彝走廊南下的人群造成的。根据古DNA的结果,小永所引用的细石器文化的北迁的族群,现在来看,明显是以N系人群为主导的。N系人群是兴隆洼文化的主体。
这里面年龄的估算全部用的是千人组1期统一的数据,不存在覆盖上的差异。我说的参考YFull、FGC、复旦的数据,是因为他们对O系SNP有过系统的命名,方便在树上标注和比对,千人组的大量SNPs都还没被命名,尤其是终端的。

关于年龄问题,我已经反复表述,只能得到相对年龄和基于一定速率计算出的推测年龄,绝对年龄必须由古DNA来校正。
SNP系统发育树的另一个意义就是观察树形。对这个支系有了直观的了解,清楚支系发育中瓶颈、扩张的程度。至于三大簇爆发前的两次瓶颈成因,我只提供了一个我的思路。可以进一步讨论的地方很多,仁者见仁、智者见智。算是抛砖引玉、齐东芹献吧。
fjnj讲的很有道理,不同测序方法覆盖度不同,所以把不同的数据放到一起比较,对年代估算来说,只有相对价值,绝对年代误差比较大。风虎云龙说的几次瓶颈事件,我觉得只有13000~9000年这次比较靠谱,其他几次在考古上 ...
氐羌人后裔 发表于 2015-2-10 22:32
对吉大的古代DNA结果还是要慎重看待,吉大的古DNA结果很多都非常奇怪,难以解释,在更有资质的古DNA测试单位(如马普所)测试之前,我是不会采纳吉大的结果的
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
很早之前就有一个想法,认为滇缅东南岭南这一带的M117中很大一部分可能并不是历史时期汉人南迁所致,可能在先秦或更早时期由西北经藏彝走廊到滇缅孟,然后回护至桂粤闽一带的。现在看CTS1642比较符合。

现在有些初步想法,感觉F5下是早期汉人成份的支系可能只有阿尔法1、2和某些*。
支系之间在5000年内能积累多个多少个新的SNP呢?

我们来推算一下,现在认为差不多每四代人就会产生一个新的SNP突变(10Mbp长度下的全测,薛阿姨做的全测是13代人积累3个SNP)。

SNP突变产生的实质不就是基于 ...
风虎云龙 发表于 2015-2-10 14:07
看来你还是没明白我的疑问

谁都知道父子传递的代间距在不同支系间是有很大差距的,哪个村子里没有这种现象?问题恰恰是在有很大代间距的支系之间,“在相同的时间里,父子传递的代数越多的支系积累的SNP突变自然也会多。”这个猜想不是想当然就能拿来当事实的。

打个比方,甲部落有晚生晚育的习惯,1000年里只产生了30代;而乙部落相信早生贵子早得福,1000年里产生了60代。
我们是否可以断定:相对于第一代来说,乙部落的第60代子孙的SNP积累在统计意义上比甲部落的第30代多?

到底是由于父子传递的时候更容易发生拷贝错误,还是因为父亲年龄大自身细胞内更容易产生DNA的拷贝错误,从而把错误传给儿子?我印象中好像已经有研究数据了。结论跟你猜想的恰好相反。
54# 风虎云龙
Why using the phase 1, not the phase 3 vcf file?  The quality of data is much better in phase 3.
很早之前就有一个想法,认为滇缅东南岭南这一带的M117中很大一部分可能并不是历史时期汉人南迁所致,可能在先秦或更早时期由西北经藏彝走廊到滇缅孟,然后回护至桂粤闽一带的。现在看CTS1642比较符合。

现在有些初步想法,感觉F5下是早期汉人成份的支系可能只有阿尔法1、2和某些*。
风虎云龙 发表于 2015-2-10 23:26
不知道F444或是否也有類似的情形,當然F444是不是漢藏核心類型也未可得知。目前比較公認的是,M117之於漢藏語族,好比R1a1a-M17之於印歐語族。
Y染色體:O3 M134+ M117- 應屬F444+
mtDNA:D5a2
不知道F444或Oβ是否也有類似的情形
natsuya 发表于 2015-2-11 01:30
这个问题目前应当还没有明确的答案

A)

http://www.ranhaer.com/viewthread.php?tid=24647&page=1#pid334376

样本DYS19DYS389iDYS389bDYS390DYS391DYS392DYS393DYS437DYS438DYS439DYS448
广东罗姓15121823111212-1-111-1
闽西罗姓13121724101212-1-111-1
闽西谢姓1312182510121215101119
闽西张姓1312192410121215101119
闽西罗姓1312172410121215101119
闽西李姓1312182410121215101119
闽西罗姓1312172410121315101119
闽西刘姓1312172410121315101119
闽西刘姓1312172410121315101119


DYS456DYS458DYS635DYS439DYS385aDYS385bDYS426DYS388
-1-1-1-112131112
-1-1-1-112151112
-1-1-11212151112
-1-1-11212161112
-1-1-11212151112
-1-1-11212151112
-1-1-11212161112
-1-1-11212161112
-1-1-11212151112



VS

B) (印东北特里普里人65例样本,记得M117占半数左右,M134xM117占4/65)

http://www.ranhaer.com/viewthread.php?tid=15443&page=4#pid226824



A)B)两者的共同趋势是,相对于常见的ht:

DYS19 ↓   (取低值。 <=14)
DYS390 ↑ (取高值。>=24。虽然你也是24但其他两点不合,因此你本人的DYS390只是偶然巧合的概率大)
DYS385b ↓(取低值。<=15)

在常见17-STR中,390/385a/19/385b是突变低频度次于438/392/393/437/448的四个权重点,其中390几乎和448相当,因此上面这几个趋势可以将就着一看

目前的还有一系列其他问题没解决,如印度的M159与湖南、闽粤桂交汇处M159的关系,等等,这些小群未来有可能会为解开这些关键谜团提供线索,甚至为韩半岛地区与南亚语系M159有近亲关系的F1531等的来源之谜的解开提供线索,当前只是因几大机构不重视(比如复旦,基本就摊牌直言不测M159,至少迄今为止),所以还没走到那一步罢了
1

评分次数

这里还有其他几例DYS19 ↓  DYS390 ↑ 的,尚需以后高通结果来论证。

http://www.ranhaer.com/thread-29394-1-1.html

还有我在此贴中提到的僜人的疑似CTS5063等谜团,这几个问题迟早要解决的

54# 风虎云龙
Why using the phase 1, not the phase 3 vcf file?  The quality of data is much better in phase 3.
fjnj 发表于 2015-2-11 00:12
我使用的是千人组20130502释放的数据,查了下这次好像是属于phase 3。
返回列表
baidu
互联网 www.ranhaer.org