Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
查看: 88203|回复: 266

F444支系SNP树及细分型的单倍群Y-STR特征匹配专贴

[复制链接]
发表于 2014-5-1 16:18 | 显示全部楼层 |阅读模式
本帖最后由 风虎云龙 于 2017-4-11 11:25 编辑

结合复旦、1000genomes、HGDP、SGDP、KPGP、FT、yfull等资料,获得F444树形如下,供爱好者参考。
另附千人组及HGDP样本的23Y-STR资料于后。
F444.png
O-F444汉人比例.png
F444汉族分省分布.png
F444.png

评分

11

查看全部评分

 楼主| 发表于 2016-6-4 22:00 | 显示全部楼层
扶楼贴,Oβ1a2a1b-F3530的中心型及已发表数据的匹配。
1.png

评分

2

查看全部评分

 楼主| 发表于 2016-6-4 22:02 | 显示全部楼层
2
2.png
发表于 2014-5-2 10:29 | 显示全部楼层
2# sahaliyan The phylogenetic tree of F2887 samples in 1K genome, HGDP-CEPH,Fudan.

f2887_ver12.jpg

评分

1

查看全部评分

发表于 2014-5-2 10:53 | 显示全部楼层
贝塔3下很多是缺资料,你和大力那支可能包含不少人
另外NASOS和哈萨克乃蛮,山东杨氏等属于贝塔3下另外一支
sahaliyan 发表于 2014-5-1 17:00

F2887下面这么多*

占了贝塔3的2/3

只能是研究还不深入的结果......

看好这一支,貌似最喜欢流窜
发表于 2014-5-2 10:55 | 显示全部楼层
记得俺跟鹤山那个谁

STR差的相当大

都看不出属于一个SNP了

只能说分离很久了

所以F2887,至少在五个农民出现之后不久就诞生了
发表于 2014-5-2 11:00 | 显示全部楼层
2# sahaliyan The phylogenetic tree of F2887 samples in 1K genome, HGDP-CEPH,Fudan.

37524
yayul 发表于 2014-5-2 10:29

看来虎子那个表问题不少.........
 楼主| 发表于 2014-5-2 21:16 | 显示全部楼层
看来虎子那个表问题不少.........
Nasos 发表于 2014-5-2 11:00

表里面标示为*,其实是只是测了当位位点,并没有测当位以下的位点,因此有些支系*的人数多,但未必是不能归类的那种*,而是还没有实测下游的SNP进行确认。

比如连云港刘氏那例,被归为Oβ3*,从STR及姓氏籍贯推断他应该是下游的F4249+,只不是过他现在只测了F2887+,F4249位点在确认中,所以只能把他放在Oβ3*中。
 楼主| 发表于 2014-5-2 22:01 | 显示全部楼层
本帖最后由 风虎云龙 于 2014-5-2 23:11 编辑
贝塔3下很多是缺资料,你和大力那支可能包含不少人
另外NASOS和哈萨克乃蛮,山东杨氏等属于贝塔3下另外一支
sahaliyan 发表于 2014-5-1 17:00
感谢大力失败的全测中贡献出F4249位点的信息,要不然我等还得泯然众Oβ3*矣。

F4249可能算是Oβ3下相对年轻的支系,上游的CTS558年龄估算在3800年左右,那么F4249应该更为晚近,对比了下数据(图一),发现F4249+的样本还是有些特色的,最重要的几个点是437=14 (特色点,突变率较低,而且在F444中大多数是15)& 448=19 & 635=19(635=19可能是极大多数Oβ3的特点)。


不过也有朋友推测,奈曼簇也可能是F4249+,蒙古的HGDP01228样本STR与奈曼簇也相对接近(图二),不过我觉得图三这些样本才算是和奈曼簇真正比较相似的,或者是特征性较强的。


当然都是推测,希望能早日看到奈曼F444簇的归属,Nasos老兄,点射个F4249看看呗!
F4249.jpg
奈曼.jpg
图三.jpg
发表于 2014-5-2 22:35 | 显示全部楼层
要钱木有......

不过那几个点当初是注意到了

因为跟奈曼的差距相对很小,有差异的主要是高变点

所以推算分开在1500年左右,最多不超过2000年太多

现在同属一个SNP,看来猜对了
 楼主| 发表于 2014-5-2 22:56 | 显示全部楼层
要钱木有......

不过那几个点当初是注意到了

因为跟奈曼的差距相对很小,有差异的主要是高变点

所以推算分开在1500年左右,最多不超过2000年太多

现在同属一个SNP,看来猜对了
Nasos 发表于 2014-5-2 22:35
测个F4249也就是一包烟钱,还要钱没有·········
发表于 2014-5-2 22:58 | 显示全部楼层
俺现在对任何点射都木有性趣

只对跟奈曼和李唐遗骸的比对有感觉的说
发表于 2014-5-2 23:00 | 显示全部楼层
关键F4249测出来也木有啥呀

要是一包烟钱,跟多面体打个招呼直接测了,支付宝划账

不过再采血一次........上次疼死俺了,这辈子还没献过血呢...........
 楼主| 发表于 2014-5-2 23:12 | 显示全部楼层
关键F4249测出来也木有啥呀

要是一包烟钱,跟多面体打个招呼直接测了,支付宝划账

不过再采血一次........上次疼死俺了,这辈子还没献过血呢...........
Nasos 发表于 2014-5-2 23:00

有一种取样方式叫口腔拭子···········
 楼主| 发表于 2014-5-4 19:53 | 显示全部楼层
本帖最后由 风虎云龙 于 2014-5-5 18:09 编辑

感谢yayul提供的数据,F444树有了更多更新,可以分为33个不同支系了,有些位点没被命名,暂且编号并提供物理位置信息于表上。
 楼主| 发表于 2014-5-4 20:08 | 显示全部楼层
最细化的F4249支系按照FT最新的排序命名应该叫O1a1b2a1a1b2a1a-F4249,如果按照复旦的命名顺序应该叫O2a2b1b1a1c1b2a1a-F4249。
 楼主| 发表于 2014-5-5 23:32 | 显示全部楼层
本帖最后由 风虎云龙 于 2014-5-6 19:15 编辑

HGDP中F444样本很有意思,有点剑走偏锋的感觉,12个样本中涉及国内的土、畲、拉祜、赫哲、土家、蒙古、锡伯、维吾尔等8个少数民族,却没有一个汉族的样本-----》属于小概率事件,然后国外的样本中竟然能抽到巴基斯坦的Burusho人F444,又是小概率事件,然后在三个土族样本中,细分下来其中竟然有一例F444样本(HGDP01347)是属于久闻其名,不见其状的Oβ5样本。总之,算是比较神奇的一次F444样本大汇合。看了看这个Oβ5的Y-STR,在渭南汉族中有不少的较近样本,牡丹江也有一些。448值偏高不知道是不是Oβ5的一大特色。
土族贝塔五.jpg
发表于 2014-5-6 02:16 | 显示全部楼层
感觉那几个渭南汉族,其中的大部分,若干代之前,有可能属于同一个大家族?

两个牡丹江汉族可能也是
 楼主| 发表于 2014-5-6 19:07 | 显示全部楼层
本帖最后由 风虎云龙 于 2014-5-6 19:11 编辑
感觉那几个渭南汉族,其中的大部分,若干代之前,有可能属于同一个大家族?

两个牡丹江汉族可能也是
Nasos 发表于 2014-5-6 02:16

渭南的这几个疑似贝塔五样本确实可能是当地一个较大的大家族,比例接近有该样本的百分之一。

同看这些匹配,贝塔五可能整体人数不多,但分布或许也是相当的广泛,从西北的土族,到东北的朝鲜族、汉族,再到关中渭南的汉族、西南的土家族,甚至在东南的浙江和台湾的阿美族都有一定比例。

推测这些样本的共祖时间可能并不遥远,极有可能是在历史时期内,这东西南北、天涯海角的分布状况,究竟是什么样的历史情形造就的,总让人无尽的好奇。
发表于 2014-5-6 19:38 | 显示全部楼层
渭南的这几个疑似贝塔五样本确实可能是当地一个较大的大家族,比例接近有该样本的百分之一。

同看这些匹配,贝塔五可能整体人数不多,但分布或许也是相当的广泛,从西北的土族,到东北的朝鲜族、汉族,再到关中 ...
风虎云龙 发表于 2014-5-6 19:07


呵呵,F444中的相当部分,跟Q1一样,在历史时期,貌似喜欢到处流窜啊

可能跟早期农牧兼营的经济形态,以及地处兵荒马乱之地关系较大
 楼主| 发表于 2014-5-7 13:45 | 显示全部楼层
本帖最后由 风虎云龙 于 2014-5-7 13:47 编辑

匹配数据的时候发现一个F444的STR簇,人数不少,中心型STR组合特征为:
15 12 17 23 10 12 12 14 10 12 19 16 18 19 12 12 17


已知的几个F4249的样本,都是在这个中心型三步以内的匹配(表里绝大多数搜集的是其3步以内的匹配样本),这个中心型极有可能是F4249支系的STR特征型。

数据涵盖了俄罗斯卡尔梅克首府埃利斯塔的杜尔伯特与和硕特样本(约占卡尔梅克样本的2.8%的比例);蒙古国中部和西北部的喀尔喀样本;朝鲜首尔和忠清道的韩人样本;菲律宾人样本;国内的甘肃回族、辽宁回族、辽宁满族、辽宁锡伯族、重庆酉阳土家族样本;汉族的云南宣威、台湾外省人、江苏(徐州、连云港、盐城)、浙江、山东济南、陕西渭南、河南南阳、河北石家庄、辽宁、黑龙江牡丹江等处样本。
F4249.jpg
 楼主| 发表于 2014-5-8 22:09 | 显示全部楼层
本帖最后由 风虎云龙 于 2014-5-8 22:50 编辑

又有一个重大收获,哈萨克奈曼的F46的簇归属有了最终的答案。

     因为第一次下载的千人组的Y数据的版本是20101123版的,数据比较老,coverage较少,今天又下载了更新到20130415的资料,结果在北京NA18543样本中发现了L1360<7589390 REF->ALT (A->C)>这个位点,之前就注意到哈萨克奈曼F46簇的朋友参加WTY的测试时候发现了该位点,当时发现者注释为:Found in a hg O-P201 WTY participant,哈萨克的分子人类学爱好者称之为奈曼专属SNP,还号召更多的奈曼人去测这个点。
     因为当时没有确切的对比数据,所以不清楚这个位点在树上的位置,今天在千人组中发现北京NA18543汉族样本中L1360+,另外在FT项目中的国内一位乔姓朋友(编号229673),测的SNP结果是M134+,M117-,L1360-,这样就可以确定L1360这个位点是在F444的下游了,所以现在确定了是奈曼F46簇的是Oβ3下的KM3028,FO1788支下游的L1360支系。

     结合千人组的数据,更新了F444的SNP系统树状图于首楼。

评分

4

查看全部评分

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2018-12-14 22:39 , Processed in 0.174553 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表