返回列表 回复 发帖

世界各地11,393人17Y-STR數據

YFiler Haplotype Database

數據明細

African American 1,932
Asian 330
Asian Indian 564
Caucasian 4,114
Chinese 577
Filifino 105
Hispanic 1,601
Japanese 1,078
Malay 579
Native American 105
Sub-saharan African 59
Thai 246
Vietnamese 103
All 11,393

Yfiler Haplotype Database.xlsx (946.94 KB)

17 Y-STR數據採集自 http://www6.appliedbiosystems.com/yfilerdatabase/
2

评分次数

里面中国577人数据,有94个P203,有16.3%比率,还有一个是M110。有74个是F78支系的占总样本的12.8%比率,其中有65个是F492支系的有11.2%,有9个是F78*支系的1.6%的比率。还有19个是F4084支系的有3.3%比率。
中国577人数据F4084的17-STR数据和下游估测
NPOPULATIONDYS19DYS389IDYS389IIDYS390DYS391DYS392DYS393DYS437DYS438DYS439DYS448DYS456DYS458DYS635YGATAH4DYS385估单倍群
3Chinese14132923101413141012181516211212,13F4084
18Chinese14132923101413151010181515201313,13F4084+CTS8902
19Chinese14122923101413141012181516211213,13F4084
55Chinese14132923101413151013181516201213,13F4084
126Chinese15122923101413141011181516201313,13F4084
134Chinese14122923101413141012181516211213,13F4084
165Chinese15122823101413141011181516201213,13F4084
287Chinese15122822101413141010181415201213,14F4084
314Chinese15122823101413141012181516201213,13F4084
325Chinese15122924101413141011181516201213,13F4084
390Chinese14132823101414141012181616191213,14F4084+KM203
403Chinese15122823111413141011181517211213,13F4084
407Chinese14142922101413141012181715201313,13F4084+KM203
409Chinese14132923101413151013181515201213,13F4084+CTS8902
419Chinese15122822101413141011181415201214,14F4084
430Chinese15122823101413141011191415201213,14F4084
463Chinese14132923101513141011181516211212,13F4084
494Chinese15123023111313141012181517201113,13F4084
498Chinese15122922101414141111181416211213,13F4084
576Chinese15122722101413141011181415201213,14F4084
NPOPULATIONDYS19DYS389IDYS389IIDYS390DYS391DYS392DYS393DYS437DYS438DYS439DYS448DYS456DYS458DYS635YGATAH4DYS385估单倍群
5Chinese16122823101413141012191816191213,13F492
31Chinese15123023101412141011181615201113,14F492
34Chinese16122823111413141011181715191213,13F492
35Chinese15122823111413141011181715201213,13F492
43Chinese15122923101413141011181715191213,13F492
52Chinese16122723101413141014181715201213,13F492
72Chinese15133123111413141011181615191213,13F492
75Chinese15122923101413141011181715191213,13F492
80Chinese15122923121413141012181815201213,13F492
89Chinese1612272391413141012181715201113,13F492
97Chinese15122923111413141012181715191213,14F492
102Chinese15122823111413141012181715191213,13F492
103Chinese15122822101413141012181715191213,14F492
116Chinese15122823101413141012191615191213,13F492
117Chinese16122723101413141012181715201213,13F492
120Chinese15122923111413141011181816191213,13F492
127Chinese16122723101413141014181715201213,13F492
131Chinese15122723101413141012181817201213,13F492
137Chinese14132923101413141012181515191214,14F492
139Chinese15122823111413141011181815191213,13F492
140Chinese15132923101413141011181615191213,14F492
143Chinese15122923101413141011181615201113,14F492
144Chinese15122823101412141012181715201212,14F492
146Chinese15122923111413141012181715191213,13F492
157Chinese15122823101413141012181515201212,13F492
163Chinese15122923101513141012181815201212,14F492
179Chinese15122823101413141011181715191213,13F492
218Chinese15122823111413141012191816191213,13F492
219Chinese15122723101413141013181615201213,13F492
221Chinese15122923111413141011181715191213,13F492
226Chinese15122823111413141013171715191212,13F492
243Chinese16122723101413141013181715201213,13F492
244Chinese15122823111413141011181615191113,14F492
245Chinese16122823101413141012181515191213,13F492
261Chinese15122923101413141011181815191213,13F492
262Chinese15122823101413141012191716191213,13F492
264Chinese15122823111413141011181716191113,13F492
267Chinese15122923101413141011181615191213,14F492
NPOPULATIONDYS19DYS389IDYS389IIDYS390DYS391DYS392DYS393DYS437DYS438DYS439DYS448DYS456DYS458DYS635YGATAH4DYS385估单倍群
279Chinese15122923111413141012181715191213,13F492
296Chinese16112823101413141011181615191113,13F492
341Chinese15122923111413141011181716201212,13F492
344Chinese14122823111413141011181815191213,13F492
355Chinese15122923111413141012<161715191213,13F492
376Chinese15122823111413141012181615191213,13F492
379Chinese15123023111413141011181715191213,13F492
388Chinese15132923111413141011181715191213,13F492
402Chinese15122923111413141011181715191213,13F492
410Chinese15123023101413141011181615201113,13F492
417Chinese15122923111413141013181615191213,13F492
422Chinese15122823101413141012181515201213,13F492
434Chinese15122823101413141011181815201213,13F492
441Chinese15123023111413141013181715191213,13F492
444Chinese15122923111414141011191515191213,13F492
445Chinese15123023111413141011181715191113,14F492
450Chinese15133023111414141011201615191213,13F492
477Chinese15122723101413141011181715201213,13F492
479Chinese14122823101413141011181616191113,13F492
487Chinese15133023101414141011191614191213,13F492
507Chinese15122823111413141110181715191213,13F492
510Chinese15122923111413141012181515191213,13F492
523Chinese15122823101413141013181515201212,13F492
527Chinese15122923101413141011181515201113,14F492
551Chinese15122823101413141011181615201313,13F492
557Chinese15122924101413141012181515191213,13F492
559Chinese15122823101413141011181616191213,14F492
考考眼力,大家根据数据推测一下这份中国577人数据的样本来源地。
thanks for sharing.发现Chinese组N85、N228,跟我17STR完全匹配。
中国577人数据差一两步就很多,17-STR数据和我全同的只有两个N146和N279。
菲律宾105例样本中有7个P203占6.6%比率,其中有3个F78*占2.85%比率,有2个F492有1.9%比率,还有两个是F446,M110有14个占13.3%的比率。
菲律宾105例中P203的17-STR数据和所估下游.jpg
马来西亚579人样本中有27个P203有4.66%比率,其中有15个F492占2.6%比率,8个F78*占1.38%比率,还有3个F4084和一个F446。M110有31个占5.3%比率。
马来西亚579例样本中27个P203所估下游支系.jpg
泰国246例样本中有13个P203占5.3%比率,其中有7个是F4084支系的占2.8%.4个F492有1.6%.还有2个M110。
泰国246例样本中13个P203所估下游支系表.jpg
越南103例样本中有8个P203占7.8%比率,其中3个是F4084支系的有2.9%比率,5个是F492支系有4.8%比率。越南样本中没发现有M110。
越南103例样本8个P203估下游支系.jpg
根据几个主要的单倍群的构成比例以及匹配的地域,推测这份Chinese 577例数据的样本主要来自华南沿海的闽(台)粤地区。

其中M117虽然高频(20%+),但主要是由CTS7634和CTS5063组成,地域特色显著。

另外,这577人的数据中没有一例疑似Oα1a-F316的样本,M120倒是还有几个。据复旦以往的研究,Oα1a-F316簇极为年轻,分布也非常广泛,能占汉人近2%的比例,不过五六百人的数据没有,也算少见。以前的数据就发现,华南沿海的闽语等人群基本缺失或罕见Oα1a-F316,这次算是在大样本数据中再次证实。

这份Chinese 577样本中F444约占8%+,符合闽地的预期。其中地域特征的小类存在感很强,譬如β-X-8的闽台小类、Oβ3a2a-KM3031支、β-X-3闽台新小类、β-X-4的闽西小类已经鹤山谭的F2887下的粤地小类,在数据中都有体现。

当然更为大路货的Oβ2-F563簇、Oβ3a2b1a1-F4249簇、Oβ1a1-F279也都存在。
根据几个主要的单倍群的构成比例以及匹配的地域,推测这份Chinese 577例数据的样本主要来自华南沿海的闽(台)粤地区。
其中M117虽然高频(20%+),但主要是由CTS7634和CTS5063组成,地域特色显著。
另外,这5 ...
风虎云龙 发表于 2014-9-17 09:00
福建西部受江西等移民影响的地区还是有一定的Oα1a-F316分布,譬如汇泽的宁化某个村的那些刘氏M117样本,推测为Oα1a-F316。从目前300多个刘氏样本中,SNP测试确认为Oα1a-F316的刘氏有9位,分布在南北两个区域,北方为京鲁豫陇,各1个样本;南方为湘赣粤,其中湘赣各2个样本,粤1位。从刘氏样本的STR推测的疑似F316样本看,也大都集中在这些地方或者受这些地方移民影响的区域,福建宁化样本中有匹配差1、2步的,而福建其他地方暂时未见接近样本。
福建西部受江西等移民影响的地区还是有一定的Oα1a-F316分布,譬如汇泽的宁化某个村的那些M117样本,推测为Oα1a-F316。从目前300多个刘氏样本中,SNP测试确认为Oα1a-F316的刘氏有9位,分布在南北两个区域,一个区 ...
SNPEC 发表于 2014-9-17 12:37
客家中还是有些F316的,闽语人群则缺失或罕见。
根据几个主要的单倍群的构成比例以及匹配的地域,推测这份Chinese 577例数据的样本主要来自华南沿海的闽(台)粤地区。

其中M117虽然高频(20%+),但主要是由CTS7634和CTS5063组成,地域特色显著。

另外,这5 ...
风虎云龙 发表于 2014-9-17 09:00
北美华人主要是华南沿海移民,如广东台山(Toisan)等地。

查了一下,M117+ Overall约128/578,占22.15%左右,其中:
1) CTS1642'CTS7634(含F2188)约占61/578,
2) CTS5063约占38/578,
3) F-O3-9约占12/578(不清楚这两者与CTS1642'CTS7634的关系)。

上述三大人群,占据了该华人数据总量的111/578

而M117x(上述三大人群)占17/578,也就是约占2.94%

也就是说华南沿海群体没多少除这四种类型之外的M117,比例低于5%,甚至低于F444的你说的8%
原始分型数据附件。包含了所有上述128个样本

华南ht类型汇总.txt (8.63 KB)

单倍群                                                      频度
M117(xCTS1642'7634, CTS5063, F-O3-9)  ~3.0%
F444                                                       ~8.0%


CTS1642'7634                                       ~10.6%
           其中
                     CTS1642约20/578               占3.5% (以广东珠三角及东南亚泰老民族和云南傣族最为常见)
                     CTS7634(xF2188)约9/578    占1.6%
                     F2188约32/578                   占5.5% (以福建沿海及粤东沿海最为常见)

CTS5063                                                 ~6.6%

F-O3-9                                                    ~2.1%

其实CTS5063等也不排除是在CTS1642'7634这个大类里面的,但目前没看到树,不多作预判
客家中还是有些F316的,闽语人群则缺失或罕见。
风虎云龙 发表于 2014-9-17 12:45
这个也不一定吧,只是目前为止采的多是沿海闽语区,内陆闽(例如闽语邵将片)不好说。另外,福建的南平市区一带有官话方言岛(可能以上江官话为主)。福建龙岩武平还有军话岛

广东和福建的遗传地势总体上看都是首先是东西差异其次才是南北差异(对于广东,这是移民来源地多样性导致,对于福建,这主要是地形因素导致,西高东低),福建沿海的南北(闽东、莆田和闽南)之间部分人的认同感不强,这应主要是地形、方言等因素导致的(而非真正的遗传学差异。跟苏南人跟苏北东部沿海人之间、浙南沿海人和闽北沿海人之间的情况类似。苏南人不认同“江北人”,除了语言之外更重要的还是经济、文化礼俗各个方面[表观上看,文化礼俗(包括所谓言谈素质、家教等等)是主要因素,但实际上经济因素也占了很大的一块]。主观认同感低于客观遗传学关系。而跟北方一些省份恰好相反,北方一些省份内部的主观认同感要强于客观遗传学关系。因为北方人更追求“大同”而非“个性”)。但从父系、姓氏群体结构来看,沿海闽差异并不大,从语言学上的发生关系来看,沿海闽内部(闽东、莆田、闽南)的南北差异,也比北部沿海(闽东)、中部沿海(莆田)和南部沿海(闽南)三者分别与内陆闽的差别要略小,尽管两两仍不能通话

至于Oα1a-F316,个人不负责任瞎猜一个,其最大支系可能在中原周边地区
Oα1a-F316从现有的数据来看,比例上还是北方略多于南方的。现在来看最高的是北京,其次是河南、河北,然后是山西、东北,关中比例倒算是北方里偏低的。

F316无论是姬周还是刘汉哪个的备选,都着实令人期待,一旦被考古证实,也算是3000年来最“汉”人群迁徙的最佳指示剂,也足以平息“北汉灭绝论”、“衣冠尽数南迁论”等论战多年、经久不息的话题。
Oα1a-F316从现有的数据来看,比例上还是北方略多于南方的。现在来看最高的是北京,其次是河南、河北,然后是山西、东北,关中比例倒算是北方里偏低的。

F316无论是姬周还是刘汉哪个的备选,都着实令人期待,一旦 ...
风虎云龙 发表于 2014-9-17 15:04
可有该单倍群在姓氏间的分布情况?姬姓确实不能排除包括某些Oα1a在内的O3,但从目前来看姬姓的人口规模已经可以肯定不会超过汉族男性总人口的5%,因此是O3还是C、O2*、N、Q等的概率并无本质区别。此外,Oα在陕西包括关中偏低频,因此目前说姬姓与阿尔法下任何一支有关联性都证据不足。陕北关中高频的是Oβ而不是Oα,当然我没说一定是前者,只就事论事

要测中国那些“姬周正统”迷们所关注的姬姓其实还可以通过进一步缩小姓氏搜索范围,像令[Líng]狐(山西运城临猗、贵州遵义桐梓等地)、郕(成。最好是山西南部汾河流域等地的成姓,不要江苏成姓)、邴、郜、东野(山东临沂等地)、解[Xiè]、滑、祭[Zhài]这类人口级别的姓氏(这些姓目前仍大多分布在黄河流域,而在长江流域及以南地区并不高频,或者缺失。甚至韩贾这类人口级别的姓也是如此)都可以考虑采个上万个样本,当然曾有人说大姓存在的问题小姓也同样存在,但总而言之还是比什么杨吴周郭郑冯董这些要靠谱多了,也更容易研究。甚至荀、蔺这一人口级别的姓也比杨吴周要靠谱

http://www.ranhaer.com/viewthread.php?tid=24506&page=1#pid331951
陕西确实是中国的一个复姓宝库,而复姓由于改姓概率很可能远低于单字姓,所以其研究价值远高于单字姓,比如

要研究姬姓,去山西运城临猗令狐营、三管乡测五六个不同家系的令狐,山东临沂平邑卞桥东家庄以及保太镇等地测五六个东野,都比测一大堆韩贾郑甚至解郜郕滑之类的姓氏要有价值得多;

要研究姜姓,烟台龙口的淳于村首当其冲,杭州桐庐富阳的申屠也可参照(假如是O1,那么没有悬念;但假如不是,则还是可以留备以后参考的);

要研究妫姓,首先要把陕西的第五淮北的颛孙研究透还有广东开平阳江的司徒氏(不过司徒氏以职为氏,可靠性不佳,广东离该姓的发源地又远了些,也许测出来的仍是很多样或者很“广东”的结果也未可知)也可作参考;

要研究子姓,就应该广泛地采集全国各地的皇甫氏样本(但皇甫由于在全国各地分布太广太均匀,典型性肯定差一些。这里也顺便一提,陕西的第一大复姓很可能是皇甫而不是欧阳),与山东黑龙江等地的太史氏(或为东莱太史慈后裔)拿来对比;

要研究嬴姓,可去临沂罗庄莒南等地多采些主父氏的样,浙江金华兰溪诸葛村也可参考(虽然未必靠谱,也许测出O1。不过有参考总比没参考强吧);

至于姒姓,我想复旦的夏侯氏样本已经够用了,虽然仍然很多样,但多样性显然比一般的姓氏已经大大降低,只局限在几个群里,而且但总有一天找到合适的参照姓氏肯定会发现规律的。

总之,测这些人口基数更小、聚居度更为局限、受改姓影响几率相对小些的复姓,总比测单字姓,哪怕是郜(姬,或少民来源,首要分布区:豫鄂)、晏(姜,或少民来源,首要分布区:赣川)、陆(妫,或少民来源,首要分布区:苏浙)、戴(子,或少民来源,首要分布区:东部稍偏南)、葛(嬴,或少民来源,首要分布区:豫苏)、窦/佀(姒,或少民来源,窦首要分布区:华北如晋鲁,佀[Sì,非侣]首要分布区:我们知道著名作家海岩祖籍湖南,不过此姓主要分布在豫东鲁西南等地,此外北京[非海岩一家]沈阳亦有零星聚居)、蔡/吉(蔡亦有一部分是起源于姞姓,蔡首要分布区:东南尤其闽,吉首要分布区:晋)、姚(首要分布区:全国各地,但苏浙和西北某些地区相对集中,不过西北的姚显然更可能跟羌人或其他少民有关)、鄢/郐(妘姓,或少民来源,鄢首要分布区:川鄂,郐首要分布区:鄂鲁)这些中等或四五线单字姓要靠谱些吧?更不要提跟杨高陈徐这些大姓比了。

雄镇散人 发表于 2013-5-20 23:05
返回列表
baidu
互联网 www.ranhaer.org