返回列表 回复 发帖

【原创】汉族母系线粒体DNA主成分浅析

本帖最后由 baiyueren 于 2011-4-25 18:20 编辑

汉族母系线粒体DNA主成分浅析

前言
其实我认为汉族是一个晚近时期形成的文化共同体,而不是一个血缘和遗传共同体。但是从另一角度来说,以往大量的文献和数据都揭示了华中和北方地区的汉族在血缘上的交流混合更加均匀。个人认为这个过程并不是始于汉族(或其前身华夏族)形成之后,而是在汉族(华夏族)形成之前,从农业文明兴起开始,在广阔的东亚大地上这种血缘交流与融合已经进行了很长时间。而这种混血融合的所形成的东亚遗传连锁群体,应该都保留在现在所谓的“汉族人群”中。因此把汉族当作一个界定参与混合的东亚遗传人群的来进行分析,至少有一部分结果应该是有现实参考和指导意义的。
鉴于分析是前几年完成的, mtDNA数据主要来自复旦和云南所的论文,分型比较粗,基本只到亚单倍群的级别,所以不再正式发表论文而只在网坛披露主要分析结果。欢迎转载,注明原作者即可。

本文线粒体数据的分型:AB4*B4a&B4bB5bC&ZD*D5*D5aF1aF1bF1cF2a*M*M7*M7b&M7b1M7b2M7cM8aM9aN*N9aR9FYWest(西部欧亚)

本文涉及的汉族样本:新疆汉族、北京汉族、大连汉族、甘肃汉族、青岛汉族、陕西汉族、青海汉族、淄博汉族、香港汉族、四川汉族、台湾汉族、武汉汉族、昆明汉族、凤城汉族、泰安汉族、安徽汉族、长汀汉族、广州汉族、湛江汉族、湖南汉族、江苏汉族、江西汉族、上海汉族、四川汉族、曲靖汉族、浙江汉族、河南汉族、山西汉族、潮汕汉族、闽南汉族、莆仙汉族、赤峰汉族

正文

汉族第一主成分

1s.png
2011-4-25 18:13


汉族第一主成分占总信息量的53.9%。相关性分析显示与D*(含D4但不含D5,下同)单倍群关联性最大。从分布上看汉族各地区都有分布,但是北方的频率更高,特别是在陕西、山西、宁夏一带更为高发。但是因此这基本上可以看成是东亚人遗传成分中最古老的底层。

汉族第二主成分
2s.png
2011-4-25 18:13


第二主成分占总信息量的10.6%,其高发区域非常明确,核心是在广西和广东西部地区,云南南部地区也有一定分布。进一步的分析显示第二主成份与M*B4aB4b关联性最为密切。我个人认为第二主成份很可能代表了在某一史前时期(也许是农业文明初期)自北部湾地区开始扩张的一支祖先人群的遗存。从梯度分布判断迁徙的主体方向是向北。

汉族第三主成分
3s.png
2011-4-25 18:13


第三主成分占总信息量的6.7%,主要分布在东、西两个区域:其中西部云南一带最为高发,东部则是在福建-华中-中原一带比较高发。分析显示第三主成分主要与M7bF1a相联系。目前尚难以判断这支人群具体的动向,从分布上看似乎是从北部湾地区迁出后分为东西两支:东支往北向东亚大陆腹地迁徙;西支向云南一带迁徙,从流向上判断应该最终进入了印支半岛。

汉族第四主成分
4s.png
2011-4-25 18:13


第四主成分占总信息量的4.7%。从完成的分布图上看呈现一个很小的分布核心,从鄂豫皖三省交界一直延伸至河南北部。主要与AG单倍群相关联。这似乎与历史上关于华夏族在中原形成的传说想吻合,个人认为是代表了汉族(华夏族)的起源时期的遗传学痕迹。相反地,第四主成份在陕甘宁一带的分布频率很低,这是否说明了至少在母系上西北部氐羌人群并非是汉族的正源?

汉族第五主成分

5s.png
2011-4-25 18:13

第五主成分占总信息量的4.1%。从图上看呈现河南北部、四川成都平原、江西北部等多个中心。其确切含义并不很明确,也许是历史上汉族曾出现过大量人口增殖的地区。
5

评分次数

NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
首先说一句,主成分的梯次形状不一定代表从高梯度向低梯度扩张,也可能代表从低梯度向高梯度被扩张。譬如欧洲的主成分中巴斯克人。譬如汉族的第二主成分,我的感觉就不是扩张,而是被扩张。是被从鲁豫和西北两个方向的扩张阻隔成了南北两个高发区域。
本帖最后由 隆攀gdzq 于 2011-4-25 20:40 编辑

与史前中原文化流入长江流域有关的一些考古或传说。

湖北江汉地区出现的仰韶文化,基本上属于半坡文化类型,同时有一些庙底沟文化的因素,推测应源于仰韶文化中晚期,鄂地的仰韶文化应为渭水流域炎帝部落的一个分支而不是相反,年代估计在5.5千年前左右,这应是中原文化流入长江流域的最早年代。随州炎帝故里、湖南炎帝陵或与这个炎帝支系南迁有关。但估计这个时期,长江流域主要应还是荆蛮的地盘,当时黄帝与蚩尤还没有开战,尧舜也还没大战三苗。

第二期中原文化对长江流域影响应是龙山文化期,青龙泉三期文化,又称湖北龙山文化,年代约前2400,这个年代应发生于黄帝大败蚩尤之后,早于尧舜大战三苗的年代。

第三期尧舜大战三苗,后有祝融八姓部落集团迁入江汉地区(对祝融八姓迁入的年代没多少把握?)。

几个过程中,中原人群与荆蛮人群到底有过什么样的消长关系?令人困惹,也是很有意思的问题。

华夏集团早期在渭水流域应有过一个壮大过程,这个过程可能也是母系D的暴发扩张过程。但这个D又源自何处?

进入龙山文化期,华夏集团的重心发生了东移,传说中的颛顼-帝喾时代(约4900-4200年前,可参考许顺湛的方案),其重心在河南南部一带。因此,河南从血缘及文化上都应是很华夏的,华夏因素应远多于东夷因素,北汉的东夷份额可能并不多。
D啥事变成东亚最古老的,又是新老亚洲人那套
首先说一句,主成分的梯次形状不一定代表从高梯度向低梯度扩张,也可能代表从低梯度向高梯度被扩张。譬如欧洲的主成分中巴斯克人。譬如汉族的第二主成分,我的感觉就不是扩张,而是被扩张。是被从鲁豫和西北两个方向 ...
wolfgang 发表于 2011-4-25 20:10
你的观点从理论上来说是有可能的。但是第一主成分呈弥散性分布,而第二主成分的呈集中分布,这已经基本指明了扩散的基本顺序。如果说是第一主成分在某段历史时期(比如气候变冷)向南推挤第二是有可能的,但总的趋势我想非常清楚,应该是第二主成分自南向北后扩散。
还有第二主成分其实只有一个核心。你所认为的那个北方高发中心是北京汉族造成的误差。我们已经很清楚那是近代江淮移民造成的影响。所以可以从思想上排除掉。
NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
其实很简单的一件事情,非要搞得那么复杂,mtdna应该建立于体质人类学上

按照现代人分布猜想,跟空对空有什么区别
其实很简单的一件事情,非要搞得那么复杂,mtdna应该建立于体质人类学上

按照现代人分布猜想,跟空对空有什么区别
天天向上 发表于 2011-4-25 21:14
彻底无语
4# 天天向上
很不幸,新老亚洲人是我做分析下来最吻合的假说。而不是我最先预设的结果。如果这个分析与Daic的新老亚洲人理论十分雷同,我只能说实属巧合!
NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
4# 天天向上  
很不幸,新老亚洲人是我做分析下来最吻合的假说。而不是我最先预设的结果。如果这个分析与Daic的新老亚洲人理论十分雷同,我只能说实属巧合!
baiyueren 发表于 2011-4-25 21:22
还好,Daic的科幻小说是用中文发表的,不然我国学术界的脸就丢大了
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
本帖最后由 ranhaer 于 2011-4-25 21:48 编辑

大家都和气一点啦。  mtDNA的数据非常多,有兴趣的话可以自行研究。B/F确实在南方高发而C/D(mt)在北方高发,扩张的时间总是会有差异的。远古的历史事件不是一下子就能完全无误的阐述的。我唯一坚信的,就是数据。但现在,Y-SNP的数据还不够精细,远没有到达决定性的程度。东亚数万年人口历史,还有很多需要耐性等待的。


关于线粒体,我同样认为对分析群体历史非常有用,虽然我对baiyueren的结果也有不同的观点。 希望大家也能够对mtDNA感兴趣并研究它。
自问,于民于家何用?
本帖最后由 thelasthuns 于 2011-4-25 22:19 编辑

看了分布图后,还是觉得楼上的一位朋友说的对,第二主成分M和B,应该是“被扩张”的。
因为明代以来的北京地区江淮移民应该不会造成如此大的扩散梯度啊


一个问题给百越版主:你列出的是M+B(共同构成第二主成分)的分布,是不是M和B分别的两个分布图都一致?
新得一名narsan,蒙语松树,象征健康
  1. 你的观点从理论上来说是有可能的。但是第一主成分呈弥散性分布,而第二主成分的呈集中分布,这已经基本指明了扩散的基本顺序。如果说是第一主成分在某段历史时期(比如气候变冷)向南推挤第二是有可能的,但总的趋势我想非常清楚,应该是第二主成分自南向北后扩散。
  2. 还有第二主成分其实只有一个核心。你所认为的那个北方高发中心是北京汉族造成的误差。我们已经很清楚那是近代江淮移民造成的影响。所以可以从思想上排除掉。
复制代码
还请你注意一下,第二主成分不但有北方汉族那个局部高发中心,而且还有福建南部那个局部低发中心,而那个点,我们知道是由唐代移民形成的。既然一个局部高发中心,一个局部低发中心都离现代如此之近,何以见得整个第二主成分能说明新石器时代农业刚出现的情况?说实话,我觉得第二主成分表现的是战国以来北方汉族向南方的移民过程,是一种被稀释的过程。
胡乱说几句:
一、我怎么感觉第一主成分最高密度区域和李家崖文化(可能是鬼方)重合?当然李家崖文化的年代可能迟了点。从整体上看,整一个汉藏(古代羌人)+戎狄,哈哈。五六千年前山西北部和陕西的文化在南北方向上有沟通,可能他们都是属于这个类型的。
二、第二主成分明显就是越人成份。但不解的是为什么闽南厦门一带会是空白?
傻逼太多,懒得理会。
看了分布图后,还是觉得楼上的一位朋友说的对,第二主成分M和B,应该是“被扩张”的。
因为明代以来的北京地区江淮移民应该不会造成如此大的扩散梯度啊
一个问题给百越版主:你列出的是M+B(共同构成第二主成分)的分布,是不是M和B分别的两个分布图都一致?
thelasthuns 发表于 2011-4-25 22:17
关于北京汉族的问题,注意这是由算法造成的问题。并且经过了主成分的提取,第二主成份只占10%左右,这意味着在作图时的误差被放大了10倍。
M*和B4的高发区域是不一致的,M*在云南更多,B4在两广更多。
NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
17# wolfgang
第二主成份在福建低是因为福建以A为主,B4很少。所以跟两广有巨大的反差。
NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
本帖最后由 baiyueren 于 2011-4-25 22:37 编辑
胡乱说几句:
二、第二主成分明显就是越人成份。但不解的是为什么闽南厦门一带会是空白?
roxsan 发表于 2011-4-25 22:21
我认为第二主成分很可能不是越人成分,因为我倾向于认为起源早期的O3伴随的母系是B4。
这样的话:在西南地区O3的母系被替换成M*,而在东南O3携带着B4a/B4b迁徙了更长的距离。
NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
请教百越版,四种成份的划分依据?
真正与越人有关的是第三主成份,因为我认为早期的O1携带的母系是F1a。当然,那时还没有越人,只有他们的澳泰(原始马来)祖先。
NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
24# torpedo
这是SPSS软件自动生成的结果,不是我人为划分的结果。
NRY: O2a1c1a1a1a1a1a1-002611,F11,F17,F856,F1495(源自粤西云浮)
mtDNA:B4d1(源自浙北慈溪)
百越人的人类学文集 http://blog.sina.com.cn/baiyueren
24# torpedo  
这是SPSS软件自动生成的结果,不是我人为划分的结果。
baiyueren 发表于 2011-4-25 22:40
那SPSS软件是依据什么划分的?发生频度吗?
返回列表
baidu
互联网 www.ranhaer.org