返回列表 回复 发帖

admixture K=20,雅库特的北亚和西伯利亚血统估算

本帖最后由 Yungsiyebu 于 2013-9-27 16:45 编辑

K=20运行了一天,总算出来了,内容庞杂,先聊聊雅库特。考察的是雅库特先祖骨力干自漠北北上后,融合多少西伯利亚土著血统。

当K=20时,蒙古人种分为四类,北极(克利亚克)、东亚(日本)、西伯利亚(Nganassan)和南亚(Iban),与体质人类学的分类恰好吻合。其中,北亚类型大体介于西伯利亚和东亚之间。
这里,我们假设,漠北骨力干人的血统组成与我随机选择的一例蒙古国样本(0 GSM558856 rasmussen siberia mongolians m )一致,而西伯利亚土著与当前西伯利亚血统最单纯的一例nganassan(0 GSM558805 rasmussen siberia nganassans m)吻合,这样分别以蒙古和nganassans作为100%北亚和100%西伯利亚,计算的结果是:63.8092% : 36.1908%,北亚因素较强。【注】:仅比较北亚和西伯利亚两种成分。

这样回过头来再看我们上边的两例样本,如果地理位置最初偏北的骨力干事实上的血统要比今天的蒙古族还要更西伯利亚一点,那么,就意味着今天雅库特人继承的骨力干血统还要更多,但如果我们以最高西伯利亚血统的样本当标尺,也可能高估当时西伯利亚土著的西伯利亚血统,那么实际的骨力干血统就要低一些。

综合而言,估计雅库特大约是60%上下的骨力干血统,融合约40%的中西伯利亚土著血统。

当然,更准确的估算,要有直接的古dna做参比。

K=20时,此例雅库特样本(0 HGDP00946 hgdp siberia yakut m)直接计算的结果,值得注意的是克里亚克代表的北极类型因素近于0,这与雅库特人归入北亚类型中亚细亚子类型的体质人类学特征吻合,即与北极类型种系相距较远。

JapnaeseNganassansKoryaksIban
Yakut0.1827580.7163540.000010.024323


另一例样本(0 HGDP00958 hgdp siberia yakut m ),北亚因素更强一些,k=20直接计算结果为:

Yakut0.1919210.6479040.000010.001716


顺序同上。

折算后,北亚(mongolia):西伯利亚(nganassan)为

0.7065420.293458
2

评分次数

新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
雅库特人主要是骨力干男性与当地鄂温克女性的混合,在雅库特人到来之前,当地已被鄂温克人占据
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
这是假设C、D等高频见于鄂温克的母系成分都是西伯利亚土著的混合,但事实上,这些类型在蒙古比例也很高,只不过蒙古的类型更庞杂,而鄂温克相对单纯,所以,在mtdna细分到可以区分蒙古和鄂温克之前,很难以此估算骨力干混合多少西伯利亚土著血统。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
現在的雅庫特人是不是普遍帶有西歐亞血統成分?
Y染色體:O3 M134+ M117-
mtDNA:D5a2
現在的雅庫特人是不是普遍帶有西歐亞血統成分?
natsuya 发表于 2013-9-27 16:24
以第一例雅库特样本为例,K=3时,蒙古人种、高加索人种和尼格罗人种的比例如下:

0.862094 0.137896 0.000010
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
以第一例雅库特样本为例,K=3时,蒙古人种、高加索人种和尼格罗人种的比例如下:

0.862094 0.137896 0.000010
Yungsiyebu 发表于 2013-9-27 16:29
尼格羅人種的0.000010是否為noise,常染色體分析演算時常有微妙偏差。
Y染色體:O3 M134+ M117-
mtDNA:D5a2
本帖最后由 Yungsiyebu 于 2013-9-27 16:35 编辑

嗯,通常低于1,就要慎重对待。不过,我相信东方的高加索人种混合,以当前的计算方法,肯定是低估的,需要混血儿实例验证。
比如自述1/16(6.25%)发过血统的K7b计算结果仅为0.83%,尽管比大多人都高很多。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
另外,这里比对的第一例样本HGDP00946,编号EU597530(查询网址http://www.ncbi.nlm.nih.gov/nuccore/EU597530 ),Mtdna是雅库特标志性的D5a2a2。
突变:

73, 150, 263, 309+C, 315+C, 489, 523-524d, 750, 752, 1107, 2706, 4769, 4883, 5178A, 5301, 7028, 8479, 8701, 8860, 9180, 9540, 10397, 10398, 10400, 10873, 11719, 11944, 12026, 12705, 14530, 14766, 14783, 15043, 15301, 15326, 16092, 16172, 16182C, 16183C, 16189, 16223, 16266, 16362
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
嗯,通常低于1,就要慎重对待。不过,我相信东方的高加索人种混合,以当前的计算方法,肯定是低估的,需要混血儿实例验证。
比如自述1/16(6.25%)发过血统的K7b计算结果仅为0.83%,尽管比大多人都高很多。
Yungsiyebu 发表于 2013-9-27 16:34
我舉一個例子:歐巴馬的父親是肯亞黑人,他的母親是美國白人,歐巴馬的常染色體一半來自其父親一半則來自其母親,其血統為50% African+50% European。然後我們知道歐巴馬的妻子蜜雪兒是美國黑人,暫且假設她是100% African。

在這樣的條件之下,我們"理論上"可算出歐巴馬的兩個女兒都是75% African+25% European。但那是理論上或最理想的狀況,根據以前高中學過生物課的遺傳學以及23andMe測試者的討論,產生精子或卵子的時候,會有減數分裂和重組(recombination),也就是說歐巴馬本身是50% African+50% European,但他遺傳給女兒的血統不會剛好是African+European各半的比例,因此他的女兒不見得剛好是25% European,可能會略高或略低於這個比例,然後隨著多個世代遺傳下去,偏差可能會不小。

如此,自述1/16歐洲血統的網友,仍有可能是真實的,雖然0.83%與6.25%的誤差有點大,也或許該網友的混血是更久遠的年代。23andMe有個美國網友,傳說他的家族有個印第安祖先,該印第安祖先據說是6 generations以前,他測試前預估自己是1/32印第安血統,23andMe測試結果出來果然3%左右的Native American,是最吻合的例子。
Y染色體:O3 M134+ M117-
mtDNA:D5a2
23andme的计算工具不是admixture,是另一个。这个没亲自算过,不清楚具体情况。

admixture的问题主要是东亚,以目前的估算,k=3时,连非洲桑人的东亚血统都有近2%,肯定有问题。

子女继承或父亲多一点或母亲多一点,这是对的,但肯定不可能代代向某一种成分减少的方向偏离,是一个波动式的情况,所以,第一代是1/2,可能是1/2.15,而后在有些波动,但不可能变成0.83%。这是肯定的。如果自述者的情况属实,计算方法肯定是有问题的。需要校正。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
我舉一個例子:歐巴馬的父親是肯亞黑人,他的母親是美國白人,歐巴馬的常染色體一半來自其父親一半則來自其母親,其血統為50% African+50% European。然後我們知道歐巴馬的妻子蜜雪兒是美國黑人,暫且假設她是100% A ...
natsuya 发表于 2013-9-27 17:07
奥巴马的妻子有一定白人血统,美国黑人平均20%白人血统,比较均匀,几乎所有美国黑人都有一点
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
嗯,通常低于1,就要慎重对待。不过,我相信东方的高加索人种混合,以当前的计算方法,肯定是低估的,需要混血儿实例验证。
比如自述1/16(6.25%)发过血统的K7b计算结果仅为0.83%,尽管比大多人都高很多。
Yungsiyebu 发表于 2013-9-27 16:34
我不认为当前方法低估了东方人的西方成分,反而可能高估了,具体见中亚的例子,高加索成分达到一半,但是某些人的人种特征却没有体现出来
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
我不认为当前方法低估了东方人的西方成分,反而可能高估了,具体见中亚的例子,高加索成分达到一半,但是某些人的人种特征却没有体现出来
sahaliyan 发表于 2013-9-27 17:25
那是平均的,具体案例差异很大,比如我最忌看得乌兹别克样本,有的非常接近土耳其,几乎没有多少蒙古人种血统。有得则相反。

K7b低估高加索人种血统是无容置疑的,北京组不可能为0,y-dna就有一例J,以admixture k=3计算,最高一例北京人是2.2%,我认为这个值也是低估的。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
那是平均的,具体案例差异很大,比如我最忌看得乌兹别克样本,有的非常接近土耳其,几乎没有多少蒙古人种血统。有得则相反。

K7b低估高加索人种血统是无容置疑的,北京组不可能为0,y-dna就有一例J,以admixtur ...
Yungsiyebu 发表于 2013-9-27 17:35
有欧洲父系不代表常染西方成分就高,如我们的双相同志。所以这并不是一个很好的逻辑,而是荒诞的逻辑
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
有欧洲父系不代表常染西方成分就高,如我们的双相同志。所以这并不是一个很好的逻辑,而是荒诞的逻辑
sahaliyan 发表于 2013-9-27 17:38
我说的是K=3是admixture分析的常染色体,很多乌兹别克样本就非常接近土耳其,维吾尔族也有极高的。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
我说的是K=3是admixture分析的常染色体,很多乌兹别克样本就非常接近土耳其,维吾尔族也有极高的。
Yungsiyebu 发表于 2013-9-27 17:44
我针对的是你的第二个问题
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
12# sahaliyan
混血儿外表性征是个蛮吊诡的东西。我有个朋友,她丈夫1/4的日本血统(他爷爷是日本人),而我这朋友是纯白人,他们俩的小孩照理来说只有1/8亚洲,但这小孩看起来像是1/2黄白混血。。。
狗肉滚三滚,神仙站不稳
我针对的是你的第二个问题
sahaliyan 发表于 2013-9-27 17:46
道理很清晰,1-2%的西域因素存在于人群父系血统之中,其常染色体中的西域因素就不可能为0。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@好奇云怪 QQ群:387100816。
道理很清晰,1-2%的西域因素存在于人群父系血统之中,其常染色体中的西域因素就不可能为0。
Yungsiyebu 发表于 2013-9-27 18:41
这有什么奇怪的?波罗地海某些国家N的比例也很高
三界无安,犹如火宅。众苦充满,甚可怖畏
                            --------《法华经》
是以法从心生。名因法立
                      ------------《宗镜录》
23andme的计算工具不是admixture,是另一个。这个没亲自算过,不清楚具体情况。

admixture的问题主要是东亚,以目前的估算,k=3时,连非洲桑人的东亚血统都有近2%,肯定有问题。

子女继承或父亲多一点或母亲多 ...
Yungsiyebu 发表于 2013-9-27 17:16
很奇怪,桑人确实略接近蒙古人种相比于与高加索人种,从全基因序列来看。
O3a3c* (M134+, M117-)
返回列表
baidu
互联网 www.ranhaer.org