返回列表 回复 发帖

23andme更新了,问个关于如何解读的问题

本帖最后由 skyquy 于 2017-6-19 18:27 编辑

前阵子收到更新的邮件通知,看到新版附了个ancestry timeline的估计,想请教下关于解读的问题,我自己是做粒子物理的,对分子人类学完全是外行,纯粹个人兴趣围观。
我知道北方汉人带些欧洲的组成完全不奇怪,但不知道有没有人统计过大概的比例是多少?是不是都在百分之个位数左右?测出来的是都是比较单一的来源吗,还是西欧、南欧、北欧啥都有随机分布的?

我想问的问题是这样的,我看到例如有些人测出来犹太的成分,一开头最简单的解释是例如开封有群犹太人,但如果稍微仔细估计下就会注意到,如果按每一代1/2的稀释速度,其实大概没个6、7代就衰减到1%以下了,逆推时间的话其实连明代都不到,超出清代的范围根本就降到极小的比例,那么这测出来的1%、2%甚至0.1% 是怎么去理解呢?是压根就没这个“外国人”存在,纯粹是随机产生的噪讯?(但这貌似比较难解释南方为啥就少欧洲成分)。还是历史上确实有这么几小撮外国人,然后他们的DNA一直在广大的群体里随机起伏,碰巧有人累积到了比较多,看起来就这个数量级?或是确实大概在清代有这么一个老外跑来了中国,然后留下了后代。

如果是很大的群体里都有个1%、2%,那很容易随机累积个一点点,那么某个人测出来的犹太比重比较高基本上像是高矮胖重一样的概念了,几乎可以理解成碰巧长得比较高那样,可以说是某人“长得比较犹太”,言外之意就是其实大家都多少有点犹太,只是这人碰巧稍微多一点而已。如果是压倒性绝大部分人的比重都是零,而某个人测出了1%,那或许是“清代某个老外跑到中国来”的解释比较合理。

如果我没猜错的话,客观情况应该是前者吧,但要在整个北方人群里占个1%,当初得有多少移民啊。。。


但除此之外,就我所知wegene报告显示的外国比例和23andme又挺不一样的,这又是怎么回事?是wegene其实没咋做欧洲的数据比对吗?还是其实这DNA的噪讯已经小到每家公司拿不同的标准来比对,结果已经挺不一样了?换句话说其实早就没有参考价值了


我留意到23andme附的图解里,有个是各个成分在染色体上具体位置的图示。看起来其实比我想的“整块出现”的多,我原以为如果不断稀释的话,按理应该是被切成非常多极细小的片段的。这是因为DNA重新排列的机制本身就是一大块一大块切的吗?

还有其实都已经稀释到1%以下了,区分西欧、南欧、北欧有意义吗?是“真的明确能标记这段是西欧特有”,还是其实就是个细分下必然的模糊性?例如单看某一个字母ATGC,我想不会有人说这单一位置是A的就算作西欧,这显然是无意义的



Screen Shot 2017-06-15 at 7.00.49 PM.png
2017-6-19 18:13


Screen Shot 2017-06-15 at 7.00.34 PM.png
2017-6-19 18:13


Screen Shot 2017-06-19 at 5.14.59 PM.png
2017-6-19 18:13
1# skyquy 我知道北方汉人带些欧洲的组成完全不奇怪,但不知道有没有人统计过大概的比例是多少?是不是都在百分之个位数左右?测出来的是都是比较单一的来源吗,还是西欧、南欧、北欧啥都有随机分布的?
----------------------------------------
首先说明一下,欧洲成分在旧石器时期主要是WHG(内部分为几种类型,后世一般以bichon类型为主)、很少量的当地尼人成分以及微量的东欧亚EE成分,应该还有其它灭绝的成分(可能极微量遗传给现代欧洲人,不过需要更高精度的检测才能知道)。旧石器时期有一个很大的特点就是,欧洲各地人种差异极大,甚至相隔不远的两个地方也是如此,其中很多古人的血统已经灭绝,没有流传到后世。
到了新石器时期,则主要是WHG、BASAL eurasian(主要是体现为ENF)、AN(小亚农夫成分,)、ANE(主要表现为与WHG的混合,比如EHG与SHG),以及大比例的CHG成分(主要是以伊朗农夫的成分表现)
后来的欧洲人基本上是建立在新石器的成分基础上,总的来说,变化不是很大,个别地区比如西欧高纬度地区,则是体现出一种接近新石器铜石时代的东欧EHG成分得到明显上升。


所以我们现在无法笼统地说‘欧洲成分’,因为无法说清楚。有一些是新石器东西方就共有的,比如ANE、EE。有一些则是后来流通的,比如baltic或Gedrosian(一种CHG、WHG、ANE以及极少量的ASE的混合),当然,Gedrosian也不是真正的‘欧洲’成分,只能说是类欧洲成分。
西欧、南欧、北欧成分在表现上是不太一样的,这个回头有时间再详细解释。


我想问的问题是这样的,我看到例如有些人测出来犹太的成分,一开头最简单的解释是例如开封有群犹太人,但如果稍微仔细估计下就会注意到,如果按每一代1/2的稀释速度,其实大概没个6、7代就衰减到1%以下了,逆推时间的话其实连明代都不到,超出清代的范围根本就降到极小的比例,那么这测出来的1%、2%甚至0.1% 是怎么去理解呢?是压根就没这个“外国人”存在,纯粹是随机产生的噪讯?(但这貌似比较难解释南方为啥就少欧洲成分)。还是历史上确实有这么几小撮外国人,然后他们的DNA一直在广大的群体里随机起伏,碰巧有人累积到了比较多,看起来就这个数量级?或是确实大概在清代有这么一个老外跑来了中国,然后留下了后代。

如果是很大的群体里都有个1%、2%,那很容易随机累积个一点点,那么某个人测出来的犹太比重比较高基本上像是高矮胖重一样的概念了,几乎可以理解成碰巧长得比较高那样,可以说是某人“长得比较犹太”,言外之意就是其实大家都多少有点犹太,只是这人碰巧稍微多一点而已。如果是压倒性绝大部分人的比重都是零,而某个人测出了1%,那或许是“清代某个老外跑到中国来”的解释比较合理。

------------------------------------------------------------------------
你这个推测很有科学性,看来搞分子物理的就是容易观察到实质性所在,呵呵。 我的观点,分子人类学与分子物理在许多方面道理是相通的。
具体到‘开封犹太人’,目前基本无法断定这种成分是否存在,因为不出意外,这个成分也是高度混杂的成分,如果带有原始犹太人特有的BASAL eurasian成分与非洲成分,估计也是很少量的,而且难以与其他‘色目人’带到中国的做严格区分,除非找到当年的遗骨做比对。


如果我没猜错的话,客观情况应该是前者吧,但要在整个北方人群里占个1%,当初得有多少移民啊。。。
----------------------------------------------------------------
1%,看你具体指哪一种成分?


但除此之外,就我所知wegene报告显示的外国比例和23andme又挺不一样的,这又是怎么回事?是wegene其实没咋做欧洲的数据比对吗?还是其实这DNA的噪讯已经小到每家公司拿不同的标准来比对,结果已经挺不一样了?换句话说其实早就没有参考价值了

--------------------------------------------------
是的,感觉这是一个问题,wegene在出报告时应该说明一下


我留意到23andme附的图解里,有个是各个成分在染色体上具体位置的图示。看起来其实比我想的“整块出现”的多,我原以为如果不断稀释的话,按理应该是被切成非常多极细小的片段的。这是因为DNA重新排列的机制本身就是一大块一大块切的吗?

还有其实都已经稀释到1%以下了,区分西欧、南欧、北欧有意义吗?是“真的明确能标记这段是西欧特有”,还是其实就是个细分下必然的模糊性?例如单看某一个字母ATGC,我想不会有人说这单一位置是A的就算作西欧,这显然是无意义的

----------------------------------------------------
感觉应该是细分下必然的模糊性,这个以后还可以探讨~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
本帖最后由 skyquy 于 2017-6-21 14:22 编辑

谢谢了,非常详细的回复。
1%,看你具体指哪一种成分?
imvivi001 发表于 2017-6-20 07:51
我查了下资料,首先23andme的报告里头,明确会写在报告里的常染色体,东南西北欧的最小成分是 0.1%,
如果我们做个非常理想化的粗糙估计的话:
例如假设所有的外来DNA都是唐代各色人种一口气移民进来留下后代,然后在北方人群中达到平衡0.1%的,之后这0.1%就在人群中随机窜来窜去不再明显增加,那么需要多少外来人口呢?
wiki上的资料,李隆基的时候全国登记在案的人口数有 41,419,712,四千万。(前后浮动不小,初唐才一千万,不过中国一战乱就常有人自动逃户籍避免税务和兵役) 按南北人数个占一半的估计,0.1%大概是需要有两万个外国人,这个估计可能很不精准,毕竟我忽略了南北人数不均还有一大堆数不清的因素,纯粹是数量级的估计,但从这样看起来其实不是不可能,当时的长安城外国移民确实数量到了上万。不过这也看具体指哪,如果说历史时代曾经西欧、北欧有上万人来中国显然不大可能,丝路上的那些国家甚至到南欧勉强算进来倒是不是不可能的。

另外我查了下宋朝人口数差不多也是这个数量上下,三四千万,所以如果开封犹太人真来了例如一万多人,而且都留下后代,大概是能在测量的最小精度附近很勉强的冒个泡。就统计来说这种无法直接排除但又无法证实的情况应该是最糟糕的吧。。。


不过从你的解释我感觉其实最开始的各个地方的“欧洲成分”怎么定义就是个特别难解读的问题,关键最开始大家就不是能很简单的区分了。不过尽管定义不清的同时,南北的所谓欧洲成分(无论他是指什么)还是有一定程度的区别度的,这点还是反应了些内容(无论反应的是什么)。
返回列表
baidu
互联网 www.ranhaer.org