返回列表 回复 发帖

Dodecad V3

Dodecad V3的结果已经有了。 日本人与南韩人无曲别。 北汉亦很像南汉。
https://spreadsheets.google.com/spreadsheet/ccc?key=0ArAJcY18g2GadDUyeEtjNnBmY09EbnowN3M3UWRyNnc&hl=en_US&authkey=COCa89AJ#gid=0
4

评分次数

该死的墙。。。
2# lengshui366
Ok, here it goes :-)

Dodecad v3_ K=12 averages.xls (109 KB)

4

评分次数

南韩和日本人的小区别∶近零的South Asian (0% for Korean and 1.5% for Japanese), 多5%的Southeast Asian (70% for Japanese and 75% for Korean).
4# fjnj
There is an old saying that one picture is worth a thousand words:-).
Dodecad3.PNG
2011-7-1 03:28
我和东亚群体
FJ.PNG
本帖最后由 Yungsiyebu 于 2011-7-1 21:49 编辑

东北亚和东南亚的比例高低,不同算法差异巨大,与作者选择有很大关系,但如果看共享比例,差异就很小了。

一般来说,不同文献,都是要么把最北方的雅库特选择为标准点,其蒙古人种成分都假定为单一成分,要么选择最南方的傣族为标准点,其蒙古人种成分都假定为单一成分。这个比例分析,是南北都没有假定为单一成分。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
本帖最后由 Yungsiyebu 于 2011-7-1 22:08 编辑
不是选择的关系,而是与成分距离有关,东南亚成分内部还可以分出不同成分,但这些成分内部距离比他们与其他成分的距离小,所以是同一成分。但在K值不同的时候,显现的有所不同
sahaliyan 发表于 2011-7-1 21:50
参考点的选择太管事了,可以对比这篇,同样的数据,雅库特的东北亚成分,77.4%,而东南亚成分只有0.5%.

http://hi.baidu.com/%CD%E4%D4%C2%BF%A6%C0%AE%C7%DF/blog/item/8b1f401f45761d0740341730.html

而这篇的东南亚成分可以高达27.1%,


这种分析还是要看共享的相对比例,绝对比例意义不大,当然大种系另当别论。

新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
本帖最后由 Yungsiyebu 于 2011-7-1 22:19 编辑
这个是K=4的情况,而DIENEKES的是K=12的情况,不同成分在K值不同时是会合并分离的,我想K值越大反映的情况越晚近。而K值小的时候计算出来的是古老的成分
sahaliyan 发表于 2011-7-1 22:09
这个没关系,这里的K在高值也是只分到南北两种成分,与其他在低值时的数据是一样的,为什么会出现这么大的差异,其实原因很明显,因为此文最南族群时中国的傣族,尽管作者也扣除一小部分作为北方成分,但还是假定绝大多数时东南亚成分,而上文最南方的族群是东南亚人群,而他们与雅库特只共享0.5%也在情理之中。

总之,这类分析绝多数值意义不大,还是要看相对数值。比如说,中国傣族相对东南亚人群还是与北方人群有着更多一些血统共享的。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
然而东南亚山地民族的文章里傣族的东南亚成分有95%,与DIENEKES的结果并没有太大差别。要说参照系的话,估计也是汉族中的很多成分算作东南亚成分,而这些成分之所以算成东南亚成分是因为遗传距离与东南亚更近。虽然 ...
sahaliyan 发表于 2011-7-1 22:26
遗传距离的分析图谱相当于混合后的主成分分析,关系不大,这个还是人为选择后的差异。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
因为甚至雅库特都有高比例的东南亚成分。
...
sahaliyan 发表于 2011-7-1 14:18
.
      记得以前有一位国内的通俗历史作家有一句名言:文明就如烈性传染病,会很快传给任何与它接触的人群。(大意如此)
       我看DNA也差不多,总会在空气中飘来荡去~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
这张图东北亚成分和东南亚成分的划分由于样本的原因其实是不精确的。在大东亚人群常染的图上,虽然没有柬埔寨人常染的样本,但是根据附近泰国曼谷的人群的样本,我们可以看出中南半岛除了最南端的马来西亚外,都是远东成分和南亚成分兼有的格局。真正纯正的南亚成分人群,出现在印尼西部和菲律宾以及马来西亚,而这张图上,没有出现以上样本,而是以柬埔寨作为南亚人群的代表,这样一来就不可避免的把划分南北标准的界限往北部推。
http://www.ranhaer.com/thread-15039-3-1.html
比如这个K=7和K=8的时候变化就很大,K=8的时候,达斡尔族出现一种绝对主体成分。而K=7的时候却不是如此,显然是不同成分融合的结果。而汉族在K=7的浅绿色很少,到K=8 ...
sahaliyan 发表于 2011-7-1 22:45
.
          好见地~
物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平...
远东人种成分并不存在。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
http://www.ranhaer.com/thread-15039-3-1.html
比如这个K=7和K=8的时候变化就很大,K=8的时候,达斡尔族出现一种绝对主体成分。而K=7的时候却不是如此,显然是不同成分融合的结果。而汉族在K=7的浅绿色很少,到K=8 ...
sahaliyan 发表于 2011-7-1 22:45
同样一种颜色,在不同值时的含义是不一样的,比如k=4时,蒙古人种共享的一种颜色是黄色,那么当k=12时,这个黄色还是存在的,但显然与k=4时的含义不同了。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
但是,你看看K=7的情况,达斡尔族是没有主体成分的,到K=8的时候就有了绝对主体成分
sahaliyan 发表于 2011-7-1 23:34
这种图我还没自己学着做,所以一些具体的细节也不太清楚,但从不同作者的做的图差别很大这一点来看,人为因素是很强的。目前所使用的数据基本都是一样的。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
本帖最后由 fjnj 于 2011-7-1 23:57 编辑

从网友的评论来看, 有必要解释一下Dodecad v3的设计:

以下为dienekes'的原文:
The design of Dodecad v3
Dodecad v2 was short-lived, as I discovered a way to improve it shortly after I announced it.

The first step was to carry out an extensive K=3 ADMIXTURE analysis of about 130 different populations and about 2,000 individuals from Europe, Asia, and Africa. Using the allele frequency results of this analysis I was able to create the most comprehensive synthetic individuals to represent West Eurasians, Asians, and Sub-Saharan Africans.

Subsequently, I carried out an analysis of East Eurasian populations using the West Eurasian/Sub-Saharan synthetic individuals as controls, as well as an analysis of Sub-Saharan populations using the West Eurasian/Asian individuals as controls.

In East Eurasia, I was able to infer the existence of two components, one centered in the extreme northeast, another in the southeast, with many other populations arrayed between these two extremes:


In Sub-Saharan Africa, the primary division was between San, Mbuti, and Biaka Pygmies (whom I have called "Palaeo-Africans") and the rest (Yoruba, Mandenka, and Bantu, "Neo-Africans"):


Now, I had four synthetic "framing populations": Neo-Africans, Palaeo-Africans, Northeast Asians and Southeast Asians, created from hundreds of individuals from several different populations:

    I did not have to choose a particular population (e.g., Chinese) to represent East Asia
    I did not have to aggregate individuals from populations with variable levels of non-East Asian admixture

I now used my South Asian populations, together with Neo-African, West Eurasian, Northeast and Southeast Asian controls to extract a South Asian specific component:



Armed with these 5 synthetic "framing" populations, I carried out a K=12 analysis with my West Eurasian, South Asian, and North/East African populations (1,247 individuals; 69 populations):

And, finally, I generated 50 synthetic individuals from each of the 12 inferred components to create a dataset of 600 individuals that will be the basis of Dodecad v3.

Below is the table of Fst divergences:



The following MDS plots show the first 10 dimensions of variation of these individuals:

Finally, here is a neighbor-joining tree of the 12 components:
1

评分次数

其实常染色体snp分类,也和我们更熟悉的y-snp类似,想分清楚那个是南哪个是北很困难的,不同人的分析往往差别很大,甚至k在不同值是变化也很大,都可能与这些有关。
新技术方案尝试:低覆盖全基因组,最低成本深度解析父系源流,略有成效,大家一起摸索。微博@基因人王冰 QQ群:387100816。
安德曼岛的土著
ADMIXTURE Onge_12.png
2011-7-2 06:04
Onge-couple.jpg
25# sahaliyan
这个我当然看的懂。这里的东北亚成分近似于原始的乌拉尔--北极成分。
返回列表
baidu
互联网 www.ranhaer.org