Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
查看: 833|回复: 5

猜测,微基因参考集产生的方式

[复制链接]
发表于 2018-6-27 14:52 | 显示全部楼层 |阅读模式
解释pop取样点,却不是pop最高频区域的原因
 楼主| 发表于 2018-6-27 14:54 | 显示全部楼层
模式1:直接unsupervised产生虚拟祖先人群的pop。参考集是有福建和信阳的人群的。然后在admixture的过程中,分离出一种pop,这种pop是福建的主要pop(60%以上),于是这种pop被命名为南汉。同理,在信阳人高频的pop,被命名为北汉。
 楼主| 发表于 2018-6-27 14:55 | 显示全部楼层
模式2:先unsupervised,再supervised。产生了这个pop以后,发现福建的个体,这个pop的比例从40-90%不等,筛选出这个pop占比90%以上的个体,再用这些相对“纯”的个体作为参考集,进行supervised的admixture。
 楼主| 发表于 2018-6-27 14:56 | 显示全部楼层
模式3(猜测魔方是使用这种模式):先降维,再supervised。先把所有的参考集降维,做成二维的图(pca/mds),删除各参考集相互之间交叠的样本,确保各参考集分得足够开。在删除以后,保留下那些相对“纯”的样本,再进行supervised admixture
 楼主| 发表于 2018-6-27 14:57 | 显示全部楼层
三种做法,各有不同,但是无论哪种,产生的pop都不会是当地人群的实际基因频率,而是经过筛选处理,产生了被认为“纯粹”的pop。
这就解释了解释pop取样点,却不是pop最高频区域的原因
发表于 2018-6-27 18:15 | 显示全部楼层
分析的有道理~
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2018-10-16 23:08 , Processed in 0.210425 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表