Yungsiyebu 发表于 2018-9-16 19:51

增加指数脑容量,会不会明显影响PCA结果?

把一些容易反复扯皮的问题单拉一下,避免浪费口舌。


PCA怎么读,直接用数据导出cluster,是不是比谁谁主观臆断,是不是更好?就像,有人声称,加入脑容量会剧烈影响PCA结果。一个比华北汉族与马来人遗传距离都更远的两个古代样本,都被归入古中原类型,到底靠不靠谱,一目了然。
Yungsiyebu 发表于 2018-7-17 22:15 http://www.ranhaer.com/images/common/back.gif

http://www.ranhaer.com/attachments/forumid_43/1807172215e3ea5b7e0ddadb72.png.thumb.jpg
http://www.ranhaer.com/attachments/forumid_43/1807172215224f3f8df923a9e3.png.thumb.jpg

Yungsiyebu 发表于 2018-9-16 19:56

类似,部分的残缺数据会不会严重影响PCA结果,多数情况事实上不会。

录入更大样本,删除残缺的古华南类型样本,PCA主成分聚类分析结果如下图,结论一致,古华南类型多数样本依然介于波利尼西亚人种和澳大利亚-美拉尼西亚人种之间,与全部现代蒙古人种,包括马来人种,差异明显。

说明,北亚组和东北亚组略重叠,安达曼组和菲律宾尼格利陀组略重叠,有点遮挡。

这是录入更多残缺古华南样本,颅高数据缺失的PCA结果。大家可以比对,可见一两项指标缺失并不会影响种系分析结果。情况与之前,加入脑容量和不加入脑容量,结果基本上没有差异。http://www.ranhaer.com/attachments/forumid_43/18080723490157c18d37aa8a30.png.thumb.jpg

http://www.ranhaer.com/attachments/forumid_43/1808062229b3622c2692cb7a87.png

Yungsiyebu 发表于 2018-9-16 20:00

类似,即使分别用全组数据和分别用测量数据和指数数据做PCA,结果也不会有特别颠覆性的变化。

http://www.ranhaer.com/attachments/forumid_43/1808062326b4048f853f7c2bbc.png.thumb.jpg
http://www.ranhaer.com/attachments/forumid_43/180806232619254e6ec43f4830.png.thumb.jpg
http://www.ranhaer.com/attachments/forumid_43/18080623269e41865db36fa3fd.png.thumb.jpg

情况很类似,我们1,000snp和100,000snp跑出来的admixture通常不会有什么明显区别,除非有人为选择,比如wegene筛选的中国人特异数据,可能就会有所不同。
页: [1]
查看完整版本: 增加指数脑容量,会不会明显影响PCA结果?