Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
查看: 1433|回复: 14

大数据汇总共享:Bam转23andme-like

[复制链接]
发表于 2018-8-19 15:11 | 显示全部楼层 |阅读模式
本帖最后由 Yungsiyebu 于 2019-5-24 12:51 编辑

有一个小程序可以便捷的将Bam大文件提取出类23andme的genotype数据,便于使用gedmatch等流行分析工具。名字叫:tkrahn/extract23。可github免费下载使用。readme文件中的命令代码有详细说明,Linux系统。不过,我尝试提取欧亚草原样本和田园洞样本的BAM文件,结果导出的内容是空的,没有任何错误提示,还没找到原因,大家试试吧。

https://github.com/tkrahn/extract23

y-str.org还提供了一个windows版的程序BAM Analysis Kit ,也可以做类似的提取,发烧玩生信工具,把win7卸载好久,没亲自试,但网友有用的,可以通。

http://www.y-str.org/2014/04/bam-analysis-kit.html


另外,经典工具GATK应当也可以实现,但还没去学。

有其它开源代码,也欢迎分享。

因为Bam太过庞大,下载和运算都太费劲,我拉一个共享帖,欢迎大家一起下载和转化数据,把23andme-like格式的数据汇总一下。

我先开头,用tkrahn/extract23提取的阿穆尔鬼门洞Mos4/Mos5/Mos6,上传云盘,欢迎下载。

23andme_like data:
链接: https://pan.baidu.com/s/1ZiReY10dkJZUIFh9mlxpJw 密码: hgpe


另外,genotype还上传至gedmatch,大家可以随时查看,其中,Mos6有效数据量太小,未被gedmatch接受。

gedmatch ID
Mos4: M643438
Mos5: M940107

更新:

田园洞Bam文件不是Hg19作为ref,所有提取时出现问题,调整一下,跑出来数据,更新到网盘,链接同上。

gedmatch ID
Tianyuan: M575278

更新:越南新石器时代样本:

Vietnam_neolithic_I0626.1240K: M217159

更新:马来西亚前农业时代样本:

Ma911: M777094

更新:日本绳纹人样本:

IK002 Jomon: M592785

更新:哈萨克斯坦铜石并期Botai文化

Botai_BKZ001: KM5937700
Botai_BKZ002: PK7751810


评分

1

查看全部评分

 楼主| 发表于 2019-5-25 10:56 | 显示全部楼层
imvivi001 发表于 2019-5-25 10:53
的确是的,比如说继承了49%ANE成分的“西伯利亚玛尔它男孩,与ANE古人没有关系”之类的金句,其他的 ...


跟黄秋生代表英格兰一样的道理。那个计算器的所谓ANE根本与malta Yana afantova等ANE人群无关。
发表于 2019-5-25 10:42 | 显示全部楼层
Yungsiyebu 发表于 2018-8-19 15:13
Mos4和Mos5的K7b计算结果,大家参考。

结果来看,在未录入Ulchi/Nivkh等潜在的更近人群时,Mos4-Mos5与 ...

  


    小云老师此处选用了低k的K7b,不过依然可以看出,7千年前的鬼门穴古人最接近的是北亚最典型的农耕民族达斡尔,而不是挨得更近的渔猎民族鄂伦春或赫哲族,这是耐人寻味的。(我们知道,现代达斡尔人是带有较多东亚成分的而且带有较多的南方东亚成分EAS2)

    如果把k级提升到12,那么在K12b的分析图中,可以明显看到之前在较低k级的“西伯利亚成分”,其实是东亚成分与相对较纯的“新西伯利亚成分”的混合(其实也不是真正的ANE,依然是ANE与更早的东亚成分的混合)。 另外,之前鬼门穴古人的“东亚成分”,其实是带有明显的“华南成分”的,如下:

     
      鬼门穴M4-K23b.jpg
 楼主| 发表于 2018-8-19 15:13 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2018-8-19 15:21 编辑

Mos4和Mos5的K7b计算结果,大家参考。

结果来看,在未录入Ulchi/Nivkh等潜在的更近人群时,Mos4-Mos5与阿穆尔河流域的达斡尔、鄂伦春、赫哲族等最为接近。
Mos4-k7b.png
Mos5_K7b.png
Mos4_FstDistance.png
Mos5-FstDistance.png
 楼主| 发表于 2018-9-8 11:19 | 显示全部楼层
更新日本绳纹样本IK002。欢迎更多朋友一起处理各类Bam数据,转化为23andme-like格式。
Jomon-K7b.png
Jomon-K12b.png
Jomon-Harappaworld.png
发表于 2018-9-8 21:59 | 显示全部楼层
Mos4和Mos5的K7b计算结果,大家参考。

结果来看,在未录入Ulchi/Nivkh等潜在的更近人群时,Mos4-Mos5与阿穆尔河流域的达斡尔、鄂伦春、赫哲族等最为接近。
Yungsiyebu 发表于 2018-8-19 15:13
.

     建议把K12b的结果发上来~
 楼主| 发表于 2019-5-24 12:51 | 显示全部楼层
Botai_BKZ001: KM5937700
Botai_BKZ002: PK7751810

哈萨克斯坦铜石并期Botai文化
发表于 2019-5-24 22:34 | 显示全部楼层
俺算是看出来了,云老师周期性地爆发一些小高潮
 楼主| 发表于 2019-5-25 10:53 | 显示全部楼层
imvivi001 发表于 2019-5-25 10:42
小云老师此处选用了低k的K7b,不过依然可以看出,7千年前的鬼门穴古人最接近的是北亚最典型 ...

典型的以今推古,devilgate是单纯的细石器文化,与东亚更不要提华南东南亚同时代文化没有任何关联。devilgate与东亚东南亚有血统关联,显然是北方种系南下的结果,古DNA也证实了,东南亚同时代人种与蒙古人种无关,是类尼格利陀人种。

评分

1

查看全部评分

发表于 2019-5-25 10:57 | 显示全部楼层
鬼门洞之前我已经分析过多次,原文给出的常染图上看仍然最接近今天的通古斯人群,尤其接近乌尔其人,而跟东南亚还有着相当一段距离,因此说什么鬼门洞类南岛纯粹是无稽之谈。不论是K=5还是K=8,鬼门洞都缺乏东南亚常见的蓝色成分。


发表于 2019-5-25 11:02 | 显示全部楼层
imvivi001 发表于 2019-5-25 10:53
的确是的,比如说继承了49%ANE成分的“西伯利亚玛尔它男孩,与ANE古人没有关系”之类的金句,其他的 ...


     本月最佳金句,存照留念~

      玛尔它M1-ane-小云20190523.png
发表于 2019-5-25 11:14 | 显示全部楼层
lindberg 发表于 2019-5-24 22:34
俺算是看出来了,云老师周期性地爆发一些小高潮


      的确是的,比如说继承了49%ANE成分的“西伯利亚玛尔它男孩,与ANE古人没有关系”之类的金句,其他的暂且不提~
发表于 2019-5-25 11:18 | 显示全部楼层
Yungsiyebu 发表于 2019-5-25 10:53
典型的以今推古,devilgate是单纯的细石器文化,与东亚更不要提华南东南亚同时代文化没有任何关联。devilgate与东亚东南亚有血统关联,显然是北方种系南下的结果,古DNA也证实了,东南亚同时代人种与蒙古人种无关,是类尼格利陀人种。

       真是牢冇好意思,您的高贵的鬼门穴古人,居然带有那么多“次撒哈拉非洲成分”,咋整呢?

鬼门穴M4-K23b.jpg



发表于 2019-5-25 11:31 | 显示全部楼层
Yungsiyebu 发表于 2019-5-25 10:56
跟黄秋生代表英格兰一样的道理。那个计算器的所谓ANE根本与malta Yana afantova等ANE人群无关。


    所以黄秋生与英格兰无关?(尽管他老爹好像是苏格兰)
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2019-6-19 09:05 , Processed in 0.131002 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表