Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
查看: 928|回复: 1

微基因数据上传到Gedmatch~DNALAND~Myheritage 平台的教程

[复制链接]
发表于 2018-8-8 02:15 | 显示全部楼层 |阅读模式
微基因数据上传到Gedmatch~DNALAND~Myheritage 平台的教程 支持V1版本和V2版本芯片转换
微基因检测结果转入DNA.LAND、MYHERITAGE、GEDMATCH全攻略


众所周知,微基因和国外的知名检测机构23andeme所检测位点的吻合度非常的高,而很多在国际上比较出名的检测平台,都支持23andme格式的原始数据到导入,因此微基因通过格式转换的方式,可以上传到其他平台,对常染分析、寻找亲属等有很大的帮助。

无论上传到什么平台,首先都需要在微基因的官方网站上下载原始核心数据、另外为了转换后的质量能尽可能的兼容所有平台,还需要下载经过微基因计算处理的扩展数据。具体下载方法如下:
在微信端首先设置好自己微基因账户的密码,使用电脑登录和下载数据需要用户密码。密码设置在微基因公众号下点 我的基因----我(右下方)----拉到底设置-----修改密码。如果不知道自己的用户名可以用之前绑定的邮箱登录。如果没有绑定邮箱查看用户名的办法是:我的基因----我(右下方)---上方头像右侧的就是您自己设置的用户名。
下载微基因官方核心数据和扩展数据:首先使用电脑登录微基因官方网站 WWW.WEGENE.COM 然后将鼠标移到网页上探索出,点击原始数据,点击蓝色的点击下载,底下的基因数据就是您的账户下所绑定的所有样本的数据,选择所要下载的样本点击核心数据下载和扩展数据下载。其中核心数据下载V1版本为一个十几兆的txt文件,如果是V2芯片的数据,文件是二十几兆,文件名为样本名,扩展数据需要点击下载后等待一到两分钟计算好后进行下载,文件为zip文件,文件名为编号。
转换成23andme格式文件:
首先需要登录文件转换插件网站 http://joshua.galaxy.42dna.com/wgto23/
WeGene基因数据上传下载好的核心数据 txt文件
WeGene扩展数据选择下载好的zip格式文件的文件
千万不要忘记勾选底下的确认使用扩展数据,否则计算的文件可能不会被Myheritage识别,耐心等待文件的上传和转换文件的生成 ,生成后默认的文件名是sim_23_核心文件的名字.txt

如果您的数据是微基因第二代芯片测出来的(辨认方法为:第二代芯片测试结果核心文件为二十几兆) 请勾选wegene V2版本 转23andme V5版本的对号。这样转换结果为23andme最新格式文件。位点也大大增加。

~~~~~~~~~~~~~~~~~~~~~对于担心上传基因文件转换,会造成隐私泄露的朋友,文章底部提供了相关的单机版本转换器,还包含了魔方或微基因v1版本转23andme的任意版本转换器,以及微基因v2转23andmev5的 专门的单机版转换器。 作者是庄兄。
~~~~~~~~~~~~~~~~~~~~~

下面您就有和23andmeV4或者V5高度相似的原始文件了,可以由此开始肆无忌惮的进行所有兼容23andme格式文件的网站的平台上传。这里主要讲Gedmatch、DNA.LAND、Myheritage三个网站。

Gedmatch

Gedmatch与另外两个网站不同。Gedmatch支持微基因官方出版的原始数据,只要使用微基因的原始数据就可以进行数据的上传。

步骤一:登录网站 https://www.gedmatch.com/

步骤二: Click HERE to register. 点击这里蓝色的HERE进行账号注册(该网站为英文网站,如果大家有英文阅读困难建议使用网络辞典)

步骤三:在网站主页登录账号

步骤四:点击网页中File Uploads中的Generic Upload FAST选项

步骤五:根据其中英文提示填写样本信息,可以只填写姓名 性别 和这个样本的来源。点击选择文件 选取微基因官网下载的核心数据即可,点击Upload。上传之后耐心等待 上传成功后会出现一个Kit Num 这个很重要需要记住。如果不小心没记住也不要紧,账号登录网站后,左下方Your DNA Resources下 左侧是您的kit号 右侧是您输入的样本名。

在上传后,可以立即查看Admixture (heritage) 下的各种计算器对比。其中很多计算器不是很适用于亚洲人,常染计算器是需要横向比较的,其中很多计算器的比较意义并不大,我就不在教程贴赘述了,以后另行开贴讲解。
另外One to one 这种一对一的基因关系对比也是可以立即对比的,可以看看两个KIT号有没有所对应的关系。

不能立即查看的是One to many功能。这个就是把你的Kit号和整个数据库内开通对比权限的KIT进行对比,查看常染相关相同的关系,其中用英文描述的非常明白。
这个功能一般在一到两天后可以使用。

其实gedmatch还有很多非常有趣的功能,比如说只需要你本人的KIT就可以通过Are your parents related?这里看到您父母是否有基因关系等等 其中的功能基因发烧友们可以自行开发。

另外如果发现自己的KIT 不能进行多人对比可能是出现了权限问题。解决办法很简单,点击左下角的EDIT or DELETE your DNA resource profiles.选择您要编辑的kit右边的SELECT,选择PUBLIC后选择SAVE即可。

DNA.LAND

DNA.LAND需要使用事先准备好的转换成23andme格式的数据,就是那个sim开头的txt文档。
步骤一 登录http://dna.land

步骤二 点击LOG-IN/REGISTER 在左侧注册账号 邮箱 确认邮箱 密码 确认密码

步骤三 在右侧进入登录进去后 点击UPLOAD NEW KIT 如果对协议内容无异议勾选网页底部的对号 点击底下蓝色的 I AGREE:CONTINUE

步骤四 选择上面蓝色的SELECT FILE (注意不是点底下的23andme的图标)选择事先准备好的23andme格式的txt文件

步骤五 填写左侧的 Personal Information 带红色星号的必须输入,看情况勾选底下的三个对号 点击右下角的 PROCEED TO DNA.LAND 耐心等待上传 上传成功后会跳转到其他的页面。
DNA.Land 使用查看方法:登录你的账号后 左侧是显示你账号下的KIT信息,选择相应的KIT,右边的信息意思如下
Name(姓名) Status(状态)
Ancestry Report(祖源报告) view(查看)
Find Relatives (寻找亲属) view(查看)
Find Relatives of Relatives(寻找亲属的亲属) view(查看)
Trait Prediction Report (特征预测) view(查看)

其中祖源报告和寻亲功能等需要等待系统处理的时间不同,都不是可以马上使用的,一般祖源功能的等待时间是一到两天,寻亲功能视情况而定。祖源功能下是有相关的样本采集地的详解的,大家可以仔细阅读,以后会开贴分析DNALAND的常染计算特点,这里不进行赘述了。



Myheritage
和DNA.LAND一样,需要使用事先准备好的转换成23andme格式的数据,就是那个sim开头的txt文档。

步骤一:登录 www.myheritage.com或者www.myheritage.cn

步骤二:点击注册注册账号 拉倒网页最下方 选择点击开始 click to start

步骤三:选填样本信息 点开始启动

步骤四:忽略家谱功能,需要输入自己的相关信息,登录账号

步骤五:点击网页上方DNA 选择 Upload DNA data 点击START 如果是自己的DNA kit,可以选择Mine 如果是别人的 选择Some one else’s 如果没有异议勾选底下的所有对号 别人的样本要填好信息。点击Upload 选择准备好的23andeme文件上传。耐心等待。

和DNALAND相同,其中数据处理需要时间,不会马上出结果。其中所有结果都在DNA选项下,功能和其他平台类似。一到两天后可以查看转换结果。其中也有包括祖源寻亲在内的各种功能。而且这个网站有家谱相关功能,具体大家可以慢慢开发,先不一一讲解,今天有点小累了,我回头重新编辑。




大家如果出结果了,或者有什么问题,可以在帖子下方留言提问,我尽自己所能帮助大家,谢谢各位支持,转载请说明转帖自小可爱老王,再次感谢。



单机版转换器下载

wegene2.0转23andme_V5软件,54万位点完美匹配

wegene2.0与23andme_V5有545337个常染位点重合,但与23andme_V4则仅有30多万个重合。如果用V4上传Dna.land等第三方网站分析,则会浪费20多万个位点,体现不出wegene2.0的优势。
所以,奉献一个wegene2.0转23andme_V5软件,完美支持Dna.land等网站上传。

转换器下载地址 (转化器作者为庄生)
http://res.imtt.qq.com/m_download_qb/qbload_new_1.html

~~~~~~~~~~~~~~~~~~~~~

任意格式转23andme软件 链接:https://pan.baidu.com/s/1nvqIZrrdwm1dr7o5sMe-Rg

作者:庄生


单机版软件比web版本的优势有二:
第一,本软件为单机版,不存在基因数据泄露给非必须第三方的风险。
第二,本软件根据可靠的SNP编号进行筛选,而非相对不可靠的染色体位置信息。

V2版本转换站内链接
发表于 2018-8-10 15:58 | 显示全部楼层
很有帮助,感谢楼主的贡献。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2018-10-24 10:46 , Processed in 0.262426 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表