Google

蓝海人类学在线 Ryan WEI's Forum of Anthropology

 找回密码
 注册
查看: 1227|回复: 1

尼泊尔古DNA样本持续分型继续ing

[复制链接]
发表于 2019-8-22 12:32 | 显示全部楼层 |阅读模式
本帖最后由 Yungsiyebu 于 2019-8-28 22:16 编辑

文献判断为M117+,最古老的,Chokopani sample C1,这两天牛车一样的速度把C1样本的第一个Run的数据下载下来了,SRR2751055。其他进行中。

https://www.ncbi.nlm.nih.gov/sra/SRR2751055
https://www.ncbi.nlm.nih.gov/sra/SRX1629437

原始数据太庞大,最小的数据也下载和分析好久。SRR2751055。结果先分享。其中O类型下,2个O的定义marker阳性,这样,O大分型应当没有问题。

然后,就是CTS9678+下的一个分支O2a2b1a1a1c1a1a2a Z44925阳性,Isogg官网最新更新的点。Yfull还没有录入。附件中是Bam文件中的组装上的这段序列,只有20多个bp,可靠性有待验证。

Hg38位置        参考序列        读取次数        读取结果        测序质量
14517051        A        1        T        I        14517051 O F355 M1754 rs1864258 16628931 A->T        
14517051        A        1        T        I        14517051 O M1754 F355 rs1864258 16628931 A->T        
20939915        g        1        t        I        20939915 O2a2b1a1a1c1a1a2a Z44925  rs773476411 23101801 G->T        


另外,在M117+下,还覆盖到另外两个marker,其中一个为A9468,是CTS1642下游突变,阴性。另一个是F693,是F6800下游支系,阴性。
Hg38位置        参考序列        读取次数        读取结果        测序质量       
16048660        T        1        .        I        16048660 O2a2b1a1a1a2a1 F693  rs762169605 18160540 T->G
19217699        a        1        ,        F        19217699 O2a2b1a1a1a4a2a2 A9468  rs756741162 21379585 A->C
20939915        g        1        t        I        20939915 O2a2b1a1a1c1a1a2a Z44925  rs773476411 23101801 G->T


其它Run下载中,有待验证。

SRR3222686,更新另一个Run,26G+的SRA文件,两个Fastq各接近100G。

在这个run中,有一个O2a2b1a1a1a3a1a1a1-Z42620突变,但其上游覆盖到多个位点,均为阴性,因此,可以排除。

Hg38位置        参考序列        读取次数        读取结果        测序质量        Hg38位置        单倍体群        基因标记        标记别称        RS编号        Hg19位置
9575353        t        5        ..,,,        JJFJF        9575353        O2a2b1a1a1a3a        Z25853        rs747718394        9412962        T->C
13707108        g        3        ,.,        JJJ        13707108        O2a2b1a1a1a3a1        CTS4789        rs756118225        15818988        G->A
13886009        G        4        ,,..        FJFF        13886009        O2a2b1a1a1a3a1        CTS5063        rs749298987        15997889        G->A
15359173        T        6        .,..,,        JJJJJF        15359173        O2a2b1a1a1a3a1        CTS7418        rs778585655        17471053        T->A
14817956        g        1        ,        J        14817956        O2a2b1a1a1a3a1a1        Z25903        rs778695956        16929836        G->A
21297621        t        2        .,        AJ        21297621        O2a2b1a1a1a3a1a1        Z25905        rs748922311        23459507        T->G
15202721        t        1        c        J        15202721        O2a2b1a1a1a3a1a1a1        Z42620        rs775489568        17314601        T->A
14584712        g        1        .        <        14584712        O2a2b1a1a1a3a1a2        F20963        rs757227540        16696592        G->A
19673019        g        2        .,        JJ        19673019        O2a2b1a1a1a3a1a2        Z44927        21834905        G->A       


O2a2b1a1a1a4a-CtS1642,携带突变,但在覆盖到的下游位点,没有突变,尚未十分肯定,但很有可能。
读取次数        读取结果        测序质量        Hg38位置        单倍体群        基因标记
1        a        J        11881505        O2a2b1a1a1a4a        CTS1642
3        .,.        JJJ        17296085        O2a2b1a1a1a4a2        Z25928
3        ,.,        JJA        14942801        O2a2b1a1a1a4a2a1a1        Z26031
2        .,        JJ        12881150        O2a2b1a1a1a4a2a1b        Z26013
3        ,.,        <JJ        14080322        O2a2b1a1a1a4a2a1b        Z26014
1        .        J        8867377        O2a2b1a1a1a4a2a2        A9464
4        .,.,        JJJF        14187047        O2a2b1a1a1a4a2a2        A9467
6        .....,        JJJJJJ        19217699        O2a2b1a1a1a4a2a2        A9468
2        .,        JJ        8614317        O2a2b1a1a1a4a2a3        Z39704
2        .,        FJ        19011457        O2a2b1a1a1a4a2a3a        Z39705
6        ,.,,..        >7JFJJ        21262537        O2a2b1a1a1a4a2a3a        Z39708
5        ...,,        JFJ7J        19533107        O2a2b1a1a1a4a2a3a1        Z39706
3        .,,        JJF        19534442        O2a2b1a1a1a4a2a3a1        Z39707


上一个run中的O2a2b1a1a1c1a1a2a-Z44925位点,在这个run中覆盖到多个上游位点,但结果均为阴性,因此,可以排除。

读取次数        读取结果        测序质量        Hg38位置        单倍体群        基因标记
6        ...,,,        JJJF<J        20574925        O2a2b1a1a1c        CTS10738
6        ...,,,        JJJF<J        20574925        O2a2b1a1a1c        M1707
6        .,..,,        JJJJJF        7279654        O2a2b1a1a1c        CTS1017
6        .,..,,        JJJJJF        7279654        O2a2b1a1a1c        M1532
1        .        F        19392837        O2a2b1a1a1c        M1694
2        .,        JF        21315272        O2a2b1a1a1c        M1726
3        ..,        JJJ        2957664        O2a2b1a1a1c1a1        E261
3        ..,        JJJ        2957664        O2a2b1a1a1c1a1        M1518
5        ..,,.        AJJJJ        8779294        O2a2b1a1a1c1a1        Z25850
1        ,        J        21149813        O2a2b1a1a1c1a1a        M1722
2        ..        JJ        21632224        O2a2b1a1a1c1a1a        E543^^
2        ..        JJ        21632224        O2a2b1a1a1c1a1a        M1727^^
2        .,        JJ        11985023        O2a2b1a1a1c1a1a1        Z39663
2        ,,        JJ        13265445        O2a2b1a1a1c1a1a2        M1604
2        .,        JJ        12956136        O2a2b1a1a1c1a1a2a        M1602
2        ..        JJ        14890734        O2a2b1a1a1c1a1a2a        M1637
5        ,.,.,        JJJAJ        19078926        O2a2b1a1a1c1a1a2a        M1688
2        .,        JJ        12335591        O2a2b1a1a1c1a1a2a        Z44923
1        ,        J        14796631        O2a2b1a1a1c1a1a2a        Z44924


CTS1642的上游位点,多数位点突变都是存在的。这样,CTS1642应当是当前两个run概率最高的。

读取次数        读取结果        测序质量        Hg38位置        单倍体群        基因标记        标记别称
1        T        J        17401190        NO        or        K2a
1        T        J        17401190        NO        or        K2a
1        T        J        17401190        NO        or        K2a
1        T        J        17401190        NO        or        K2a
1        C        F        13360045        NO1        or        K2a1
1        C        F        13360045        NO1        or        K2a1
4        TtTt        JJJJ        7389453        O        CTS1182        M1740
4        TtTt        JJJJ        7389453        O        M1740        CTS1182
1        T        J        12684429        O        CTS3283        M1749
1        T        J        12684429        O        M1749        CTS3283
1        ,        J        13912404        O        CTS5118        M1752
1        ,        J        13912404        O        M1752        CTS5118
1        c        J        14205386        O        CTS5493        M1753
1        c        J        14205386        O        M1753        CTS5493
2        Gg        AJ        15423152        O        CTS7553        M1759
2        Gg        AJ        15423152        O        M1759        CTS7553
1        A        J        16063935        O        CTS8746        M1763
1        A        J        16063935        O        M1763        CTS8746
1        G        J        16518305        O        CTS9039        M1766
1        G        J        16518305        O        M1766        CTS9039
78        .$.$....,,..,.,,.,,,,,..,,,,......,t,,,,,,,,,,,,.,,..,.,,,,.,,t...,..,.,....,,,.        ABJJJJJJ<JF7JJJJJJJJJJJJJJFJJJFJJJFJJJFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFJJJF        16858290        O        CTS9577        rs200616343
1        .        J        20615310        O        CTS10784        M1779
1        .        J        20615310        O        M1779        CTS10784
2        Gg        FJ        16509420        O        F494        M1765
2        Gg        FJ        16509420        O        M1765        F494
6        aAAAAa        0JJJJJ        17209062        O        F537        M1769
6        aAAAAa        0JJJJJ        17209062        O        M1769        F537
2        Tt        FJ        17272669        O        F540        rs72611684
3        Ccc        JJF        17369000        O        F546        M1770
3        Ccc        JJF        17369000        O        M1770        F546
1        T        J        20004569        O        F600        M1777
1        T        J        20004569        O        M1777        F600
1        t        J        20397115        O        F614        M1778
1        t        J        20397115        O        M1778        F614
1        A        J        21829172        O        F668        M1782
1        A        J        21829172        O        M1782        F668
2        Aa        JJ        11497116        O        FGC12433        rs72607998
2        Aa        FJ        19321399        O        M1772        rs201951932
1        T        J        19463341        O        M1774        rs79890836
2        Cc        JJ        10202311        O        Z16962        rs72619870
1        G        J        19602788        O2        M122        rs78149062
2        tt        JJ        20573824        O2        CTS10736        rs80262406
2        Aa        FJ        15219730        O2        F400        rs75702914
3        CCc        JJ<        20769171        O2        F633        rs78109950
1        A        J        15865543        O2a        CTS8399        rs79310124
1        a        J        8922944        O2a        F166        rs78945156
2        TT        JJ        12757572        O2a        P93        Page79
2        TT        JJ        12757572        O2a        Page79        P93
1        c        J        15591667        O2a2b        F427        rs75640541
2        Aa        JJ        7443127        O2a2b1        CTS1287        rs201040012
2        Gg        JJ        7941728        O2a2b1        F100        M1546
2        Gg        JJ        7941728        O2a2b1        M1546        F100
3        Aaa        JJJ        12656930        O2a2b1a1        CTS3251        rs761714165
2        Cc        3J        13916516        O2a2b1a1        CTS5128        M1619
2        Cc        3J        13916516        O2a2b1a1        M1619        CTS5128
1        t        7        14902615        O2a2b1a1        CTS6623        M1638
1        t        7        14902615        O2a2b1a1        M1638        CTS6623
1        T        J        14768205        O2a2b1a1        F373        M1636
1        T        J        14768205        O2a2b1a1        M1636        F373
1        ,        J        12671503        O2a2b1a1a        CTS3270        rs753417706
1        a        J        11881505        O2a2b1a1a1a4a        CTS1642        rs756878296
chrY20939915-SRR2751055.png
 楼主| 发表于 2019-8-29 16:07 | 显示全部楼层
本帖最后由 Yungsiyebu 于 2019-8-29 16:17 编辑

D样本的第一个run,编号SRR2751148,Samdzong 41

结果:

参考序列        读取次数        读取结果        测序质量        Hg38位置        单倍体群        基因标记
g        2        Aa        IF        13893646        D        CTS5085^
g        2        Aa        IF        13893646        D        Z1607^
A        1        c        I        7261650        D        F3845
A        1        c        I        7261650        D        Z1588
c        2        Aa        0        7752511        D        V1288
c        2        Aa        0        7752511        D        Z3711
g        1        A        F        13170094        D~        CTS3946
a        1        g        B        16099817        D~        CTS8801
c        2        Tt        FI        15707146        D1a1a        Z27323
g        1        A        <        19490726        D1a1a1a        YP4237
g        1        A        <        19490726        D1a1a1a        Z27338
a        1        T        I        9230462        D1a1a1a        Z27285
A        1        g        F        13982443        D1a1a1a        Z27315
c        1        A        I        15503738        D1a1a1a1a~        Z29437
a        1        t        I        10626257        D1a1a1a2        Z31603


上下游看,D1a1a1a1a~Z29437,有一层D1a1a1a1未覆盖到。而D1a1a1a2-Z31603是连续的,上游突变都阳性。所以,暂判断为D1a1a1a2-Z31603。

该类型为D-N1下游分支。

https://www.yfull.com/tree/D-N1/

参考序列        读取次数        读取结果        测序质量        Hg38位置        单倍体群        基因标记
g        1        A        <        19490726        D1a1a1a        YP4237
g        1        A        <        19490726        D1a1a1a        Z27338
a        1        T        I        9230462        D1a1a1a        Z27285
A        1        g        F        13982443        D1a1a1a        Z27315
c        1        A        I        15503738        D1a1a1a1a~        Z29437
T        2        .,        <<        18651823        D1a1a1a1a2        Z43920
a        1        t        I        10626257        D1a1a1a2        Z31603
c        2        .,        IF        7423920        D1a1a1a2a~        Z31626
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|人类生物学在线 ( 苏ICP备16053048号 )

GMT+8, 2019-11-14 17:33 , Processed in 0.085794 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表