16
answers
779views


已解决

我用mega4构建的进化树好像有些问题。换了很多种model和方法得到的bootstrap值都有些特别小的值,有的分支甚至为0.按道理的话这样得到的树是不可信的。我看文献一般得到的树的bootstrap值都在90~100之间。我的问题究竟出在哪儿呢?该怎么改进?烦请赐教啊~

我多重比对的序列大概有15条左右(也试过只建树其中的某几条序列),均属一个科的序列(主要为该科的三个不同的种),是用同一对引物扩增同一个编码区后获得的片段,长度均在300左右,彼此长度差异很小,多重比对和建树(NJ和ME MP 都试过)的参数为默认,bootstrap的replication值勾选的是1000和2000甚至5000都试过,不胜感激!




    1

    这种情况还真没见过 是不是同源性差啊
    要不把 序列贴出来看看 呵呵

    Current score: 0
    [Link] | [回复Ta]
    2

    可以把序列贴出来。叫楼上的帮你运行看看。~~

    Current score: 0
    [Link] | [回复Ta]
    3

    序列如下:

    >18Y-9
    TACGGAGATTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >1b-16
    TACGGAGATTATGTTTTCGACCGTACCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >3f-6
    TACGGAGATTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >qg-14
    TACGGAGATTATGTTTTTGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >qg-7
    TACGGAGACTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGTAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >k8y-1
    TACGGAGACTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACCATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >k8y-35
    TACGGAGACTATGTTTTTGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >ch.pneumonia (TWAR strain AR-39) 267bp
    TACGGAGACTATGTTTTCGACCGTATCTTAAAAGCAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >qib-17
    TACGGAGATTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    
    Current score: 0
    [Link] | [回复Ta]
    4
    >67
    GAATTGACATGATTACGCCAAGTTTGCACGCCTGCCGTTCGACGATTTAC
    GGAGATTATGTTTTTGATCGTGTATTAAAAGTTGATGTGAATAAAACTTT
    TAGCGGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATA
    CTAATCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCAT
    ATGGAAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACAT
    TTGGGATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACT
    TCAAGGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCA
    GCTGCAAGCTCAATCTCTACCGATCTTCCAACGCAACTTCCTAACGTAGG
    CATCACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTC
    ACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCC
    AACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGC
    GAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGG
    CGAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTT
    CACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAG
    TTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGC
    TTGTCTGCTCCCGGCATCCGCTTACAGACAGCTGTGACCG
    >68
    GAGGTACATGCATTACGCCAGTTTGCACGCCTGCCGTTCGACGATTTACG
    GAGATTATGTTTTTGATCGTGTACTAAAAGTTGATGTGAATAAAACTTTT
    AGCGGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATAC
    TAATCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCATA
    TAGAAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACATT
    TGGGATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACTT
    CAAAGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCAG
    CTGCAAGCTCAATCTCTACCGATCTTCCAACGCAACTTCCTAACGTAGGC
    ATCACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCA
    CTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCA
    ACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCG
    AAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGC
    GAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTC
    ACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGT
    TAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCT
    TGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCG
    >69
    ATGAAACATGATTACGCCAAGTTTGCACGCCTGCCGTTCGACGATTTACG
    GAGATTATGTTTTTGATCGTGTATTAAAAGTTGATGTGAATAAAACTTTT
    AGCGGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATAC
    TAATCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCATA
    TGGAAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACATT
    TGGGATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACTT
    CAAAGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCAG
    CTGCAAGCTCAATCTCTACTGATCTTCCAACGCAACTTCCTAACGTAGGC
    ATCACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCA
    CTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCA
    ACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCG
    AAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGC
    GAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTC
    ACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGT
    TAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCT
    TGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCG
    >70
    AGGAACTGATTACGCCAGTTTGCACGCCTGCCGTTCGACGATTTACGGAG
    ATTATGTTTTTGATCGTGTATTAAAAGTTGATGTGAATAAAACTTTTAGC
    GGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATACTAA
    TCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCATATGG
    AAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACATTTGG
    GATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACTTCAA
    AGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCAGCTG
    CAAGCTCAATCTCTACCGATCTTCCAACGCAACTTCCTAACGTAGGCATC
    ACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCACTG
    GCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACT
    TAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAG
    AGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAA
    TGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACA
    CCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
    GCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGT
    CTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCT
    >71
    ATACATGATTACGCCAAGTTTGCACGCCTGCCGTTCGACGATTGCCTTGA
    GTGATGCCTACGTTAGGAAGTTGCGTTGGAAGATCGGTAGAGATTGAGCT
    TGCAGCTGAAAACCCTATTAACCCAACCAAGTTGAATGCAGCCGAACTTG
    CTTTGAAGTATCCATTGGATGCCCCTAAGGTGCAGAAAATGTCGAAGCGA
    TCCCAAATGTTTAAGGCTAGGAAGGCTGCATTTGAAAACCACTCTGCATC
    TCCCATATGCCTTCCGTAAGCGACGTTCGGTCTGCCATTTGCTTCTGGCT
    GATTAGTATTACTTGCGTTACCTGTAGCCTGCGTAGGAGTTGCAGCCATG
    CCGCTAAAAGTTTTATTCACATCAACTTTTAATACACGATCAAAAACATA
    ATCTCCGTAAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCACTG
    GCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACT
    TAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAG
    AGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAA
    TGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACA
    CCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
    GCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGT
    CTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCT
    >72
    AGACTGATTACGCCAGTTTGCACGCCTGCCGTTCGACGATTGCCTTGAGT
    GATGCCTACGTTAGGAAGTTGCGTTGGAAGATCGGTAGAGATTGAGCTTG
    CAGCTGAAAACCCTATTAACCCAACCAAGTTGAATGCAGCCGAACTTGCT
    TTGAAGTATCCATTGGATGCCCCTAAGGTGCAGAAAATGTCGAAGCGATC
    CCAAATGTTTAAGGCTAGGAAGGCTGCATTTGAAAACCACTCTGCATCTT
    CCATATGCCTTCCGTAAGCGATGTTCGGTCTGCCATTTGCTTCTGGCTGA
    TTAGTATTACTTGCGTTACCTGTAGCCTGCGTAGGAGTTGCAGCCATGCC
    GCTAAAAGTTTTGTTCACATCAACTTTTAATACACGATCAAAAACATAAT
    CTCCGTAAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCACTGGC
    CGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTA
    ATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAG
    GCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATG
    GCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACC
    GCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGC
    CAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCT
    GCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCC
    
    Current score: 0
    [Link] | [回复Ta]
    5

    Figure

    Current score: 0
    [Link] | [回复Ta]
    6

    是直系同源序列吗?试过贝斯方法吗?

    Current score: 0
    [Link] | [回复Ta]
    7

    直系同源的。为啥楼主构建的tree的bootstrap值也这么低啊 问题出在哪儿呢?

    Current score: 0
    [Link] | [回复Ta]
    8

    拿这个问题问了导师,他说问题就是出在序列同源性太高。LZ提供的序列几乎完全相同,在bootstrap的时候很难取到差异位点,于是出来的树都是多分枝(星状)的,没法重复出相应的拓扑结构,所以bootstrap值反而小。这种情况下建树意义不大,不如直接分析alignment上发生突变的位点。

    Current score: 1
    [Link] | [回复Ta]
    9

    谢谢~

    Current score: 0
    [Link] | [回复Ta]
    10

    @zephyr: 原来还有这回事。学习了~~

    Current score: 0
    [Link] | [回复Ta]
    11

    学习了

    Current score: 0
    [Link] | [回复Ta]
    12

    来看看

    Current score: 0
    [Link] | [回复Ta]
    13

    @zephyr:谢谢你回答的这么好,我也有个问题就是:

    什么时候建树意义才大呢?看了一些总是不明白,有些描述与blast比对结果是一样的

    Current score: 0
    [Link] | [回复Ta]
    14

    在做同源模建的时候,只有氨基酸序列相似度在30%以上才有意义。同样在构建进化树的时候,也应该控制在这个值,构建才有意义,只是个人经验,我现在构建4000多条流感病毒蛋白的进化树,就是这样做的!

    Current score: 1
    [Link] | [回复Ta]
    15

    具体构建进化树入门请参看关于进化树的经典文献 Phylogeny for the faint of heart: a tutorial

    Current score: 0
    [Link] | [回复Ta]
    16

    一般来说,如果序列较少的话,推荐使用UPMGA来建模,它得到的结果更准确些。另外,UPMGA特别适合差异较小的数据。最后,关于Bootstrap检验时,replication的值取1000基本上就适合了,没必要无限制的增加。

    Current score: 1
    [Link] | [回复Ta]

    评论已关闭。