12answers
319views

我用mega4构建的进化树好像有些问题。换了很多种model和方法得到的bootstrap值都有些特别小的值,有的分支甚至为0.按道理的话这样得到的树是不可信的。我看文献一般得到的树的bootstrap值都在90~100之间。我的问题究竟出在哪儿呢?该怎么改进?烦请赐教啊~

我多重比对的序列大概有15条左右(也试过只建树其中的某几条序列),均属一个科的序列(主要为该科的三个不同的种),是用同一对引物扩增同一个编码区后获得的片段,长度均在300左右,彼此长度差异很小,多重比对和建树(NJ和ME MP 都试过)的参数为默认,bootstrap的replication值勾选的是1000和2000甚至5000都试过,不胜感激!

    1

    这种情况还真没见过 是不是同源性差啊
    要不把 序列贴出来看看 呵呵

    [Link] | [回复]
    2

    可以把序列贴出来。叫楼上的帮你运行看看。~~

    [Link] | [回复]
    3

    序列如下:

    >18Y-9
    TACGGAGATTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >1b-16
    TACGGAGATTATGTTTTCGACCGTACCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >3f-6
    TACGGAGATTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >qg-14
    TACGGAGATTATGTTTTTGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >qg-7
    TACGGAGACTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGTAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >k8y-1
    TACGGAGACTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACCATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >k8y-35
    TACGGAGACTATGTTTTTGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >ch.pneumonia (TWAR strain AR-39) 267bp
    TACGGAGACTATGTTTTCGACCGTATCTTAAAAGCAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    >qib-17
    TACGGAGATTATGTTTTCGACCGTATCTTAAAAGTAGATGCACCTAAAACATTTTCTATGGGAGCCAAGCCTACTGGATCCGCTGCTGCAAACTATACTACTGCCGTAGATAGACCTAACCCGGCCTACAATAAGCATTTACACGATGCAGAGTGGTTCACTAATGCAGGCTTCATTGCCTTAAACATTTGGGATCGCTTTGATGTTTTCTGTACTTTAGGAGCTTCTAATGGTTACATTAGAGGAAACTCTACAGCGTTCAATCTC
    
    [Link] | [回复]
    4
    >67
    GAATTGACATGATTACGCCAAGTTTGCACGCCTGCCGTTCGACGATTTAC
    GGAGATTATGTTTTTGATCGTGTATTAAAAGTTGATGTGAATAAAACTTT
    TAGCGGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATA
    CTAATCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCAT
    ATGGAAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACAT
    TTGGGATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACT
    TCAAGGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCA
    GCTGCAAGCTCAATCTCTACCGATCTTCCAACGCAACTTCCTAACGTAGG
    CATCACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTC
    ACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCC
    AACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGC
    GAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGG
    CGAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTT
    CACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAG
    TTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGC
    TTGTCTGCTCCCGGCATCCGCTTACAGACAGCTGTGACCG
    >68
    GAGGTACATGCATTACGCCAGTTTGCACGCCTGCCGTTCGACGATTTACG
    GAGATTATGTTTTTGATCGTGTACTAAAAGTTGATGTGAATAAAACTTTT
    AGCGGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATAC
    TAATCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCATA
    TAGAAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACATT
    TGGGATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACTT
    CAAAGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCAG
    CTGCAAGCTCAATCTCTACCGATCTTCCAACGCAACTTCCTAACGTAGGC
    ATCACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCA
    CTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCA
    ACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCG
    AAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGC
    GAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTC
    ACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGT
    TAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCT
    TGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCG
    >69
    ATGAAACATGATTACGCCAAGTTTGCACGCCTGCCGTTCGACGATTTACG
    GAGATTATGTTTTTGATCGTGTATTAAAAGTTGATGTGAATAAAACTTTT
    AGCGGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATAC
    TAATCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCATA
    TGGAAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACATT
    TGGGATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACTT
    CAAAGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCAG
    CTGCAAGCTCAATCTCTACTGATCTTCCAACGCAACTTCCTAACGTAGGC
    ATCACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCA
    CTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCA
    ACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCG
    AAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGC
    GAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTC
    ACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGT
    TAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCT
    TGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCG
    >70
    AGGAACTGATTACGCCAGTTTGCACGCCTGCCGTTCGACGATTTACGGAG
    ATTATGTTTTTGATCGTGTATTAAAAGTTGATGTGAATAAAACTTTTAGC
    GGCATGGCTGCAACTCCTACGCAGGCTACAGGTAACGCAAGTAATACTAA
    TCAGCCAGAAGCAAATGGCAGACCGAACATCGCTTACGGAAGGCATATGG
    AAGATGCAGAGTGGTTTTCAAATGCAGCCTTCCTAGCCTTAAACATTTGG
    GATCGCTTCGACATTTTCTGCACCTTAGGGGCATCCAATGGATACTTCAA
    AGCAAGTTCGGCTGCATTCAACTTGGTTGGGTTAATAGGGTTTTCAGCTG
    CAAGCTCAATCTCTACCGATCTTCCAACGCAACTTCCTAACGTAGGCATC
    ACTCAAGGCAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCACTG
    GCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACT
    TAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAG
    AGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAA
    TGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACA
    CCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
    GCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGT
    CTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCT
    >71
    ATACATGATTACGCCAAGTTTGCACGCCTGCCGTTCGACGATTGCCTTGA
    GTGATGCCTACGTTAGGAAGTTGCGTTGGAAGATCGGTAGAGATTGAGCT
    TGCAGCTGAAAACCCTATTAACCCAACCAAGTTGAATGCAGCCGAACTTG
    CTTTGAAGTATCCATTGGATGCCCCTAAGGTGCAGAAAATGTCGAAGCGA
    TCCCAAATGTTTAAGGCTAGGAAGGCTGCATTTGAAAACCACTCTGCATC
    TCCCATATGCCTTCCGTAAGCGACGTTCGGTCTGCCATTTGCTTCTGGCT
    GATTAGTATTACTTGCGTTACCTGTAGCCTGCGTAGGAGTTGCAGCCATG
    CCGCTAAAAGTTTTATTCACATCAACTTTTAATACACGATCAAAAACATA
    ATCTCCGTAAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCACTG
    GCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACT
    TAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAG
    AGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAA
    TGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACA
    CCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
    GCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGT
    CTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCT
    >72
    AGACTGATTACGCCAGTTTGCACGCCTGCCGTTCGACGATTGCCTTGAGT
    GATGCCTACGTTAGGAAGTTGCGTTGGAAGATCGGTAGAGATTGAGCTTG
    CAGCTGAAAACCCTATTAACCCAACCAAGTTGAATGCAGCCGAACTTGCT
    TTGAAGTATCCATTGGATGCCCCTAAGGTGCAGAAAATGTCGAAGCGATC
    CCAAATGTTTAAGGCTAGGAAGGCTGCATTTGAAAACCACTCTGCATCTT
    CCATATGCCTTCCGTAAGCGATGTTCGGTCTGCCATTTGCTTCTGGCTGA
    TTAGTATTACTTGCGTTACCTGTAGCCTGCGTAGGAGTTGCAGCCATGCC
    GCTAAAAGTTTTGTTCACATCAACTTTTAATACACGATCAAAAACATAAT
    CTCCGTAAATCTCTGGAAGATCCGCGCGTACCGAGTTCTAATTCACTGGC
    CGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTA
    ATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAG
    GCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATG
    GCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACC
    GCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGC
    CAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCT
    GCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCC
    
    [Link] | [回复]
    6

    是直系同源序列吗?试过贝斯方法吗?

    [Link] | [回复]
    7

    直系同源的。为啥楼主构建的tree的bootstrap值也这么低啊 问题出在哪儿呢?

    [Link] | [回复]
    8

    拿这个问题问了导师,他说问题就是出在序列同源性太高。LZ提供的序列几乎完全相同,在bootstrap的时候很难取到差异位点,于是出来的树都是多分枝(星状)的,没法重复出相应的拓扑结构,所以bootstrap值反而小。这种情况下建树意义不大,不如直接分析alignment上发生突变的位点。

    [Link] | [回复]
    10

    @zephyr: 原来还有这回事。学习了~~

    [Link] | [回复]
    12

    来看看

    [Link] | [回复]

Your Answer

You must be logged in to post a comment.

登陆后可评论。