Mrbayes-进化分析软件

mrbayes 进化树


安装

mrbayes下载链接 mrbayes使用说明

tar -xvf mrbayes.tar.gz 解压后进入src文件,打开CompileInstructions.txt文件按照提示操作

命令行示例

- ./mb 运行mrbayes
- execute $PATH/primates.nex 输入文件
- lset nst=6 rates=invgamma 设置lset是模型设定(model set)命令,nst=6 是将替换模型设为GTR(General Time Reversible,普通时间可逆)模型,rates=invgamma是将位点间差异比率设为invgamma。
- mcmc ngen=10 000 samplefreq=10 义是:使用马可夫链一蒙特卡罗(melnc)数据模拟技术来估算后验概率,运算进行10000代,取样频率为10(从每10条马可夫链中取样一个)。完成10 000代运算后,在>提示符后显示“Continue with analy—sis?(yes/no):”,等待用户输入yes或no。这时需要查看“分列频率平均标准差”的值,如果该值小于0.01,则输入no终止运算。本例中经过10 000代运算该值为0.0130 314,小于0.01,所以可以终止运算。
- sump burnin=250,其含义是:舍弃前250个老化(burn.in)样本之后对各参数值(parameter Values)进行总结(8Unllllary)。老化样本数一般为总样本数的25%,本例中总样本数为1 000,所以老化样本数为250。该命令的运行结果是生成两个具有“.P”后缀名的文件。
- sumt bumin=250,即舍弃250个老化样本后对各进化树(trees)进行总结。该命令的运行结果是生成“.t”文件两个和“.parts”、“.con”及“.trprobs”文件各一。其中“.con”文件就是含有两棵共有树(collsensu9trees)的文件,可以用TreeView程序查看
- 后台运行方法:./mb 

输入文件格式

- examples文件夹下primates.nex文件格式如下:
  #NEXUS

  [ Data from: Hayasaka, K., T. Gojobori, and S. Horai. 1988.Molecular phylogeny and evolution of primate mitochondrial DNA. Mol. Biol. Evol. 5:626-644. ]

  begin data;
      dimensions ntax=12 nchar=898;
      format datatype=dna interleave=no gap=-;
      matrix
  Tarsius_syrichta      AAGTTTCATTGGAGCCACCACTCTTATAATTGCCCATGGCCTCACCTCCTCCCTATTATTTTGCCTAGCAAATACAAACTACGAACGAGTCCACAGTCGAACAATAGCACTAGCCCGTGGCCTTCAAACCCTATTACCTCTTGCAGCAACATGATGACTCCTCGCCAGCTTAACCAACCTGGCCCTTCCCCCAACAATTAATTTAATCGGTGAACTGTCCGTAATAATAGCAGCATTTTCATGGTCACACCTAACTATTATCTTAGTAGGCCTTAACACCCTTATCACCGCCCTATATTCCCTATATATACTAATCATAACTCAACGAGGAAAATACACATATCATATCAACAATATCATGCCCCCTTTCACCCGAGAAAATACATTAATAATCATACACCTATTTCCCTTAATCCTACTATCTACCAACCCCAAAGTAATTATAGGAACCATGTACTGTAAATATAGTTTAAACAAAACATTAGATTGTGAGTCTAATAATAGAAGCCCAAAGATTTCTTATTTACCAAGAAAGTA-TGCAAGAACTGCTAACTCATGCCTCCATATATAACAATGTGGCTTTCTT-ACTTTTAAAGGATAGAAGTAATCCATCGGTCTTAGGAACCGAAAA-ATTGGTGCAACTCCAAATAAAAGTAATAAATTTATTTTCATCCTCCATTTTACTATCACTTACACTCTTAATTACCCCATTTATTATTACAACAACTAAAAAATATGAAACACATGCATACCCTTACTACGTAAAAAACTCTATCGCCTGCGCATTTATAACAAGCCTAGTCCCAATGCTCATATTTCTATACACAAATCAAGAAATAATCATTTCCAACTGACATTGAATAACGATTCATACTATCAAATTATGCCTAAGCTT
  Lemur_catta         AAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATTCTGTCTAGCCAACTCTAACTACGAACGAATCCATAGCCGTACAATACTACTAGCACGAGGGATCCAAACCATTCTCCCTCTTATAGCCACCTGATGACTACTCGCCAGCCTAACTAACCTAGCCCTACCCACCTCTATCAATTTAATTGGCGAACTATTCGTCACTATAGCATCCTTCTCATGATCAAACATTACAATTATCTTAATAGGCTTAAATATGCTCATCACCGCTCTCTATTCCCTCTATATATTAACTACTACACAACGAGGAAAACTCACATATCATTCGCACAACCTAAACCCATCCTTTACACGAGAAAACACCCTTATATCCATACACATACTCCCCCTTCTCCTATTTACCTTAAACCCCAAAATTATTCTAGGACCCACGTACTGTAAATATAGTTTAAA-AAAACACTAGATTGTGAATCCAGAAATAGAAGCTCAAAC-CTTCTTATTTACCGAGAAAGTAATGTATGAACTGCTAACTCTGCACTCCGTATATAAAAATACGGCTATCTCAACTTTTAAAGGATAGAAGTAATCCATTGGCCTTAGGAGCCAAAAA-ATTGGTGCAACTCCAAATAAAAGTAATAAATCTATTATCCTCTTTCACCCTTGTCACACTGATTATCCTAACTTTACCTATCATTATAAACGTTACAAACATATACAAAAACTACCCCTATGCACCATACGTAAAATCTTCTATTGCATGTGCCTTCATCACTAGCCTCATCCCAACTATATTATTTATCTCCTCAGGACAAGAAACAATCATTTCCAACTGACATTGAATAACAATCCAAACCCTAAAACTATCTATTAGCTT
  .....
     ;
  end;
文件以“#Nexus”开头,并有其固定的结构。以程序提供的primates.nex文件为例,该文件由4个部分组成:
 ①定义数据大小部分用“begin data;”表明下面有一个数据模块;之后用“dimensions ntax=12 nchar=898;”说明该数据的生物类群数(number of taxa,ntax)为12,数据的字符数(number of characters。nchar)为898。
②定义数据格式部分用“format datatype=dna interleave=no gap=一;”说明数据类型为DNA、不隔行排列并且空缺用“一”来表示。
③具体数据列表部分先用“matrix”表明下面有数据矩阵,之后是12行数据,每l行的开头是生物类群的名称,后面是具体的碱基序列;请注意,这里的12条序列已经用Clustalw或其他程序做了多序列比对。
④数据结尾用“;”以及“end;”进行标识。

输入文件类型

上述是一种输入核酸序列的输入文件类型,除此之外还有四种:

  • 普通蛋白序列: example 目录下的示例文件vian_ovomucoids.nex
  • 含编码区域的DNA序列: bglo_bin.nex- mRNA序列 :replicase.nex
  • 混合型数据文件:合型数据文件是指由DNA、RNA、蛋白质序列和形态特征观察结果之中两种以上数据组成的文件,示例文件cynmix.nex中的序列属于这一类型。

你可能感兴趣的:(Mrbayes-进化分析软件)