系统发育分析之贝叶斯BI

构建系统发育树主要有四种方法:ML、NJ、MP和BI

与ML和NJ相比,BI的方法效率更高,已有的研究结果显示,对于同一组数据的分析, 贝叶斯方法分析结果中的节点支持率高于其它算法中的相应结果。最大似然法(ML)被选择时候后最多,但是计算比较慢,如果序列属于远缘,选ML比较好;相比较而言NJ计算过程比较快。

一般系统发育分析都需要做两个及其以上的方法计算。这里简单记录一下 如何用BI构建系统发育树。

1. 多序列比对(我一般选择MEGA-clustw)

2. 保守区检测(Gblock 0.91b_)

http://molevol.cmima.csic.es/castresana/Gblocks_server.html   ( 如果用的时候总是导不进去,可以直接以Fasta格式粘贴进去。这个运行时间有点久,不知道是不是电脑的原因)

3. 饱和度检测(DAMBE)如果序列饱和就不能建树,如果不饱和符合建树条件。

运行完结果后检查ISS 说明不饱和可以建树。

DAMBE的使用方法:http://blog.sciencenet.cn/blog-508298-716082.html  可以完全按照这个来,导入文件的时候最好选择FASTA格式的文件。

4. 核苷酸替代模型的选择 【这一步很重要,再这个上面我花费了不少的时间。

这里我用是 MrMTgui 。需要加载的其他插件还有PAUP、Modeltest(48种)和MrModeltest (24种)。PAUP 文件格式是NEX,可以用mega导出这种格式的文件。

打开 MrMTgui软件后,再下方path的位置选择各个插件的位置。比如PAUP 的console.exe文件,其他的插件也是这样。

图一

如果全都设置好以后,选择 RUA-PAUP, 选怎nex格式文件(有时候找不到文件,别忘了把文件类型改为ALL*)

会出现以下界面,这是在计算score文件,不要着急。计算完成后会提示是否运行下一步,选择否,点击Save Scores。文件名保存为 mrmodel.scores 文件【scores文件即可】。

图二


点击select files ,选择刚刚保存的.score 文件。点击MrModeltest 就开始运行了。结果有两部分文件hLRTs和AIC,下滑到AIC部分,然后 找到贝叶斯部分,这个时候就已经得到了最好的模型。将从begin到end这部分程序,复制保存。

图三

到这里做完了前期所有的工作,开始了真正的进行BI分析。MrBays 准备好,这是不需要安装的软件,直接打开其.exe文件,可以直接使用。将已原来已经复制的几行执行程序粘贴到你的序列文件种,http://www.360doc.com/content/17/1002/18/45962007_691819677.shtml 【连接包括参数的各种意义。】

BEGIN mrbayes;

lset nst=6 rates=propinv Code=Metmt(如果程序是线粒体);

Prset statefreqpr=dirichlet(1,1,1,1);

                mcmc ngen=300000(代) printfreq=1000 samplefreq=100;

sump;

sumt;

END;

设置好各项参数之后,就可以打开软件,输入exe   文件名.nex 运行了。

最后可以用figtree打开 文件名.nex.con.tre 文件,编辑树。

ps:贝叶斯的nex和paup要求的有点不一样可以用,ALTER http://www.sing-group.org/ALTER/ 转换格式

图四

相关参考资料:

冯思玲. 系统发育树构建方法研究[J]. 信息技术, 2009(06):45-47+51.

https://www.docin.com/p-945498009-f2.html  (高芳銮老师写的十分详细)

Ending~

你可能感兴趣的:(系统发育分析之贝叶斯BI)