基因家族分析(1)——进化树构建与美化

更多内容关注微信公众号:“今日之森”   后获取。


“好看的皮囊千篇一律,有趣的灵魂万里挑一”

进化树的构建绝不仅仅是将一堆序列扔进MEGA等建树软件,随便生成树那么简单,因为总体上随着论文图片质量的不断提高,构建系统进化树更不能将就,好看又能清晰说明问题的进化树或许不会加分,但绝不能减分。

相信大多数低年级的研究生都会构建进化树,但对于进化树的美化就不怎么了解了。

好,下面就简单介绍一下关于系统发育树的构建与美化。

正式开始之前先来了解了解建树并美化的基本流程:

  •  获取数据

    获取需要进行系统发育分析的序列,fasta格式;

  • 多序列比对

    考究序列差异性,若序列所含结构域高度保守,且长度基本一致,则直接进行多序列比对,以比对后的文件选择合适的模型建树即可;若序列中所含结构域多种多样,且序列长短不一,就需要考察序列中是否有唯一或几个较为保守的结构域,如有,则需要根据情况提取每条序列中的保守结构域进行基于结构域序列的系统发育树构建,如仅有个别序列过长过短,则需要单独进行结构与分析,选择保留或舍弃。总之需要选择尽可能准确的策略进行建树。若出现序列参差不齐,且无明显的规律(包含唯一或几个保守结构域),但又都需保留的情况下则需要在进行多序列比对后删除gap或删掉差异过大的区间。然后再进行建树。

  • 进化模型的选择

    3.1 基于距离:

  •   UPGMA(类平均法)

  •   ME(Minimum Evolution,最小进化法)

  •   NJ(Neighbor-Joining,邻接法)

  •        3.2基于特征:

  •    MP(Maximum parsimony,最大简约法)

  •    ML(Maximum likelihood,最大似然法)

  •    Bayesian Inference (BI,贝叶斯方法)

  •     4.系统发育树的构建

        5.系统发育树的编辑与美化


    一、进化树的构建

    1 MEGA软件https://www.megasoftware.net/

    想必都用过MEGA,这应该大多数研究生建树最常用到的软件了。

    先来看昨天基因家族成员确定②提到的那篇文章中的系统发育树,总体来看还是可以的,但是这样一个进化树如果强行用MEGA来美化就有点吃力了,所以先来建树。

    2 开始操作

    2.1 获取数据

    获取数据的方式多种多样,由于上一篇推文已经获取到马铃薯hsp20基因的蛋白序列,也提取到拟南芥hsp20基因的序列,因此就作为今天的建树序列文件。

    2.2 多序列比对

    关于多序列比对,这里只介绍两个软件,一是MEGA,虽然该软件操作简单,也集成了Clustalw和Muscle(如下图),但适合配置一般的电脑进行少于500条以内的多序列比对(经验之谈);二是mafft,需要基于命令行操作,但tbtools中好像也集成了mafft,感兴趣的可以去研究,mafft的最大优势是可以快速进行几千条序列的比对,是我用过最快的多序列比对软件,当然还有其他优势。

    将马铃薯和拟南芥hsp20基因蛋白序列用MEGA打开后,我们这里选择Muscle进行多序列比对。比对结果如下:

    以下三张多序列比对均只截取起始位置的界面。

    从这个比对结果来看,差异是非常之大,由于序列较少,继续建树应该影响不大。但我们还是单独看一下拟南芥和马铃薯各自的比对结果。

    拟南芥

    马铃薯

    可以看出,这样的结果使我们不想要的,但是由于序列较少,基本不影响建树的准确性。但是为了进一步。我们需要进行修剪多序列比对结果,以构建更准确的进化树。

    先讲MEGA多序列比对结果导出为fasta格式。然后打开tbtools,使用Trimmer快速修剪。

    修建之后,就美好了很多,如下:

    2.3 进化树构建

    这里选择NJ模型进行建树。如下:

    在保存的时候就出现一些bug,总体来说还是不习惯用MEGA来编辑和美化进化树。

    因此在这里将树文件导出

    导出后生成以.nwk结尾的树文件,这个文件可以用其他进化树美化软件打开后进行操作。

    二、进化树的编辑与美化

    用过两款在线软件,一是Evolview,二是iTOL。两款都是在线软件,最开始用Evolview,很容易上手操作,但是个人感觉软件功能较为单一,适合初学者进行操作,后来就放弃使用了。iTOL就比较强大了,建议注册账号,这样可以保留编辑记录,以便后期查看,这款软件的强大之处在于可以配置各种自己所需的配置文件,使进化树更具个性。网址贴在这里,感兴趣的自行探索,下面使用iTOL进行简单编辑。

    Evolview:https://www.evolgenius.info/evolview/#login

    iTOL:https://itol.embl.de/itol.cgi

    好了,打开iTOL,界面如下:

    可以看到右边操作面板很人性化,可以通过点击不同的选项进行美化和编辑。

    先来上传刚才生成的树文件。

    这个无根树,hhh……,看起来怎么有点像一只小动物,interesting!

    由于这个例子只是做一示范,并不想花很多精力去准备配置文件做更为详细的美化和编辑。

    授人以鱼不如授人以渔,这里直接推进iTOL官网的help说明文档,https://itol.embl.de/help.cgi

    配置文件不难准备,根据个人需要准备即可。尤其在颜色配置过程中还是蛮考验审美水平的,如果对颜色没有超高理解的话还是尽量选择高水平文章中的色彩搭配进行练习并使用。

    先写到这里。

    你可能感兴趣的:(基因家族分析(1)——进化树构建与美化)