1.载入序列:运行ClustalX,主界面窗口如下所图(图1),依次在程序上方的菜单栏选择“File”-“Load Sequence”载入待比对的序列,如图2所示,如果当前已载入序列,此时会提示是否替换现有序列(Replace existing sequences),根据具体情形选择操作。
2.编辑序列:对标尺(Ruler)上方的序列进行编辑操作,主要有Cut sequences(剪切序列)、Paste sequences(粘贴)、Select All sequences(选定所有序列),Clear sequence Selection(清除序列选定)、Search for string(搜索字串)、Remove All gaps(移除序列空位)、Remove Gap-Only Columns(仅移除选定序列的空位)
3.参数设置:可以根据分析要求设置相对的比对参数。通常情况下,我们可以使用默认参数。比对参数主要有六个,分别是Reset New Gaps before Alignment(比对前重置新的空位参数),Reset All Gaps before Alignment(比对前重置所有空位参数),Pairwise Alignment Parameters(两两序列比对参数),Multiple Alignment Parameters(多重序列比对参数),Protein Gap Parameters(蛋白空位参数),Secondary structure Parameters(二级结构参数),如图4所示:
修改参数只需点击相应标签,示例比对的是多序列比对,故可选择“Multiple Alignment Parameters”弹出参数设置窗口,如图5所示:
4.完全比对:返回菜单栏选择“Complete Alignment”标签,此时会弹出输出文件路径的设置窗口,设置Guide Tree File(向导树或指导树文件)、Alignment File(比对文件)的保存位置(存放路径),点击“Align”按钮程序自动开始序列的完全比对,比对所需时间因序列文件大小和长度、计算机性能而异,如图6-8所示:
当主界面的左下状态栏会提示“CLUSTAL-Alignment File created []”时说明比全完毕,这时文件保存位置的目录下会生成生成两个文件,分别是*.aln和*.dnd,aln是序列比对的文件,可以进一步用于构树系统发育树,dnd是向导树文件(指导树),这两个文件可以用Windows系统中的“记事本”或第三方程序“UltraEdit”等打开,如:
5.后续分析:
1)Clustalx比对生成的结果可读性不是太好,一般需要专业的序列着色软件处理,如Boxshade、ESPript,这两个工具都是在线进行,其中Boxshade图解教程详见本Blog日志。
Boxshade在线网址:http://www.ch.embnet.org/software/BOX_form.html
ESPript在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi
2)转换ALN文件,进一步构建系统发育树,转换格式依不同软件而有所不同,如在PHYLIP分析前需要将ALN格式转换为PHY格式方可...
注意事项:
1)dnd是向导树文件,可以用TreeViews软件查看树图。注意:向导树不是系统发育树,两者区别敬请关注近期-系统发育分析专题。
2)多重比对文件推荐要求为规范的FASTA格式,文件扩展名不限,格式大致如下:
>RGDV_BAA02676
MSRQAWIETSALIECISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
>RGDV_ABC75537
MSRQAWIETSALIECISEYGTKCSFCHLWVIMSFIAVFGRYYTVN
>RGDV_AAO64253
MSRQAWIETSALIERISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
>RGDV_AAY14576