MEGA 的 No common sites found

感谢原贴答主白墨

错误

解决过程

看文档,文档的提示如下:

https://www.megasoftware.net/webhelp/errormessages_hc/hc_no_common_sites.htmwww.megasoftware.net

No Common Sites

For the sequences and data subset options selected, MEGA found zero common sites. If you selected the complete deletion option then you might achieve better results using the pairwise deletion option, as complete deletion removes all sites containing a gap in any part of the alignment. If you selected the pairwise deletion option then MEGA was unable to calculate the distance between one and several of the sequence pairs in the alignment. To identify such pairs compute a pairwise distance matrix using the p-distance method and look for the word “n/c” in place of the pairwise distance value.

P-distance

计算p距离(p-distance),计算式为:p= nd /n,其中 n为所测定序列的核苷酸数,nd 为核苷酸差异数.p距离没有考虑同一个位点多个核苷酸间的替换状况,即将2个序列间核苷酸差异率作为彼此间的遗传距离.

你有可能用到的技巧

左键按住ID列拖动这行,可以移动整条序列,可以把相似的序列放在一起,排出差异较大的序列

点击选中ID来选择整条序列,按Delete键删除整条序列,切记不要删除单个或多个碱基

进化树一般用NJ树,速度快,效果也不错,如果需要其他模型可以先用NJ树测一下,然后再用耗时的其他模型构建

Ctrl+Z撤销上一步操作

Ctrl+c拷贝数据

Ctrl+x截切数据

Ctrl+v粘贴剪切板中的数据,如果是非序列,那么无效

实际操作

1 进入 Pairwise Distances 工具,选择比对后的序列 fas 文件

2 参数按如下方法修改

3 我们会得到一个矩阵,里面有红色标识的色块,这些就是 No Common Sites

4 删除掉这些无意义数据(在比对序列页面中删除)

需要注意的是每删除一条序列,MEGA会重新编号,意味着距离矩阵和对比页面的编号会不匹配,所以最好看着id名字来删除

5 如果还有这些空值,理所应当的出现如下错误:

6 我们可以看到在71行有问题回到比对页面

7 可以看到,这一序列在这个地方几乎没有和前后任何序列有匹配(相似序列),果断删除

8 保存为meg文件,以便后续分析

9 命名

10 这里指是否要翻译,这里我们只做DNA序列,选择No(当然,你如果要做氨基酸序列分析,选择yes)

11 现在回到MEGA的开始的页面

这里需要注意的是:序列比对窗口和主窗口可以同时显示,为了方便,将窗口调成如下所示

12 选择构建NJ树

13 这里会弹框,问你要不要使用已经载入的数据,我们当然不用啦,选择No。重新选择刚刚删除了差异序列的meg文件

14 参数默认,开始测试

15 如果还出现弹框,按照5-14步骤定位的序列,删除它。如果没问题的话,开始跑图

16 出图

另外,如果想出图结果比较好的话,试试以下的方法

记录那些差异比较大的序列

比对前,比对前,比对前的文件中删除这些序列

用MEGA做序列比对

查看比对情况,如果还出现如上错误,继续1,2,3步骤

直到出现同源性较高一组序列,完成进化树

选择多种建树方法来出图

其他原因:

1.对比完的序列由于需要对齐相似部分序列就会产生gaps(为了保证更多的匹配对比软件会把整体序列拆分成多段序列,但是要保证两条序列要长度一致,那么中间就会产生间隔)。一般情况下,序列gaps由-替代。如果你的序列中里出现了空格就会报错。

PYAAPYQKPP DSHSAGGGGAAYPP

PYAAPYQKPPKEDSHSSSGGGAAYPP

解决:将空格替换为-

PYAAPYQKPP--DSHSAGGGGAAYPP

PYAAPYQKPPKEDSHSSSGGGAAYPP

2.在序列比对时,没有设置gaps,就会使序列长短不一。由于一般的进化树算法需要序列对齐的矩阵来进行后续计算,因此报错。一般MEGA里自带的对比程序不会出现这个问题

解决:

你可能感兴趣的:(MEGA 的 No common sites found)