基因家族分析八(计算串联重复基因KAKS值)

1.准备文件

即要是1,2是一对串联重复,就将其放在一个文件内。
在上一步获得的文件,一对重复基因是一行,所以我们就将两列一行转为一列两行,并以两行为准分割文件,最后利用生成的文件将序列提取出来。

$for i in repeat_gene_id; do awk '{print $0}' $i |xargs -n1 >$i.bed; done
split -l2 $I.bed
$seqkit grep -f 分割出来的文件  cds_hits > 分割出来的文件.fa

2.计算Kaks值

计算kaks值之前需要将序列比对。kaks自带了将aln文件改为axt文件。

## 转换格式
$~biosoft/KAKS_Calculator/KaKs_Calculator2.0/src/AXTConvertor xaa.aln xaa.axt

报错

打开这个axt文件,文件末尾会发现gap和别的比对上了。把多余的A及gap删掉。


修改之后



再次运行



结果文件

你可能感兴趣的:(基因家族分析八(计算串联重复基因KAKS值))