gffread使用小妙招

大家好,今天给大家分享一个软件(cufflinks)中的一个命令gffread,前一段时间需要提取生菜所有基因的CDS序列,本来一开始准备自己写脚本,后来发现gffread就可以实现。

1. 安装:

#下载
wget http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz](http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz
#解压
tar -zvxf cufflinks-2.2.1.Linux_x86_64.tar.gz
#加入到自己环境变量中
export PATH=/home/software/cufflinks-2.2.1.Linux_x86_64/:$PATH
#进入软件目录
cd cufflinks-2.2.1.Linux_x86_64
#查看
ls -l
图1.png

这样即安装好了。

2.gffread使用
以生菜为例吧,现在我们有生菜基因组文件lettuce_genome.fa和gff文件。

2.1 使用gffread利用生菜生菜基因组文件lettuce_genome.fa和gff文件生成生菜所有基因的CDS序列文件,格式为fasta格式。

gffread  Lactuca_sativa_lettuce.gff -g lettuce_genome.fa -x 
Lactuca_sativa_lettuce_cds.fa

这样就好了,已经生成所有基因的CDS序列文件。

less Lactuca_sativa_lettuce_cds.fa
图 2.png
##还可以利用gffread提取参考基因组文件中的转录本,与上面提取CDS序列类似
gffread Lactuca_sativa_lettuce.gtf  -g lettuce_genome.fa -w transcripts.fa

2.2 我们还可以使用gffread实现gff文件和gtf文件格式转换

#gff to gtf
gffread Lactuca_sativa_lettuce.gff -T -o Lactuca_sativa_lettuce.gtf
#gtf to gff 
gffread Lactuca_sativa_lettuce.gtf -o tmp.gff

当然,这个软件还要很多其他功能,感兴趣的可以自己试试哦。

你可能感兴趣的:(gffread使用小妙招)