转录组重建系统发育(三)使用minimap2过滤掉序列中的叶绿体和线粒体基因

使用conda安装minimap2,并在NCBI上下载一些与你目标物种相近物种的叶绿体和线粒体基因组。
minimap2的使用非常简单,直接用叶绿体基因组与目标转录组数据比对

minimap2 -a ../../database/chloroplast_genome/gesneriaceae_chloroplast.fasta ../04.trinity_longest/SRS7102777_trinity_longest.fasta > SRS7102777_chloroplast_blast.sam
#gesneriaceae_chloroplast.fasta 为参考叶绿体基因组,SRS7102777_trinity_longest.fasta为目标样品数据

运行后会获得一个sam文件,根据此文件可以提取出比对上的叶绿体基因和去除叶绿体基因的数据集。
使用-F4可以获得比对上的叶绿体基因

samtools fasta -F4 ../SRS7102777_chloroplast_blast.sam > SRS7102777_chloroplast.fasta

使用-f4获得去除叶绿体之后的转录组数据

samtools fasta -f4 ../SRS7102777_chloroplast_blast.sam > SRS7102777_separate_chloroplast.fasta

同理可去除数据中的线粒体基因。最后保留核基因数据。

你可能感兴趣的:(转录组重建系统发育(三)使用minimap2过滤掉序列中的叶绿体和线粒体基因)