FastQ_Screen 检测原始数据fastq污染情况

  1. 下载
    该软件需要以下依赖
  • [Bowtie], [Bowtie2] 或者 [BWA].
  • Perl
    *[Bismark](可选项, 针对bisulfite 数据)

1.1
有相关的软件之后,进入官方网站,点击下载

https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqscreen

作者也非常贴心的提供了视频教程

https://www.youtube.com/watch?v=WqiKPRxHzNU

1.2 下载测试数据以及配置该软件

https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/fastq_screen_test_dataset.tar.gz

解压

tar xvzf fastq_screen_test_dataset.tar.gz

进入FastQ-Screen文件夹,配置

cd FastQ-Screen-0.15.2
cp fastq_screen.conf.example fastq_screen.conf

编辑配置文件

vim fastq_screen.conf

告诉软件你安装mapping软件的位置

#BOWTIE /usr/local/bin/bowtie/bowtie
BOWTIE2 /opt/share/bowtie2
#BWA /usr/local/bwa/bwa

建立候选参考基因组的索引并写入配置文件

DATABASE        Human   /data/public/Genomes/Human_Bowtie/GRCh37/Homo_sapiens.GRCh37
DATABASE       Mouse   /data/public/Genomes/Mouse/NCBIM37/Mus_musculus.NCBIM37
  1. 测试软件
./fastq_screen fastq_screen_test_dataset/fqs_test_dataset.fastq.gz

4.查看结果
生成了一个html 和 一个txt 文件;截图如下所示。


fastq-screen.png

从图中可以看出人和拟南芥基因组所占比列非常小,查看作者的测试结果发现是小鼠的基因组.


fastq_screen2.png

这个软件也可以帮助我们删除指定物种的reads
更多详细内容可以查看官方tutorials.

https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/_build/html/index.html#:~:text=FastQ%20Screen%20is%20a%20simple,useful%20in%20characterising%20metagenomic%20samples.

你可能感兴趣的:(FastQ_Screen 检测原始数据fastq污染情况)