【生信训练营-5】利用fastqcr做批量QC分析

FastQC是最常用的评估高通量测序数据质量的软件,相信做NGS数据分析的小伙伴们都应该很熟悉它的用法。
FastQC下载地址:
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/

【生信训练营-5】利用fastqcr做批量QC分析_第1张图片
fastqc.png

FastQC界面:
【生信训练营-5】利用fastqcr做批量QC分析_第2张图片
fastqc_software.png

本文的目的并不是介绍QC的方法和意义,也不是教大家怎么使用FastQC软件,因为这些都是NGS新人的必修课,相关的资源很多。我要给大家介绍的是一个很有用的R包:fastqcr ( http://www.sthda.com/english/rpkgs/fastqcr/ )

【生信训练营-5】利用fastqcr做批量QC分析_第3张图片
fastqcr.png

既然FastQC已经足够简单易用,为什么还要用R来处理QC呢?这里需要强调的是:fastqcr并不是取代FastQC,而是对FastQC产生的report进行处理

设想一个情景,你手中有100个sample需要做QC分析,当FastQC程序跑完以后,面对这100个html文件,如何用最简单的方法迅速找出质量有问题的sample呢?最笨的办法就是一个一个点开看,估计没一会就晕了。稍微高级点的办法就是写一个脚本,但是需要从QC report中提取的信息很多,这样的脚本写起来也挺麻烦。

fastqcr的作用就是将FastQC的report整合成一个table(qc_aggregate),并提供相关参数的统计数据(summary, qc_stats),而且提供了许多函数来快速查找问题sample(qc_problems),连dplyr都不需要用了,实在是贴心又周到。此外,fastqcr还可以把整合后的数据生成一个完整的report,只要打开一个文件就可以看到所有sample的信息,非常人性化。

【生信训练营-5】利用fastqcr做批量QC分析_第4张图片
fastqcr_report.png

fastqcr的文档写的非常清楚,很快就能上手,赶紧去试试吧!

【生信训练营-5】利用fastqcr做批量QC分析_第5张图片
qrcode.jpg

你可能感兴趣的:(【生信训练营-5】利用fastqcr做批量QC分析)