2020-06-19 Fastp官方教程学习笔记

Fastp官方教程学习笔记

资源

  1. OpenGene/fastp: An ultra-fast all-in-one FASTQ preprocessor (QC/adapters/trimming/filtering/splitting/merging...)

输入和输出参数

  1. 单端:-i -o
  2. 双端:-i -I -o -O
  3. 如果不指定-o,则对QC前后的序列文件进行质检报告,但是没有输出文件
  4. -o如果以gz结尾,则对输出文件进行压缩等级为4的zip压缩
  5. --unpaired1--unpaired2指定的是未配对的文件,如果两个文件的名称相同,则将未配对的read输出到一个文件
  6. --failed_out可以指定未通过QC的read
  7. --read_to_process仅仅处理部分read
  8. --dont_overwrite

Filtering

  1. 质量
    1. -n 指定N的数目最多为多少个
    2. -q 指定好read的phred值
    3. -u 指定不合格的read的最大的百分比
    4. -e指定average的phread值
  2. 长度:
    1. -l read的长度不短于该值的时候保留
    2. --length_limitread不长于
  3. complexity:
    1. -Y默认为30%,即相邻的碱基必须至少30%是不同的

Adapter

  1. -a指定adapter的序列
  2. 对于双端测序数据来说,一般不用指定adapter序列,软件可以自动识别
  3. 利用--detecet_adapter_for_pe打开自动识别adapter的功能
  4. 软件有给出常用的adapter序列,在帮助文件里面有提到
  5. --adapter_fasta
  6. ==先trimauto_detect_adapter或--adapter_seq,在trim--adapter_fasta==

cut模式

  1. -5
  2. -3
  3. -r

miscellaneous

  1. --split_prefix_digits指定把数据分块的prefix
  2. -s分块的块数

你可能感兴趣的:(2020-06-19 Fastp官方教程学习笔记)