DamID-seq分析笔记(一)

pre: 尽量写详细点,方便理解

1:
illumia机器测序的方向是3---->5,附上一张图:


image.png

我是PE150测序,测序的adapter :GATCG GAAGA
拿到数据的第一眼,先看一下测序的情况,我先打开一个fq的文件先看看:

cat  XXX_R1.fq | grep GATCGGAAGA

illumia机器测序的方向是3-5,从这个情况来看,trim之后的有些reads长度会短一些。


但是因为在加接头之前需要加A,再加接头,我们把这个碱基往前挪去A去看,然后就可以发现都序列特征是AG

这个是DamID-seq的数据
我们需要知道,DamID是利用Dam和DpnI来工作的,DpnI的位点是G(me)ATC :


结合3--->5的illumia的测序,我们知道,有AG开头的reads是我们要的reads.

(PS:记得在Adapter 后面加个A)
数据处理思路
1:先用cutadapt去掉接头
然后跑一个fastqc看一些结果,如果碱基质量很好的话,可以不用trim,如果碱基质量不够好还是需要trim的

cutadapt -a ADAPTER_FWD -o out.1.fastq -p out.2.fastq reads.1.fastq reads.2.fastq

2(可选):trimmomatic

java -jar /asnas/sunyl_group/liull/software/Trimmomatic-0.36/trimmomatic-0.36. jar  PE Reads_R1. fq.gz Reads_R2.fq.gz reads_R1.trimmo.fq unpair_1.trimo.fq reads_R2.trimmo.fq unpair_2.trimo.fq LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15  MINLEN:51

那么好,接下来把接头给去了,并且去掉一些低质量的数据:
接下来就是mapping 到基因组上


总结一下:
利用cutadapter去了接头
trimmomatic去了低质量数据(可选)
fastqc看结果



下一步:mapping

你可能感兴趣的:(DamID-seq分析笔记(一))