deeptols 画图工具 使用方法与代码
deeptools 使用
安装:conda install -y deeptools
使用:
1、将bam文件转为bw格式的文件
(1)先给bam文件排序:
samtools sort SRRxxx.bam -o SRRxxx_sorted.bam
(2)给排序之后的bam文件建索引
samtools index SRRxxx_sorted.bam
(3)将排序之后的bam文件转换为bw格式
bamCoverage --normalizeUsing CPM -b SRRxxx_sorted.bam -o SRRxxx.bw
多个文件:
ls *sorted.bam | cut -d"_" -f 1 | while read id ;do bamCoverage --normalizeUsing CPM -b ${id}_sorted.bam -o ./bw/${id}.bw; done
1
2、使用macs2将bam文件转换生成bed文件
安装:conda install -c bioconda macs2
使用:
单个文件:
macs2 callpeak -t ./SRRxxx_sorted.bam -f BAM -g 1.87e9 -n SRRxxx -B -q 0.01 --nomodel --extsize 147
1
出现这个错误时,在命令行里面加上 –nomodel 和 –extsize 147 (数字为固定的)两个参数即可
多个文件:
ls *sorted.bam | cut -d"_" -f 1 | while read id ;do macs2 callpeak -t ./${id}_sorted.bam -f BAM -g 1.87e9 -n ./bed/${id} -B -q 0.01 --nomodel --extsize 147; done
3、作图
单个文件:
热图:
computeMatrix reference-point -S SRR.bw -R ./Macs2/SRR_summits.bed --referencePoint TSS -a 2000 -b 2000 -out SRR_TSS.gz
plotHeatmap -m SRR_TSS.gz -out SRR_TSS.png --heatmapHeight 15 --refPointLabel enh.center --regionsLabel enhancers --plotTitle '图片名称'
多个文件:
computeMatrix reference-point -S ./bw/H3K4Me1-Input.bw ./bw/H3K4Me3-Input.bw ./bw/H3K27Me3-input.bw -R ./bed/genes19.bed ./bed/genex.bed --referencePoint TSS -a 3000 -b 3000 -out TSS.gz
热图:
plotHeatmap -m TSS.gz -out ExampleHeatmap1.png
plotHeatmap -m TSS.gz -out hm_DNase_ESC.png --heatmapHeight 10 --refPointLabel enh.center --regionsLabel enhancers --plotTitle 'DNase signal'
根据bam文件画图
plotProfile -m TSS.gz -out ExampleProfile1.png --numPlotsPerRow 2 --plotTitle "Test data profile"
根据基因画图
plotProfile -m TSS.gz -out ExampleProfile2.png --plotType=fill --perGroup --colors red yellow blue --plotTitle "Test data profile"
聚类画图:
plotProfile -m TSS.gz --perGroup --kmeans 2 -out ExampleProfile3.png
热图:
plotProfile -m TSS.gz --perGroup --kmeans 2 --plotType heatmap -out ExampleProfile4.png
PCA图等:
multiBamSummary bins --bamfiles ./sort/*_sorted.bam --minMappingQuality 30 --region 19 --labels H3K27me3 H3K4me1 H3K4me3 input -out readCounts.npz --outRawCounts readCounts.tab
利用上面输出的结果作图:
1、
plotCorrelation -in ./mul/readCounts.npz --corMethod spearman --skipZeros --plotTitle "Spearman Correlation of Read Counts" --whatToPlot heatmap --colorMap RdYlBu --plotNumbers -o heatmap_readCounts.png --outFileCorMatrix SpearmanCorr_readCounts.tab
plotPCA -in ./mul/readCounts.npz -o PCA_readCounts.png -T "PCA of read counts"
3、
plotFingerprint -b ./*_sorted.bam --labels H3K27me3 H3K4me1 H3K4me3 input --minMappingQuality 30 --skipZeros --region 19 --numberOfSamples 50000 -T "Fingerprints of different samples" --plotFile fingerprints.png --outRawCounts fingerprints.tab