macs2的输出文件解读

macs2的输出文件解读

NAME_peaks.xls
包含peak信息的tab分割的文件,前几行会显示callpeak时的命令。输出信息包含:

染色体号
peak起始位点
peak结束位点
peak区域长度
peak的峰值位点(summit position)
peak 峰值的高度(pileup height at peak summit, -log10(pvalue) for the peak summit)
peak的富集倍数(相对于random Poisson distribution with local lambda

NAME_peaks.narrowPeak
*narrowPeak文件是BED6+4格式,可以上传到UCSC浏览。输出文件每列信息分别包含:

1;染色体号
2:peak起始位点
3:结束位点
4:peak name
5:int(-10*log10qvalue)
6 :正负链
7:fold change
8:-log10pvalue
9:-log10qvalue
10:relative summit position to peak start(?)

NAME_summits.bed
BED格式的文件,包含peak的summits位置,第5列是-log10pvalue。如果想找motif,推荐使用此文件。
Remove the beginning track line if you want to analyze it by other tools.???

.bdg
bedGraph格式,可以导入UCSC或者转换为bigwig格式。两种bfg文件:treat_pileup, and control_lambda.
NAME_peaks.broadPeak
BED6+3格式与narrowPeak类似,只是没有第10列。
summits.bed,narrowPeak,bdg, xls四种类型输出文件的比较:
xls文件
文件包含信息还是比较多的,和narrowPeak唯一不同的是peak的起始位置需要减1才是bed格式的文件,另外还包含fold_enrichment 和narrowPeak的fold change 对应,-log10pvalue,-log10qvalue,peak长度,peak 峰值位置等。
narrowPeak文件
和xls文件信息类似
summits.bed文件
包含峰的位置信息和-log10pvalue
bdg文件
bdg文件适合导入UCSC或IGV进行谱图可视化,或者转换为bigwig格式再进行可视化。
为什么染色体号后面会出现其他的字符串????

你可能感兴趣的:(生物信息)