2020.9.15丨Chip-seq结果可视化之peak检测(上)

  • macs2运行参数
    • macs2 callpeak -t K1_ChIPed_S1_L007_R1.bam -c K1_Input_S5_L007_R1.bam -f BAM -g mm -n K1 -B -q 0.01
      -t -c 实验组和对照组结果
      ​-f 输入文件格式
      -g 参考基因组有效大小,人类选择hs,也可以根据基因组大小直接输入数值
      -n 输出前缀
      -B 输出bdg格式文件,可以上传到UCSC生成峰图
      -q q值,默认0.05
      -p p值,未校正值
    • 导入到R中
      • d.c1 <- read.table('C1_result/C1_peaks.xls',header = TRUE)
        header = TRUE表示第一行为列名称
  • 生成列并处理列表数据
    • head(d.c1)
      • 染色体位置 起始位点 终止位点 区域长度 峰值位点 峰值高度
      • 1 chr start end length abs_summit pileup
      • 2 NC_000067.6  24611563 24616156 4594   24615334 149
      • 3 NC_000067.6  73948825 73948947 123 73948886 13
      • 4 NC_000067.6  75360214 75360329 116 75360218 10
      • 5 NC_000067.6  81725035 81725163 129 81725075 12
      • 6 NC_000067.6 134956043 134956222 180  134956160 17
      • P值 富集倍数 校正后的Q值 peak名称
      • 1 -log10(pvalue) fold_enrichment -log10(qvalue) name
      • 2 26.0732 2.72183 19.7407 C1_peak_1
      • 3 9.26951 5.71575 4.7134 C1_peak_2
      • 4 8.14861 5.59441 3.64848 C1_peak_3
      • 5 10.87 6.91483 6.24174 C1_peak_4
      • 6 16.4718 9.15449 11.5107 C1_peak_5
    • column<-as.numeric(d.c1[,'col_name'])
      d.c1[,'co_name']选择生成图片的列
      as.numberic()用于将字符串转换为数值
    • 注:XLS里的坐标起始坐标需要减1才与narrowPeak的起始坐标一样。2020.9.15丨Chip-seq结果可视化之peak检测(上)_第1张图片
  • 生成富集峰的宽度分布图
    • 运行代码
      • width<-as.numeric(d.c1[,'length'])
      • hist(width,breaks = 1000,xlim = range(1:1000),main = 'C1_ChIPed_vs_C1_Input',xlab = 'insert_size',col = 'aquamarine1')
      • 图示2020.9.15丨Chip-seq结果可视化之peak检测(上)_第2张图片
  • 生成富集倍数直方图
    • 运行代码
      • fold<-as.numeric(d.c1[,'fold_enrichment'])
      • hist(fold,ylim = range(1:300),xlim = range(1:30),main = 'C1_ChIPed_vs_C1_Input',xlab = 'fold_enrichment',col = 'aquamarine1')
      • 图示2020.9.15丨Chip-seq结果可视化之peak检测(上)_第3张图片
  • 生成显著性水平分布图
    • 运行代码
      • pvalue<-as.numeric(d.c1[,"X.log10.pvalue."])
      • hist(pvalue,breaks = 100,xlim = range(0:100),main = 'C1_ChIPed_vs_C1_Input',xlab = '-10*log10(pvalue)',col = 'aquamarine1')
      • 图示2020.9.15丨Chip-seq结果可视化之peak检测(上)_第4张图片
  •  

你可能感兴趣的:(生物信息,R语言,Chip-seq)