ChIP-seq笔记

文章目录

  • ChIP-seq学习
    • 1 数据下载
      • 1.1 数据主要分为三个部分
      • 1.2 从NCBI上下载数据
    • 2 质量控制
      • 2.1 软件安装
      • 2.2 转化数据格式 sra ----- fastq
      • 2.3 下载小鼠参考基因组的index
      • 2.4 质量检测
      • 2.5 质控结果批量查看
      • 2.6 数据清理
    • 3 对比到参考基因组
      • 3.1 bowtie2
        • 3.1.1 首先介绍一下bowtie2的一些参数
      • 3.2 index必须与待匹配的read.fastq文件放在同一个目录下,方可开始匹配。
    • 4 搜峰
      • 4.1 MACS2
      • 4.2MACS2 核心: callpeak 用法
      • 4.3 实际操作语句
      • 4.4 参数介绍
      • 4.5 callpeak 结果文件说明
      • 4.5.1
    • 5 峰注释
    • 6 作图分析
      • 6.1 ChIP peaks结合TSS 区域的情况
        • 6.1.1 Heatmap of ChIP binding to TSS regions (chip结合到TSS区域的热图)
        • 6.1.2 Average Profile of ChIP peaks binding to TSS region (chip峰值对TSS区域的平均配置)
    • 6.2 peaks注释
    • 7 组合可视化分析

ChIP-seq学习

这是我第一次做ChIP-seq,将所有的步骤以及代码全部记录下来,如有错误欢迎大家指正。

chip-seq主要有四个步骤
Cross-linking(DNA和蛋白质交联)
Sonication(超声将染色体切割)
IP(利用抗原抗体的特异性识别)
Sequencing(测序)

(Linux操作系统CentOS)
流程图
ChIP-seq笔记_第1张图片

1 数据下载

1.1 数据主要分为三个部分

(1)ivf GSE112546
(2)scnt GSE112546
(3)zyy GSE73952

1.2 从NCBI上下载数据

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR714/SRR7145717/SRR7145717.sra #Morula.IVF.H3K27me3.Rep1
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR714/SRR7145718/SRR7145718.sra #Morula.IVF.H3K27me3.Rep2
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR714/SRR7145722/SRR7145722.sra #Morula.IVF.Input

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR714/SRR7145719/SRR7145719.sra #Morula.SCNT.H3K27me3.Rep1
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR714/SRR7145720/SRR7145720.sra #Morula.SCNT.H3K27me3.Rep2
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR714/SRR7145721/SRR7145721.sra #Morula.SCNT.Input

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208744/SRR3208744.sra #MII Oocyte Input
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208749/SRR3208749.sra #MII Oocyte H3K27me3 rep1
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208750/SRR3208750.sra #MII Oocyte H3K27me3 rep2
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208751/SRR3208751.sra #MII Oocyte H3K27me3 rep3

ESC
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208788/SRR3208788.sra #ESC input
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208791/SRR3208791.sra #ESC H3K27me3 rep1
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208792/SRR3208792.sra #ESC H3K27me3 rep2
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208793/SRR3208793.sra #ESC H3K27me3 rep3
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208794/SRR3208794.sra #ESC H3K27me3 rep4

TSC
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208795/SRR3208795.sra #TSC input
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208799/SRR3208799.sra #TSC H3K27me3 rep1
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208800/SRR3208800.sra #TSC H3K27me3 rep2
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR320/SRR3208801/SRR3208801.sra #TSC H3K27me3 rep3


2 质量控制

2.1 软件安装

#安装sratoolkit

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz

#解压sratoolkit

tar -zxvf sratoolkit.2.9.2-centos_linux64.tar.gz

2.2 转化数据格式 sra ----- fastq

for i in *sra 
do
echo $i
/data/sunyu/h3k27/sratoolkit/sratoolkit.2.9.2-centos_linux64/bin/fastq-dump --split-3 $i; 
done

2.3 下载小鼠参考基因组的index

wget -c "ftp://ftp.ccb.jhu.edu/pub/data/bowtie2_indexes/mm10.zip" &```
unzip mm10.zip 

2.4 质量检测

for i in *fastq
do
fastqc -t 4 $i
done

2.5 质控结果批量查看

multiqc *fastqc.zip --export 

如果没有添加环境变量可采用一下方法

export PATH=$PATH:/data/sunyu/anaconda2/bin
multiqc *fastqc.zip --export 

##trimmomatic

安装 trimmomatic

wget -c http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.38.zip &
unzip Trimmomatic-0.38.zip

2.6 数据清理

-threads 设置多线程运行

java -jar /data/sunyu/h3k27/trimmomatic/Trimmomatic-0.38

你可能感兴趣的:(ChIP-seq学习笔记)