Chip-seq原理篇

CHIP-seq

染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。

实验流程:

(1)甲醛交联整个细胞系(组织),即将目标蛋白与染色质连结起来;(这一步一般会检测下交联情况)
(2)分离基因组DNA,并用超声波将其打断成一定长度的小片段;
(3)添加与目标蛋白质特异的抗体,该抗体与目标蛋白形成免疫沉淀免疫结合复合体;(chip级别的抗体,会有效率问题存在,很考验抗体质量和操作)
(4)去交联,纯化DNA即得到染色质免疫沉淀的DNA样本,准备测序;
(5)将准备好的样本进行深度测序(一般会准备空白对照,排除假阳性,有两种,1.input DNA:不用任何抗体拉的DNA;2.mock IP DNA:用不含有抗体的DNA)


image.png

分析流程:

(1)质量控制,质量可以先用fastqc快速可视化一下,很多上传到geo的数据质量都非常棒,基本不用什么处理,如果需要处理,trimmomatic,cutadapter,trim galore等等。
(2)序列比对,用bowtie2或者bwa都可以(但是这里有一个问题,很多文章他会提到read uniquely mapped 来进行下游分析,bowtie可以通过设置-m 1 参数,但是对于bowtie2以及bwa,并不存在这样的参数,可以使用bwa输出中的XT:A:U(用于标记unique hit)以及tophat中的NH:i:1(用于标记unique hit)来进行过滤,bowtie2则可以根据sam或bam文件的tag来提取)

grep “AS:” aligned.sam | grep –v“XS:” >unique_alignments.sam

(3)peak calling,macs(做很长的修饰peak时,可以考虑rseg)

(4)peak注释,Y叔的chipseeker,deeptools也很棒,我看很多文章的profile图都是deeptools画的

质控和序列比对,NGS步骤都差不多,chipseq主要不同在于callpeak

image.png

我们测得的read只是跟随着TF一起沉淀下来的DNA fragment的末端,所以它体现的read位置不是真实的TFbindind的位置。在callpeak之前,read会进行延伸,延伸的reads会平均的分布到正负链,因此在TFbind的附近会形成双峰。MACS会根据某个window size扫描基因组,统计每个window里面的reads富集程度,然后抽取合适的window做样本,建立双峰模型,而双峰之间的距离就被认为TF的长度D,每个read延伸D/2的长度。

你可能感兴趣的:(Chip-seq原理篇)