ChIP-seq 分析:文库的复杂性和丰富性(7)

1. 文库复杂性

ChIPseq 中的一个潜在噪声源是 ChIPseq 库在 PCR 步骤中的过度放大。这可能会导致大量重复读取,从而混淆峰值调用。

ChIP-seq 分析:文库的复杂性和丰富性(7)_第1张图片

2. 重复

我们应该比较样本之间的重复率,以确定任何经历过度放大的样本,从而确定复杂性较低的可能性。

flattagcounts() 函数报告可以报告重复的数量和总映射读取,因此我们可以从那里计算我们的重复率。

myFlags <- flagtagcounts(myQC)
myFlags["DuplicateByChIPQC", ]/myFlags["Mapped", ]

myFlags

3. 跨基因 reads 富集

我们还可以使用 ChIPQC 使用 plotRegi() 函数来查看我们在基因特征上的 reads 分布。

在这里,与输入样本相比,我们预计 ChIPseq 信号在 5'UTR 和启动子中更强。

p <- plotRegi(myQC)

ChIP-seq 分析:文库的复杂性和丰富性(7)_第2张图片

本文由mdnice多平台发布

你可能感兴趣的:(程序员)