植物chip-seq数据的可视化(Y叔的神器chip-seeker包)

近期接手一个chip-seq项目,在call出来peak之后,发现在可视化这一块对植物并不友好。对于动物来说,整套流程都是极其详细的,但是相对于植物,流程的各个部分都是零零散散的。在这里整合一下各路大神对于植物可视化的流程,方便植物领域的同行们参考。纯粹是一个生信小白的搬运工作,如果有侵权,请联系我,立删。

为什么不用chip-seek可视化网站?唉,没办法,网站对我不友好,提交不了任务。好,话不多说,分析开始,所有步骤都在R里面完成。

source ("https://bioconductor.org/biocLite.R")

biocLite("ChIPseeker")

biocLite("DO.db")

library("ChIPseeker") 

以上为调用Y叔的chip-seeker包的步骤(不过现在基本上都用下文提到的BiocManager方法来安装各种包了),若是动物,可直接调用txdb对象,植物的话,需要自己制作。接下来就是制作植物的txdb对象的方法,本方法参考另一位大神“https://www.jianshu.com/p/4a92ce5174fb”,可直接去搜索他的“灵动的小猪”,写的很详细,是玉米的,我用的水稻的,都是模式植物。

install.packages("BiocManager")  #选择CRAN镜子时直接选第一个

BiocManager::install("GenomicFeatures", version = "3.8")

BiocManager::install("biomaRt", version = "3.8")

library("GenomicFeatures")

library("biomaRt")

listMarts()

listMarts(host = "http://plants.ensembl.org")

mart<-useMart(biomart = "plants_mart",host = "http://plants.ensembl.org")

datasets <- listDatasets(mart)

datasets$dataset #此步骤会出现植物品种列表,选择自己所需的即可

rice_txdb <- makeTxDbFromBiomart(biomart = "plants_mart",dataset = "osativa_eg_gene",host = "http://plants.ensembl.org")

saveDb(rice_txdb, file="rice_2019_07.sqlite")

上面的一步步来,就把对象建好了。最后txdb文件被命名为了“rice_2019_07.sqlite”,保存在了当前的工作目录下。若是想知道每步具体啥意思,可以去大神的里看。

以上步骤是第一次用的时候需要做的,若是第二次用的时候,只需要调用两个包就好了,如下:

library("ChIPseeker")

library("GenomicFeatures")

rice_txdb <- loadDb("rice_2019_07.sqlite")  #调用你建好的txdb对象

然后就是激动人心的时候,该步骤参考Y叔写的“chip-seq数据分析大礼包”记得去关注Y叔的公众号biobabble,绝对的大神

H3K27ac <- readPeakFile("H3K27ac_peaks.narrowPeak")

covplot(H3K27ac,weightCol=5)  #所有染色体上峰值分布图

covplot(H3K27ac, weightCol=5, chrs=c("Chr4","Chr6", "Chr5")) #部分染色体


接下来是peak的注释,最好自己下载注释文件来制作txdb对象,快速便捷

rice_anno_txdb <- makeTxDbFromGFF("Oryza_sativa.IRGSP-1.0.44.chr.gff3.gz")  #自行下载注释的文件。推荐ensemblplants

peakAnno <- annotatePeak(H3K27ac, tssRegion=c(-3000, 3000),TxDb=rice_txdb, annoDb="rice_anno_txdb") #报错信息我直接忽视了

plotAnnoPie(peakAnno)


plotAnnoBar(peakAnno)


vennpie(peakAnno)

upsetplot(peakAnno)

以上就是peak及peak注释可视化,是不是很方便?具体啥意思或者想要其他图片可以直接关注Y叔公众号去找到该包。

按照上述流程完全可以跑通,该流程适用于植物的chip-seq数据可视化,网上的很多流程包含了一些容易出错的和容易把人绕晕的步骤,已尽量避开。

生信小白,努力学习中,写的不对的地方请指出,欢迎多交流!

你可能感兴趣的:(植物chip-seq数据的可视化(Y叔的神器chip-seeker包))