Hi-C分析练习(从cool文件到可视化热图)

在上一篇笔记里,介绍了如何从fastq文件得到.cool文件(.mcool)(Hi-C分析练习(从fastq文件到contact矩阵)),现在就要对这个contact矩阵进行可视化了。在哈佛医学院的教程里,可视化的这一步需要安装docker,并且要进行一系列的配置设置(https://docs.higlass.io/higlass_docker.html),非常的麻烦,如果电脑不给力或者比较懒的同学来说(比如我)就不好上手来练习,那么有什么简单的方法可以简单的了解Hi-C分析得到的cool文件的可视化吗?答案是:当然。

作为初学者,你所遇到的所有问题,基本上google全都可以解决。比如我懒得去配置docker软件,可以这样:

然后就发现了一个网页:https://www.biostars.org/p/360254/,这里有人提供了一个网址,里面介绍了很多文件进行可视化的方法:here。

首先:安装higlass-python:

$ pip install higlass-python

安装好以后,需要打开jupyter notebook,关于如何打开jupyter notebook的网页版,请移步我之前的文章:ipython的初步了解。

打开jupyter notebook:

#输入以下代码
import higlass
import higlass.client as hgc
import higlass.tilesets as hgti
ts1 = hgti.cooler('./output.mcool') #这是在前一篇笔记里得到的mcool文件的路径
tr1 = hgc.Track('heatmap', tileset=ts1)
view1 = hgc.View([tr1])
(display, server, viewconf) = higlass.display([view1])
display

然后,点击run,就会得到一张热图了:

点击右上角的加号,还可以添加track,比如RNA-seq或者Chip-Seq,或者添加基因的注释等等,添加的位置可以自己选择是加在热图的上下左右:

举个例子,这里我想给热图添加基因注释,添加在热图的上方,就点击“top”,会弹出很多Higlass收录的一些已经发表的结果,比如一些人上传的RNA-seq和Chip-seq数据,这里我选择gene annotation,打开它的下拉菜单:

因为我们得到的这个mcool文件是根据hg38基因组比对得到的,所以也选择hg38,选中之后点击右下角的submit:

这时显示的基因并不全,你可以用鼠标滚轮把热图进行放大,随着放大的图像,基因的annotation会逐渐的多起来,比如我把热图放大很多倍:

这时你会看到热图中的每一个小点都被放大成了一个方框,这个方框就是之前我们在上游分析中设置的分辨率。而上方的基因注释也被放大的很清晰,你可以清楚的看到每一个基因的方向。

然后点击右上角的“设置”:

你可以把这张图保存,也可以导出json文件格式:

拿到这个json文件,你还可以到higlass网站,进行在线的可视化,网址:http://higlass.io/。

打开网站,长这样:

注意这个热图是人家的例子,不是你刚做的热图。把你之前保存的.json文件拖到上面“Drag &drop a config”那里,然后就自动生成一个热图了,和你在jupyter notebook里做的图是一样的~

当然Hi-C的可视化还有其他的软件可以用,这里我就先只介绍这一种。待今后如果涉及到Hi-C实验会进行更深入的了解~

你可能感兴趣的:(Hi-C分析练习(从cool文件到可视化热图))