各种HIC处理数据之间的相互转化

各种HIC处理数据之间的相互转化


目前HI-C数据研究比较火爆,出现了各种各样的工具来分析HI-C。这些工具各有优缺点,而且对应的有不同的下游处理工具。但这些工具的结果数据格式大相径庭。如 juicer的.hic,hic-pro的六列文件,cool,hdf5,homer等。这些文件格式的不同给数据处理也带来了一定的困难。之前我已经介绍过

Hic-pro的结果文件转化为.hic文件,在juicebox中实现可视化,今天我就拓展下数据转化的范围。

今天我们用到的是HiCExplorer

1,安装HiCExplorer


conda install hicexplorer -c bioconda -c conda-forge

这个是官网写的,但我试了几次,都用不了。所以只好从bioconda 重新搜了下载

image-20210125155743530

从三个下载命令中,随便选择一个就好。

2,进行转化


hicexplorer里面工具很多,有兴趣可以详细看一下https://hicexplorer.readthedocs.io/en/latest/content/tools/hicConvertFormat.html

转化使用的工具是它里面的hicConvertFormat

image-20210125160659399

必须的几个参数是:

image-20210125160748677

-m 你需要进行转化的文件

-o 转化后输出的文件

--inputFormat 输入文件格式,就是这几种{H5,cool,hic,homer,hicpro}

--outputFormat 输出文件格式 {cool,h5,homer,ginteractions,mcool}

3,例子


hic to cool
 hicConvertFormat -m matrix.hic --inputFormat hic --outputFormat cool -o matrix.cool --resolutions 10000

--resolutions 分辨率,其中一个[2500000, 1000000, 500000, 250000, 100000, 50000, 25000, 10000, 5000]

cool to cool
hicConvertFormat -m matrix.cool --inputFormat cool --outputFormat cool -o matrix.cool --correction_name KR
homer to cool
hicConvertFormat -m matrix.homer --inputFormat homer --outputFormat cool -o matrix.cool
hicpro to cool
hicConvertFormat -m matrix.hicpro --bedFileHicpro hicpro.bed --inputFormat hicpro --outputFormat cool -o matrix.cool

这些命令都很简单。值得注意的是 .hic只能先转化为.cool文件,然后借助cool文件才能转化为其它类型

cool to h5
hicConvertFormat -m matric_5000.cool --inputFormat cool --outputFormat h5 -o matric.h5 --resolutions 5000

你可能感兴趣的:(各种HIC处理数据之间的相互转化)