各种HIC处理数据之间的相互转化
目前HI-C数据研究比较火爆,出现了各种各样的工具来分析HI-C。这些工具各有优缺点,而且对应的有不同的下游处理工具。但这些工具的结果数据格式大相径庭。如 juicer的.hic,hic-pro的六列文件,cool,hdf5,homer等。这些文件格式的不同给数据处理也带来了一定的困难。之前我已经介绍过
Hic-pro的结果文件转化为.hic文件,在juicebox中实现可视化,今天我就拓展下数据转化的范围。
今天我们用到的是HiCExplorer
1,安装HiCExplorer
conda install hicexplorer -c bioconda -c conda-forge
这个是官网写的,但我试了几次,都用不了。所以只好从bioconda 重新搜了下载
从三个下载命令中,随便选择一个就好。
2,进行转化
hicexplorer里面工具很多,有兴趣可以详细看一下https://hicexplorer.readthedocs.io/en/latest/content/tools/hicConvertFormat.html
转化使用的工具是它里面的hicConvertFormat
必须的几个参数是:
-m 你需要进行转化的文件
-o 转化后输出的文件
--inputFormat 输入文件格式,就是这几种{H5,cool,hic,homer,hicpro}
--outputFormat 输出文件格式 {cool,h5,homer,ginteractions,mcool}
3,例子
hic to cool
hicConvertFormat -m matrix.hic --inputFormat hic --outputFormat cool -o matrix.cool --resolutions 10000
--resolutions 分辨率,其中一个[2500000, 1000000, 500000, 250000, 100000, 50000, 25000, 10000, 5000]
cool to cool
hicConvertFormat -m matrix.cool --inputFormat cool --outputFormat cool -o matrix.cool --correction_name KR
homer to cool
hicConvertFormat -m matrix.homer --inputFormat homer --outputFormat cool -o matrix.cool
hicpro to cool
hicConvertFormat -m matrix.hicpro --bedFileHicpro hicpro.bed --inputFormat hicpro --outputFormat cool -o matrix.cool
这些命令都很简单。值得注意的是 .hic只能先转化为.cool文件,然后借助cool文件才能转化为其它类型
cool to h5
hicConvertFormat -m matric_5000.cool --inputFormat cool --outputFormat h5 -o matric.h5 --resolutions 5000