Tools:CrossMap用于基因坐标转换

基因组不同版本之间的转换工具常用的有:
CrossMap(各种转换),liftover(bed转换),picard(VCF转换)
详细讲解各组工具的地址 https://www.biostars.org/p/65558/
基因坐标转换工具合集
CrossMap使用教程官网

CrossMap软件版本目录
下载原始的tar.gzw文件
安装

tar -zxvf CrossMap-0.4.0.tar.gz
cd CrossMap-0.4.0
python3 setup.py install --root=/public//home/tang/soft/CrossMap

安装完成后,根据链接,修改path,或者直接使用。

#找到文件的路径
which CrossMap.py
#直接运行
python3 /public//home/tang/soft/CrossMap/CrossMap-0.3.9/bin/CrossMap.py
##/public//home/tang/soft/CrossMap/路径是我存放CrossMap-0.3.9.tar.gz的目录位置。

自己修改上述的安装目录,毕竟大多数人都不是root管理员。

方法二:(需要自行解决依赖包安装)
pip3 install CrossMap --user
CrossMap依赖其他的包
pyBigWig
pysam
bx
bx.intervals
依赖比较多,根据提示在安装3-5个依赖后,基本可以解决。目前使用的是0.3.9版本。下载地址
一定要注意,这些版本不支持python2,必须要python3。

  • CrossMap (version 0.2.3 to 0.2.9) supports Python2.7.*
  • CrossMap (>= 0.3.0) supports Python3
#conda create --name CrossMap
source activate CrossMap
pip install CrossMap
which CrossMap.py
python3 /CrossMap.py

可能会遇到numpy的错误,

解决方法:

pip uninstall numpy
pip install numpy
pip uninstall CrossMap
pip3 install CrossMap

conda的使用

jian书的链接不支持ftp地址,直接复制链接访问
对于非模式生物的chain文件下载:可以直接到对应物种ensembl站点,选择Assembly_chain。
玉米的Assembly_chain地址ftp://ftp.gramene.org/pub/gramene/CURRENT_RELEASE/assembly_chain/zea_mays/

使用CrossMap转换vcf坐标

#此处是将hg19转换为hg38
CrossMap.py vcf GRCh37_to_GRCh38.chain.gz genes_noINS.vcf hg38.fa hg38.genes_noINS.vcf

你可能感兴趣的:(Tools:CrossMap用于基因坐标转换)