ChIP-Seq数据挖掘系列-4: liftOver - 基因组坐标在不同基因组注释版本间转换

UCSC Genome Browser

liftover 是UCSC提供的一个用于不同基因组注释版本间基因组坐标转换的工具。UCSC 提供了一个web版本;数据过多时用起来很不方便,也可以下载程序到本地进行批量操作。

应用: 已经发表的chipseq peak 结果可能基于不同基因组版本,这样就不好直接比较某些peak之间的关系了,重新分析一次数据需要时间成本;因此,使用liftover将peak位置信息转换到同一基因组版本不失为为一个简单的方法。


#1. 网页版 liftover在线使用

##1.1 UCSC 官网的web版liftover :

web版liftover

ChIP-Seq数据挖掘系列-4: liftOver - 基因组坐标在不同基因组注释版本间转换_第1张图片
web版liftover

##1.2 使用方法

  1. 选定原始数据物种及版本信息
  2. 选定需要转化的目标物种及版本信息
  3. 上传数据或直接黏贴数据,提交

##1.3 示例

chr1    3505060 3505170
chr1    4504150 4504258
chr1    4791886 4792031
chr1    4792358 4792452
chr1    4797825 4797956
chr1    7079047 7079164
chr1    9550473 9550602
chr1    9615477 9615630
chr1    9616792 9616994
chr1    9623913 9624108
chr1    9624276 9624419
chr1    9685842 9685935
chr1    9929393 9929495
chr1    9932939 9933071
chr1    9974265 9974358

##1.4 示例操作结果和参数使用

ChIP-Seq数据挖掘系列-4: liftOver - 基因组坐标在不同基因组注释版本间转换_第2张图片
Result and Parameters Used

#2 命令行版本liftover

##2.1 根据自己系统选择程序版本

版本选择
[linux.x86_64 liftOver]: http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/liftOver

##2.2 使用方法

$ chmod +x liftOver
$ liftOver input.bed map.chain output.bed unMapped.bed
#input.bed: 输入数据
#output.bed:转换成功的坐标
#unMapped.bed:转换失败的坐标

##2.23 map.chain

liftOver工作需要的一个转换数据,此数据可以从UCSC下载;

  • map.chain数据下载,以mm10ToHg19.over.chain 为例:
    mm10ToHg19.over.chain.gz包含了将mm10 (Mouse GRCm38) 坐标转换成 hg19 (Human GRCh37)坐标需要的信息。
    • UCSC -> Downloads -> Genome data -> Mammals
      -> Mouse -> (GRCm38/mm10) -> LiftOver files


ChIP-Seq 数据挖掘系列文章目录:
ChIP-Seq数据挖掘系列-1:Motif 分析(1)-HOMER 安装
ChIP-Seq数据挖掘系列-2: Motif 分析(2) - HOMER Motif 分析基本步骤
ChIP-Seq数据挖掘系列-3: Motif 分析(3) - 利用ChIP-Seq结果在基因组区域中寻找富集的Motifs
ChIP-Seq数据挖掘系列-4: liftOver - 基因组坐标在不同基因组注释版本间转换
ChIP-Seq数据挖掘系列-5.1: ngs.plot 可视化ChIP-Seq 数据
ChIP-Seq数据挖掘系列-5.2: ngs.plot 画图工具ngs.plot.r 和 replot.r 参数详解

你可能感兴趣的:(ChIP-Seq数据挖掘系列-4: liftOver - 基因组坐标在不同基因组注释版本间转换)