homer安装和使用

介绍

安装

1.下载homer文件

网址:http://homer.ucsd.edu/homer/download.html

下载其中名为configureHomer.pl的文件。

2.在~目录下新建文件夹:homer

mkdir homer

3.将刚下载的pl文件移至homer文件夹中:

mv configureHomer.pl homer

4.开始安装Homer软件:

perl /home/wuxiaobin/homer/configureHomer.pl -install (根据自己的confihureHomer.pl所在的路径更改)

5.将可执行的二进制文件的路径添加至环境变量文件中

vi ~/.bashrc

6.在.bashrc文件的最后一行加上一下内容:

export PATH=/home/wuxiaobin/homer/bin:$PATH

7.激活刚刚添加的环境变量文件:

source .bashrc

使用

homer是一款基于测序数据预测或寻找motif的软件,通常运用于chipseq和clipseq,原因在于探究这些结合蛋白是否会特定结合基因组上的特定序列——称之为motif。

所以如果能够预测知道这些motif,将预测的motif回帖到基因组上,那就可以知道这些蛋白潜在的结合位点。

功能介绍:

1、预测基因组的motif以及对现有注释的motif进行富集

2、可以根据预测完的motif,进行基因组的回帖比对,从而预测蛋白质结合调控于哪些基因

原理:

将pc序列分割成寡聚核苷酸,长度可设定,默认为8,10,12,然后homer会统计所有的相同的序列,这里允许错配,默认为2,统计所有相同的寡聚核苷酸,计算每条寡聚核苷酸位置,四个碱基的比例,从而预测出结果。当完成一条motif预测的时候,与该条motif对应的序列会被删掉,然后重复上述,进行motif地迭代查找。默认25条。

随后,将预测的motif回帖到基因组回去,homer很良心,有可以将得到的motif文件直接回帖到基因组上的函数:http://homer.ucsd.edu/homer/motif/genomeWideMotifScan.html

回扫之后会得到bed文件,该文件记录着motif与基因组的对应信息:

BED (tab) format (use-bed):

chr

start

end

motif name

log-odds score (will be floored to an integer)

strand

最后,可以再将这份bed与gtf参考组做交集,就可以得知每个motif具体结合哪些基因了,更进一步说,可以知道哪些蛋白可能结合哪些基因组或者转录组。

你可能感兴趣的:(homer安装和使用)