12.GWAS:候选基因挖掘

在上一步确定好候选区间后,需要找到候选区间内的基因,即候选区间和参考基因组取交集,用到的工具是bedtools。

关于bedtools的详细用法,推荐这篇文章,介绍的很详细,需要的自取:
https://www.jieandze1314.com/post/cnposts/151/

0.下载安装

各版本的安装包下载链接:https://github.com/arq5x/bedtools2/releases

$ tar xvf bedtools-2.25.0.tar.gz
# 进入目录
$ cd /your/path/bedtools2
#安装
$ make

bedtools现在不太好装,推荐用conda解决。

1.准备区间位置文件

11.GWAS:确定候选区间 - (jianshu.com)
将上一步计算得到的候选基因区间整理为.pos文件,格式如下:
其中第一列为染色体,第二列为区间起始位置,第三列为区间终止位置。

candi_range.pos

2.对位置文件和gff文件进行排序

bedtools的输入文件必须先进行排序再计算,否则会报错:

$ cd ~/bedtools2-2.25.0/bin
$ bedtools sort -chrThenSizeA -i candi_range.pos > candi_range_sort.pos
$ bedtools sort -chrThenSizeA -i genome.gff3 > genome_sort.gff3

3.在基因组范围内查找候选区间中的候选基因

$ ./bedtools intersect -a candi_range_sort.pos -b Cmo_sort.gff3 -wb > candi_gene.pos

查看结果:

candi_gene.pos

引用转载请注明出处,如有错误敬请指出。

你可能感兴趣的:(12.GWAS:候选基因挖掘)