使用JBrowser配置参考基因组和基因注释信息

准备参考基因组hg19及其基因的注释文件

可以在UCSC网站的官网上下载hg19参考基因组的序列和基因注释文件
image.png

使用JBrowser自带的脚本导入参考基因组序列

cd /var/www/html/JBrowse-1.16.4/
mkdir data && cd data  #新建一个data文件夹用于存放不同的基因组
mkdir hg19 && cd hg19  #新建hg19文件夹用于存放hg19参考基因组
# 使用gffread将gtf格式基因注释文件转换为gff3格式文件
/data/public/software/cufflinks-2.2.1/gffread hg19.gencode.v14.annotation.gtf -o- < hg19.gencode.v14.annotation.gff3
# 使用脚本prepare-refseqs.pl导入hg19参考基因组
../../bin/prepare-refseqs.pl --fasta hg19.fa --out ./

导入参考基因组后,会在当前文件夹中生成一个seq文件夹和trackList.jsontracks.conf两个配置文件。

使用JBrowser自带的脚本导入基因注释信息

目前JBrowser对基因的注释信息提供了两种feature的展示形式:HTMLfeaturesCanvasFeatures。其中HTMLfeatures暂时只支持gff3格式文件,而CanvasFeatures可以同时支持gtf和gff3格式,但是它是临时读取文件的,在browser中显示的速度会比较慢。

  • HTMLfeatures导入
# 查看使用说明信息
../../bin/flatfile-to-json.pl -h
Usage:
      flatfile-to-json.pl                                                         \
          ( --gff  | --bed  | --gbk  )         \
          --trackLabel                                          \
          [ --trackType  ]                                              \
          [ --out  ]                                            \
          [ --key  ]                                   \
          [ --className  ]                \
          [ --urltemplate "http://example.com/idlookup?id={id}" ]                 \
          [ --arrowheadClass  ]                                        \
          [ --noSubfeatures ]                                                     \
          [ --subfeatureClasses '{ JSON-format subfeature class map }' ]          \
          [ --clientConfig '{ JSON-format style configuration for this track }' ] \
          [ --config '{ JSON-format extra configuration for this track }' ]       \
          [ --thinType  ]                                         \
          [ --thicktype ]                                        \
          [ --type  ]                                   \
          [ --nclChunk  ]                          \
          [ --compress ]                                                          \
          [ --sortMem  ]                      \
          [ --maxLookback  ]  \
          [ --nameAttributes "name,alias,id" ]                                    \
# 使用flatfile-to-json.pl脚本导入基因注释信息
../../bin/flatfile-to-json.pl --gff hg19.gencode.v14.annotation.gff3 --type mRNA --trackLabel GeneAnnot --key 'GFF3-mRNA-HTMLfeatures' --className transcript --getSubfeatures --subfeatureClasses '{"CDS": "transcript-CDS"}' --arrowheadClass arrowhead --autocomplete all --metadata '{"category" : "GeneAnnotation"}' --out ./

导入基因的注释信息后,会在当前文件夹下生成一个tracks文件夹,并将相应基因注释的配置信息写入到trackList.json配置文件中。

  • CanvasFeatures导入
    编辑生成的tracks.conf文件,直接在里面添加相应基因注释的配置信息
    (1) 导入gff3文件
    在./tracks.conf文件中添加以下配置信息:
[ tracks . hg19-GFF3 ]
storeClass = JBrowse/Store/SeqFeature/GFF3
urlTemplate = ./hg19.gencode.v14.annotation.gff3
type = CanvasFeatures
category = Gene
key = GFF3-hg19-CanvasFeatures

(2) 导入gtf文件
在./tracks.conf文件中加入以下配置信息:

[ tracks . hg19-GTF]
storeClass = JBrowse/Store/SeqFeature/GTF
urlTemplate = ./hg19.gencode.v14.annotation.gtf
type = CanvasFeatures
category = Gene
key = GTF-hg19-CanvasFeatures
style.label = transcript_id,gene_id

在浏览器中展示hg19参考基因组及其基因注释信息

打开google浏览器,在里面直接输入服务器对应的ip地址和文件路径即可查看相应基因组的相关信息
http://xxx.xxx.xxx.xx/JBrowse-1.16.4/index.html?data=data/hg19/

使用JBrowser配置参考基因组和基因注释信息_第1张图片
image.png

你可能感兴趣的:(使用JBrowser配置参考基因组和基因注释信息)