tRNAscan-SE安装使用教程

TIPs:

最近帮一个老师用SPORTS软件分析miRNA(也可以分析其他小RNA)序列的结构特征,可能会用到以下数据库,Few main database source:
mirbase database
rRNA database
GtRNAdb database
mitotRNAdb database
piRBase database
piRNABank
ensembl ncRNA database
rfam database
其中有些数据库中没有我需要的物种数据信息,需要借助其他软件分析提取,例如GtRNAdb database中没有鸽子tRNA信息,因此就需要下面的方法来预测tRNA出来。
推荐两个博客资源:1)https://blog.csdn.net/herokoking/article/details/77853662;2)https://blog.csdn.net/weixin_43569478/article/details/108079199

软件安装和测试

$ wget -c http://eddylab.org/infernal/infernal-1.1.2-linux-intel-gcc.tar.gz
$ tar xzvf infernal-1.1.2-linux-intel-gcc.tar.gz
$ cd infernal-1.1.2-linux-intel-gcc/
$ ./configure --prefix=/user/software/infernal-1.1.2-linux-intel-gcc
$ make && make install
$ cp binaries/*  bin

$ wget -c http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz
$ tar -xvf tRNAscan-SE.tar.gz
$ mkdir tRNAscan-SE-2.0_installed # 跳过此操作安装在解压目录下也可以
$ ./configure --prefix=/user/software/tRNAscan-SE-2.0_installed
$ make && make install
# 添加bashrc【建议】或者terminal运行
    export PATH=/user/software/tRNAscan-SE-2.0_installed/bin:$PATH
    export PERL5LIB=/user/software/tRNAscan-SE-2.0_installed/lib:$PERL5LIB

# 需要编辑/user/software/tRNAscan-SE-2.0_installed/bin/tRNAscan-SE.conf文件,每个项目单独拷贝到相应目录下编辑保存
    bin_dir:/user/software/tRNAscan-SE-2.0_installed/bin
    lib_dir: /user/software/tRNAscan-SE-2.0_installed/lib
    infernal_dir: /user/software/infernal-1.1.2-linux-intel-gcc/bin

# 查看帮助说明和具体参数
$ tRNAscan-SE --help
tRNAscan-SE /user/database/GeZi_ncbi_1.0/final.fa -o final.out -f final.ss -s final.iso  -m final.stats -b final.bed -c /user/software/tRNAscan-SE-2.0_installed/bin/tRNAscan-SE.conf
# 该命令产生的结果与Demo文件夹中的结果文件类型一致,其中参数
  -o 结果文件
  -f 二级结构(tRNA)文件
  -s (Isotype specific)结果
  -m 统计文件(statistics)
  -b 输出bed格式结果,也可不设置

结果文件展示

final.out

Sequence Name: 输入的用于预测tRNA的序列名称
tRNA: 预测到的tRNA的个数(第n个)
tRNA Begin: tRNA基因的起始位置
Bounds End: tRNA 基因的终止位置
tRNA Type: tRNA 的类型,该tRNA转运的氨基酸的类型
Anticodon: 反义密码子
Intro Begin: 内含子的起始位置
Bounds End: 内含子的终止位置
Inf Score: cutoff score for reporting tRNAs (default=20)这里输出阈值以上的预测结果


final.out

final.ss

Str 代表的就是二级结构,其中每个< 和每个 > 是配对的,代表在二级结构中这两个碱基是连在一起的。
final.ss

final.iso

tRNAscan-SE 会根据反义密码子和 Isotype Model 两种方法预测tRNA的类型,对于每个tRNA, 分别给出反义密码子和 Isotype Model 预测的结果,以及两种结果预测的一致性,其中isotype model 会对每一种氨基酸进行打分,选得分最高的作为最终的结果
final.iso

final.stats

运行环境、参数等的设置在这里,另外还统计了基因组处理的过程、指标的统计。
final.stats

final.stats

bed输出我没跑,放上demo中的bed,估计我们文件产生的格式与之一致,至于bed文件现在看来作为常识了,自己百度吧。
bed文件

总结

  1. http://lowelab.ucsc.edu/tRNAscan-SE/index.html 可以网页版运行,很方便,但是注意网页中内置的参数等问题:
    网页运行
  2. 注意tRNA鉴定(search)的模式,或者如果不知道某些参数(score)的涵义等等,可以grep一下。
    search
    score
  3. 最后,聊以记录我学习该软件的过程,欢迎交流学习!

你可能感兴趣的:(tRNAscan-SE安装使用教程)