TRF--Tandem Repeat Finder

TRF软件是基因组注释中常用于检测序列中串联重复序列的软件,无需安装,使用简单方便。

1. 重复序列分为串联重复序列和散在重复序列(转座子);

串联重复序列又包含卫星序列 >100bp;小卫星序列 10bp < <100bp;微卫星序列 <=10bp;软件有TRF,RepeatMasker

转座子包含反转座子(复制粘贴)和DNA转座子(复制粘贴,剪切);反转座子又包含LTR 长末端重复序列;LINE 长散在元件;SINE 短散在元件;

2. TRF安装

trf下载地址:https://tandem.bu.edu/trf/trf409.linux64.download.html

mv trf409.linux64 trf

chmod a+x trf

3. 软件运行

命令格式:trf File Match Mismatch Delta PM PI Minscore MaxPeriod [options] (注:以上所有数字参数都为正数)

File: 输入文件,fasta格式

Match:匹配权重

Mismatch:错配惩罚分值

Delta:插入缺失惩罚分值

PM:匹配概率

PI:插入的概率

Minscore:报告中比对的分值最小值,相当于筛选阈值

MaxPeriod:重复片段长度的最大值

options: -m 将重复序列屏蔽,即转为N表示;-f 表示输出重复序列两边各500bp碱基,主要用于PCR;-d 生成另外的总结文档,用于后续脚本分析等;-h 压缩html输出,默认会自动加上-d参数;

一般设置参数为:trf sequence.fa 2 7 7 80 10 50 500 -m -f -d

TRF--Tandem Repeat Finder_第1张图片
未加-h参数

4. 结果文件

除了会生成对应的masked文件,就是将重复序列用N表示,还会生成dat文件,展示重复序列的详细信息;masked文件可用于后续注释软件使用

实际结果


TRF--Tandem Repeat Finder_第2张图片
表头说明

此外还可参考http://www.chenlianfu.com/?p=1747

参考网址:http://tandem.bu.edu/trf/trf.unix.help.html

http://tandem.bu.edu/trf/trf.html

http://www.chenlianfu.com/?p=1747

http://tandem.bu.edu/trf/868y4Zg25ikZE.2.7.7.80.10.50.500.1.html

http://tandem.bu.edu/trf/trf.definitions.html#table

你可能感兴趣的:(TRF--Tandem Repeat Finder)