同源建模之I-TASSER

同源建模之I-TASSER

1. I-TASSER简介

​ I-TASSER (Iterative Threading ASSEmbly Refinement)是一种用于蛋白质结构和功能预测方法。它首先通过多线程方法LOMETS从PDB中识别结构模板,并通过基于迭代模板的碎片组装模拟构建完整的原子模型。接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化,从而预测靶标的功能。在最近的社区范围的比赛CASP7、CASP8、CASP9、CASP10、CASP12和CASP13实验中,I-TASSER(即“Zhang Server”)被列为蛋白质结构预测的首选服务器。在CASP9中,它也是功能预测的最佳工具。该服务器正在积极开发,目标是使用最先进的算法提供最精确的蛋白质结构和功能预测。

2. I-TASSER服务器版

I-TASSER服务器版只需要提交序列(序列大小10-1500个氨基酸)

填写序列、账户和作业名(ID)即可提交至服务器Run I-TASSER

同源建模之I-TASSER_第1张图片

注:在使用服务器前必须先使用教育邮箱注册申请。

3. I-TASSER申请、下载和安装

3.1 注册

使用教育邮箱(.edu)注册申请I-TASSER Suite本地程序。

3.2 下载

下载本地程序I-TASSER5.1.tar.bz2

3.3 安装
tar -xjvf I-TASSER5.1.tar.bz2
cd I-TASSER5.1/

解压完成即可使用。其中I-TASSER5.1/I-TASSERmod/runI-TASSER.pl为主要使用脚本。

3.4 下载依赖库

通过I-TASSER5.1/download_lib.pl脚本下载所需数据,约94 GB.

nohup perl I-TASSER5.1/download_lib.pl -libdir libdir -P true -B true -N true &

4. I-TASSER Suite运行

4.1 下载序列

下载fasta序列,并修改文件名为seq.fasta

wget https://www.uniprot.org/uniprot/P29590.fasta
mv P29590.fasta seq.fasta
4.2 运行runI-TASSER.pl

编写PBS脚本run.qsub进行计算。

qsub run.qsub

run.qsub脚本如下:

#!/bin/bash
#PBS -q q_share
#PBS -V
#PBS -N P29590
#PBS -l nodes=1:ppn=24
#PBS -o /home/homo_model/P29590/log
#PBS -j oe
cd /home/homo_model/P29590/

/I-TASSER5.1/I-TASSERmod/runI-TASSER.pl -libdir /I-TASSER5.1/lib/ -seqname P29590 -datadir /home/homo_model/P29590/ -LBS true

-libdir:是指download_lib.pl所下载库的路径/I-TASSER5.1/lib/

-seqname:是指查询序列的名称

-datadir:是指包含有seq.fasta文件的目录

-LBS true:是指预测ligand-binding site,默认为false

4.3 运行流程
  1. standardize seq.fastato seq.txtand get the sequence length.

  2. run psiblastto generate chk, ou, pssm, mtx files.
    runPSSpred to getseq.dat, seq.dat.ss.
    run solve to get exp.dat.
    run pairmod to get pair1.dat and pair3.dat.

  3. run threading programs sequentially.
    run mkinit.plto generate restraints.

  4. run I-TASSER simulation.

  5. run SPICKER clustering program.
    run get_cscore.pl to get confidence score.
    run EMrefinement.pl to get full-atomic models.
    run get_rsq_bfp.pl to get local accuracy and B-factor estimations.

  6. run runCOACH.pl to generate ligand-binding sites, EC number and .
    GO terms predictions.

4.4 结果分析

最终生成5个结构,取C-socre最高构象,辅助参考TM-score值,一般取model1.pdb

你可能感兴趣的:(药物设计软件,Linux,shell,bash)