由于PROCHECK这个工具真的相对比较久远了,哪怕官方给出的文档也存在部分代码无法使用了的问题.因此来记录下RPOCHECK的安装过程.下面是相关资料下载地址:
软件包下载:https://www.ebi.ac.uk/thornton-srv/software/PROCHECK/download.html
参考文献:
Deviations from Standard Atomic Volumes as a Quality Measure for Protein Crystal Structures
AQUA and PROCHECK-NMR: Programs for checking the quality of protein structures solved by NMR
随着蛋白结构预测工具alphafold2的流行以及基于人工智能的生物大分子结构重构技术的不断强化, 如何对预测的蛋白结构进行有效的评估就成为了一个新的议题, 除了远近闻名的CASP比赛这样的使用未发布的新型蛋白结构作为对照来反映蛋白结构预测工具的准确度的方式以外,依赖几何结构, 能量项, 相互作用的通用计算指标也不失为一种简单且好用的评估方式, 而PROCHECK就是这样的一种工具.
提示:以下是本篇文章正文内容,下面案例可供参考
在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度 psi. PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成如下的Ramachandran图表示
横坐标为φ角, 纵坐标为ψ. 图中按颜色分为最合理区 (the most favored regions), 其它合理区 (the additional allowed regions), 一般合理区 (the generous allowed regions), 不合理区(the disallowed regions)。蓝色的点代表着所有的2面角, 当不少于90%的二面角分布在最佳合理区时,则蛋白质的结构是合理的。
解压软件包中的procheck.tar.gz文件, 将procomp.scr文件内的F77改为自己在用的forran语言编译器.(如gfortran), 以及删掉convax.for中的**CARRIAGECONTROL=‘LIST’**语句(该语句已经在新版本中被弃用,会报错)
之后进行在命令行进行如下操作完成安装过程:
csh procomp.scr #运行procomp.scr文件对文件夹中的文件进行编译, 有warning不用管,不影响使用
gfortran -o convax convax.for #编译convax.for文件
./convax #运行convax程序将.f后缀文件修改为.for
之后修改环境变量, 由于procheck中需要一个只想procheck根目录的prodir的环境变量才能运行,因此需要一个小写的变量名(实在变扭 +_+)
#procheck
export PRODIR="/path/to/your/procheck"
export prodir=$PRODIR
alias procheck="$PRODIR/procheck.scr"
alias proplot="$PRODIR/proplot.scr"
alias gfac2pdb="$PRODIR/gfac2pdb.scr"
alias viol2pdb="$PRODIR/vio2pdb.scr"
alias wirplot="$PRODIR/wirplot.scr"
使用方法如下所示(示例):
procheck coordinate_file [chain-ID] resolution #无图输出
proplot coordinate_file [chain-ID] resolution #有图输出
其中 coordinate_file问pdb蛋白文件路径, [chain-ID]为链的序号(如A),是可选项可以不填, resulution为蛋白文件的分辨率.