蛋白三级结构预测(I TASSER)

献给初学者:手把手教你在线预测蛋白质结构
I TASSER算是比较好的华人教授开发的一个预测软件,在线可以直接分析。但是需要等待挺长时间并且一次只能run一个。所幸我们HPC上有这个软件所以我就直接run起来代码如下。
先将RNA序列用CPC2预测下氨基酸序列,当然也可以下已知的氨基酸序列,存储为fasta格式,我上批量运行的所以直接就批量递交了,大家参考即可。
这里要注意的是他们会默认序列名字为seq.fasta所以要将该序列放在工作目录里面

#!/bin/bash
#SBATCH --time=1:00:00
#SBATCH --cpus-per-task=2
#SBATCH --mem=2g

data_dir=/I_TASSER
fa_dir=${data_dir}/fasta_files
job_dir=${data_dir}/job
log_dir=${data_dir}/log
mkdir -p ${log_dir}
mkdir -p ${job_dir}
thread=14

cd ${fa_dir}
for i in $(ls $pwd *.fa);do
job_file="${job_dir}/${i%.fa*}.job"

echo "#!/bin/bash
#SBATCH --job-name=${i%.fa*}.I-TASSER.job
#SBATCH --output=$log_dir/${i%.fa*}.I-TASSER.out
#SBATCH --time=40:00:00
#SBATCH --cpus-per-task=${thread}
#SBATCH --mem=30g
module load I-TASSER
out_dir=${fa_dir}/${i%.fa*}
mkdir -p \${out_dir}
cp ${fa_dir}/${i} \${out_dir}/seq.fasta
runI-TASSER.pl -runstyle gnuparallel \
-LBS true -EC true -GO true -seqname ${i%.fa*} \
-datadir \${out_dir}  -light true \
-outdir \${out_dir} && file2html.py \${out_dir}
" > $job_file
sbatch $job_file
done
image.png

结果看起来还可以,pdb文件用PyMol再美化下就好

你可能感兴趣的:(蛋白三级结构预测(I TASSER))