生物信息SSH命令一

想要备份下在基因组所能用到的shell命令,包括日常科研和数据分析中应用到的工具,都会在这个系列中列出,不会涉及到机密性问题吧。。

 

同时真心希望Javaeye能够建立一个生物信息专栏,毕竟很多生物信息方面的从业者都是从计算机过来的,很多生物信息方向的学生都是Javaeye的忠实观众,很多bioinformatics的问题都是用Java和Python或者Perl解决的,这和Javaeye的关注是相同的。希望生物信息人能够在Javaeye找到属于自己的天地。I love Javaeye!

 

一:1:mkdirm mkdir chromat_dir mkdir edit_dir 2:phred –id chromat_dir –pd phd_dir -trim_cutoff 0.05 -trim_phd -trim_alt "" 3:phd2fasta –id phd_dir –os edit_dir/1609.seq –oq edit_dir/1609.seq.qual 4:phrap 1227.seq –view –new_ace >1609.out 5:formatdb -p F -o T -i Artemia_franciscana.txt -n Arte.db blastall -p blastn -d Arte.db -i 1610.seq.contigs -o 1610.blast perl EblastN.pl -i 1610.blast –o 1610.xls -e 0.001 -l 100 phred -id ../chromat_dir/ -pd phd_dir/ -trim_cutoff 0.05 -trim_phd -trim_alt "" 二:finishing phred -id chromat_dir -pd phd_dir -trim_alt "" -trim_phd phd2fasta -id phd_dir -os edit_dir/1609.seq -oq edit_dir/1609.seq.qual cross_match mouse.seq pGMT.seq -screen >mouse.screen.out phrap 1609.seq.screen –view –new_ace –revise_greedy >1609.out 三:恢复与E.coli同源的序列 mv wheat2.seq.qual wheat2.seq.screen.qual phrap wheat2.seq.screen -new_ace > phrap.out perl determine---.pl 四:预测ORF命令ls long-orfs Contig70.fasta > longorf_out 打开文件longorf_out,去掉开头几行 extract Contig70.fasta longorf_out >train.seq build-icm <train.seq >train.model glimmer2 Contig70.fasta train.model > orf_list 打开文件orf_list,去掉putative gene 之前的东西 extract Contig70.fasta orf_list >orf_seq perl ../../../perl/process_glimmer.pl -i orf_seq -n nuc70.seq -p pro70.seq 将orf.seq转换成fasta格式 五:formatdb -p F -o T -i wheat3.seq.screen.contigs -n wheat3contig.db blastall -p blastn -d wheat3contig.db -i wprobesequences -o out3.blast perl ../../perl/EblastN.pl -i out4.blast -o out4.xls -e 0.001 -l 100(overlap) 六:RepeatMasker –species human –no_is seq.fa(需要除重复的序列)

你可能感兴趣的:(生物,python,OS,ssh,perl)