转录组系统进化分析

  1. trim_galore双端数据过滤
    nohup trim_galore -q 20 --phred33 --stringency 3 --length 20 -e 0.1 --paired JS2-10_R1.fastq.gz JS2-10_R2.fastq.gz &

2.Trinitry 无参组装
nohup Trinity --seqType fq --max_memory 200G --left TGJ003_FRAS210089984-2r_1.clean.fq.gz --right TGJ003_FRAS210089984-2r_2.clean.fq.gz --CPU 25 > myout.file 2>&1 & 正反测序序列组装,
3.cd-hit 去冗余
nohup cd-hit-est -i TF05_Trinity.fasta -o TF05_Trinity_cd.fasta -c 0.95 -n 10 -d 0 -T 20 -M 200000 > myout.file 2>&1 &

4.TransDecoder 预测
TransDecoder.LongOrfs -t target_transcripts.fasta
TransDecoder.Predict -t target_transcripts.fasta
4.1替换TRINITY名字为物种名字
sed -i s/TRINITY/TFY02/g `grep TRINITY -rl --include="TFY02_Trinity.cd.fasta.transdecoder.cds" ./

4.trinity自带脚本获取最长转录本
perl /datapool/miniconda3/pkgs/trinity-2.8.5-h8b12597_5/opt/trinity-2.8.5/util/misc/get_longest_isoform_seq_per_trinity_gene.pl ../03.trinity/SRS7102777_trinity.Trinity.fasta > 168_trinity_longest.fasta

你可能感兴趣的:(转录组系统进化分析)