子宫内膜癌circRNA数据分析(重分析)

项目目的

CIRI2和CIRCexplore,2联合使用对数据进行circRNAs鉴定,并进一步做下游的差异表达等分析。

项目流程

1·tophat,BWA用于map到参考基因组。
2·CIRCexplorer2,CIRI2 用于circRNA的鉴定。
3·DESeq2用于差异表达分析
4·BlastN 用于比较在线数据库(circbase)上的信息以获得保守或者新鉴定circRNA
5·Targetscans 用于miRNA靶位点的预测。
6·Blast2go 用于GO富集分析

参考文章

circRNA_茶树叶片
circRNA学习专题 – circRNA数据获得方式的讨论
CircTest

具体流程实现

使用CIRI2鉴定circRNA

#!/bin/sh
work_path=$(echo "/home/zhou/RNASEQ/CircularRNA-seq/rawdata/")
cd $work_path
sampledir=($(ls -d Sample*/))
#echo ${array[@]} 
for ((i=0;i<${#sampledir[@]};i++))
    do
        #进入对应样本的目录
        cd $work_path
        cd ${sampledir[$i]}
        
        #获取文件名
        fastpinput1=$(ls *R1*fastq.gz)
        fastpinput2=$(ls *R2*fastq.gz)
        #echo $fastpinput1
        #echo $fastpinput2
        fastpoutput1=$(ls *R1*fastq.gz|sed 's/\.fastq\.gz/\_fastpedited\.fastq/g')
        fastpoutput2=$(ls *R2*fastq.gz|sed 's/\.fastq\.gz/\_fastpedited\.fastq/g')
        #echo $fastpoutput1
        #echo $fastpoutput2
        #fastp预处理
        fastp -w 16 --dont_overwrite -i $fastpinput1 -I $fastpinput2 -o $fastpoutput1 -O $fastpoutput2
        #bwa mem 比对
        index=$(echo "/home/zhou/RNASEQ/index/hg19.fa")
        gtf_anno=$(echo "/home/zhou/RNASEQ/index/hg19.gtf")
        outdir=$(echo "ciri_output")
        #echo $index
        #echo $outdir
        if [[ ! -d "$outdir" ]]; then
            mkdir ${outdir}
        fi
        rm ${outdir}/*
        name=$(echo ${fastpoutput1}|sed 's/\_[ACTG]*\_.*\.fastq//g')
        samplename=$(echo ${name}|sed 's/\/.*\///g')
        bwasamfile=$(echo "${outdir}/${samplename}.sam")
        echo $samplename
        SHELL_FOLDER=$(cd "$(dirname "$0")";pwd)
        #echo $SHELL_FOLDER
        bwa mem -T 19 -t 24 $index $fastpoutput1 $fastpoutput2   > $bwasamfile
        ciripath=$(echo "/home/zhou/Software/CIRI-full_v2.0/bin/CIRI_v2.0.6/CIRI2.pl")
        cirioutfile=$(echo "${outdir}/${samplename}.ciri")
        perl $ciripath -I $bwasamfile -O $cirioutfile -F $index -A $gtf_anno -T 20
    done

对每个样本的ciri结果文件进行合并

把ciri结果文件全部复制到一个文件夹下,然后通过脚本CircTest/merge_ciri.pyjunction_reads.txtnon_junction_reads.txtjunction_reads_ratio.txt合并出来

#!/bin/sh
mergedir="CIRI2_merge"
if [[ ! -d "$mergedir" ]]; then
    
    mkdir $mergedir
fi
find ./ -name *ciri|xargs -n1 -i cp {} ./${mergedir}/
git clone https://github.com/dieterich-lab/CircTest.git
cp CircTest/merge_ciri.py ./${mergedir}/
python ./${mergedir}/merge_ciri.py ~/RNASEQ/CircularRNA-seq/rawdata/CIRI2_merge/

结果展示

子宫内膜癌circRNA数据分析(重分析)_第1张图片
image.png

你可能感兴趣的:(子宫内膜癌circRNA数据分析(重分析))