2023-05-16 RNA测序上流分析流程

建了个专门存放软件的文件夹,/home/zenglab/biosoft/

查看软件安装位置:whereis hisat2


一、FastQC

1.下载安装

需要java环境,先用java -version查看一下是否有java

没有则在官网下载一个64位Linux系统的tar文件

在/usr下建立一个java文件夹,sudo mkdir java

将下载的tar文件拷贝到该目录下,tar -ZXVf解压;安装完毕为他建立一个链接以节省目录长度ln -s /usr/java/jdk1.8.0/ /usr/jdk

配置环境,在~/.bashrc中写入export PATH=/usr/jdk/bin:$PATH,sourc一下,输入java --version得知安装为20.0.1版本的java

java弄好了,开始安装fastqc(未进行环境配置!也可使用)

sudo apt-get install fastqc

fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN

nohup fastqc -o ./fastqc_70/ -t 6  /fastq clean/*.fq.gz


输出结果每组都有两个文件,一个是html,一个是zip文件。

二、multiqc

软件安装

conda install -c bioconda multiqc

multiqc /B313/Zjunlin/raw_data/fastqc_70/ -o /B313/Zjunlin/raw_data/multi_qcraw/

三、数据过滤trimmotic

conda install -c bioconda trimmomatic

竟然不需要配置环境!

四、下载hisat2

conda install -c bioconda hisat2


下载参考基因组的index文件,网站地址http://daehwankimlab.github.io/hisat2/download/#m-musculus

下载鼠的UCSC mm10文件

五、安装samtools

需安装特定版本要不然读不了gz文件

conda install -c bioconda samtools=1.0 --force-reinstall

六、比对,并将输出文件转换成bam格式

hisat2 -p5 --dta-cufflinks -x /media/zenglab/YQQ/RNAseq/mm10/genome -1 /media/zenglab/ZQ/KCseq/00CleanData/F-AR_1/F-AR_1_.clean.fq.gz -2 /media/zenglab/ZQ/KCseq/00CleanData/F-AR_1/F-AR_2_.clean.fq.gz --no-unal |samtools view -b > F-AR_1.bam

七、featurecounts

本次annotation文件使用的是数据2/YQQ/RNAseq/MmAnnotation/Mus.GRCm39.109.chr.gtf.gz

featureCounts -T 5 -a 数据2/YQQ/RNAseq/MmAnnotation/Mus.GRCm39.109.chr.gtf.gz -o counts.txt -p -B -C -f -t exon -t exon -g gene_id ./*.bam

做个小记录,有不对的地方还请大佬们指出,感谢!

你可能感兴趣的:(2023-05-16 RNA测序上流分析流程)