建了个专门存放软件的文件夹,/home/zenglab/biosoft/
查看软件安装位置:whereis hisat2
一、FastQC
1.下载安装
需要java环境,先用java -version查看一下是否有java
没有则在官网下载一个64位Linux系统的tar文件
在/usr下建立一个java文件夹,sudo mkdir java
将下载的tar文件拷贝到该目录下,tar -ZXVf解压;安装完毕为他建立一个链接以节省目录长度ln -s /usr/java/jdk1.8.0/ /usr/jdk
配置环境,在~/.bashrc中写入export PATH=/usr/jdk/bin:$PATH,sourc一下,输入java --version得知安装为20.0.1版本的java
java弄好了,开始安装fastqc(未进行环境配置!也可使用)
sudo apt-get install fastqc
fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN
nohup fastqc -o ./fastqc_70/ -t 6 /fastq clean/*.fq.gz
输出结果每组都有两个文件,一个是html,一个是zip文件。
二、multiqc
软件安装
conda install -c bioconda multiqc
multiqc /B313/Zjunlin/raw_data/fastqc_70/ -o /B313/Zjunlin/raw_data/multi_qcraw/
三、数据过滤trimmotic
conda install -c bioconda trimmomatic
竟然不需要配置环境!
四、下载hisat2
conda install -c bioconda hisat2
下载参考基因组的index文件,网站地址http://daehwankimlab.github.io/hisat2/download/#m-musculus
下载鼠的UCSC mm10文件
五、安装samtools
需安装特定版本要不然读不了gz文件
conda install -c bioconda samtools=1.0 --force-reinstall
六、比对,并将输出文件转换成bam格式
hisat2 -p5 --dta-cufflinks -x /media/zenglab/YQQ/RNAseq/mm10/genome -1 /media/zenglab/ZQ/KCseq/00CleanData/F-AR_1/F-AR_1_.clean.fq.gz -2 /media/zenglab/ZQ/KCseq/00CleanData/F-AR_1/F-AR_2_.clean.fq.gz --no-unal |samtools view -b > F-AR_1.bam
七、featurecounts
本次annotation文件使用的是数据2/YQQ/RNAseq/MmAnnotation/Mus.GRCm39.109.chr.gtf.gz
featureCounts -T 5 -a 数据2/YQQ/RNAseq/MmAnnotation/Mus.GRCm39.109.chr.gtf.gz -o counts.txt -p -B -C -f -t exon -t exon -g gene_id ./*.bam
做个小记录,有不对的地方还请大佬们指出,感谢!