生信学习——转录组测序分析的大致流程

如果想要从最原始的测序结果开始分析,如何分析?
转录组测序的分析流程大致可以分成三类,包括基因组比对( Genome mapping )、转录组比对(Transcriptome mapping)、转录组组装(Reference-free assembly)有大牛写的很好:聊聊转录组测序——2.数据分析与解读(上)
原始数据一般下载得到的是Fastq文件格式:
每一条序列(read)包含四行,第一行是read的ID,第二行是序列,第四行是序列中每个碱基的测序质量
但是由于有的reads测序质量较低,可能需要去除,以及测序时的接头也需要去除,清洗后得到cleaned data,一般使用fastqc进行质量控制。

最后是与参考物种进行比对(分为基因组比对和转录组比对)基因组比对得到的是基因组测序结果,转录组测序得到的是转录组测序结果,得到的比对结果后和注释文件以及reads 三者,通过HTseq得到reads计数,即counts矩阵,得到的counts矩阵,可直接用DESeq进行差异表达分析,因为DESeq自带标准化counts矩阵的计算方法,也可以用RPKM,FPKM等方式进行标准化用于其他分析。继续回到之前差异分析的结果,可以继续做富集分析(GO/KEGG)RNA-seq相关链接:
传送门一
传送门二

你可能感兴趣的:(生信学习)