RNA-seq——学习路线、学习经验、实战项目、学习总结

1. 参考课程和博客

B站:
RNA-seq转录组数据分析入门实战
【生信技能树】转录组测序数据分析

简书:
RNA-seq(1) :用conda安装RNA-seq所需要的工具 - 简书
RNA-seq(2)-1:原始数据下载的几种方法 - 简书
RNA-seq(2)-2:下载数据 - 简书
RNA-seq(3):sra到fastq格式转换并进行质量控制 - 简书
RNA-seq(4):下载参考基因组及基因注释 - 简书
RNA-seq(5):序列比对:Hisat2 - 简书
RNA-seq(6): reads计数,合并矩阵并进行注释 - 简书
RNA-seq(7): DEseq2筛选差异表达基因并注释(bioMart) - 简书
RNA-seq(8): 探索分析结果:Data visulization - 简书
RNA-seq(9):功能富集分析 - 简书
RNA-seq(10):KEGG通路可视化:gage和pathview - 简书

上述教程大约是18年左右的,不过很是经典,能够帮助我们快速入门,之后就可以根据自己的需求进行某方面的延伸学习。

2. 前期准备

在做转录组分析实战的时候,我们需要有一个Linux系统的服务器。因为很多生信分析软件都是在Linux上,所以我们要有一些shell语言的基础,这样才能顺利安装所需要的软件。

我本人是按需租了一个阿里云的服务器,2核8G的配置,使用时是每小时8毛,不用的时候关机,每小时2毛,还是很便宜的,而且能满足练习需求。反正比在自己电脑上安装虚拟机好用!!!

关于在Linux安装软件,可以参考:RNA-seq——一、Linux软件安装

3. 上游分析

上游分析主要包括:数据集下载、数据集质量检测、质控与序列比对。
其中我做了两个上游分析的实战练习
(1)单端测序
文章:《Promiscuous RNA binding by Polycomb Repressive Complex 2》
参考:http://www.bio-info-trainee.com/2218.html

具体步骤见:
RNA-seq——二、sra数据下载、fastqc与质量控制
RNA-seq——三、使用Hisat2进行序列比对

(2)双端测序
文章:《AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors》

具体步骤见:
RNA-seq——上游分析练习(数据下载+hisat2+samtools+htseq-count)

上游分析只需要掌握流程即可,基本上都外包给公司做了,重点应该放在对结果的处理以及可视化。

3. 下游分析

下游分析基本上就脱离了服务器,一般在Rstudio上就可以完成了。需要有一定的R语言基础。

下游分析的内容很多很多,包括根据比对结果筛选差异基因,差异基因的的分析及可视化,差异基因GO富集分析及可视化,差异基因KEGG分析及可视乎等等,对于我来说,最重要的就是可视化这一部分了。一个好看的图才能牢牢抓住审稿人的眼球,好看的图真的会让人身心愉悦!!!

在这里,我只做了差异基因的火山图展示以及GO富集分析,并且加入了自己的一些理解,绘制更好看的图。
其余的可以查看Y大宽的简书,写的很好,很基础。

我的实战练习:
RNA-seq——四、根据序列比对结果筛选差异基因
RNA-seq——五、根据差异基因画火山图、在火山图上标记基因名
RNA-seq——六、差异基因富集分析(画一个上下调基因分别富集的双Y轴柱状折线图)

4. 总结

从一开始的一脸懵逼,到现在的略知一二,已经过去了一个月了。这一个月学习的动力完全是每天扣我钱的服务器给予的!!!

关于转录组的学习,我的经验就是:找几篇RNA-seq的文章,熟悉上游分析流程。上游分析做不来也没关系,重点要放在下游分析。找几个基因比对结果文件,去练习如何处理。熟悉R语言,达到所想即所得的完美状态。
最好的情况就是课题需要~我很幸运,学的东西真的派上用场了,嘿嘿。

至此,RNA-seq的学习告一段落,祝大家学习顺利~
完结撒花~❀❀❀

你可能感兴趣的:(生信学习,RNA-seq,转录组分析,hisat2,samtools,DESeq2)