我花了两个月从零学会转录组分析

我本科学药学,研究生转到分子生物与细胞生物学,开始接触生物实验。刚到生物实验室我连移液枪都不会用,经过一年的努力,基本掌握了生物实验的规律与思想,与化学实验差距还是蛮大的。

后来我发现很多文章中出现了heatmap,GSEA,以及单细胞转录组的分群,不论是作图方法还是对文章中figure的理解都令我一头雾水,我才发现生信是那么的有意思。

于是我花了2个月,平均每天晚上3小时,终于学会了bulk rna-seq与single-cell rna-seq的全流程分析,即从上游下机数据,到可以发表的分析结果。

第一个月,我学习R语言,参考《R语言实战(第二版)》这本书,把前150页学了2遍。看了ggplot2教程,掌握ggplot2绘图思想。R语言重点掌握:矩阵,数据框的异同点及其变换操作,

然后我开始学习RNA-seq的分析,花了2晚上学习R包Deseq2,分析了GEO中下载的表达矩阵,RNA-seq下游分析基本入门。

然后我开始学习单细胞转录组分析,花了2周分别学习了Seurat,Monocle包,数据是自实验室测序结果。

Deseq2, Seurat, Monocle包的学习,我只参考了官方给出的教程,非常方便易操作,直接复制网上给出的代码就可以跑出来,很多中国网站上的教程都是照搬的,改了些参数而已。

接下来,我想学习上游分析,请教了下周围生信的同学,说要用服务器,用xshell远程链接。于是我找网络管理员开通了linux服务器权限并学习相关操作。然后我开始学习Linux,参考《linux命令行与脚本大全》,学习复制粘贴查看路径创建删除文件以及创建并运行脚本的有关内容即可。推荐B站视频:兄弟连。不论是入门linux还是深入学习,兄弟连的视频都很合适。如果只是入门转录组,兄弟连的视频主要是用来认识什么是Linux,它和windows很不一样,比如它的硬件都是以文件形式存在等。我入门linux只花了3个晚上,因为真的很简单。

linux服务器操作掌握之后,就可以进行上游分析了。bulk RNA-seq的教程参考:https://www.cnblogs.com/chenpeng1024/,里面有全套分析。这篇教程最复杂的地方就是软件的安装,好在服务器已经为我们装好了(我把软件都装了一遍才被告知有现成软件)。学习bulk RNA-seq,我花了一周时间跑出结果,不仅看了这篇教程也咨询了同学。单细胞测序的上游分析就更简单了,参考cellranger官网教程就可以了,我花了3天跑出结果。这些上游分析的结果可以用R来做下游分析,我早就已经掌握R的分析了。

如今网络那么发达,百度搜索引擎做的那么好,想学什么都能搜到。比如我想用R画热图,但不知道用什么包。别急啊,你不知道百度知道啊。

虽然我短时间就掌握了转录组上下游分析,但是想要精通转录组分析,精通R,别说2个月,10个月都很困难。如果只是入门2个月,100小时足够了。后续可根据情况,深入了解参数的设置。

网上的教程铺天盖地,有很多都是前篇一律,上就数不胜数。我来到本来想像他们一样,写写教程,顺便赚点小钱。后来我不想写了,因为我不想和他们一样,目的性那么强,也不想写千篇一律的攻略。我还是想佛系的分享点自己的经验与思想。

你可能感兴趣的:(我花了两个月从零学会转录组分析)