生信入门-2

到现在更多了解之后,认为上一篇《生信入门》还是很扎实的。
学什么都是一个先放后收的过程
想做一个收束和延伸,于是就有了这篇文章。

统计基础、数据处理、作图是三大基础

统计基础就找一本医学统计学简单了解就可以了;
数据处理和作图的话还是看我之前推荐的两本R的书

生信学习分三块

  1. 序列比对
    Linux上使用各种软件对原始测序结果进行分析;
    GWAS是很经典的方法,可以了解一下

  2. 表达富集及差异分析
    建议阅读《advanced R》这本书中对数据结构的描述;
    这个过程就是积累方法和R包;
    学习R包先从经典的包开始,如limma、Deseq2等;
    学R包就是找其中几个关键的方法来看;
    学方法是学方法输入和输出的类及类的处理、方法有哪些关键参数

  3. 机器学习
    回归和分类是大部分上述方面的基础,想深入了解这部分是要看的,看这部分要学一点基础的数学,比如线代;
    简单了解机器学习,推荐阅读《深入浅出python机器学习》;
    需要深入学习背后的理论,推荐阅读《普林斯顿概率论》;

其他

推荐生信入门还是从R语言开始,然后再到序列比对,机器学习的第二本书算是解惑用的;
无论是数据处理,还是作图,都可以作为专门的一个领域来研究了,平时要多练习,可以自己多创建随机数来训练;
《R packages》后面有空再读,再学习写R包;

后面有什么再补充

你可能感兴趣的:(生信入门-2)