第2章 序言

2.1 引用limma

Limma执行了作者和合作伙伴的一系列方法论研究。在出版物中使用limma软件的结果时,请尝试引用适当的参考文献,因为引用是作者获得专业信誉的主要手段。

limma软件包本身可以引用:

Ritchie, ME, Phipson, B, Wu, D, Hu, Y, Law, CW, Shi, W, and Smyth, GK (2015). limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research 43(7), e47.

上述文章回顾了limma软件包的整体功能,包括新旧各种版本。

其他文章描述了软件包特定函数背后的统计方法。 如果你使用limma软件包进行差异表达分析,请引用:

Phipson, B, Lee, S, Majewski, IJ, Alexander, WS, and Smyth, GK (2016). Robust hyperparameter estimation protects against hypervariable genes and improves power to detect di�erential expression. Annals of Applied Statistics 10(2), 946-963.

本文介绍了由lmFit实现的线性建模方法和通过eBayestopTable等实现的经验贝叶斯统计,尤其描述了具有robust=TRUEtrend=TRUE选项的eBayes

如果你使用limma进行RNA-seq分析,请引用:

Law, CW, Chen, Y, Shi, W, and Smyth, GK (2014). Voom: precision weights unlock linear model analysis tools for RNA-seq read counts. Genome Biology 15, R29.

或者

Liu, R, Holik, AZ, Su, S, Jansz, N, Chen, K, Leong, HS, Blewitt, ME, Asselin-Labat, M-L, Smyth, GK, Ritchie, ME (2015). Why weight? Modelling sample and observational level variability improves power in RNA-seq analyses. Nucleic Acids Research 43, e97.

Law等人(2014)描述了RNA-seq的voom和limma趋势流程,而Liu等(2015)描述了voomWithQualityWeights函数。

如果你使用具有重复点或技术复制的limma,请引用:

Smyth, G. K., Michaud, J., and Scott, H. (2005). The use of within-array replicate spots for assessing di�erential expression in microarray experiments. Bioinformatics 21, 2067-2075. http://www.statsci.org/smyth/pubs/dupcor.pdf

上面的文章介绍了duplicateCorrelation函数背后的原理。

如果你使用limma进行双色微阵列数据的归一化,请引用以下其中一项:

Smyth, G. K., and Speed, T. P. (2003). Normalization of cDNA microarray data. Methods 31, 265-273. http://www.statsci.org/smyth/pubs/normalize.pdf
Oshlack, A., Emslie, D., Corcoran, L., and Smyth, G. K. (2007). Normalization of boutique two-color microarrays with a high proportion of differentially expressed probes. Genome Biology 8, R2.

第一篇文章中描述了read.maimagesnormalizeWithinArraysnormalizeBetweenArrays函数。第二篇文章描述了利用点质量权重来归一化对照探针的方法。

backgroundCorrect函数所提供的各种选项在下文中被解释:

Ritchie, M. E., Silver, J., Oshlack, A., Silver, J., Holmes, M., Diyagama, D., Holloway, A., and Smyth, G. K. (2007). A comparison of background correction methods for two-colour microarrays. Bioinformatics 23, 2700-2707.

如果你使用arrayWeights或相关函数估计样本质量的权重,请引用:

Ritchie, M. E., Diyagama, D., Neilson, van Laar, R., J., Dobrovic, A., Holloway, A., and Smyth, G. K. (2006). Empirical array quality weights in the analysis of microarray data. BMC Bioinformatics 7, 261.

如果使用read.ilmnnecneqc函数来处理Illumina的BeadChip芯片数据,请引用:

Shi, W, Oshlack, A, and Smyth, GK (2010). Optimizing the noise versus bias trade-off for Illumina Whole Genome Expression BeadChips. Nucleic Acids Research 38, e204.

propexpr函数在下文中被解释:

Shi, W, de Graaf, C, Kinkel, S, Achtman, A, Baldwin, T, Schoeld, L, Scott, H, Hilton, D, Smyth, GK (2010). Estimating the proportion of microarray probes expressed in an RNA sample. Nucleic Acids Research 38, 2168-2176.

双色微阵列数据的单通道分析lmscFit函数由下文解释:

Smyth, GK, and Altman, NS (2013). Separate-channel analysis of two-channel microarrays: recovering inter-spot information. BMC Bioinformatics 14, 165.

最后,如果你正在使用该软件的菜单驱动界面,请引用下列其中之一:

Wettenhall, J. M., and Smyth, G. K. (2004). limmaGUI: a graphical user interface for linear modeling of microarray data. Bioinformatics, 20, 3705-3706.
Wettenhall, J. M., Simpson, K. M., Satterley, K., and Smyth, G. K. (2006). affylmGUI: a graphical user interface for linear modeling of single channel microarray data. Bioinformatics 22, 897-899.

2.2 安装

Limma是R计算环境的一个软件包,它假定你已经安装了R。R的具体情况可以参见http://www.r-project.org。要安装最新版本的limma,你需要使用最新版本的R。

Limma是Bioconductor(http://www.bioconductor.org)项目的一部分(在R 2.6.0之前,也可以从R项目CRAN网站获得limma)。它是通过biocLite安装的一组默认软件包。你可以通过以下命令安装一系列Bioconductor软件包:

> source("http://www.bioconductor.org/biocLite.R")
> biocLite()

要单独安装limma(更快),你可以使用以下命令:

> biocLite("limma")

这将允许你执行许多基本分析,尽管你可能还需要

> biocLite("statmod")

Bioconductor的官方发布周期为6个月,稍晚于每个主要的R版本更新。与其他Bioconductor软件包一样,总是有两种版本的limma。大多数用户都会使用当前官方发布的版本,如果你使用的是当前安装版本的R,可以通过biocLite直接安装。还有一个开发版的limma,其中包含了下次正式发布的新功能。如果你正在使用开发版本的R,将会安装该开发版本的limma。官方发行的版本号第二位总是一个偶数(例如3.6.5),而开发版本号第二位是一个奇数(例如3.7.7)。

Limma经常更新。一旦安装了limma,就可以从R提示命令行中查看更改日志。要查看最近的20行,键入:

> changeLog(n=20)

2.3 如何获得帮助

关于limma的大多数问题希望能够通过文档或参考文献来回答。如果你遇到了文档未解决的问题,或者你发现文档和软件本身之间存在冲突,那么有一个积极的支持社区可以提供帮助。

该软件包的作者始终感激可以收到软件包函数中或文档中的错误报告。经过深思熟虑的改进建议也是如此。所有其他有关limma的问题或错误应发布在Bioconductor支持网站上https://support.bioconductor.org。一般的帮助和建议请求请发送到支持网站而不是作者本人。向Bioconductor邮件列表发布问题有很多优点:首先,邮件列表包括一个有经验的limma用户社区,可以回答最常见的问题。其次,limma软件包作者努力确保所有向Bioconductor发布问题的用户都将获得帮助。第三,邮件列表允许其他拥有同样问题的人从答案中获得有用的信息。首次发布到邮件列表的用户可以阅读http://www.bioconductor.org/help/support/上的发布指南作为发帖参考。

请注意,limma中的每个函数都有自己的在线帮助页面,如下一章所述。如果你有任何特定函数的相关问题,阅读函数的帮助页面通常会很快回答这个问题。无论如何,在向支持网站发布问题之前,请详细阅读相关帮助页面。

你可能感兴趣的:(第2章 序言)