基因芯片Pro-processions -------Bioconductor 安装包

基于R的一个用于分析高通量基因组数据的工具,Bioconductor的应用功能是以包的集成形式呈现在用户面前,它提供的软件包中包括各种基因组数据分析和注释工具,其中大多数工具是针对DNA微阵列或基因芯片数据的处理、分析、注释及可视化的。同时,Bioconductor。还提供许多与DNA微阵列相关的数据包。开源,每年更新一次。


1.打开R直接 install.packages("affy");                   结果:

 package ‘affy’ is not available (as a binary package for R version 3.1.3)

source("http://bioconductor.org/biocLite.R")      //安装下载脚本

biocLite("affy");

这是一开始出现的问题

一直没有解决,parallel包一直下载不了,最后没办法,只好下载3.2.3版本,直接下affy就好了


2.R中Update all/some/none? [a/s/n]

  还不清楚,我直接 n 拒绝更新 >>>>  如果R包改动有需求的话,可以“yes”


3.设置Rstudio中的包存储路径


4.(.packages())查看加载包

5  包parallel    load不了,

  Update all/some/none? [a/s/n]: n
        Warning message:
         package ‘parrallel’ is not available (as a binary package for R version 3.1.3)


6. installed.packages()[,c('Package','Version','LibPath')]    查看已安装包


7 package ‘BiocInstaller’ was built under R version 3.2.0

 是由R 3.2.0版本开发的


8.  not allocate 1.6G for vector 是因为R为32位的

32位内存分配少,但是运行快,而64位内存分配多,大数据处理时候遇到的内存问题比较少

如果你的操作系统不支持64位程序,或者你的计算机内存小于4GB,那么应该选择32位版本的R。如果操作系统支持64位版本的R,那么适用于windows系统和Mac系统的R安装程序会自动安装两个版本的R   


10 背景校正去噪音 rma()         //          

                       mas5()         //

                         gcrma()   //

MAS5每个芯片可以单独进行标准化,RMA由于采用的多芯片模型需要所有芯片一起进行标准化。

MAS5利用MM探针的信息去除背景噪声,基本思路是PM-MM。

RMA不使用MM信息,而是基于PM的信号分布采用随机模型来评估表达值。

RMA处理后的数据是经过以2为底的对数转换的,而MAS5不是,这一点非常重要。


一:安装基本的Bioconductor组件

BioC的官方网站上http://bioconductor.org/,存放着Bioc包的安装脚本,biocLite.R, 每次需要安装BioC的包之前,我们运行该脚本。source是运行代码脚本的命令,可以是本地文件,可以是网络上的文件。需要你有流畅的网络链接

source(“http://bioconductor.org/biocLite.R”)

biocLite()

biocLite()是安装函数,相当于R中的常用的install.package命令,如果不传递需要安装的包的名称,那么则安装如下的组建。 affy, affydata, affyPLM, affyQCReport, annaffy, annotate, Biobase,biomaRt, Biostrings, DynDoc, gcrma, genefilter, geneplotter, GenomicRanges, hgu95av2.db, limma,marray, multtest, vsn, xtable. 在下载和安装完成之后,会打印 Installation complete  TRUE.

 

Bioconducto中包含的各种包:http://bioconductor.org/packages/release/bioc/

 

同时biocLite()也有其他的参数,控制安装。

pkgs    字符,指定需要安装的包

destdir    文件系统路径

lib    安装包的库

 

二:安装额外的包

除了一种所描述的默认安装的包之外,RBioc有非常多的其他的包供安装,bioc包的分类参见[color=rgb(26, 129, 194)]BiocViews 假设我们需要安装一个名为EBImage的包

source(“http://bioconductor.org/biocLite.R”)

biocLite(“EBImage”)

 

可以同时安装多个包

biocLite(c(pkg1,pkg2))

 

三:升级安装的包

Bioc的包尤其是那些开发版本的包,升级的非常频繁,如果需要同步更新的代码,需要升级。打开新的R。运行

source(“http://bioconductor.org/biocLite.R”)

old.packages(repos=biocinstallRepos())

 

升级所有已经安装的包,运行

source(“http://bioconductor.org/biocLite.R”)

update.packages(repos=biocinstallRepos(), ask=FALSE)

请阅读update.packages的帮助文档,获得更多的信息。极少的情况下,需要重新编译bioc的包,为了兼容C或者Fortran, 一个方法就是输入并且运行

source(“http://bioconductor.org/biocLite.R”)

pkgs <- rownames(installed.packages())

biocLite(pkgs)

这将重新安装所有目前的已安装包,大家需要注意,可能对带宽要求极高。一般不建议进行。

你可能感兴趣的:(R学习中的问题)