基于R的一个用于分析高通量基因组数据的工具,Bioconductor的应用功能是以包的集成形式呈现在用户面前,它提供的软件包中包括各种基因组数据分析和注释工具,其中大多数工具是针对DNA微阵列或基因芯片数据的处理、分析、注释及可视化的。同时,Bioconductor。还提供许多与DNA微阵列相关的数据包。开源,每年更新一次。
1.打开R直接 install.packages("affy"); 结果:
package ‘affy’ is not available (as a binary package for R version 3.1.3)
source("http://bioconductor.org/biocLite.R") //安装下载脚本
biocLite("affy");
这是一开始出现的问题
一直没有解决,parallel包一直下载不了,最后没办法,只好下载3.2.3版本,直接下affy就好了
2.R中Update all/some/none? [a/s/n]
还不清楚,我直接 n 拒绝更新 >>>> 如果R包改动有需求的话,可以“yes”
3.设置Rstudio中的包存储路径
4.(.packages())查看加载包
5 包parallel load不了,
Update all/some/none? [a/s/n]: n
Warning message:
package ‘parrallel’ is not available (as a binary package for R version 3.1.3)
6. installed.packages()[,c('Package','Version','LibPath')] 查看已安装包
7 package ‘BiocInstaller’ was built under R version 3.2.0
是由R 3.2.0版本开发的
8. not allocate 1.6G for vector 是因为R为32位的
32位内存分配少,但是运行快,而64位内存分配多,大数据处理时候遇到的内存问题比较少
如果你的操作系统不支持64位程序,或者你的计算机内存小于4GB,那么应该选择32位版本的R。如果操作系统支持64位版本的R,那么适用于windows系统和Mac系统的R安装程序会自动安装两个版本的R
10 背景校正去噪音 rma() //
mas5() //
gcrma() //
MAS5每个芯片可以单独进行标准化,RMA由于采用的多芯片模型需要所有芯片一起进行标准化。
MAS5利用MM探针的信息去除背景噪声,基本思路是PM-MM。
RMA不使用MM信息,而是基于PM的信号分布采用随机模型来评估表达值。
RMA处理后的数据是经过以2为底的对数转换的,而MAS5不是,这一点非常重要。
一:安装基本的Bioconductor组件
在BioC的官方网站上http://bioconductor.org/,存放着Bioc包的安装脚本,biocLite.R, 每次需要安装BioC的包之前,我们运行该脚本。source是运行代码脚本的命令,可以是本地文件,可以是网络上的文件。需要你有流畅的网络链接
source(“http://bioconductor.org/biocLite.R”)
biocLite()
biocLite()是安装函数,相当于R中的常用的install.package命令,如果不传递需要安装的包的名称,那么则安装如下的组建。 affy, affydata, affyPLM, affyQCReport, annaffy, annotate, Biobase,biomaRt, Biostrings, DynDoc, gcrma, genefilter, geneplotter, GenomicRanges, hgu95av2.db, limma,marray, multtest, vsn, 和xtable. 在下载和安装完成之后,会打印 “Installation complete” 和 TRUE.
Bioconducto中包含的各种包:http://bioconductor.org/packages/release/bioc/
同时biocLite()也有其他的参数,控制安装。
pkgs 字符,指定需要安装的包
destdir 文件系统路径
lib 安装包的库
二:安装额外的包
除了一种所描述的默认安装的包之外,R和Bioc有非常多的其他的包供安装,bioc包的分类参见[color=rgb(26, 129, 194)]BiocViews, 假设我们需要安装一个名为EBImage的包
source(“http://bioconductor.org/biocLite.R”)
biocLite(“EBImage”)
可以同时安装多个包
biocLite(c(“pkg1″,”pkg2″))
三:升级安装的包
Bioc的包尤其是那些开发版本的包,升级的非常频繁,如果需要同步更新的代码,需要升级。打开新的R。运行
source(“http://bioconductor.org/biocLite.R”)
old.packages(repos=biocinstallRepos())
升级所有已经安装的包,运行
source(“http://bioconductor.org/biocLite.R”)
update.packages(repos=biocinstallRepos(), ask=FALSE)
请阅读update.packages的帮助文档,获得更多的信息。极少的情况下,需要重新编译bioc的包,为了兼容C或者Fortran, 一个方法就是输入并且运行
source(“http://bioconductor.org/biocLite.R”)
pkgs <- rownames(installed.packages())
biocLite(pkgs)
这将重新安装所有目前的已安装包,大家需要注意,可能对带宽要求极高。一般不建议进行。