勘误?
Sys.getenv("R\_HOME") 报错,反斜杠的作用?
几个目录的用途
R_HOME
HOME
当前目录
通过Rprofile.site自定义启动环境
R_HOME/etc目录下
更新R并迁移包
在这里,我们用installed.packages()函数保存R目录树之外的扩展包清单,然后根据这个清单用install.packages()函数将最新版的扩展包下载和安装到新版R中。操作步骤如下。
(1) 如果有自定义的Rprofile.site文件(见附录B),将其保存到R目录树之外。
(2) 启动当前版本的R,然后执行下面的命令:
其中path是R之外的目录。
(3) 下载安装新版的R。
(4) 如果在第(1)步保存了自定义的Rprofile.site文件,现在把它复制到新的R中。
(5) 启动新版本的R,然后执行下面的命令:
其中path是第(2)步中设置的位置。
(6) 删除旧版本(可选)。
这种方法只能安装CRAN上的扩展包,不会安装从其他地方获取的包。
setwd("current_file_path") P36
setwd("E:/R_CRAN/R Programming/R in Action")
#注意setwd()命令的路径中使用了正斜杠。R将反斜杠(\)作为一个转义符。即使在Windows平台上运行R,在路径中也要使用正斜杠。
#同时注意,函数setwd()不会自动创建一个不存在的目录。如果必要的话,可以使用函数dir.create()来创建新目录,然后使用setwd()将工作目录指向这个新目录。
#在独立的目录中保存项目是一个好主意。我通常会在启动一个R会话时使用setwd()命令指定到某一个项目的路径,后接不加选项的load()命令。这样做可以让我从上一次会话结束的地方重新开始,并保证各个项目之间的数据和设置互不干扰。
libPaths()会返回两个以上的路径?
source("filename") 输入
#函数source("filename")可在当前会话中执行一个脚本。
sink("filename") 文本输出
#函数sink("filename")将输出重定向到文件filename中。
#默认情况下,如果文件已经存在,则它的内容将被覆盖。使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。
#参数split=TRUE可将输出同时发送到屏幕和输出文件中。
#不加参数调用命令sink()将仅向屏幕返回输出结果。
图形输出
【示例】
> sink("myoutput",append = TRUE,split = TRUE)
> pdf("mygraphs.pdf")
> source("script2.R")
#输出函数要放在输入函数之前?
#文件script2.R中的R代码将执行,结果也将显示在屏幕上。除此之外,文本输出将被追加到文件myoutput中,图形输出将保存到文件mygraphs.pdf中。
> sink()
> dev.off()
RStudioGD
2
> source("script3.R")
#文件script3.R中的R代码将执行,结果将显示在屏幕上。这一次,没有文本或图形输出保存到文件中。
#dev.off()将输出返回到终端,终端是指?dev.off()和sink()是否功能相同?都只将结果返回到屏幕上?可否省略?
1.4.1 什么是包
.libPaths() 显示库的位置
library() 显示有哪些包
search() 显示哪些包已加载并可使用
1.4.2 包的安装
install.packages("package_name") 第一次安装一个包
update.packages() 更新已安装的包
installed.packages("package_name") 查看已安装包的描述
1.4.3 包的载入
library("package_name") 在一次会话中,包需载入一次
可通过自定义启动环境,自动载入频繁使用的包
1.4.4 包的使用方法
help(package="nutshell")
#输出某个包的简短描述以及包中的函数名称和数据集名称的列表
1.5 批处理
windows下,在命令行中输入调用命令
r CMD BATCH path/filename.R
需实际操作一次!!!
1.6 将输出用为输入——结果重用
> lmfit <- lm(mpg~wt,data=mtcars)
> summary(lmfit)
> plot(lmfit)
#通过车身重量wt,预测每加仑行驶的英里数mpg,使用简单线性回归
#回归结果会生成多少幅图?
> cook <- cooks.distance(lmfit)
> plot(cook)
> predict(lmfit,mynewdata)
#计算影响度量统计量—>第八章
#利用已有模型对新的数据进行预测
1.7 处理大数据集/附录G
影响因素:
内存大小、数据集大小、应用的统计方法