从2018年秋季(大二上学期)开始接触R语言,曾在2019年寒假读过一遍本书的第一版,感觉受益匪浅,之后遇到问题也曾回头来查阅这本书,前几天刚学习过Simulink,趁现在有空再来温习这本书,回顾一下代码和各种命令,简单记录。
虽然感觉R的功能和用途不如MATLAB广泛,但是需要派上用场的时候如果能熟练地运用真的是很好的体验。
- R用方括号[ ]引用数组元素,而MATLAB用圆括号( ),同时使用它俩的时候总搞混;
- R不需要分号来结束语句;
- 如果之前运行过多行代码,R在Console中输入↑可同时得到多行,MATLAB在Command Window中输入↑只能得到单行。
但是它们还是有很多相似之处的:
- 数组下标从1开始,哈哈,和C、Python等不同;
- 都有交互式命令窗口,工作空间;
- 都有实时脚本等,很多很多……
1.1 为何要使用R
- 免费
- 功能全面
- 更新快
- 绘图强大
- 交互式,方便操作
- 数据导入导出方便
- 语言自然简单
- 可以被整合到其他语言编写的应用程序中
- 可运行于多种平台之上
1.2 R的使用
1.2.1 获取帮助
- help.start() 打开帮助文档首页
-
help("foo")或?foo 查看函数 foo 的帮助(引号可以省略)
- example("foo") 函数 foo 的使用示例(引号可以省略)
- help.search("foo")或??foo 以 foo 为关键词搜索本地帮助文档
- RSiteSearch("foo") 以 foo 为关键词搜索在线文档和邮件列表存档
- apropos("foo", mode="function") 列出名称中含有 foo 的所有可用函数
- data() 列出当前已加载包中所含的所有可用示例数据集
1.2.2 工作空间
- getwd() 显示当前的工作目录
- setwd("mydirectory") 修改当前的工作目录为 mydirectory
- ls() 列出当前工作空间中的对象
- rm(objectlist) 移除(删除)一个或多个对象
- help(options) 显示可用选项的说明
- options() 显示或设置当前选项
> x=rnorm(3) > x [1] -0.1284972 0.1003854 -1.8987649 > options(digits=3) > x [1] -0.128 0.100 -1.899
- savehistory("myfile") 保存命令历史到文件 myfile 中(默认值为.Rhistory)
- loadhistory("myfile") 载入一个命令历史文件(默认值为.Rhistory)
- save.image("myfile") 保存工作空间到文件 myfile 中(默认值为.RData)
- load("myfile") 读取一个工作空间到当前会话中(默认值为.RData)
- save(objectlist, file="myfile") 保存指定对象到一个文件中
1.2.3 输入和输出
-
source("filename") 在当前会话中执行一个脚本
-
sink("filename")将输出重定向到文件filename中
sink("sink-examp.txt") i <- 1:10 outer(i, i, "*") sink()
- cat()
Outputs the objects, concatenating the representations. cat performs much less conversion than print.
cat is useful for producing output in user-defined functions.
cat(... , file = "", sep = " ", fill = FALSE, labels = NULL, append = FALSE)
fill:a logical or (positive) numeric controlling how the output is broken into successive lines. If FALSE (default), only newlines created explicitly by "\n" are printed. Otherwise, the output is broken into lines with print width equal to the option width if fill is TRUE, or the value of fill if this is numeric. Non-positive fill values are ignored, with a warning.
labels:character vector of labels for the lines printed. Ignored if fill is FALSE.
example:
i<-1:10 text<-c("a","b","c","d") cat(i,file="i.txt",sep="-",fill=10,labels=text)
-
bmp("filename.bmp") BMP 文件
-
jpeg("filename.jpg") JPEG 文件
-
pdf("filename.pdf") PDF 文件
-
png("filename.png") PNG 文件
-
postscript("filename.ps") PostScript 文件
-
svg("filename.svg") SVG 文件
- win.metafile("filename.wmf") Windows 图元文件
i <- 1:10 bmp("ii.bmp") plot(i,i) dev.off()
1.3 包
> .libPaths() [1] "D:/R/R-3.5.1/library" > search() [1] ".GlobalEnv" "tools:rstudio" [3] "package:stats" "package:graphics" [5] "package:grDevices" "package:utils" [7] "package:datasets" "package:methods" [9] "Autoloads" "package:base"
- install.packages() 安装一个包
- update.packages() 更新已经安装的包
- library() 载入一个包
- help(package="package_name")
1.4 批处理
reference: https://blog.revolutionanalytics.com/2009/06/running-scripts-with-r-cmd-batch.html
R CMD BATCH myscript.R myscript.Rout
#example.R clotting <- data.frame( u = c(5,10,15,20,30,40,60,80,100), lot1 = c(118,58,42,35,27,25,21,19,18), lot2 = c(69,35,26,21,18,16,13,12,12)) cat("Model data:\n") print(clotting) warning("Model starting") obj <- glm(lot1 ~ log(u), data=clotting, family=Gamma) cat("\nEstimated parameters:\n") coef(summary(obj))
PS C:\Users\lenovo> cd Desktop PS C:\Users\lenovo\Desktop> D:\R\R-3.5.1\bin\R.exe CMD BATCH example.R example.Rout
R version 3.5.1 (2018-07-02) -- "Feather Spray" Copyright (C) 2018 The R Foundation for Statistical Computing Platform: x86_64-w64-mingw32/x64 (64-bit) R是自由软件,不带任何担保。 在某些条件下你可以将其自由散布。 用'license()'或'licence()'来看散布的详细条件。 R是个合作计划,有许多人为之做出了贡献. 用'contributors()'来看合作者的详细情况 用'citation()'会告诉你如何在出版物中正确地引用R或R程序包。 用'demo()'来看一些示范程序,用'help()'来阅读在线帮助文件,或 用'help.start()'通过HTML浏览器来看帮助文件。 用'q()'退出R. [原来保存的工作空间已还原] > clotting <- data.frame( + u = c(5,10,15,20,30,40,60,80,100), + lot1 = c(118,58,42,35,27,25,21,19,18), + lot2 = c(69,35,26,21,18,16,13,12,12)) > cat("Model data:\n") Model data: > print(clotting) u lot1 lot2 1 5 118 69 2 10 58 35 3 15 42 26 4 20 35 21 5 30 27 18 6 40 25 16 7 60 21 13 8 80 19 12 9 100 18 12 > warning("Model starting") Warning message: Model starting > obj <- glm(lot1 ~ log(u), data=clotting, family=Gamma) > cat("\nEstimated parameters:\n") Estimated parameters: > coef(summary(obj)) Estimate Std. Error t value Pr(>|t|) (Intercept) -0.01655438 0.0009275466 -17.84749 4.279149e-07 log(u) 0.01534311 0.0004149596 36.97496 2.751191e-09 > > proc.time() 用户 系统 流逝 0.25 0.20 0.36
At the same time we can get a file with the suffix .RData.
Or we can just write the following two lines to a .bat file and double-click to run it.
cd C:\Users\lenovo\Desktop D:\R\R-3.5.1\bin\R.exe CMD BATCH example.R example.Rout
#example.R argv<-commandArgs(TRUE) x<-as.numeric(argv[1]) y<-as.numeric(argv[2]) cat("x=",x,"\n") cat("y=",y,"\n") cat("x+y=",x+y,"\n") cat("x^y",x^y,"\n")
PS C:\Users\lenovo> cd Desktop PS C:\Users\lenovo\Desktop> D:\R\R-3.5.1\bin\Rscript.exe example.R 1 2 >output.ROut
Output in output.Rout:
x= 1 y= 2 x+y= 3 x^y 1
1.5 结果的重用
lmfit <- lm(mpg~wt, data=mtcars)
-
summary(lmfit) 显示分析结果的统计概要
-
plot(lmfit) 生成回归诊断图形