基础语法
变量
在R语言中,变量的命名方式是由一定的要求的:
变量名 | 是否正确 | 原因 |
---|---|---|
.dad12 | 正确 | 可以以 . 开始 |
_dad12 | 错误 | 不可以以 _ 开始 |
ad18 | 正确 | 可以以字母开始 |
5aads | 错误 | 不可以以数字开始 |
.5aads | 错误 | . 开始不可以直接接数字 |
ad18% | 错误 | $ 是非法字符 |
总结来说就是,变量可以包含数字,字符,点符号,可以字符或点开头,但是点后不能直接接数字。
你可以通过 print(ls())
来查看你的所有变量:
> print(ls())
[1] "a" "ad18" "adsaw" "test" "tt"
还可以通过 rm()
来删除变量:
> print(ls())
[1] "a" "adsaw" "test" "tt"
赋值语法
赋值语句: str <- "Hello World"
,前面的语句是将右侧的字符串赋值给变量 str
,其实在R语言中,=
,<-
和 <<-
都可以起到赋值的作用,然而他们在许多情况下的作用是完全不一样的,具体表现有几种(参考文献:你被R语言的=和<-搞昏了头吗):
PS: 最新的R包里面还支持 ->
, ->>
作为赋值符号,如:test(2) -> tt
,这是合法的
第一种:<- 生成匿名函数变量
# 假如有一个函数,接受4个参数作为变量进行数据处理
test <- function(data, key, value, bool){
a = cat('data:',data,'key:',key) # 输出一个拼接后的字符串
c <- paste('value:',value,'bool:',bool) # 输出一个拼接后的字符串
g <- paste(a,c)
print(g)
}
# 接着我要调用这个函数(顺序=)
test(data='testdata', key='testkey', value='testValue', bool=TRUE)
# 返回一个拼接后的字符串,可以看到现在是一一对应的
# [1] "data: testdata key: testkey value: testValue bool: TRUE"
# 接着我要调用这个函数(乱序=)
test(key='testkey', data='testdata', bool=TRUE, value='testValue')
# 返回一个拼接后的字符串,可以看到现在还是一一对应的
# [1] "data: testdata key: testkey value: testValue bool: TRUE"
# 接着我要调用这个函数(乱序<-)
test(key<-'testkey', data<-'testdata', bool=TRUE, value='testValue')
# 返回一个拼接后的字符串,可以看到后买你等号的并灭有被影响,
# 而使用<-符号的最终却是按照函数定义的顺序赋值,
# 和我们想象中的不一致
# [1] "data: testkey key: testdata value: testValue bool: TRUE"
第二种:<- 生成变量
此外,和 =
差异一点的就是, a = 12
表达的仅仅是传值语句,并不会在空间中保留变量,而 a <- 12
是一个表达式,这在一些其他语法中就像是 var a = 12
,以一个简单的例子来说明:
# 定义一个简单的输出函数,默认参数等于12
test <- function(a=12){
print(a)
}
# 当我们尝试调用函数的时候
# 使用 = 号
test(a = 6)
# [1] 6
# 使用 <- 符号
test(a <- 6)
PS: 这些都是在函数中使用的时候存在的差异,平时在控制台直接使用 a = 12
和 a <- 12
是等价的
输出函数(常用)
R语言的输出函数,使用极其简单,只需要将需要输出的内容作为参数传入函数即可:
> print('dsafafa')
[1] "dsafafa"
cat 和 paste
上面的两个函数都是能用于拼接输出的,他们之间的差异主要体现在, cat
函数只是单纯的拼接然后输出,而 paste
则是在输出的同时,还能将拼接后的数据以新变量保存。
> str1 = cat(1:9,c("st","nd","rd",rep("th",6)),"n",sep = '/')
1/2/3/4/5/6/7/8/9/st/nd/rd/th/th/th/th/th/th/n
> str1 #以cat拼接的该变量的值为空0
NULL
> str2 = paste(1:9,c("st","nd","rd",rep("th",6)),sep = '',collapse='\n')
> str2
[1] "1st\n2nd\n3rd\n4th\n5th\n6th\n7th\n8th\n9th"
此外,函数内的参数代表的意义,共有参数
sep
:拼接中间的分割符,默认为空格
paste
私有参数:
collapse
:拼接结束的符号,默认为空格
cat
私有参数:
file
:文件或链接的名称,有值时输出到文件中,没有则输出到打印台;
append
:为true
时将数据新增到文件末尾,false
时覆盖文件原始内容,当且仅当参数file是文件名而非链接时,此参数才有效;
fill
:是否填充(具体细节还要考虑),当为false
时默认\n
换行输出
labels
: 输出文件的标签,当fill
为true
才生效
sink
具体函数及参数: sink(file = NULL, append = FALSE, type = c("output", "message"), split = FALSE)
,默认情况下,如果文件已经存在,则它的内容将被覆盖。
file
:需要输出的文件名
append
:设为true
时追加到文件中,反之则覆盖原文件
type
:输出的类型,常用的输出到文件类型为output
,message
类型则是输出警告,停止等stderr()
split
:设为true
可以保留控制台输出
其他的都好理解,其中 message
类型的数据例子如下:
## 首先定义一个可写的文件
zz <- file("C:/Users/Tutu/Desktop/testR/all.Rout", open = "wt")
## 调用sink函数设置类型为message
sink(zz, type = "message")
## 使用try 函数检测log函数
try(log("a"))
##随后在之前新建的文件中可以看到 :
## Error in log("a") : 数学函数中用了非数值参数
其他的输出方法
## PDF文件
pdf("filename.pdf")
## Windows图元文件
win.metafile("filename.wmf")
## PBG文件
png("filename.png")
## JPEG文件
jpeg("filename.jpg")
## BMP文件
bmp("filename.bmp")
## PostScript文件
postscript("filename.ps")
输入函数
暂时获取到的时 readLines
,其他的应该还有很多,后续会补充,这门语言时解释性语言,相对来说更直白一些,可以直接读取表格类数据。