R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。下面我简单介绍一下R语言的基本语法:
1. 基本命令
a) ls() list当前工作区内存中的变量
b) rm(args) 移除内存变量Remove Object
c) history() 查看历史命令清单
d) help(“函数”) 打开函数帮助文档
e) names(变量) 返回数据集中名字属性
f) mode(变量)/class(变量) 返回基本数据类型
g) is(变量) 返回变量的基本数据类型和高级数据类型
2. 变量命令规则:
a) 字母、数字或者下划线组成;
b) 变量名称以字母开头,或者点后面不带数字。
3. 运算符
a) 算数运算符:+ 、-、*、/ 、%%(求余)、%/%(求商)、%in%(判断除数和被除数是否相等);
b) 关系运算符:>、<、==、>=、<=、!=
c) 逻辑运算符:
i. 将第一个向量的每个元素与第二个向量的相应元素进行比较:
& | !
ii. 只考虑向量的第一个元素,给出单个元素的向量作为输入:
&& ||
d) 赋值运算符:<-、=
4. 基本数据类型:
a) 数字 numeric eg:1、-2、0.7
b) 字符 character eg:”hello”
c) 逻辑型 logical eg:TRUE、FALSE
d) 日期时间型 data/datatime
e) 空值 NA
5. 高级数据类型—向量vector
a) x<-c(1,2,3,6.7)
b) z<-1:100 s<-seq(1,100) 生成元素从1到100的向量
c) s<-req(1:100,2) 生成两次元素是1:到100的向量
d) a<-req(x,10) 生成10次向量x
e) b<-seq(-10,10,0.5) 生成元素从-10到10的向量,增加梯度为0.5
6. 向量访问:
a) x[1] 返回向量x的第一个元素
b) x[-1] 移除向量x的第一个元素外的向量
c) y[2:3] 向量第2到第3个原始组成的向量(包前包后)
d) x[x>2] 向量x中,元素大于2组成的新的向量
e) x[c(2,3,7)] 输出向量第2、3、7位置的元素组成的新向量
f) index <- which(x==9) 获取数据对应的索引值
7. 向量运算:
a) 相同程度:
a<-c(3,8,4,5,0,11)
b<-c(4,11,0,8,12)
c<-a+b
[1] 7 19 4 13 1 13
b) 不同长度(长度必须是倍数关系)
a<-c(3,8,4,5,0,11)
b<-c(4,11)
c=a+b
[1] 7 19 8 16 4 22
8. 向量排序
v<-c(3,8,4,5,0,11)
sort(v)
[1] 0 3 4 5 8 11
9. 矩阵运算
a) 定义:matrix(data,nrow,ncol,byrow,dimnames)
Byrow:逻辑线索,如果为TRUE,则输入向量元素按行排序,否则按列排序。
b) 例子:
a<-matrix(2:7,2,3,TRUE)
10. 矩阵访问
a) a[1,1:3] 取第一行向量
b) a[-1] 除去一行后的矩阵
c) a[1:2,1:2] 部分矩阵
11. 矩阵运算
+、-、*、/ 与向量运算相同
12. 数组(array)
a) 创建三维数组:xx<-array(1:24,c(3,4,2))
b) 创建四维数组:yy<-array(1:36,c(2,3,3,2))
13. 维度转换:
x<-1:36
dim(x)<-c(6,2,3) 转换为6行、2列、3页的三维数组
dim(x)<-c(9,4) 转换为9X4的矩阵
dim(x)<-36 转化为长度为36的向量
14. 列表:
a) 创建列表:list(name1=value1,name2-value2,…)
b) 访问列表:list$name1