1.获取帮助-最重要的学习技能
1.1 ?函数名/help('函数名') #获取函数帮助
1.2 help.search('字符/短语')
#获取单词或短语的帮助文件
1.3 help(package='dplyr') #获取包的帮助文件
2.查看对象信息
```
str(iris) #获取对象结构概要
class(iris) #查看对象数据结构(向量/数组/矩阵/数据框/列表)
```
3.R包安装和使用
```
install.packages('dplyr') #CRAN来源的包安装
BiocManager::install('dplyr') #bioconductor R包安装
library('dplyr') #R包调用,使用R包之前必须的操作
dplyr::select() #dplyr包中特定功能函数的使用
data(iris) #导入R内置的数据集到环境中
```
4.工作目录
```getwd() #查看当前工作目录
setwd('E:/R_analysis') #设置当前工作目录,注意直接从windows复制过来的地址是E:\R_analysis 要把‘\’改成‘/’ ```
5.数据类型
数据类型有数值型numeric(1,2,3),逻辑型logical(TRUE/FALSE)字符型character(‘1’,‘2’#带引号),因子型factor(‘1’,‘0’,‘1’,levels:‘0’,‘1’)有水平
```is.logical() #查看数据类型
as.logical() #转换数据类型```
6.基本数学运算函数
log(x) #自然对数 sum(x) #求和
exp(x) #指数运算 mean(x) #平均值
max(x) #最大值 median(x) #中位数
min(x) #最小值 quantile(x) #分位数/分位点
round(x,n)#四舍五入到第n位数
rank(x) #元素秩 var(x) #方差
cor(x,y) #相关性 sd(x) #标准差
signif(x,n) #四舍五入到n个有效数字
7.变量赋值
a<-'apple' #用<-/=号
8.当前工作环境
```ls() #列出当前环境所有变量
rm(x) #删除变量x
rm(list=ls()) #删除当前环境所有变量
#通过Rstudio中的环境窗口浏览环境下的所有变量 ```
9.基本数据结构
9.1向量
9.1.1创建向量
c(2,4,6) #创建一个包含2,4,6三个数值的向量,用c()函数创建
2:6 # ':'表示二到六2,3,4,5,6五个元素的向量
seq(2,3,by=0.5) [1] 2.0 2.5 3.0 #seq()函数表示等差数列,从2到3,以0.5为等差
rep(1:2,times=3) [1] 1 2 1 2 1 2 #rep()函数表示重复,1到2所有元素排列重复3次
rep(1:2,each=3) [1] 1 1 1 2 2 2 #每个元素重复3次
sort(x) #排序,默认从小到大
table(x) #统计某个值个数
rev(x) #返回与x相反的值
unique(x) #返回特异的值,重复值将被去掉
``` x <- c(3:5, 11:8, 8 + 0:5)
x
[1] 3 4 5 11 10 9 8 8 9 10 11 12 13
unique(x)
[1] 3 4 5 11 10 9 8 12 13
u2 <- unique(x, fromLast = TRUE)
u2
[1] 3 4 5 8 9 10 11 12 13 #fromLast参数默认为FALSE,若重复保留前面的重复,为TRUE表示若重复保留最后的重复 ```
9.1.2提取向量元素
x[4] #提取第四个元素
x[-4] #提取除了第四个以外的其他所有元素
x[2:4] #第二到第四个元素
x[-(2:4)] #除了第二到第四以外的其他元素
x[c(2,5)] #第二和第五个元素
x[x==10] #取返回逻辑值为TRUE的元素
x[x<0] #取小于0的元素
x[x%in%c(1,2,5)] #%in%表示判断前者是否在后者中,在返回TRUE,不在返回FALSE再用[]取返回结果为TRUE的元素
```x
[1] 3 4 5 11 10 9 8 8 9 10 11 12 13
x%in%c(1,3,8)
[1] TRUE FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE
FALSE FALSE
x[x%in%c(1,3,8)]
3 8 8
x['apple'] #按名称取向量,取名为apple的向量```
10.矩阵----二维数据
```m=matrix(x,nrow=3,ncol=3) #j将x创建成3行3列的二维数组
m[2,] #取第二行所有列
m[,1] #取第一列所有行```