学习小组Day5笔记-陶*

今天的课好难呀,学的有点吃力。几个注意点:

  • ?read.table产看帮助文档
  • 1.理解元素、标量、向量的概念

元素可以是数字、字符串、字母等,字符串要用英文状态下的双引号引起来;标量是指一个元素组成的变量;向量是指多个有序排列的元素组成的变量;

补充:脚本窗口的打开:通常脚本窗口时隐藏的,可通过点击文件下拉菜单,选择“新建文件”-“R脚本”来打开此隐藏窗口。

  • 常用R语言

x<- c(1,2,3)回车后出现 1 2 3,该命令意为将x定义为由元素1,2,3组成的向量。
x<- 1:10 该命令意为从1-10之间所有的整数
x<- seq(1,10,by = 0.5) 该命令意为1-10之间每隔0.5取一个数
x<- rep(1:3,times=2) 该命令意为1-3之间所有的整数, 重复2次
x[4] 第4个元素;x[2:4]第2到4个元素;
x[-4]除了第4个元素之外剩余的元素
x[-(2:4)]除了第2-4个元素;
x[c(1,5)] 第1个和第5个元素;
x[x==10] 等于10的元素; 这是2个等号哦;
x[x<0]小于0的元素;
x[x %in% c(1,2,5) a %in% table表示存在于table中的a;

重要内容

1.查看本地数据

read.csv(file="XX.txt")是指将文件以数据框(表格)形式打开同时创建一个数据框;
read.table(file="xxx.txt",seq=''\t'',header=T)表示将xxx.txt文件以数据框形式打开,各元素之间用空格分隔开(/t或者直接空格都一样),header=T表示是否将第一行作为列名,是选择T,false则第一行即为具体数据)。read.csv()函数默认为head=T。

2.查看及修改行号、列数

colnames(变量名)查看列名;
rownames(变量名) 查看行名;
colnames(X)[1]<-"haha" 将变量X第一列名称改为haha;
row.names=1表示将第1列的元素作为行号;

3.导出数据框

write.table(X,file = "yu.txt",sep = ",",quote=F)将变量X相关元素导出为表格的形式,命名为yu.txt,各元素之间用,隔开,quote=F表示各字符串不加双引号,quote=T表示各字符串要加双引号,默认是quote=T的状态)

4.数据的保存与重新加载

save.image(file="taotao.RData ")意为将当前全部变量保存至taotao.RData文件,注意文件后缀为RData;
save(X,file=" taotaoA.RData")将变量X保存为taotaoA.RData;
load("taotao.RData")加载taotao.RData文件显示其数据;

5.提取元素

  • X[x,y] 第x行第y列 X[x,] 第x行 X[,y] 第y列
  • X[y] #也是第y列;
  • X[a:b] 第a列到第b列
  • X[c(a,b)] 第a列和第b列
  • X$列名#也可以提取列(此时可以tab键自动补齐)

注意:第5条是在变量X的状态下查看的,如果变量赋名为a,替换即可。

6.直接使用数据框中的变量

options(stringsAsFactors = T)
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)
环境设置函数为options(),stringsAsFactors=Fasle意思为防止导入数据任何因子的转换,=T则相反;
paste0与paste函数,前者是指返回无空格的对象,具体可见20190506-R语言字符处理函数paste、paste0一文。例子可见:

xx<-c("ac","bg")
paste(xx,1:2)
[1] "ac 1" "bg 2"
paste0(xx,1:2)
[1] "ac1" "bg2"

不想多次输入变量名可使用下列方法(还是刚才那个变量a为例哈):

  • attach(a),plot(case,values)。做完后将a删除出搜索环境 detach(a)。这种方法的局限性:两个以上数据框的列名有冲突时,同时attach会报错。
  • 用with函数,我觉得没怎么懂

最后,记得清除所有变量哈 rm(list = ls())

文中代码引用自生信星球,在此感谢。

你可能感兴趣的:(学习小组Day5笔记-陶*)