学习小组Day5笔记--扑通&扑通

R way -- P5

Tips

  • 读取文件时,read.table(file = "filename" , sep = "\t" , header = T ) ,

    • 其中sep是形式参数,用来指定字符的分隔符号。csv 文件是用逗号分隔的,所以sep = ",",tsvtxt文件是以 制表符 分隔的,所以sep = "\t",如果有文件的是以空格分隔的,则sep = " "
    • 其中header = T指的是导入数据时,第一行作为 列的名称,具体数据从第二行开始 ,如果header = F指的是,第一行视为具体数据。
  • colnames(a) #查看 a 的列名;rownames(a) #查看 a 的行名

    • colnames(a)[1] <- "newname" #如果左上角第一个为空,R会自动补为x,用这个命令来修改成自己想要的名字
  • b <- read.csv(file = "filename", sep = ",", header = T, row.names = 1) #这行代码中最后的row.names = 1的意思是 第一列为行名

  • write.table(a, file = "filename2", sep = ",", quote = F) #导出数据框。quote = F意思是 字符串不加双引号 (默认格式带有双引号,不影响读入)

  • 这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是.RData。
    save.image(file="bioinfoplanet.RData") #保存镜像文件
    save(X,file="test.RData") #保存其中一个变量
    load("test.RData") #再次使用 RData 时的加载命令

  • X$列名 #可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列)

  • a <-data.frame(case=paste("S",1:50),values=runif(50)) # case和values 是列名。
    plot(a$case,a$values) #根据这两列的数据作图
    为了避免多次输入变量a,可有更高效的方式

    • attach(a) plot(case,values)#attach(a),就是将数据框名添加到搜索环境中,作图时就只需输入列名(连$都不用了)。

      detach(a) #做完之后,将a删除出搜索环境。
      局限性:两个以上数据框的列名有冲突时,同时attach会报错。

课后作业

原因可能是前文代码中的x与保存文件是的x的大小写不统一,造成找不到对象。

所以在命名变量时,尽量使用大小写不同的英文字母。

你可能感兴趣的:(学习小组Day5笔记--扑通&扑通)