像Excel一样使用R语言做数据分析

一、R语言导入数据(读取数据)

1、定位 (待读取的数据地址)

getwd() : 返回当前工作目录
setwd("d:/data")更改工作目录

2、 读取导入Excel或csv文件

读取导入Excel或csv数据:

(1)第一种方法 (如果你是新手,其他不用看,这个最快最便捷)

首先将文件另存为成csv格式,放到D:/盘
然后读取csv文件

setwd("D:/")
df1=read.csv("文件名称.scv")

(2)第二种方法:使用“xlsx”库 (要求你的R语言软件是3.5.3以上版本)

安装xlsx库

install.packages("xlsx")

运行稍微等一会,它会让你选择CRAN连接方式,选择北京或香港


R语言你知道自己为啥不被人待见吗?台湾省应该放到China,ok?!

调用库 (有问题 点这里:解决R语言xlsx安装遇到问题)

library(xlsx)

使用

 df3=read.xlsx("d:/1.xlsx",'Sheet1') #别忘了添加sheet1


用xlsx导入会产生一个问题,数据会为string类型。很难处理,建议直接用csv格式, 语法read.csv(file=“..”)与上述类似。
如果要批量导入CSV格式数据,则可以用dir("C:\\Users\\10097\\Desktop\\index")类型形式,找到某个文件夹内所有文件的文件名,利用 路径+文件名的形式,组合,再利用上述方法进行导入,拼接方式为:

read.csv(file=paste("C:\\Users\\10097\\Desktop\\index\\",dir[i],sep="") 

dir为存取路径下各个文件的文件名,以一个数组的形式呈现。
(3)第三种方法
首先打开Excel,选中需要的数据后复制,然后再R中输入以下的指令:

df2 =read.delim(“clipboard”) 

clipboard即剪贴板
(4)第四种方法:
使用RODBC包,获取Excel连接的函数是odbcConnectExcel()和odbcConnectExcel2007() 分别读取Excel2003版和2007版的数据channel =odbcConnectExcel2007(“d:/a.xlsx”)sqlTables(channel)# 列出Excel中的表格获取Sheet1中的数据,可以使用如下任意的一种方式,
data.excel2 =sqlFetch(channel,“Sheet1”)
data.excel2 =sqlQuery(channel,"select * from [Sheet1KaTeX parse error: Expected 'EOF', got '#' at position 20: …lose(channel) #̲关闭ODBC连接,释放空间

3、 清除

清空所有变量 rm(list=ls())
清理屏幕 ctrl+L
直接写入数据 y=c(1,2,3)

4、数据保存:

1、使用函数cat() cat(…,file="",sep="",fill = FALSE ,labels=NULL,append=FALSE) #file表示要输出的文件名,当参数append=TRUE时,在指定文件的末尾添加内容。sep:表示以空格作为分隔符
2、保存为文本文件:write仅可以写出一个矩阵或向量的特定列,和对一个矩阵进行转置write.table() 可以把一个数据框或列表等对象以包含行列标签的方式写出。write.csv(): 将数据框保存为逗号分隔文件,但是不包含列名
inidat<-c(res1,res2)
f<-data.frame(inidat)
write.table(f,file=“test.csv”,row.names=FALSE,col.names=FALSE);
3、保存R格式文件:save(data,file=“d:/data/salary1.Rdata”)dim():求维度mode() 用来显示对象的类型names():显示对象中的标签

二、R语言数据分析处理:

1、按条件增加一列

代码如下
df1 <- data.frame(名字=c("小明", "小红","小绿","小紫","小黑", "小华","小林"),位置=c("广东_广州","广东_汕头", "广东_珠海","黑龙江_漠河","黑龙江_黑河","黑龙江_哈尔滨","黑龙江_伊春"),语言=c("粤语","潮汕话", "粤语", "方言","方言","普通话","方言"))
df1

df1[grepl("黑龙江",df1$位置),"大众语言"] <- "普通话"
df1

df1[grepl("黑龙江",df1$位置),"大众语言"] <- "普通话"
df1[grepl("广东",df1$位置),"大众语言"] <- "粤语"
df1

2、关联两表

R语言使用merge函数匹配数据(vlookup,join)

3例子

你可能感兴趣的:(像Excel一样使用R语言做数据分析)