[R数据预处理] 数据清洗: 删除重复数据、剔除空值和清除串前后空格

1. 删除重复数据 unique (x)

> a<-round(runif(30,10,20))  #生成有重复值得数据
> a
 [1] 19 10 13 15 16 13 14 14 19 11 11 20 14 14 12 11 17 16 20 16 11 12
[23] 15 10 14 13 19 17 12 15
> data<-write.csv(a,'data.csv',row.names=F)  #写文件
> newdata<-read.csv('data.csv')         #读文件
> > unique(newdata)       #删除重复项
    x
1  19
2  10
3  13
4  15
5  16
7  14
10 11
12 20
15 12
17 17

2. 剔除数据结构中值为空(即缺失值以NA表示)的数据 na.omit (x)

> a<-5:15
> a[18]<-18
> a
 [1]  5  6  7  8  9 10 11 12 13 14 15 NA NA NA NA NA NA 18
> na.omit(a)
 [1]  5  6  7  8  9 10 11 12 13 14 15 18
attr(,"na.action")
[1] 12 13 14 15 16 17
attr(,"class")
[1] "omit"

3. 清除字符型数据前后的空格trim (x)

trim 函数来自 raster包,使用前,先使用 install.packages(“raster”) 安装,再使用 library (raster) 引入该包。

install.packages("raster")
library (raster) 
> a<-'  hello   world  '
> data<-trim(a)
> data
[1] "hello   world"  #字符串中间的空格不处理

你可能感兴趣的:(R)