R语言 数据预处理

 

关注微信号:小程在线

关注CSDN博客:程志伟的博客

数据预处理包括:

1.数据采样:sample()

2.修改变量名:tolower()、strsplit()

3.产生新的变量:cut()

4.数据离散化

5.日期处理:lubridate包、paste()、ymd()

6.数据二值化

7.合并数据集:merge()

8.排列数据集:order()

9.重塑数据集:melt()

10.dplyr数据操作

11.缺失数据处理:e1071包、 impute()

12.特征缩放:scale()

13.降维:PCA

 

-----------------------------------------------------------------------------------------------------

1.数据采样

> sample_index <-sample(1:nrow(iris), 10, replace=T)
> sample_index
 [1]  75  32  39 145 138 134  16 114  64  75
> sample_set <- iris[sample_index,]
> sample_set
     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
75            6.4         2.9          4.3         1.3 versicolor
32            5.4         3.4          1.5         0.4     setosa
39            4.4         3.0          1.

你可能感兴趣的:(R语言)