数据框中的因素层级再处理丨数析学院

问题:

在R中,如何对一个数据框中的所有因素型变量进行因素层级的再处理?

指南

在对数据进行导入与初步的清洗之后,我们有时会发现数据中存储的一些因素型变量包含了数据框内容之外的因素层级。例如数据框d
包含一条空白行,也就是说对应的因素型变量中存在层级""
,然而在进行数据清洗时空白行会被从数据框中剔除,因而""
也就成为了不在数据框内容中出现的层级。


数据框中的因素层级再处理丨数析学院_第1张图片

我们可以发现,在空白行被剔除之后,因素型变量中的""
层级依旧存在:


数据框中的因素层级再处理丨数析学院_第2张图片

droplevels函数

对于实现数据框因素层级再处理,最简单的方法便是调用droplevels()函数,具体操作如下:


数据框中的因素层级再处理丨数析学院_第3张图片

** vapply函数和lapply函数**

我们也可以运用带is.factor()vapply()语句来找到数据框中的因素型变量,之后使用lapply语句调用factor()函数,从而实现数据框因素层级再处理。

数据框中的因素层级再处理丨数析学院_第4张图片

我们致力于为你打造更加精要的数据科学课程:

数据框中的因素层级再处理丨数析学院_第5张图片

你可能感兴趣的:(数据框中的因素层级再处理丨数析学院)