Hmisc包函数(变量名批量修改、变量标签、变量描述性统计)

Hmisc包函数


1、upData函数(批量重命名变量)

upData(object, ...,subset, #相当于对于数据变量的筛选/条件判断表达式;
rename,#批量名称/变量名修改; 
drop,#去掉数据中的哪些变量;
keep,#保留哪些变量名;
labels, 
units, levels, force.single=TRUE,
lowernames=FALSE, caplabels=FALSE,
 moveUnits=FALSE,charfactor=FALSE, 
print=TRUE, html=FALSE)

2、给变量做标签/说明:valueLabel(var)

3、upFirst函数

upFirst(txt, lower = FALSE, alllower = FALSE)
#将每个单词首字母变为大写,lower设置为TRUE时仅将句子中首个单词首字母
#变为大写alllower为TRUE使得所有单词字母为小写。

4、describe函数

描述数据集或者变量中数据情况,全面了解数据的缺失情况、统计值(唯一值、均值、最大/小值、值大小累计百分比分布)

#2021/11/5更新

5、contents()函数,作用:了解数据变量的数据类型、类别情况

contents(iris_trans)

Data frame:iris_trans	150 observations and 7 variables    Maximum # NAs:0


             Levels   Storage
Sepal.Length           double
Sepal.Width            double
Petal.Length           double
Petal.Width            double
Species           3   integer
petal_sec           character
sepal_sec           character

+--------+---------------------------+
|Variable|Levels                     |
+--------+---------------------------+
| Species|setosa,versicolor,virginica|

6、capitalize()函数,作用:将字符型向量每个元素首字母转换为大写

capitalize(c("it's","a","best","way","to","finish","it"))
[1] "It's"   "A"      "Best"   "Way"    "To"     "Finish" "It" 

注:后期更新更多实用函数操作

你可能感兴趣的:(R语言,实用随笔,数据清洗,数据预处理,R语言)