R语言第二章数据处理⑤数据框列的转化和计算

目录

R语言第二章数据处理①选择列
R语言第二章数据处理②选择行
R语言第二章数据处理③删除重复数据
R语言第二章数据处理④数据框排序和重命名
R语言第二章数据处理⑤数据框列的转化和计算

=========================================

正文

本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数:

Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。
Transmutate():计算新列但删除现有变量。
同时还有mutate()和transmutate()的三个变体来一次修改多个列:
Mutate_all()/ transmutate_all():将函数应用于数据框中的每个列。
Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定列
Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择的列

R语言第二章数据处理⑤数据框列的转化和计算_第1张图片
  • mutate:通过保留现有变量来添加新变量,通过保留现有列来添加新列(sepal_by_petal):
library(tidyverse)
my_data <- as_tibble(iris)
my_data
my_data %>% 
  mutate(sepal_by_petal_l = Sepal.Length/Petal.Length)
  • transmute:通过删除现有变量来创建新变量,删除现有列,添加新列(sepal_by_petal):
my_data %>%
  transmute(
    sepal_by_petal_l = Sepal.Length/Petal.Length,
    sepal_by_petal_w = Sepal.Width/Petal.Width
    )
  • 一次修改多个列

函数mutate_all()/ transmutate_all(),mutate_at()/ transmutate_at()和mutate_if()/ transmutate_if()可用于一次修改多个列。

简化格式如下:

# Mutate variants
mutate_all(.tbl, .funs, ...)
mutate_if(.tbl, .predicate, .funs, ...)
mutate_at(.tbl, .vars, .funs, ...)

# Transmutate variants
transmute_all(.tbl, .funs, ...)
transmute_if(.tbl, .predicate, .funs, ...)
transmute_at(.tbl, .vars, .funs, ...)

tbl:一个tbl数据框
funs:由funs()生成的函数调用列表,或函数名称的字符向量,或简称为函数。predicate:要应用于列或逻辑向量的谓词函数。 选择predicate为或返回TRUE的变量。

  • 转换特定列

mutate_at():转换按名称选择的特定列:

my_data2 %>%
  mutate_at(
    c("Sepal.Length", "Petal.Width"),
    funs(cm = ./2.54)
    )
  • mutate_if():转换由谓词函数选择的特定列。
  • mutate_if()对于将变量从一种类型转换为另一种类型特别有用。
# 将所有因子列转化成字符
my_data %>% mutate_if(is.factor, as.character)
# 将左右数字列四舍五入
my_data %>% mutate_if(is.numeric, round, digits = 0)

你可能感兴趣的:(R语言第二章数据处理⑤数据框列的转化和计算)