R语言【dplyr】——summarise()或summarize()会创建一个新的数据帧。它为每个分组变量的组合返回一行;如果没有分组变量,输出将只有一行,汇总输入中的所有观测值

Package dplyr version 1.1.4


Parameters

summarise(.data, ..., .by = NULL, .groups = NULL)

summarize(.data, ..., .by = NULL, .groups = NULL)

参数【.data】:一个数据集(data frame),数据集扩展(比如:tibble),或者 lazy data frames(比如:来自 dbplyr 或 dtplyr)。

参数【...】:<data-masking> 摘要函数的键-值对。名称将是结果中变量的名称。该值可以是:

  • 长度为 1 的向量,如 min(x)n()sum(is.na(y))
  • 数据集,用于从一个表达式中添加多列。
  • reframe()

参数【.by】:<tidy-select> 可选的,仅用于此操作的列分组选择,可替代 group_by()

参数【.group】:结果的分组结构。

  • "drop_last":放弃最后一级分组。这是 1.0.0 版之前唯一支持的选项。
  • "drop": 删除所有分组级别。
  • "keep": 分组结构与参数【.data】相同。
  • "rowwise": 每一行都是自己的组。

如果未指定参数【.group】,则根据结果的行数选择:

  • 如果所有结果都只有 1 行,则得到 "drop_last"
  • 如果行数不等,则得到 "保留 "keep"。注意,由于 reframe() 也会无条件地放弃所有级别的分组,返回可变行数的做法已被弃用。

此外,除非结果未分组、选项 "dplyr.summarise.inform " 设置为 FALSE 或从软件包中的函数调用 summarise(),否则会有一条消息通知您这一选择。

summarise() 会创建一个新的数据帧。它为每个分组变量的组合返回一行;如果没有分组变量,输出将只有一行,汇总输入中的所有观测值。它将为每个分组变量包含一列,为您指定的每个汇总统计量包含一列。

summarise()summarize() 是同义词。


Value

通常与参数【.data】属于同一类型的对象。

  • 来自底层 group_keys() 的行。
  • 列是分组键和您提供的摘要表达式的组合。
  • 分组结构由参数【.group】控制,输出可能是另一个分组df、一个 tibble 或一个 rowwise 数据集。
  • 数据集属性不会保留,因为 summarise() 从根本上创建了一个新的数据集。

Available functions

  • mean()median()
  • sd()IQR()mad()
  • min()max()
  • first()last()nth()
  • n()n_distinct()
  • any()all()

你可能感兴趣的:(R语言,r语言)