tidyverse初探


文章目录

    • @[toc]
    • tidyverse简介
    • 安装
    • 体验
      • 管道函数
      • tibble数据格式
      • 可视化

tidyverse简介

tidyverse是一系列数据处理与可视化包的集合,由Hadley Wickham推出。旨在建立同一规范性的R包,以应对R语言包多而繁杂难以选择与使用的情况。
其核心包以及相关包包括:

  • ggplot2可视化
  • dplyr数据处理
  • tibble数据格式规范
  • readr数据导入
  • stringr字符串处理
  • forcats因子变量处理
  • lubridate时间日期处理
  • magrittr管道操作
  • purrr函数式编程
  • moderlr建模
  • broom模型结果汇总

安装

install.packages("tidyverse")

体验

载入包会显示tidyverse核心包的版本情况,以及与baseR包的冲突函数。

library(tidyverse)
-- Attaching packages --------------------------------------- tidyverse 1.2.1 --
√ ggplot2 3.2.1     √ purrr   0.3.3
√ tibble  2.1.3     √ dplyr   0.8.4
√ tidyr   1.0.0     √ stringr 1.4.0
√ readr   1.3.1     √ forcats 0.4.0
-- Conflicts ------------------------------------------ tidyverse_conflicts() --
x dplyr::filter() masks stats::filter()
x dplyr::lag()    masks stats::lag()

管道函数

tidyverse引入magrittr管道符号设定,使用管道符号减少不必要的变量命名赋值,更高效易读。

  • 不使用管道函数的情况
#求100个随机数的平均值
a <- rnorm(100)
mean <- mean(a)
mean
[1] 0.05481406
  • 使用管道符号%>%
mean <- rnorm(100) %>% mean()
mean
[1] 0.1361413

tibble数据格式

新一代的数据格式,显示更加美观,加载速度也有所提升。

as.tibble(mtcars)
# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
             
 1  21       6  160    110  3.9   2.62  16.5     0     1     4     4
 2  21       6  160    110  3.9   2.88  17.0     0     1     4     4
 3  22.8     4  108     93  3.85  2.32  18.6     1     1     4     1
 4  21.4     6  258    110  3.08  3.22  19.4     1     0     3     1
 5  18.7     8  360    175  3.15  3.44  17.0     0     0     3     2
 6  18.1     6  225    105  2.76  3.46  20.2     1     0     3     1
 7  14.3     8  360    245  3.21  3.57  15.8     0     0     3     4
 8  24.4     4  147.    62  3.69  3.19  20       1     0     4     2
 9  22.8     4  141.    95  3.92  3.15  22.9     1     0     4     2
10  19.2     6  168.   123  3.92  3.44  18.3     1     0     4     4
# ... with 22 more rows

可视化

可视化使用ggplot2,基于图形语法一书实现。图形更美观,绘制更加简便。

library(ggplot2)
p <- ggplot(cars,mapping = aes(x = speed,y = dist))
p + geom_point()

tidyverse初探_第1张图片

R 语 言 小 白 速 通 R语言小白速通 R
懂 点 R 语 言 懂点R语言 R
欢 迎 分 享 收 藏 关 注 欢迎分享收藏关注

你可能感兴趣的:(R语言)