学习小组Day6笔记-- Joanna

"R包的安装"

  • 性价比高的配置Rstudio的下载镜像
    按照如下代码> options()repos options(repos
    options()$BioC_mirror
    image.png

安装失败时,可在每次需要下载R包时运行这两句代码即可

  • 安装
    大部分包存于CRAN网站或Biocductor
    install.packages(“包”)或者BiocManager::install(“包”)

  • 加载
    library(包)
    require(包)

  • 安装加载三部曲
    options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
    options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
    install.packages("dplyr")

测验数据


image.png

""dplyr五个基础函数""
1.mutate(),新增列


image.png

2.select(),按列筛选

  • 按列号筛选


    image.png

    image.png

    image.png
  • 按列名筛选


    image.png

    image.png

3.filter()筛选行


image.png

image.png

4.arrange(),按某1列或某几列对整个表格进行排序


image.png

5.summarise():汇总


image.png

对数据进行汇总操作,结合group_by使用实用性强
6.管道操作 %>% (cmd/ctr + shift + M)


image.png

(加载任意一个tidyverse包即可用管道符号)

7.count统计某列的unique值


image.png

8.dplyr处理关系数据

将2个表进行连接,注意:不要引入factor

  • 内连inner_join,取交集


    image.png
  • 左连left_join


    image.png
  • 全连full_join


    image.png
  • 半连接:返回能够与y表匹配的x表所有记录semi_join


    image.png
  • 反连接:返回无法与y表匹配的x表的所记录anti_join


    反连接
  • 简单合并

bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数


基本情况

image.png

你可能感兴趣的:(学习小组Day6笔记-- Joanna)