《学习小组Day6笔记--范若辰》

  • 一.配置RStudio下载镜像

    • 1.Tools-->Global options-->Packages-->Primary CRANrepository-->China(Beijing)...

      • 输入命令options()$验证
    • 2.输入命令:
      options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
      添加镜像

      • 输入命令options()$BioC_mirror查询
    • 3.编辑.Rprofile配置文件

      • 输入命令:file.edit('~/.Rprofile')

      • 添加代码:
        options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")

      • 保存重启后输入options()$repos和options()$BioC_mirror进行验证和options()$BioC_mirror进行验证

  • 二.安装R包

    • 安装命令:

      • 1.install.packages:安装的包存在于CRAN网站

      • 2.BiocManager::install:安装的包存在于Biocductor

      • 3.安装BioConductor

        • 输入library("BiocVersion")等命令检查是否安装过BioConductor

        • 安装命令;

          • install.packages("BiocManager")

          • BiocManager::install()

        • 升级BioConducor及相关软件包

          • 先卸载当前的安装程序:remove.packages(c("BiocInstaller", "BiocManager", "BiocVersion"))

          • 再次安装新版本:

          • install.packages("BiocManager")

          • BiocManager::install(update=TRUE, ask=FALSE)

        • 使用旧版软件:BiocManager::install(version="版本号")

          • 详情见:https://blog.csdn.net/u014801157/article/details/62884401
    • 安装加载命令

      • 以安装dplyr为例

        • options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))

        • options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")

        • install.packages("dplyr")

        • library(dplyr)

  • 三.dplyr包的应用

    • 1.mutate(),新增列


      新增一列new,数值为SepalLength 与SepalWidth的乘积.png
    • 2.select(),按列筛选

      • (1)按列号筛选


        选择第一列&选择第一列和第五列.png
      • (2)按列名筛选


        选择对应的列,将保存至变量vars中.png
    • 3.filter()筛选行


      筛选Species为setosa与versicolor的行.png

      筛选Species为setosa对应的行;筛选Species为setosa对应且SepalLength数值大于5的行.png
    • 4.arrange(),按某1列或某几列对整个表格进行排序


      arrange排序默认从小到大排序,输入参数desc后按照从大到小排序.png
    • 5.summarise():汇总


      mean计算平均值sd计算标准差.png
按照Species进行分组.png
按照每一物种计算平均值(Sepal.Length)与标准差(Sepal.Length).png

6.管道操作 %>% (cmd/ctr + shift + M)

同Linux管道操作,将前面得到的数据作为标准输入


管道操作;按照每一物种计算评价年至(Sepal.Length)与标准差(Sepal.Length).png

7.count统计某列的unique值


通过count统计某一列不同数据的重复次数.png

8.将2个表进行连接

1.內连inner_join,取交集

2.左连left_join

3.全连full_join

4.半连接:返回能够与y表匹配的x表所有记录semi_join

5.反连接:返回无法与y表匹配的x表的所记录anti_join

6.简单合并
思维导图.png
学习大纲.png

你可能感兴趣的:(《学习小组Day6笔记--范若辰》)