《学习小组Day6笔记--范若辰》

一.配置RStudio下载镜像
- 1.Tools-->Global options-->Packages-->Primary CRANrepository-->China(Beijing)...
  - 输入命令options()$验证
- 2.输入命令：
  options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
  添加镜像
  - 输入命令options()$BioC_mirror查询
- 3.编辑.Rprofile配置文件
  - 输入命令：file.edit('~/.Rprofile')
  - 添加代码：
    options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
  - 保存重启后输入options()$repos和options()$BioC_mirror进行验证和options()$BioC_mirror进行验证
二.安装R包
- 安装命令：
  - 1.install.packages：安装的包存在于CRAN网站
  - 2.BiocManager::install：安装的包存在于Biocductor
  - 3.安装BioConductor
    - 输入library("BiocVersion")等命令检查是否安装过BioConductor
    - 安装命令;
      - install.packages("BiocManager")
      - BiocManager::install()
    - 升级BioConducor及相关软件包
      - 先卸载当前的安装程序：remove.packages(c("BiocInstaller", "BiocManager", "BiocVersion"))
      - 再次安装新版本：
      - install.packages("BiocManager")
      - BiocManager::install(update=TRUE, ask=FALSE)
    - 使用旧版软件：BiocManager::install(version="版本号")
      - 详情见：https://blog.csdn.net/u014801157/article/details/62884401
- 安装加载命令
  - 以安装dplyr为例
    - options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))
    - options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
    - install.packages("dplyr")
    - library(dplyr)
三.dplyr包的应用
- 1.mutate(),新增列
  
  新增一列new,数值为SepalLength 与SepalWidth的乘积.png
- 2.select(),按列筛选
  - (1)按列号筛选
    
    选择第一列&选择第一列和第五列.png
  - (2)按列名筛选
    
    选择对应的列，将保存至变量vars中.png
- 3.filter()筛选行
  
  筛选Species为setosa与versicolor的行.png
  
  筛选Species为setosa对应的行;筛选Species为setosa对应且SepalLength数值大于5的行.png
- 4.arrange(),按某1列或某几列对整个表格进行排序
  
  arrange排序默认从小到大排序，输入参数desc后按照从大到小排序.png
- 5.summarise()：汇总
  
  mean计算平均值sd计算标准差.png

按照Species进行分组.png

按照每一物种计算平均值(Sepal.Length)与标准差(Sepal.Length).png

6.管道操作 %>% (cmd/ctr + shift + M)

同Linux管道操作，将前面得到的数据作为标准输入

管道操作；按照每一物种计算评价年至(Sepal.Length)与标准差(Sepal.Length).png

7.count统计某列的unique值

通过count统计某一列不同数据的重复次数.png

8.将2个表进行连接

1.內连inner_join,取交集

2.左连left_join

3.全连full_join

4.半连接：返回能够与y表匹配的x表所有记录semi_join

5.反连接：返回无法与y表匹配的x表的所记录anti_join

6.简单合并

思维导图.png

学习大纲.png

《学习小组Day6笔记--范若辰》

你可能感兴趣的:(《学习小组Day6笔记--范若辰》)