学习小组Day6笔记—白兔儿溜溜

R语言中包的相关操作

以dplyr包为例。

1.便捷配置Rstudio的下载镜像

运用R的配置文件 .Rprofile

第一步
运用file.edit编辑.Rprofile
file.edit('~/.Rprofile')
第二步
设置镜像

# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像

第三步
check
options()$repos
options()$BioC_mirror

2.安装包

安装命令

R包安装命令是:install.packages("包")或者BiocManager::install("包")
取决于要安装的包存在于CRAN网站还是Biocductor?可以问谷歌。

加载包

以下两种方式均可
library(包)
require(包)
下面开始test
install.packages("dplyr")
library(dplyr)

3.dplyr五个基础函数

测试数据使用,使用内置数据集iris的简化版


打破砂锅

Iris数据集概况

Iris Data Set(鸢尾属植物数据集)首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文《The use of multiple measurements in taxonomic problems》中,被用来介绍线性判别式分析。在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本的4个特征,分别是:
sepal length(花萼长度cm);
sepal width(花萼宽度cm);
petal length(花瓣长度cm);
petal width(花瓣宽度cm)。

扁竹根,西南地区最常见的鸢尾科植物

test <- iris[c(1:2,51:52,101:102),]

dplyr五个基础函数

dplyr五个基础函数.png

dplyr两个实用技能

dplyr两个实用技能.png

dplyr处理关系数据

dplyr处理关系数据.png

你可能感兴趣的:(学习小组Day6笔记—白兔儿溜溜)