DAY4学习小组笔记 那朵花的名字叫面码

R和Rstudio介绍

R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点:

  • 完全免费、开源

  • 可编程语言

    可以编写自己的函数来扩展现有的语言,比SPSS、SAS等统计软件跟新快的多大多数最新的统计方法可以在R中实现
  • 具有很强的互动性

    除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口

安装

之前已经安装,在此不再赘述。注意用户名要改为英文,不然会很麻烦。

R的基本设置

工作界面

脚本编辑器script environment(对象/变量列表);history
控制台console(脚本运行结果显示) 文件、图像结果、帮助、包

外观设置

外观设置

在appearance中可以设置字体、大小、主题、控制台颜色等

R project管理工作目录

所谓工作目录就是默认的读取和储存位置,也就是说,R语言只能和文件夹进行互动,这个文件夹非常重要,做不好就会导致你的脚本、文件、图片各种乱跑,找不到(转自生信星球)
可参考Rproject

test project就只进行test里面的脚本

当需要进行很多不同的项目的时候,可以用多个project来管理

R基本操作

tab快捷键可以帮助一键补全可能的命令
可以快速复制上一命令行
dir()查看目录中有哪些项目
list()查看目录中有哪些对象

dir()
[1] "test.Rproj"
 list.files()
[1] "test.Rproj"
> 1+3
[1] 4

<-赋值符号,将后面的数值赋予前面的变量,和“=”一样,但是一般不用“=”
==判断是否相等,返回一个布尔值,如果相等就返回“TRUE”,不相等就返回“FALSE”

> x<-2 
> x
[1] 2
> a=3
> a==3
[1] TRUE 

ls()变量都被储存在ls()这个列表中

> ls()
[1] "a" "x"

rm删除变量
rm(list=(ls())删除所有变量

>rm(x)
> x
Error: object 'x' not found
> rm(list=ls()) #清除列表中所有变量
> ls()
character(0)

history()查看历史记录,也就是右上方的工作窗口
ctrl+l清空控制台
plot(rnorm(50))R语言中的runif()函数用于生成从0到1区间范围内的服从正态分布的随机数,每次生成的值都不一样;set.seed()用于生成随机数的种子元素,两个函数配合起来发挥作用

在0~1中随机取50个数做散点图

还可以根据自己的需要修改参数
> plot(rnorm(50),xlab="x",ylab="y",col=c("blue"),cex=0.5,pch=5)x轴名称为x,y轴名称为y,图像颜色为blue,散点大小为默认的50%

x轴名称为x,y轴名称为y,图像颜色为blue,散点大小为默认的50%

boxplot(iris$Sepal.Length~iris$Species,col = c("lightblue","lightyellow","lightpink"))横轴名称为iris$Sepal.Length,纵轴名称为iris$Species,颜色按顺序为浅蓝、浅黄、浅粉(如果图像个数多于颜色个数,则会按照颜色顺序进行循环使用)
(这里使用了反转义符号\$来消除$的作用)

箱图

更多关于ggplot2的基础使用,可以见详解ggplot2

你可能感兴趣的:(DAY4学习小组笔记 那朵花的名字叫面码)