最近在自学R语言,但是从纯粹的理论开始学习太慢了而且没有实操不太行,所以目前是在实际应用中查漏补缺,遇到什么临时学什么,然后把笔记都一一记录下啦。分享出来一边是方便自己查找,另一方面也是想方便和我一样入门的菜鸟哈哈哈,这个系列将持续更新哦。其中有些图表来源于网络,如有侵权联系可删 ~
目录
一、R语言介绍
二、快捷键
二、R语言包的学习
(一)ggplot2
1、数据
2、函数
三、知识点合集
(一)回归的种类
一款图形可视化的R包,核心理念是将绘图与数据分离,按图层作图,其中图层包括三层——数据层、几何图形层和美学层,有利于结构化思维,同时保有命令式作图的调整函数,使其更具灵活性,绘制出来的图形美观,同时避免繁琐细节。包含以下几个概念,以下这些不同层之间都是使用“+”连接起来的,也就是最终是以图层的形式进行叠加展示。
在使用ggplot2的过程中,接受的数据集必须是以data.frame格式的。
(1)ggplot( ):找到映射的对应关系,data=(数据集),新手训练的时候可以使用ggplot2中自带的mpg数据集进行练习。
(2)aes( ):映射函数,分别使用 x =(x轴坐标内容)
,y =(y轴坐标内容)
制定需要映射的变量。
(3)geom_point ( ):散点图绘制函数。
library(ggplot2)
ggplot(data=mpg,mapping=aes(x=cty,y=hwy))+geom_point()
这个地方的代码还可以拓展一下,函数的变化还是非常灵活的。
比如,按照年份这个变量变换颜色。
ggplot(data=mpg,mapping=aes(x=cty,y=hwy,color=factor(year)))+geom_point()
其实这里的"data=","x=","y="都可以省略,同时试着把factor省略。另外,这里的“color( )”放在ggplot( )中和geom_point( )中都是可以的,两个代码的图都是一样的哦。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()
ggplot(mpg,mapping=aes(cty,hwy))+geom_point(aes(color=year))
(4)geom_histogram( ):直方图绘制函数,针对连续变量。
library(ggplot2)
ggplot(data=mpg,mapping=aes(x=hwy))+geom_histogram()
(5)geom_bar( ):柱形图绘制函数,也称柱形图,针对离散变量。
(6)geom_density( ):密度图绘制函数。
(7)geom_box( ):箱线图绘制函数。
其他的一些几何对象变换可选。
(8)stat_smooth( ):拟合曲线。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()
其他的统计变换函数可选。
(9)facet_wrap( ):分面函数。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_warp(~year)
两张图在一行有点拥挤,可以指定行和列。其中,指定列使用ncol= ,指定行用nrow= 。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)
(10)主题函数: labs( )、xlab()、ylab()、theme( )
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')
再来调整一下标题的位置和美观程度。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')+theme(plot.title = element_text(hjust = 0.5))
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')+theme_bw()+theme(plot.title = element_text(hjust = 0.5),panel.grid = element_blank())
同时,ggplot2中提供很多可以直接使用的主题。比如theme_grey ()是默认主题,theme_bw( )是白色背景主题,theme_classic( )是经典主题。