这张图可以使用ggpubr
包的ggscatterhist()
函数绘制。
目 录
1. 加载数据集
2. 绘制图形
2.1 绘制简单图形
2.2 边际图为直方图
2.3 添加参考线
2.4 添加回归线
2.5 向模型添加系数
3. 复杂边际图
4. ggscatterhist()函数
首先安装需要的包和加载数据集。
install.packages("ggpubr") # 安装包
library(ggpubr) # 加载包
data(iris) # 加载数据集
View(iris) # 预览数据集
带边际密度图的散点图。
plots # 包含绘图变量的数据集
x = "Sepal.Length", y = "Sepal.Width", # 绘图变量
color = "#00AFBB", # 设置颜色
margin.params = list(fill = "#00AFBB")) # 设置边际图的颜色
将边际图修改为直方图。
plots # 包含绘图变量的数据集
x = "Sepal.Length", y = "Sepal.Width", # 绘图变量
color = "#00AFBB", # 设置颜色
margin.plot = "histogram", # 设置边际图的类型
margin.params = list(fill = "#00AFBB")) # 设置边际图的颜色
plots$sp $sp + # sp为散点图主图
geom_hline(yintercept = 3, linetype = "dashed", color = "blue") +
geom_vline(xintercept = 6, linetype = "dashed", color = "red")
plots
运行stat_smooth() 函数并设定method=lm即可向散点图中添加线性回归拟合线,调用lm()函数对数据拟合线性模型。
plots$sp $sp +
stat_smooth(method=lm)
plots
默认情况下,stat_smooth()函数会为回归拟合线添加95%的置信域,置信域对应的置信水平可通过设置level参数来进行调整。设定参数se=FALSE时,系统将不会对回归拟合线添加置信域。
先建立线性模型,计算出模型系数,再把系数以文本形式添加到图形中。
model <- lm(Sepal.Length ~ Sepal.Width, iris)
summary(model)
上面的结果表明模型的r2值是0.0138,p-value为0.1519。
调用annotate()函数向其手动添加文本。
plots$sp
annotate("text", x=4.7, y=4.4, parse=TRUE,
label="r^2 == 0.0138 * ' p-value = 0.1529'")
plots
ggscatterhist(
iris, x = "Sepal.Length", y = "Sepal.Width",
color = "Species", size = 2.5, alpha = 0.5,
palette = c("#00AFBB", "#E7B800", "#FC4E07"),
margin.params = list(fill = "Species", color = "black", size = 0.2)
)
ggscatterhist(
iris, x = "Sepal.Length", y = "Sepal.Width",
color = "Species", size = 3, alpha = 0.6,
palette = c("#00AFBB", "#E7B800", "#FC4E07"),
margin.plot = "histogram",
ggtheme = theme_bw()
)
ggscatterhist(data, x, y, group = NULL, color = "black", fill = NA, palette = NULL,
shape = 19, size = 2, linetype = "solid", bins = 30,
margin.plot = c("density", "histogram", "boxplot"), margin.params = list(),
margin.ggtheme = theme_void(), margin.space = FALSE, main.plot.size = 2,
margin.plot.size = 1, title = NULL, xlab = NULL, ylab = NULL, legend = "top",
ggtheme = theme_pubr(), print = TRUE, ...)
## 部分参数解释
data # 包含x、y变量的数据框
x, y # 绘图用的x、y变量
group # 分组变量;如果缺少颜色和形状选项,则按组更改点的颜色和形状。当您要创建分组的边线箱图时,也应指定该参数。
color、fill # 散点的颜色
palette # 设置线图颜色的调色板;可为灰色调色板"grey";自定义调色板c("blue","red")
# ggsci包调色板:"npg","aaas","lancet","jco","ucscgb","uchicago","simpsons"和"rickandmorty"。
shape # 散点的形状
size # 散点的大小
linetype # 线形 ("solid", "dashed", ...)
bins # 直方图的条形数量,默认30,可自定义数值
margin.plot # 边际图的类型("density", "histogram", "boxplot"),
# 默认"hist",绘制直方图
margin.params # 作用于边际图的参数,设置颜色、线形等
margin.ggtheme # 边际图的图形主题,默认theme_void().
margin.space # 逻辑词,为TRUE,则在边际图与主图之间增加空间
main.plot.size # 主图的宽度,默认为2
margin.plot.size # 边际图的宽度,默认为1
title # 图形标题
xlab、ylab # x轴、y轴标签
legend # 指定图例的位置,允许值有:"top", "bottom", "left", "right".
ggtheme # 散点图的主题,默认为theme_pubr()
print # 逻辑词,默认输出图形
热烈欢迎读者朋友们转发、点赞、点在看~~~