两组数据的相关性如何可视化,这个思路值得借鉴!

欢迎关注”生信修炼手册”!

相关性分析是最常用的分析策略之一,对于两组数据相关性结果的可视化,可以借鉴文献中的表现形式,图示如下

两组数据的相关性如何可视化,这个思路值得借鉴!_第1张图片

采用了组合图表的形式,主体是两组数据构成的散点图,在散点图中显示线性拟合的直线,并标记相关系数和相关性检验的p值;同时在上方和右侧方,用直方图的形式展示看每组数据的各自分布。这样的一幅图表,把相关性分析的多种信息同时展现了出来,信息量丰富而且美观。

这样的一幅图如何来实现呢,下面来一步步进行探究,首先看下数据

> data("mtcars")
> head(mtcars)
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

我们对mtcars这个数据框中的mpg和wt 这两列数据进行相关性分析,首先使用ggpubr中的ggscatter函数绘制散点图,代码如下

> library(ggpubr)
> ggscatter(mtcars, x = "wt", y = "mpg")

效果图如下

两组数据的相关性如何可视化,这个思路值得借鉴!_第2张图片

和文献中的插图相比,我们需要做以下调整

1.添加回归直线和置信区间,并设置颜色

2.调整散点的大小

代码如下

你可能感兴趣的:(可视化,数据可视化,数据分析,python,机器学习)