python设置散点图点的大小_数据量太大?散点图装不下怎么办?用Python解决数据密度过大难题...

当我们需要观察比较2个变量间的关系时,散点图是我们首选图表。

可当数据量非常大,数据点又比较集中在某个区间中,图表没法看,密密麻麻的怎么看?

python设置散点图点的大小_数据量太大?散点图装不下怎么办?用Python解决数据密度过大难题..._第1张图片

怎么办?这时候就得看密度图了

什么是密度图?

python设置散点图点的大小_数据量太大?散点图装不下怎么办?用Python解决数据密度过大难题..._第2张图片

所谓的密度图 (Density Plot) 就是数据的分布稠密情况,它常用于显示数据在连续时间段内的分布状况。严格来说,它是由直方图演变而来,类似于把直方图进行了填充。

一般是使用平滑曲线来绘制数值水平来观察分布,峰值数值位置是该时间段内最高度集中的地方。

它比直方图适用性更强,不受分组数量(直方图的条形数量不宜过多)的影响,能更好地界定分布形状 。

本篇文章不谈论直方图,之后老海会专门总结关于直方图的使用。

什么是2D密度图?

说完了密度图和直方图,它们都是一维数据变量。

这下我们来看看2D密度图,它显示了数据集中两个定量变量范围内值的分布,有助于避免在散点图中过度绘制。

如果点太多,则2D密度图会计算2D空间特定区域内的观察次数。

该特定区域可以是正方形或六边形(六边形),还可以估算2D内核密度估算值,并用轮廓表示它。

本篇文章主要描述一下2D密度图的使用。

python设置散点图点的大小_数据量太大?散点图装不下怎么办?用Python解决数据密度过大难题..._第3张图片

2D密度图的基本数据样式

python设置散点图点的大小_数据量太大?散点图装不下怎么办?用Python解决数据密度过大难题..._第4张图片

2D密度图的使用建议

密度图是一种直方图的代替方案,常用来观察连续变量的分布情况

2D密度图主要用来解决数据点密度过大的问题,要注意密度分割是否合理。

当数据范围都非常集中,数据间变化不大时,密度图往往很难观察效果。

下面开始具体的操作案

你可能感兴趣的:(python设置散点图点的大小)