python 数据分析——可视化基础:如何选择可视化图形

可视化图形的选择

  • 线型图(line)
  • 柱状图(bar)
  • 直方图(histogram)
  • 箱线图(box)
  • 散点图(scatter)

python 数据分析——可视化基础:如何选择可视化图形_第1张图片

线型图(line)

线型图可以用来表示具有相关性的两个变量的关系,表示一个变量随另一个变量(比如:时间)变化的情况。

注:Pandas 中的 Series 和 Dataframe 都是默认生成的这种图形(使用plot函数)。

柱状图(bar)

柱状图/条形图适合用于少数类别(<10)的分类数据的可视化,用来反映不同类别数据之间的差异。

直方图(histogram)

直方图可以展现数据点的分布情况,是一种可以对值频率进行离散化显示的柱状图。

与此相关的一种图表类型是密度图,它是通过计算“可能会产生观测数据的连续概率分布的估计”而产生的。密度图也被称为 KDE(Kernel Density Estimate,核密度估计)图。

注:直方图和柱状图的区别

  • 柱状图用于分类数据变量,一般条形呈分开排列;直方图用于数值变量,通常是连续排列(直方图的X轴代表将定量变量的数据划分为若干等宽度的区间)
  • 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。

箱线图(box)

箱线图可以展现出比直方图更详细的数据分布情况,其可以用来显示一组数据的中位数,四分位数,和异常值,是一个有用的可视化类型。

箱型的上下两条边分别表示四分之一和四分之三分位点,箱内的线表示中值,虚线条上的条线从盒中伸出以显示数据的范围。

散点图(scatter)

散点图可以直观地展现原始点的分布和两个变量间的关系,是用来观察两个一维数据序列之间的关系的有效手段。
当然,可以有多个变量同时与其中一个变量同时进行观察。

你可能感兴趣的:(数据分析,可视化,python,数据分析,数据可视化)