《机器学习Python实践 》- 可视化

数据可视化,可视化的目的,是为了更直观的理解数据、更快速的理解数据

单一图表

  • 直方图
    又称质量分布图,可以直观的展示每个属性的分布情况
axes = df.hist(figsize=(9,9))
  • 密度图
    也叫做KDE图,是一种表现与数据值对应的边界或域对象的图形表示方法,一般用于呈现连续变量。
    密度图,类似于对直方图的抽象,用平滑的曲线来描述数据分布。
df.plot.kde(subplots=True, layout=(3,3) , sharex=False , figsize=(9,9))

相比较于直方图,密度图,不需要去考虑分组数量,可以更好的绘制数据的分布形状

  • 箱线图
    又称盒须图、箱形图,用来表现数据的分散情况
## 盒须图
df.plot.box(subplots=True, layout=(3,3) , sharex=False,figsize=(9,9))

你可能感兴趣的:(《机器学习Python实践 》- 可视化)