4-1 探索型数据分析:绘制统计图形展示数据分布(版本:py3)

数据分析三大类型

  • 探索型数据分析
  • 验证型数据分析
  • 预测型数据分析

下图为数据科学的流程:

4-1 探索型数据分析:绘制统计图形展示数据分布(版本:py3)_第1张图片

探索型数据分析的作用

  • 与数据清理相辅相成
  • 支持验证型数据分析、预测型数据分析

探索型数据分析的常用图表

  • 条形图、直方图
  • 饼图(饼图在探索型数据分析中使用较少,原因是肉眼对于角度之间的大小差别没有对高度之间的差别敏感)
  • 折线图、散点图
  • 箱形图

绘图函数

这里以tips为例,在后续练习中,你也可以用这个数据集进行练习

tips = seaborn.load_dataset("tips")

#bar 条形图
seaborn.barplot(x="day",y="total_bill",data=tips)

#hist 直方图
seaborn.distplot(X)

#line chart 折线图
seaborn.pointplot(x="day",y="tip",data=tips,ci=68)

#scatter diagram 散点图
seaborn.regplot(x="total_bill",y="tip",data=tips)

#box plot 箱形图
seaborn.boxplot(x="day",y="total_bill",data=tips)

视频中给出了标准的画图指令,但是你可以根据自己的需求,修改默认的参数,来实现图形的美观性,3.6节视频中,提供了关于Seaborn库的绘图技巧,你可以返回复习

扩展: 
还有许多关于绘图的应用,比如: 
网络数据可视化:可以使用Gephi软件 
时空数据可视化:可以使用MapBox或CART实现

补充知识

Seaborn库

请阅读以下链接的材料,进行更多关于seaborn库的练习

  • 10分钟python图表绘制 | seaborn入门(一):distplot与kdeplot

  • 10分钟python图表绘制 | seaborn入门(二):barplot与countplot

  • 10分钟python图表绘制 | seaborn入门(三):Boxplot与Violinplot

  • 10分钟python图表绘制 | seaborn入门(四):回归模型lmplot

绘图利器:Plotly&ggplot 2

可视化工程师在很多公司是一个单独列出来的职位,主要的职责内容是将数据可视化展现,需要编程、设计、表达等等技能,是一块十分值得学习的内容,编程部分除了matplotlib,seabron这两大利器外,Python还有其他支持绘图的包,请阅读:

  • Python可视化工具概述

推荐你学习的Python 绘图包

  • Plotly:Quick Start ,官方的快速入门提供了很多的图形和指令,你可以进行探索,记忆合适的图形类型对应的指令
  • ggplot 2: ggplot2 官方文档,ggplot2是绘图的一大利器,pip install ggplot2库之后你就可以进行操作啦,跟着example进行操作,你可以快速掌握指令

扩展阅读

不同的统计图的特点不同,能表现的信息也有区别。请阅读几种常见统计图的比较与选择,了解不同统计图的特点

学有余力的话,你还可以阅读有哪些值得推荐的数据可视化工具?了解更多可视化工具,掌握了正确的绘图工具,可以让你的数据展现瞬间变得高大上起来

你可能感兴趣的:(4-1 探索型数据分析:绘制统计图形展示数据分布(版本:py3))