Python实现数据可视化的3大步骤,保姆级讲解

目录

前言

一、哪三个步骤?

1、Python实现可视化的三个步骤:

 2、主要画图库

二、步骤详解

1、确定问题,选择图形

2、转换数据,应用函数

3、参数设置,一目了然


前言

数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,也就是说可视化的存在是为了帮助我们更好的去传递信息。

本文主要讲述实现数据可视化的三个步骤,希望可以对正在学习或者从事数据分析的你有帮助。


一、哪三个步骤?

1、Python实现可视化的三个步骤:

  • 确定问题,选择图形
  • 转换数据,应用函数
  • 参数设置,一目了然

 2、主要画图库

  • matplotlib

Python中最基本的作图库就是matplotlib,是一个最基础的Python可视化库,一般都是从matplotlib上手Python数据可视化,然后开始做纵向与横向拓展。

  • Seaborn

是一个基于matplotlib的高级可视化效果库,针对的点主要是数据挖掘和机器学习中的变量特征选取,seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果图。

  • 其他库

Bokeh是一个用于做浏览器端交互可视化的库,实现分析师与数据的交互;Mapbox处理地理数据引擎更强的可视化工具库。

二、步骤详解

1、确定问题,选择图形

业务可能很复杂,但是经过拆分,我们要找到我们想通过图形表达什么具体问题。分析思维的训练可以学习《麦肯锡方法》和《金字塔原理》中的方法。

这是一张关于图表类型选择的总结:

Python实现数据可视化的3大步骤,保姆级讲解_第1张图片

在Python中,可以总结为以下四种基本视觉元素来展现图形:

  • :scatter plot 二维数据,适用于简单二维关系;

  • 线:line plot 二维数据,适用于时间序列;

  • 柱状:bar plot 二维数据,适用于类别统计;

  • 颜色:heatmap 适用于展示第三维度;

数据间存在分布,构成,比较,联系以及变化趋势等关系。对应不一样的关系,选择相应的图形进行展示。

2、转换数据,应用函数

数据分析和建模方面的大量编程工作都是用在数据准备的基础上的:加载、清理、转换以及重塑。我们可视化步骤也需要对数据进行整理,转换成我们需要的格式再套用可视化方法完成作图。

下面是一些常用的数据转换方法:

  • 合并:merge,concat,combine_frist(类似于数据库中的全外连接)

  • 重塑:reshape;轴向旋转:pivot(类似excel数据透视表)

  • 去重:drop_duplicates

  • 映射:map

  • 填充替换:fillna,replace

  • 重命名轴索引:rename

将分类变量转换‘哑变量矩阵’的get_dummies函数以及在df中对某列数据取限定值等等

函数则根据第一步中选择好的图形,去找Python中对应的函数。

3、参数设置,一目了然

原始图形画完后,我们可以根据需求修改颜色(color),线型(linestyle),标记(maker)或者其他图表装饰项标题(Title),轴标签(xlabel,ylabel),轴刻度(set_xticks),还有图例(legend)等,让图形更加直观。

你可能感兴趣的:(Python干货,python,开发语言,numpy)