Python数据分析入门 matplotlib数据可视化基础【三】

分析特征内部数据分布与分散状况

绘制直方图

主要用户查看各分组数据的数量分布,以及各个分组数据之间的数量比较
可比较直观地看出产品质量特性的分布状态,便于判断其总体质量分布情况
可发现分布表无法发现的数据模式、样本的频率分布和总体的分布
bar函数的常用参数及其说明
在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei' # 设置中文显示
plt.rcParams['axes.unicode_minus'] = False
data = np.load('E:/python/数据、代码/第3章/01-任务程序/data/国民经济核算季度数据.npz')
name = data['columns'] #提取其中的columns数组视为数据的标签
values = data['values'] #提取其中的values数组视为数据的存在位置 
label = ['第一产业','第二产业','第三产业']
plt.figure(figsize = (6,5)) #设置画布
#plt.bar(values[-1,3:6],range(3) ,width = 0.5)
plt.bar(range(3) ,values[-1,3:6],width = 0.5)
plt.xlabel('产业')
plt.ylabel('生产总值(亿元)')
plt.xticks (range(3),label)
plt.title('2017年第一季度国民生产总值')
plt.show()

Python数据分析入门 matplotlib数据可视化基础【三】_第1张图片

绘制饼图

倾向于查看各分组数据在总数据中的占比
可比较清楚地反映出部分与部分、部分与整体之间的比例关系,易于显示每组数据相对于总数的大小,而且显现方式直观

pie函数的常用参数及其说明
Python数据分析入门 matplotlib数据可视化基础【三】_第2张图片


plt.figure(figsize = (6,6)) #设置画布,设置为正方形,则为正圆
label = ['第一产业','第二产业','第三产业']
#plt.bar(values[-1,3:6],range(3) ,width = 0.5)
explode = [0.01,0.02,0.03] #设定各项距离圆心n个半径
plt.pie(values[-1,3:6],explode = explode ,labels = label
        ,autopct = '%1.1f%%')
plt.xlabel('产业')
plt.ylabel('生产总值(亿元)')
plt.title('2017年第一季度国民生产总值')
plt.show()

Python数据分析入门 matplotlib数据可视化基础【三】_第3张图片

绘制箱线图

主要作用是发现整体数据的分布分散情况
绘制需使用常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同特征时,更可表现其分散程度差异。
利用数据中的五个统计量(最小值、下四分位数、中位数、上四分位数和最大值)来描述数据,它也可以粗略地看出数据是否具有对称性、分布的分散程度等信息,可用于对几个样本的比较
boxplot函数的常用参数及其说明
Python数据分析入门 matplotlib数据可视化基础【三】_第4张图片

label = ['第一产业','第二产业','第三产业']
gdp = (list(values[:,3]),list(values[:,4]),list(values[:,5]))
plt.figure(figsize = (6,4)) #设置画布
plt.boxplot(gdp,notch = True ,labels = label ,meanline = True)
plt.title('2017年第一季度国民生产总值')
plt.show()

Python数据分析入门 matplotlib数据可视化基础【三】_第5张图片

你可能感兴趣的:(python数据分析)