Python数据分析--Matplotlib绘图--箱线图

Matplotlib中的箱线图

箱线图简介

Python数据分析--Matplotlib绘图--箱线图_第1张图片

箱线图函数

在这里插入图片描述

箱线图代码实现

import numpy as np
import matplotlib.pyplot as plt

plt.rcParams["font.sans-serif"] = "SimHei"
plt.rcParams["axes.unicode_minus"] = False

data = np.load("kaggle员工薪资.npz", allow_pickle=True)

# for i in data:
#     print(i)

columns = data["columns"]
values = data["values"]

print(columns)
# print(values)

# 1表示离职
left_con = values[:, -4] == 1
on_con = ~left_con  # 在职
# print(left_con.sum(), on_con.sum())
# 离职人数 3571个; 在职有11428个人数

left_satisfy = values[left_con, 0]  # 离职人满意度
on_satisfy = values[on_con, 0]  # 在职人满意度
# print("离职人满意度", left_satisfy)


# 绘图
plt.boxplot((left_satisfy, on_satisfy),
            notch=True,  # 是否增加缺口
            )

plt.xticks([1, 2], ["离职", "在职"])

plt.show()

结果展示

Python数据分析--Matplotlib绘图--箱线图_第2张图片

箱线图代码实现2

import numpy as np
import matplotlib.pyplot as plt

plt.rcParams["font.sans-serif"] = "SimHei"
plt.rcParams["axes.unicode_minus"] = False

np.random.seed(1)
arr = np.random.randint(low=1, high=10, size=30)

arr1 = np.array([-5,-10, 20, 40])
arr = np.hstack((arr, arr1) )

print("数据", arr[arr.argsort()])

q = 4
print("四分位数所有相关的值", np.quantile(arr, q=np.linspace(0, 1, q + 1)))


"""
箱线图的绘制;是剔除异常值之后,重新计算对应的分位数,绘制箱线图
"""
plt.boxplot(arr,
            notch=True,  # 是否缺口; 缺口大小 由置信区间决定
            # 以下两个命令都存在,可以增加均值线
            showmeans=True,
            meanline=True,
            sym='*', # 异常值的符号
            )

plt.grid(b=True,
         axis='y',
         # axis='both'
         alpha=0.3
         )

plt.show()

结果展示

Python数据分析--Matplotlib绘图--箱线图_第3张图片

箱线图常用参数

Python数据分析--Matplotlib绘图--箱线图_第4张图片

你可能感兴趣的:(Python,数据分析基础与进阶,python,数据分析,深度学习,机器学习,matplotlib)