Python--Matplotlib库与数据可视化②--常见图形的绘制

获取数据

以从Tushare获取到的伯特利(‘603596.SH’)的行情数据为例:

import tushare as ts
import pandas as pd
import matplotlib.pyplot as plt
token = 'Your token'   # 这里,需要输入你的接口密匙。
pro = ts.pro_api(token)
df = pro.daily(ts_code='603596.SH')   # 获取日行情的接口。
df1 = df.loc[:, ['trade_date', 'open', 'high', 'low', 'close']]
df1.rename(
    columns={
        'trade_date': 'Date', 'open': 'Open',
        'high': 'High', 'low': 'Low',
        'close': 'Close'},
    inplace=True)
df1['Date'] = pd.to_datetime(df1['Date'])  
# 将日期列作为行索引
df1.set_index(['Date'], inplace=True)
df1 = df1.sort_index()
Close = df1.Close[-50:]   # 取近50天的价格数据作为示例

1. 柱状图(Bar charts)

  • 柱状图主要用于表示定性数据的频数分布,能够直观地展现变量的分布情况。一般情况下,柱状图的X轴表示定性变量的各个取值,Y轴则表示各个取值的频数。

1.1 先简要分析一下数据

  • 绘制柱状图前,可以先简要分析一下数据的最大值,最小值,中位数,平均数等信息,这些信息可以通过调用describe()函数获得。
Close.describe()

Python--Matplotlib库与数据可视化②--常见图形的绘制_第1张图片

1.2 使用bar()函数绘制基本柱状图

  • pyplot包中的bar()函数可以用于绘制柱状图:
  • matplotlib.pyplot.bar(x, height, width=0.8, hold=None, data=None, **kwargs)
# 首先生成频数列表
a = [0, 0, 0, 0]
for i in Close:
	if (i>24)&(i<=28):
		a[0] += 1
	elif (i>28)&(i<=32):
		a[1] += 1
	elif (i>32)&(i<=36):
		a[2] += 1
	else:
		a[3] += 1	

# 查看一下a
在这里插入图片描述

# 绘制柱状图
plt.bar(['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], a)

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第2张图片

1.3 设置位置与大小

left和height分别用于设置每根棒的X轴位置和高度
width参数用于调节棒的宽度
bottom用于设定棒底部的Y轴坐标,即不一定紧贴X轴,可以设成“凌空”位置。
示例如下:

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(x=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], \
height=a, width=1.0, bottom=5.0)
plt.title('伯特利近50天收盘价分布柱状图')

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第3张图片

1.4 设置颜色

  • 棒的颜色用color参数设定,棒的边沿颜色用edgecolor参数设定。
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(x=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], \
height=a, width=1.0, bottom=5.0, color='red',edgecolor='k')
plt.title('伯特利近50天收盘价分布柱状图')

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第4张图片

1.5 绘制水平柱状图

绘制水平柱状图可以使用barh()函数,barh()函数的参数形式如下:
matplotlib.pyplot.barh(y, width,height=0.8, left=None, hold=None, **kwargs)

  • y设定棒在y轴的位置。
  • width设定棒的宽度,即一般设定为定性数据的值。
  • height设定棒的竖直高度
  • 代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.barh(['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], a, height=1.0, color='red',edgecolor='k')
plt.title('伯特利近50天收盘价分布柱状图')

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第5张图片


2. 直方图

  • 柱形图主要用于展示定性数据的分布。对于定量数据的分布,一般使用直方图来呈现。pyplot包中的**hist()**函数用于绘制直方图。

2.1 使用hist()函数绘制直方图

代码示例:

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close,bins=12)
plt.title('伯特利近50天收盘价分布直方图')

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第6张图片

2.2 hist()参数形式

matplotlib.pyplot.hist(x,bins=10,range=None,\
normed=False, weights=None, cumulatives=False,\
bottom=None, histtype='bar', \
orientation='vertical', **kwargs)

将orientation设置为’horizontal’,可以绘制水平直方图。
通过color参数设定颜色
通过edgecolor设定边沿颜色
代码示例如下:

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close, range=(25,40), orientation='horizontal', \
color='red', edgecolor='blue')
plt.title('伯特利近50天收盘价分布直方图')

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第7张图片

2.3 累积分布直方图

只需将cumulative参数设置为True即可。
此外,参数histtype设定直方图的类型,改参数可以的取值有bar,barstacked,step或stepfilled,分别表示直方图对栈图无填充的线图有填充的线图四种。

  • 绘制累计分布直方图代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close, range=(25,40), orientation='vertical', \
cumulative=True, histtype='stepfilled', color='red', edgecolor='blue')
plt.title('伯特利近50天收盘价累积分布直方图')

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第8张图片


3. 饼图(Pie Plot)

  • 饼图能够很方便地表现出每一部分占总体的比例。饼图用**pie()**函数绘制,该函数的主要形式如下:
  • matplotlib.pyplot.pie(x, labels=None, color=None, shadow=False)
  • labels: 用于设定扇形图的标签,为字符串序列类型。
  • colors:用于设定扇形图的颜色,为字符串序列类型。
  • shadow:用于设定是否有阴影,取值为True或False。默认为False。
  • 绘制饼图示例:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.pie(a, labels=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], colors=('b', 'g', 'r', 'c'), shadow=True)
plt.title('伯特利近50天收盘价分布饼状图')

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第9张图片

4.箱形图(Box Plot)(也称“箱线图”)

4.1 简况

  • 箱线图由一个矩形和两条线组成。矩形的上边和下边分别是变量的上四分位数和下四分位数;中间有一条线用来表示变量的中位数。在矩形的上下边各延伸出一条线,每条线的长度一般为1.5倍四分位距(四分位距即上下四分位数之差),这两条先被视为异常值的截断线,上端的线为上边缘线,下端的线为下边缘线。线外的点一般被认为是异常值。
  • 箱线图能够很直观地表现出一个变量的分布,也有助于检测异常值。

4.2 boxplot()函数

使用pyplot中的boxplot函数绘制箱形图,该函数主要形式为:

  • matplotlib.pyplot.boxplot(x,notch=None, labels=None)

参数x:要绘制的图形数据,可以是数组形式,也可以是多个向量序列。
参数notch:箱线图的类型,为布尔类型,默认为False,表示绘制矩形箱(rectangular box);如果取值为True,则表示绘制锯齿状箱形图(notched box)。
参数labels:表示箱形图的标签,一般为字符串序列类型。
代码示例如下:

plt.rcParams['font.sans-serif'] = ['SimHei']
import numpy as np
data=np.array(df1)
plt.boxplot(data,labels=('Open', 'High', 'Low', 'Close'))
plt.title("伯特利股价箱线图")

效果如图所示:
Python--Matplotlib库与数据可视化②--常见图形的绘制_第10张图片

你可能感兴趣的:(可视化,数据可视化,数据分析,python)