第五部分主要介绍df.scatter 、df.box和 df.boxplot 画图函数,散点图和箱体图实例 ,其中散点图通过s参数,控制散点的大小,colormap可以显示渐变色。
DataFrame.plot.scatter(x, y, s=None, c=None, **kwargs)
c: 是每个点的颜色,可以是一个值,也可以是数组值
s: 是每个点的大小,可以是一个值,也可以是数组值
df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
[6.4, 3.2, 1], [5.9, 3.0, 2]],
columns=['length', 'width', 'species'])
ax1 = df.plot.scatter(x='length',
y='width',
c='Blue',marker='H',figsize=(3,3),fontsize=12,title='Scatter')
ax2 = df.plot.scatter(x='length',
y='width',
c='species',marker='H',figsize=(3,3),fontsize=12,title='Scatter',
colormap='viridis')
c是list ,通过colormap ,显示值的大小,Scatter可以表示三维数据。
ax2 = df.plot.scatter(x='length',
y='width',
s=df['species']*100,marker='H',figsize=(3,3),fontsize=12,title='Scatter')
s=df[‘species’]*100 ,由于值比较小,放大倍数,六边形的大小。
DataFrame.plot.box(by=None, **kwargs)
data = np.random.randn(25, 4)
df = pd.DataFrame(data, columns=list('ABCD'))
ax = df.plot.box(figsize=(3,3),title='Box')
age_list = [8, 10, 12, 14, 72, 74, 76, 78, 20, 25, 30, 35, 60, 85]
df = pd.DataFrame({"gender": list("MMMMMMMMFFFFFF"), "age": age_list})
ax = df.plot.box(column="age", by="gender", figsize=(3, 2))
by=“gender” ,按性别分类统计
DataFrame.boxplot(column=None, by=None, ax=None, fontsize=None, rot=0, grid=True, figsize=None, layout=None, return_type=None, backend=None, **kwargs)
np.random.seed(1234)
df = pd.DataFrame(np.random.randn(10, 4),columns=['Col1', 'Col2', 'Col3', 'Col4'])
boxplot = df.boxplot(column=['Col1', 'Col2', 'Col3'],color='b')
df = pd.DataFrame(np.random.randn(10, 2),columns=['Col1', 'Col2'])
df['X'] = pd.Series(['A', 'A', 'A', 'A', 'A','B', 'B', 'B', 'B', 'B'])
boxplot = df.boxplot(by='X',color='b',figsize=(6,4))
plt.show()
by=‘X’,按X分类显示
上一篇area 、pie 、hist 、hexbin 四个函数演示
下一篇subplot函数,理解fig和ax(axs)的意义和作用