// An highlighted block
import numpy as np
import matplotlib.pyplot as plt
两个变量之间的相关性
// An highlighted block
height=[160,170,180,190,200]
weight=[50,51,52,53,54]
plt.scatter(height,weight)
plt.show()
c,点的大小:s(面积),透明度:alpha,点形状:marker
// An highlighted block
height=[160,170,180,190,200]
weight=[50,51,52,53,54]
plt.scatter(height,weight,s=300,c='r',marker='<',alpha=0.5)
plt.show( )
观察数据随时间变化的趋势
// An highlighted block
x=np.linspace(-10,10,5)
y=x**2
plt.plot(x,y)
plt.show()
同时实现两条线的绘制
线性:linestyle 颜色:color 点形状:marker
// An highlighted block
x=np.linspace(-10,10,5)
y=x**2
y1=x*2
plt.plot(x,y,linestyle='-',c='r',marker='o')
plt.plot(x,y1,linestyle='--',c='g',marker='<')
plt.show()
比较多个项目分类的数据大小,利用较小的数据集进行分析
// An highlighted block
y=[50,30,40,20,60]
index=np.arange(5)
pl=plt.bar(x=index,height=y)
plt.show()
带宽 width 颜色 color
// An highlighted block
y=[50,30,40,20,60]
index=np.arange(5)
pl=plt.bar(x=index,height=y,width=0.5,color='r')
plt.show()
// An highlighted block
y1=[50,30,40,20,60]
y2=[55,35,45,25,65]
index=np.arange(5)
p1=plt.bar(x=index,height=y1,width=0.3,color='r')
p2=plt.bar(x=index+0.3,height=y2,width=0.3,color='g')
plt.show()
// An highlighted block
y1=[50,30,40,20,60]
y2=[55,35,45,25,65]
index=np.arange(5)
p1=plt.bar(x=index,height=y1,width=0.5,color='r')
p2=plt.bar(x=index,height=y2,width=0.5,color='g',bottom=y1)
plt.show()
数据的分布情况
// An highlighted block
mu=100
sigma=20
x=mu+sigma*np.random.randn(2000)
#normed 标准化
plt.hist(x,bins=20)
plt.show()
normed 标准化 color 颜色
// An highlighted block
mu=100
sigma=20
x=mu+sigma*np.random.randn(2000)
#normed 标准化
plt.hist(x,bins=20,color='green',normed=True)
plt.show()
// An highlighted block
x=np.random.randn(1000)+2
y=np.random.randn(1000)+3
plt.hist2d(x,y,bins=40)
plt.show()
饼图中的数据点显示为整个饼图的百分比
// An highlighted block
labels='A','B','C','D'
fracs=[15,30,10,45]
plt.axes(aspect=1)
plt.pie(x=fracs,labels=labels,autopct='%0.2f')
plt.show()
突出显示图形中的‘B’,‘C’,explode控制图形到圆心的距离,shadow增加阴影
// An highlighted block
labels='A','B','C','D'
fracs=[15,30,10,45]
explode=[0,0.08,0.08,0]
plt.axes(aspect=1)
plt.pie(x=fracs,labels=labels,autopct='%0.2f',explode=explode,shadow=True)
plt.show()
显示数据的分散情况
由上边缘、上四分位数、中位数、下四位数、下边缘、异常值组成
// An highlighted block
np.random.seed(100)
data=np.random.normal(size=1000,loc=0,scale=1)
plt.boxplot(data)
plt.show()
异常值点的形状,whis 虚值的长度:调整异常值的长度
// An highlighted block
np.random.seed(100)
data=np.random.normal(size=1000,loc=0,scale=1)
plt.boxplot(data,sym='o',whis=0.5)
plt.show()
// An highlighted block
np.random.seed(100)
data=np.random.normal(size=(1000,4),loc=0,scale=1)
labels=['A','B','C','D']
plt.boxplot(data,labels=labels,sym='o',whis=0.5)
plt.show()
将颜色、点型、线型写成一个字符串,在绘图时很方便。
// An highlighted block
x=np.linspace(-10,10,5)
y=x**2
y1=2*x
plt.plot(x,y,'cx--')
plt.plot(x,y1,'mo:')
plt.show()