Python 数据分析 matplotlib 可视化之绘图
Matplotlib 是一个基于 python 的 2D 画图库, 能够用 python 脚本方便的画出折线图, 直方图, 功率谱图, 散点图等常用图表, 而且语法简单.
Python 中通过 matplotlib 模块的 pyplot 子库来完成绘图. Matplotlib 可用于创建高质量的图表和图形, 也可以用于绘制和可视化结果. matplotlib 是 Python 优秀的数据可视化第三方库, matplotlb.pyplot 是绘制种类可视化图形的命令子库, 相当于快捷方式 import matplotlib.pyplot as plt.
线形图:
线性图是最基本的图表类型, 常用于绘制连续的数据. 通过绘制线形图, 可以表现出数据的一种趋势变化.
Matplotlib 的 plot(X,Y)用来绘制线形图, 在参数中传入 X 和 Y 的坐标即可. 其中, X 和 Y 轴坐标的数据格式可以是列表, 数组和 Series.
例 1: 坐标数据格式为 seriesimportnumpyasnp
importmatplotlib.pyplotasplt
importpandasaspd
data={'name':['Tom','Peter','Lucy','Max'],
'sex':['female','female','male','male'],
'math':[78,79,83,92],
'city':['北京','上海','广州','北京']
}
df=pd.DataFrame(data)
print(df)
#DataFrame 数据的行索引作为 X 轴, math 列索引作为 Y 轴
plt.plot(df.index,df['math'],color='red',linestyle='-',linewidth=3,marker='D')
#通过 plot 函数的 color 参数可以指定线条的颜色,
linestyle 参数可以指定线条的形状,
linewidth 参数可指定线条的宽度,
marker 参数可对坐标点进行标记(默认情况下, 坐标点是没有标记的),
结果:
name sex math city #创建一个 DataFrame 数据
0 Tom female 78 北京
1 Peter female 79 上海
2 Lucy male 83 广州
3 Max male 92 北京
绘制的线性图:
!](http://upload-images.jianshu.io/upload_images/4809664-7ca76b8569cdce1b?imageMogr2/auto-orient/strip|imageView2/2/w/1240)
注意: 颜色设置要放在线条和点的样式的前面, 颜色, 线条和点的样式可以放置于格式字符串.
如: plt.plot(df.index,df['math'],'co-')
运行结果如下:
image
2. 柱状图
2.1 绘制柱状图主要是使用 matplotlib 的 bar 函数:
bar 函数的 color 参数可以设置柱状图的填充颜色,
alpha 参数可以设置透明度,
例如:importmatplotlib.pyplotasplt
data=[23,85,72,43,52]
plt.bar([1,2,3,4,5],data,color='royalblue',alpha=0.7)
运行结果:
image
bottom 参数用于设置柱状图的高度, 以此绘制堆积柱状图;
width 参数 用于设置柱状图的宽度, 以此可以绘制并列柱状图.
grid 函数用于绘制格网, 通过对参数的个性化设置, 可以绘制出个性的格网
例如:importnumpyasnp
importmatplotlib.pyplotasplt
data1=[23,85,72,43,52]
data2=[42,35,21,16,9]
width=0.3
plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7,width=width)
plt.bar(np.arange(len(data2))+width,data2,color='green',alpha=0.7,width=width)
plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)
运行结果:
image
Bar 函数的通过 barh 函数可以绘制水平柱状图importnumpyasnp
importmatplotlib.pyplotasplt
data1=[23,85,72,43,52]
plt.barh(np.arange(len(data1)),data1,color='green',alpha=0.5)
如图所示:
imageimportnumpyasnp
importmatplotlib.pyplotasplt
data1=[23,85,72,43,52]
labels=['A','B','C','D','E']
plt.xticks(range(len(data1)),labels)#设置刻度和标签
plt.xlabel('Class')#plt.xlabel,ylabel,title 方法分别给 X 轴和 Y 轴, 图标题添加标签.
plt.ylabel('Amounts')
plt.title('Example')
#plt.bar(range(len(data1)),data)
plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7)
plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)data1=[23,85,72,43,52]
data2=[42,35,21,16,9]
width=0.3
plt.bar(np.arange(len(data1)),data1,width=width,label='one')
plt.bar(np.arange(len(data2))+width,data2,width=width,label='two')
plt.legend()data=[23,85,72,43,52]
labels=['A','B','C','D','E']
plt.xticks(range(len(data)),labels)#设置刻度和标签
plt.xlabel('Class')
plt.ylabel('Amounts')
plt.title('Example')
plt.bar(range(len(data)),data)
forx,yinzip(range(len(data)),data):
plt.text(x,y,y,ha='center',va='bottom')#文本注解 # 第一个参数是 x 轴坐标
# 第二个参数是 y 轴坐标
# 第三个参数是要显式的内容importnumpyasnp
importmatplotlib.pyplotasplt
X=np.random.randn(100)
Y=np.random.randn(100)
plt.scatter(X,Y,color='red',marker='D')x=np.random.normal(size=100)
plt.hist(x,bins=30)fig=plt.figure(figsize=(10,6))#figsize 参数可以设置图表 (整个图) 的长宽比
ax1=fig.add_subplot(2,2,1)#不能通过空 figure 绘图, 必须用 add_subplot()创建一个或者多个子 subplot 绘图区才能绘图ax2=fig.add_subplot(2,2,2)#在创建 Figure 对象过程中, 通过 add_subplot 函数创建子图, 用于绘制图形
ax3=fig.add_subplot(2,2,3)
years=[1950,1960,1970,1980,1990,2000,2010]
gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]
ax1.scatter(years,gdp)#选用不同的 ax 变量, 则可以在对应的 subplot 子图中绘图(散点图, 线形图, 柱状图)
ax2.plot(years,gdp)
ax3.bar(years,gdp)fig,axes=plt.subplots(2,2,figsize=(10,6))
axes[1,0].plot(years,gdp)
axes[0,0].scatter(years,gdp)
axes[0,1].bar(years,gdp)
axes[1,1].hist(years,gdp)years=[1950,1960,1970,1980,1990,2000,2010]
gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]
fig,axes=plt.subplots(2,2)
plt.subplots_adjust(wspace=0.3,hspace=0.3)
axes[1,0].plot(years,gdp)
axes[0,0].scatter(years,gdp)
axes[0,1].bar(years,gdp)
axes[1,1].hist(years,gdp)plt.rcParams['font.sans-serif']=['simhei']#指定默认字体
plt.rcParams['axes.unicode_minus']=False#解决保存图像时负号'-'显示为方块的问题
来源: http://www.jianshu.com/p/3f776226eda5