约定:
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。
当有多个系列时,尤其适合使用折线图 — 对于一个系列,应该考虑使用类别图。如果有几个均匀分布的数值标签(尤其是年),也应该使用折线图。如果拥有的数值标签多于十个,请改用散点图。
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()
ts.plot();
df = pd.DataFrame(np.random.randn(1000, 4), index=pd.date_range('1/1/2000', periods=1000), columns=list('ABCD'))
df = df.cumsum()
df.plot();
柱状图(bar chart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件)。通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。
df2 = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df2.plot.bar();
df2.plot.bar(stacked=True);
df2.plot.barh(stacked=True);
直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型(或等长区间),纵轴表示分布情况(落在该区间的频数)。
直方图的常见作用有以下三点:
(1)显示数据点波动的状态;
(2)较直观地传递有关过程状况的信息;
(3)通过研究质量波动状况之后,就能掌握过程的状况,从而确定在什么地方集中力量进行质量改进工作。
df3 = pd.DataFrame({'a': np.random.randn(1000) + 1, 'b': np.random.randn(1000)}, columns=['a', 'b'])
df3['a'].hist();
df3.plot.hist(alpha=0.5,bins=20);
df3.plot.hist(stacked=True, bins=20);
类型4:水平累计直方图
df3['a'].plot.hist(orientation='horizontal', cumulative=True);
* 类型5:多子图直方图
df3.hist(color='k', alpha=0.5, bins=50);
谢谢大家的浏览,
希望我的努力能帮助到您,
共勉!