第1-6课:绘制箱线图、饼图和直方图

上一课介绍了柱形图和条形图,本课将介绍另外几种统计图表。

1.6.1 箱线图

Box Plot 有多种翻译,盒须图、盒式图、盒状图或箱线图、箱形图等,不管什么名称,它的基本结构是这样的:

第1-6课:绘制箱线图、饼图和直方图_第1张图片

这种图是由美国著名统计学家约翰·图基(John Tukey)于 1977 年发明的,它能显示出一组数据的上限、下限、中位数及上下四分位数。

  • 中位数:由矩形箱子中的线表示。中位数常用于度量数据的中心,一半观测值小于等于该值,而另一半则大于等于该值。
  • 四分位间距框:四分位间距框表示中间 50% 的数据,即上图中的矩形框,它的上下边之间的距离表示“上四分位数 Q3”和“下四分位数 Q1”的差(Q3-Q1)。
  • 须和上限、下限:由矩形框向两侧延伸的线段,线段的终点分别称为“上限”和“下限”。
  • 异常值:超出“上限”和“下限”范围的值。

为了更深入理解箱线图的含义,假设有这样一组数据:[1, 3, 5, 8, 10,11, 16, 98 ],共有 8 个数字。

首先要计算箱线图中的“四分位数”,注意不是 4 个数:

  • Q1 = 第 1 四分位数、下四分位数,即第 25 百分位数,Q1 的位置 = $\frac{n+1}{4}$ = $\frac{8+1}{4}$ = 2.25
  • Q2 = 第 2 四分位数、中位数࿰

你可能感兴趣的:(案例上手,Python,数据可视化,数据可视化,数据分析)