2小时掌握10大质量管理工具——(3)控制图、标准差

九  控制图

控制图(Control Chart)又称休哈特图,是对过程质量特性值进行测定、记录、评估和监测,以判断过程是否处于统计控制状态的一种用统计方法设计的图形。

通常控制图的横轴总是时间,而其纵轴可以有多种选择。例如:可以是单值,也可以是小组均值;可以是小组极差,也可以是小组标准差等。

控制图是SPC主要表现形式之一。

导致质量产生变异的因素很多,根据因素对产品质量影响的大小和性质可以将其分为两大类:一类是特殊因素;如工艺过程的变动、刀具的过度磨损、人员的变动更换等。这些因素对产品质量的影响是显著的,在技术上容易识别并消除。

另一类是随机因素。如温湿度的轻微变化、仪器的微小振动、原材料的细微差异等。这些因素对产品质量的影响是细小的,在技术上不易识别,更不可能消除,但如果从根本上改变了过程,这种波动会大幅减少。休哈特认为,可以以μ±3σ为控制限建立控制图,把特殊因素和随机因素区分开。

分开特殊与随机因素


(二)控制图的判断异常标准

包括“点出界就判异”的准则在内,控制图共有8条判异准则用来判断过程是否受控。为了便于具体说明这8条准则,可将控制图分为6个区,每个区的宽度为σ。6个区的标号为A、B、C、C、B、A

控制图的分区

根据控制图的分区定义,8条准则可以表达为:

(1)1点落在控制限之外。

准则1图例

判读:

一点落在控制界限外,显示制程品质已发生非机遇原因,有待追查原因并采取对策,若无其他特殊事项(若R控制图稳定,计算错误,测量误差,原材料不合格或设备故障等),则可能中心值偏移。

(2)连续9点落在中心线同一侧。

准则2 图例

判读:

显示制程品质已发生特殊原因,有待追查原因并采取对策,若無其他特殊事项(设备工作不正常或固定松动使用新的不是很一致的原材料或新的检验员或量具),可能中心值发生偏移。

(3)连续6点递增或递减。

准则3图例


判读

1、设备缓慢磨损;

2、工作者疲劳效应;

3、不良件之累计效应;

4、工作环境改变;

5、操作者技术逐渐进步;

6、原料均匀度缓慢改变;

7、测量设备已改变。

(4)连续14点中相邻升降交错。

准则4图例


判读:

数据分层不够:

a)轮流使用两台设备;

b)由两位操作员轮流进行操作而引起的系统效应。

(5)连续3点中有2点落在中心线同一侧的B区之外。

准则5 图5

判读:

1、控制过严;

2、材料品质有差异;

3、检验设备或方法之大不相同;

4、不同制程之资料绘于同一控制图上;

5、不同品质材料混合使用。

(6)连续5点中有4点落在中心线同一侧的C区之外。

准则6

判读

1、控制过严;

2、材料品质差异;

3、检验设备或方法改变;

4、不同制程之数据绘于同一管制图;

5、不同品质材料混合使用。

(7)连续15点落在C区之内。

准则7

判读:

若不是抽样有问题,就是制程已经过改善,造成变异数降低,或数据分层不够或为假数据。

(8)连续8点落在中心线两侧,但无1点在C区之内。

准则8

判读:

数据来自两个不同群体,亦即数据分层不够。

小结

准则1的主要原因:计算错误、测量误差、原材料不合格、设备故障等。

准则2的主要原因:过程平均值μ减少的缘故。

准则3的主要原因:可能是工具逐渐磨损、维修逐渐变坏、操作人员技能的逐渐提高等,从而使得参数α随着时间而变化。

准则4的主要原因:是数据分层不够的问题,如轮流使用两台设备生产的数据或由两位操作人员轮流进行操作的数据。

准则5的主要原因:是由于过程的参数μ发生了变化。

准则6的主要原因:是由于过程的参数μ发生了变化。

准则7的主要原因:可能有虚假数据或数据分层不够等。

准则8的主要原因:数据分层不够。

在8条判异准则中,前4项其实与分区无关,而后4项判断法则是在正态条件下,将±3σ区域分成6个子区,按照正态分布中各区中应该出现的概率来制定的法则。

因此,后4条只有当监控统计严格服从正态分布时才有意义,故而后4项判断法只对单值X及小组均值X的控制图适用,其他各控制图皆只适用前4项法则。

(三)控制图类型

控制图的类型很多,常用的控制图按数据类型分为两类:对于连续变量用计量控制变量有如下控制图GB/T4091:

连续变量用计量控制图类型

对于离散变量用计数控制图,常规控制图的分类如表所示GB/T4091:

离散变量用计数控制图类型

根据应用的目的不同,控制图又可分为分析用控制图与控制用控制图两个阶段。

一个过程开始实施控制图时,通常不会恰巧处于统计控制状态,总会存在一些异常波动。如果就以这种状态下的参数来建立控制图,上、下控制限的间隔一定较宽,会导致判断失误。

因此,开始过程控制时,总需要将失控状态调整到统计控制状态,这就是分析用控制图的阶段。

国标中规定,制定分析用控制图时,在合适分组的前提下,至少要采集25组数据,用来计算控制限。如有越界者要根据实际情况判定是否确实出现异常原因(简称异因),确有异因者可以删除此组数据,未发现异因者必须保留此组数据且增大观测组数。

分析用控制图阶段要解决的第一个问题是:调整过程、消除异因,以使过程受控;分析用控制图阶段要解决的第二个问题是:在过程受控后,再改进过程,以确保过程能力指数Cp或Cpk等能达到顾客要求。一旦过程实现了上述两点,就可以延长控制限作为控制用的控制图,进入控制用控制图阶段,在线使用。在此阶段,一旦判异,应停产检查找出异因,并在消除异因后再恢复生产,以保持过程的统计控制状态。

(四)控制图解析

GB/T4091《常规控制图》的解释:控制图理论认为存在两种变异:第一种变异为随机变异,由“偶然原因”(又称“一般原因”)造成。

这种变异是由种种始终存在的且不易识别的原因所造成,其中每一种原因的影响只构成总变异的一个很小的分量,而且无一构成显著的分量。

然而,所有这些不可识别的偶然原因的影响总和是可度量的,并假定为过程所固有。消除或纠正这些偶然原因,需要管理决策来配置资源,以改进过程和系统。

第二种变异表征过程中实际的改变。这种改变可归因于某些可识别的、非过程所固有的,并且至少在理论上可加以消除的原因。

这些可识别的原因称为“可查明原因”或“特殊原因”,它们可以归结为原材料不均匀、工具破损、工艺或操作的问题、制造或检测设备的性能不稳定等。

局部问题与对策和系统改进。由异常原因造成的质量变异可由控制图发现,通常由过程人员负责处理,称为局部问题的对策。统计资料表明,这类问题约占过程问题的15%。由偶然原因造成的质量变异可通过分析过程能力发现,但其改善往往耗费大量资金,需由高一级管理人员决策,称为系统改进。

控制图的作用是及时告警。只在控制图上描描点子,是不可能起预防作用的。必须强调要求现场第一线的工程技术人员来推行,把它作为日常工作的一部分,而质量管理人员则应该起到组织、协调、监督、鉴定与当好领导参谋的作用。

(五)绘制控制图

某钢管厂连续生产的钢管,壁厚是一个重要尺寸。对钢管壁厚进行控制,每隔1小时抽样1次,每次抽取5根钢管,共抽样25次,测量并记录数据。经检验,钢管壁厚服从正态分布,绘制Xbar-R图,如表所示。

钢管壁厚测量数据表

计算机软件MINITAB的实现方法如下:

选择控制图—子组变量控制


指定“子组大小”为“5”

指定“图表的所有观测值均在一列中”为“壁厚”,指定“子组大小”为“5”,如图1-25所示。指定也可根据数据选择“子组的观测值位于多列的同一行中”。

生成指定控制图
十  标准差

标准差这个概念在多个质量工具中体现。

统计学中最核心的概念之一是:标准差及其与其他统计量(如方差和均值)之间的关系。入门课程中老师常告诉学生「记住公式就行」,但这并非解释概念的最佳方式。本文将对标准差这一概念提供直观的视觉解释。

假设你有一个成绩单,在本案例中这即是现实测量(real-world measurements)。我们想将这些测量中的信息「压缩」为一组量,以便后续对比不同班级的成绩或不同年份的成绩等。鉴于认知能力有限,我们不想挨个查看分数,来找出平均分更高的班级。这时就需要总结数字,描述统计学就派上用场了。

总结数字的方式有两种:量化其相似性或差异(difference)。

量化数字的相似性即「集中趋势量数」(measures of central tendency),包括平均数、中位数和众数;

量化数字的差异即「差异量数」(measures of variability),包括方差和标准差。

标准差揭示一组数字中彼此之间的差异,以及数字与平均值之间的差异。

举例而言,假设你收集了一些学生分数(出于简洁性考虑,我们假设这些分数是总体)。

我们首先在简单的散点图中绘制这些数字:

学生成绩分布散点图

绘制完成后,计算差异的第一步是找出这些数字的中心,即平均值。

平均值计算


视觉上,我们可以绘制一条线来表示平均分数。

平均值示意线

接下来我们要计算每个点和平均值之间的距离,并对得到的数值求平方。记住,我们的目标是计算数字之间的差异,以及数字与平均值之间的差异。我们可以用数学或视图的方式完成该操作:

计算

这里有两点需要注意:我们无法计算所有差异的总和。因为一些差异是正值,一些是负值,求和会使正负抵消得到 0。为此,我们对差异取平方。

现在,我们来计算差异平方的总和(即平方和):

通过计算平方和,我们高效计算出这些分数的总变异(即差异)。理解变异(variability)与差异(difference)之间的关系是理解多个统计估计和推断检验的关键。上图中平方和 67.5 表示,如果我们将所有方框堆在一个巨大的正方形中,则大正方形的面积等于 67.5 points^2,points 指分数的单位。任意测量集的总变异都是正方形的面积。

方差

现在我们得到了总变异(即大正方形的面积),但我们真正想要的是平均变异(mean variability)。要想求得平均变异,我们只需要用总面积除以方框的数量:

标准差


我们为什么不用方差来表示分数的差异呢?唯一的问题是,我们无法对比方差和原始分数,因为方差是「平方」值,即它是面积而非长度。其单位是 points^2,与原始分数的单位 points 不同。那么如何甩掉平方呢?开平方根啊!

这就是标准差的核心理念。本文对标准差概念的基础直观解释可以帮助大家更容易地理解,为什么在处理 z 分数(z-score)、正态分布、标准误差和方差分析时要使用标准差的单位。

此外,如果你用标准差公式中的拟合线 Y 替代平均值,则你在处理的是基础回归项,如均方误差(不开根号的话)、均方根误差(开根号,但是和拟合线相关)。相关和回归公式均可使用不同量的平方和(或总变异区域)来写。分割平方和是理解机器学习中的泛化线性模型和偏差-方差权衡的关键概念。

简而言之:标准差无处不在。


绝对值的问题

你可能会疑惑,为什么对差异求平方而不是取绝对值呢。没有什么能够真正阻止你使用差异的平均绝对值。平均绝对值给所有差异提供的是相同的权重,而差异平方为距离平均值较远的数字提供更多权重。这或许是你想要的。但是,大部分数学理论利用差异平方(可用微分)。

不过,我会用一个容易理解的反例来回答这个问题。假设有两个均值相同的分数集合:x_1 和 x_2:

从这些数字中,你可以轻松观察到 x_1 的变异和数值分散性比 x_2 低。我们来计算两个集合差异的平均绝对值(二者的平均值都为 6):

哦,结果并不好!两个集合的变异值相同,尽管我们能够看到 x_1 的数字差异要比 x_2 低。现在,我们使用差异平方计算,得到:

在差异平方的作用下,我们得到了想要的结果:当数字越分散时,标准差越大。

标准差内容原文链接:

http://falhazmi.com/blog/a-visual-interpretation-of-the-standard-deviation/

你可能感兴趣的:(2小时掌握10大质量管理工具——(3)控制图、标准差)