正态分布与6-Sigma

一、阈值的选择怎样才能更科学? 

引入一个例子:在工业中,通过某种相机来识别一个产品表面是否有包装膜来判断产品是否合格。检测的原理是:带有包装膜的产品,它的白色像素点会比没有带包装膜的产品的白色像素点多很多。所以可以通过相机来识别白色像素点的多少,从而来判断产品是否合格。

问题是:这个阈值要怎么选择才科学呢?

二、随机变量的概率分布符合正态分布

X = ( u, σ^2 )-------平均值和方差

在一个标准差内,涵盖68.27%的样本;在三个标准差内,涵盖99.73%的样本

三、工业上会引入6-Sigma

工业上会把精度定在6-Sigma的标准,涵盖99.99966%的样本

四、总结

根据大量的统计数据,去求得某个待测量样本的平均值和方差,绘制它的概率分布曲线。可以通过代码的方式,随着数据的增多,去不断更近样本的平均值和方差,就会涉及到一些人工智能和机器学习了

比如上面举的例子:通过大量的数据统计,得到合格产品和不合格产品它们的概率分布曲线。如果它们各自的6-Sigma区间不会出现交集,那么就选择一个在两个6-Sigma区间之外的值作为阈值即可;否则,就要根据实际需要去选择一个阈值,比如可以误判合格品当作不合格品,但是不可以出现不合格品混入的情况,就可以选择一个阈值,它处在不合格品的6-Sigma区间之外,这样不合格品就不会出现混入情况,但是这个阈值会处在合格品的6-Sigma区间之内,也就会出现误判合格品为不合格品了

你可能感兴趣的:(控制理论,人工智能,算法)