制造业OEE&R语言数据挖掘之相关性分析

本案例针对于铅酸电池制造业的OEE统计情况进行相关性分析,旨在找出与OEE指标相关性较高的变量,帮助车间管理人员厘清管理思路。

OEE:设备综合效率,即表现设备实际的生产能力相对于理论产能的比率,是一种独立的测量工具。可以帮助管理者发现和减少生产中存在的六大损失。·可以针对问题,分析和改善生产状况及产品质量。·能最大化提高资源和设备的利用率,挖掘出最大的生产潜力。

步骤

1、数据准备

2、选择算法

3、编程建模

4、分析结果

5、评价

 

一、数据准备

本次案例的数据源是极板车间6月份所有开机的涂板机OEE报表,将其汇总整理后成如下表格,如下截图所示

制造业OEE&R语言数据挖掘之相关性分析_第1张图片

 

一共612个记录值,虽然数据量不大,但是基本涵盖了涂板机这个月的数据。

 

 

二、选择算法

本次案例采用了信息论中的互信息算法进行数据挖掘。

互信息的概念用下图来解释,简单来说,就是描述两个变量的关联程度。

制造业OEE&R语言数据挖掘之相关性分析_第2张图片

这里解释一下我为什么不用统计学的相关性分析方法,比如肯德尔相关性系数、 皮尔森相关性系数。统计学建模其实是有很多前提条件的:分布情况(是否正太分布),不同的分布决定是用参数方法还是非参数方法、假设检验、置信度等等。统计学建模针对的是小数据(30个以内),其核心思想是样本推断整体,因此误差终究是无法避免的。 因此,对于制造业大数据来说,传统的统计建模就不适合了,因此采用机器学习建模。

 

三、编程建模

R代码如下

library(infotheo)  #载入R包
library(xlsx)   #载入R包
OEE1<-as.data.frame(OEE)  #用Rstudio自带插件将EXCEL文件导入R,然后将数据集转成数据框格式
daoee<-infotheo::discretize(OEE1)  #用infotheo包中的discretize函数对数据集进行离散化
O <- mutinformation(daoee,method= "emp") #对离散化的数据集求互信息
e <- mutinformation(OEE1,method= "emp")  #对未进行离散化的数据求互信息

setwd('E:/')   #设置工作路径
write.xlsx(O,file = "./1.xlsx",row.names = TRUE)  #将R的数据集导出成EXCEL
write.xlsx(e,file = "./2.xlsx",row.names = TRUE)  #将R的数据集导出成EXCEL

四、分析结果

将R导出的EXCEL表格进行整理(相关性矩阵),截图如下

制造业OEE&R语言数据挖掘之相关性分析_第3张图片 

 

其中,与OEE相关性最大的前三位是:“合格”(0.352),“故障”(0.217),“设备效率”(0.094)

因此从以上分析来看,提升设备OEE的最大两个点分别是合格率和故障率。

 

五、评价

如果让车间的管理人员说出影响OEE的前三个点,其实也能说出以上的三个,但是通过数据挖掘能够量化他们与OEE的相关性。从而让管理者“心中有数”

本次案例与车间生产领导沟通后,对本次的分析结果是认同的,基本与生产实际情况符合,因此本次分析从思路与操作上来说是正确的。

 

 

你可能感兴趣的:(数据挖掘案例,数据挖掘,r语言)