工业大数据在铅粉机的应用(二)

        上一篇介绍了LSTM在铅粉工艺场景的实现过程,此项目最后是“失败”了;现在总结一下失败的原因,为以后的成功铺一层垫脚石

,        一、数据真伪: 在项目前半段期间,我一直认为数据是真实无误的,因为是直接从PLC中取数据,但是我还是天真了。从第一批数据开始建模,持续了三个月,发现模型精度始终不高,一直没有达到我要的效果;我反复检查了模型参数,数据清洗过程,代码bug等等,就是找不到问题。我最后猜测是不是输入数据中少了一些变量,于是又去了工厂,在工厂呆了三天,最后一天我把数据库的值和设备触摸屏上的值做对比,发现【进口风压】这个参数两边不一致,数据库中的值比设备上的要大。观察了好几轮后,我向现场工人问了这个问题,他给出的答复是这样:进口管道有时候会堵,堵了之后使风压降低,工艺文件要求这个值在35-45之间,为了“符合”工艺条件,人为在传感器上调整数值。 整了半天原来是改过的数据进了数据库,深度学习网络对数据很敏感,如果是这种较大的偏差,跑出来的结果肯定不准。我评估了两天之后,决定停掉这个项目。

        二、数据质量:除了上面的这个原因,还有一些问题值得注意。产量数据是没有直接的参数可取,是通过计算两条时间点数据-滚筒质量之差算出的。这个其实很不准:

        1、滚筒质量(KG);这个参数是设备自带的计量设备称出来的,现场工人说这个误差比较大,有100公斤左右;因为滚筒重量决定了产量值,在模型中作为“y”,这也不准的话,很难建模。

        2、滚筒是边生产边进料;而且进料时刻没有规律,是PLC自动控制。这个问题在做数据清洗的时候给我带来了很大的困扰,如果是边进料边出粉,到底出了多少粉很难计算,为了这个问题写了一大段代码来筛选出没有进料的数据

        3、备件故障; 铅粉机有个环节是过滤粉尘,过滤网用久了会堵,堵了要换,换了之后其实原来的数据就不能用了(相当于是生产环境发生了变化)

        4、生产连续性;由于客户订单不饱满,生产线开开停停,不能连续的采集数据

        三、设备老化:客户的设备用了十几年了,很多传感器其实不准(工人原话),比如温度传感器,刚开始我觉得没啥,认为只要数据量足够大,总能逼近真实值,但是实际情况显然不是这样,随着后期数据量变大,模型还是效果不好

        四、设备参数少:客户的铅粉工艺设备其实非常多,但是控制参数却不到20个,参数过少可能也会影响模型的精度;从工艺来说,环境的温湿度对铅粉生产也有影响,但是设备中并没有此类传感器,因此在本项目中我们团队在现场安装了无线温湿度传感器进行采集

        五、建模调参优化:虽然说数据的问题占大部分,但是建模过程并非完美,LSTM的参数我并未全部理解,超参数调优过程其实可以更科学,下一步需要专门研究调优。

        从三和四来说,并不是所有的制造企业适合做大数据,工业大数据建模对数据要求很高,一般来说设备自动化程度低导致数据量和质量也大概率低。

        这个项目中可以看出,工业大数据想要落地,困难重重,不仅需要有合适的场景、问题,还得有设备条件支持,生产环境支持,数据工程师对数据清洗、模型调优水平的好坏等等;工业大数据对结果要求非常高,比如这个项目,在进口风压参数有问题的情况下,跑出的模型偏离真实值10%就无法应用,从这一点来看,互联网数据挖掘相对简单一些,分析结果只有证明两者有相关性即可。但是如果能够落地,每天提升1%的产量,这个经济价值其实是巨大的(这也是流程行业对工业大数据接受度更高的原因之一)

你可能感兴趣的:(数据挖掘案例,大数据)