阿里天池工业ai大赛季军方案分享

赛题背景分析及理解
1.赛题背景
半导体产业是一个信息化程度高的产业。现有的产品质量检核方案是,生产机器生产完成后,对产品质量做非全面的抽测,一是不能即时的知道质量的好坏,二是在没有办法全面抽测的状况下,存在很大漏检的风险。

难点,TFT-LCD的生产过程较为复杂,包含几百道以上的工序,需要考虑的过程变量较多;另外,这些变量的取值可能会存在异常(如测点仪表的波动导致、设备工况漂移等现象);此外,产线每天加工的玻璃基板数以万计。

因此,在机器学习,人工智能快速发展的今天,我们希望着由机器生产参数去预测产品的质量,来达到生产结果即时性以及全面性。更进一步的,可基于预先知道的结果,去做对应的决策及应变,对客户负责,也对制造生产更加敏感。

2.赛题样本分析
首先赛题是这是一个典型的回归预测问题。同时,这是一个小样本问题,典型的特征多样本少,如果直接利用这些高维小样本数据进行数据挖掘,容易出现维数灾难问题,在机器学习中,如果样本量不足,我们利用模型学习到的结果就有可能是错误的。通过特征选择,可以删除高维小样本数据中的冗余特征和噪声特征,从而降低学习算法的时间和空间复杂度,避免维数灾难,特征选择的稳定性问题对于高维小样本数据的数据挖掘与机器学习过程是非常重要的。
阿里天池工业ai大赛季军方案分享_第1张图片

详细介绍请看如下连接:
https://tianchi.aliyun.com/forum/new_articleDetail.html?spm=5176.11165354.0.0.41a9ed867GF7xl&from=user&raceId=&postsId=4043

你可能感兴趣的:(机器学习算法)