论文阅读 8 | Contrastive Decoder Generator for Few-shot Learning in Product Quality Prediction

用于产品质量预测中小样本学习的对比解码器生成器

  • 摘要
  • I 简介
  • II 多阶段制造过程的小样本质量预测
  • III 对比解码器发生器
    • A. 总体框架

摘要

质量预测致力于预测与质量相关的关键变量,以获得过程控制的实时反馈信息。为了实现在复杂和不确定的制造过程中处理的产品的鲁棒和可转移的质量预测,已经开发了深度学习方法。然而,深度学习方法的训练过程需要大量的标注数据来避免过拟合,而质量相关变量的标记过程往往耗时耗力。因此,多阶段制造过程中的小样本质量预测被形式化,以解决缺少注释数据的问题,并在无需额外训练过程的情况下处理以前未发现的任务。此外,提出了一种新的对比解码器生成器(CDG)来实现小样本质量预测,该生成器由机器特征编码器、对比阶段和任务特征生成器以及特定于实例的解码器生成器组成。在从实际生产线收集的公共质量预测数据集上进行实验。CDG在该数据集上实现了用于小样本质量预测设置的最新结果,这证明了CDG的有效性。此外,还通过详细的实验来评估CDG中不同模块的作用。

I 简介

  为了实现生产线的智能化,提高产品质量,在生产过程中经常采用过程控制。基本上,过程控制依赖于过程运行数据的精确测量,尤其是与质量相关的关键变量[1]。然而,由于可行性、成本和时滞限制,大多数质量相关变量难以在线测量[2]。为了获得用于过程控制的实时反馈信息,许多研究人员已经研究了质量预测方法。准确的质量预测方法可以降低测量成本,提高产品质量。然而,由于实际制造过程的复杂性和不确定性,仍然难以实现准确的质量预测。

  随着物联网(IoT)的发展,在制造过程中配置了诸如智能设备和智能传感器的IoT设备。基于这些物联网设备收集的数据,数据驱动的质量预测方法得到了越来越多的研究者的关注。通过人工智能(AI),用于质量预测的数据驱动方法深入挖掘从生产机器和智能子系统收集的信息,这有可能成为AI增强的自动化系统的子组件。

  目前,数据驱动的质量预测方法主要分为两类:传统的机器学习方法[3]和[4]深度学习方法。传统的机器学习方法首先利用特征工程来处理数据,然后部署传统的机器学习模型来预测质量相关变量。在此过程中,方法的性能由特征工程控制,这需要相当大的人工工作量,并降低了方法的鲁棒性和可移植性[5]。针对这一问题,深度学习方法被开发出来,实现端到端的质量预测,成为近年来的研究热点。

  然而,深度学习方法的训练过程需要大量的数据来辅助表征学习[5]。质量相关变量的标注过程耗时耗力,往往难以获得大量标注数据。为解决上述问题,现有的研究主要集中在三条主线上。1)半监督学习方法[6]利用标记和未标记数据来解决标记样本不足所引起的问题。2)迁移学习方法[7]将知识从源任务转移到目标任务,以提高目标任务绩效。3) 多任务学习方法[8]利用多个任务,例如刀具磨损状况预测和表面质量预测,从任务中获得更容易注释的补充信息。

  尽管如此,仍有一种策略可以解决质量预测领域中尚未研究的标注数据不足的问题,即很小样本学习。小样本学习方法旨在通过使用先验知识快速推广到仅包含少量具有监督信息的样本的新任务[9]。与其他三种方法相比,小样本学习方法有能力处理之前看不见的任务,这些任务没有被训练实例覆盖[10]。此外,这些方法已被证明在许多领域有效[9]。

  在多阶段制造过程中,产品通过不同的阶段和机器加工,从而输出不同类型的质量相关变量。这反映了不同阶段和质量相关变量的独特性。此外,制造企业中不同阶段加工的产品和产生不同种类质量相关变量的机器是共用的,这说明了不同阶段和质量相关变量之间的相关性[11]。因此,本文引入小样本学习方法挖掘不同阶段和质量相关变量之间的相关性,进一步推断不同阶段和质量相关变量的唯一性。这样,基于由传感器从不同机器收集的特征,可以在没有注释数据的情况下获得关于阶段和质量相关变量的先验知识。然后,先验知识可以帮助模型快速调整以适应要预测的新的质量相关变量。

  然而,现有的小样本学习方法大多集中于分类问题,应用前景有限。为了解决这一问题,Loo等人[12]提出了一种基于基函数的小样本学习模型,该模型针对的是小样本回归任务。此外,他们使用稀疏基函数进一步改进模型[13]。任务标签需要监督信号发生器模块的方法来指导前一代的任务知识,如高斯分布的平均值和标准偏差值。然而,这些信号在实际应用中很少获得。另外,他们的方法中的权重生成器模块为所有实例生成相同的权重参数,并且不考虑偏差参数,这降低了方法的性能。

  在这项工作中,在多阶段制造过程中引入了小样本质量预测,以解决缺乏注释数据的问题,并在没有额外训练过程的情况下处理以前未知的任务。此外,提出了一种新的对比解码器生成器(CDG)来处理多阶段制造过程中的小样本质量预测。CDG集中于在解码器中生成参数(权重参数和偏置参数),而不是样本的概率。它属于文献[9]中定义的生成模型类型,其中推理网络参数的生成包含在生成模型中。借助对比学习[14],[15],提出了CDG中的对比阶段和任务特征生成器,以在没有监督信号的情况下生成阶段和任务的先验知识。这里使用对比学习,因为它可以使具有相同阶段或任务的实例的表示相似性更高,而具有不同阶段或任务实例的表示类似性更低,其中实例的表示可以被视为任务和阶段的先验知识。此外,设计了一个特定于实例的解码器生成器,以结合不同支持实例的重要性,并将权重生成扩展到层生成。此外,该方法在公共工业数据集上获得了最优的小样本质量预测结果,证明了该方法的有效性。我们的代码将在https://github.com/Donghao-Zhang/quality_prediction

  现将我们工作的贡献概述如下:

  • 在我们的工作中引入了多阶段制造过程中的小样本质量预测并将其形式化,该方法能够解决标注数据的缺乏问题,并且在没有额外训练过程的情况下处理先前未见过的任务。据我们所知,这是首次尝试将小样本学习引入质量预测任务。
  • 提出了一种新的CDG来解决多阶段制造过程中的小样本质量预测,其重点是在解码器中生成参数。具体地,CDG中的对比阶段和任务特征生成器被设计为以自我监督的方式生成包含关于任务和阶段的先验知识的两个向量。此外,设计了一个实例特定解码器生成器,根据查询实例和支持实例之间的相关性生成一层参数,包括权重参数和偏差参数。
  • 该方法的有效性在从真实的多级连续流程制造过程中收集的公共质量预测数据集上得到了验证。此外,还进行了详细的实验,实验结果证明了所提出方法中每个模块的重要性。

  本文件的其余部分安排如下。在第二节中,形式化了多阶段制造过程中的几次质量预测任务。第三节详细介绍了拟议方法。在第四节中,分析了在实际工业案例中进行的实验。结论和未来扩展见第五节。

II 多阶段制造过程的小样本质量预测

  为了能够在多阶段制造过程中进行质量预测,我们遵循[16]中的定义。具体来说,此任务的输入是来自不同机器的特征,输出是来自不同阶段的测量或标签。形式上,来自第m台机器的特征被表示为 x m ∈ R d f m x_m \in \mathbb R^{d_{fm}} xmRdfm,其中 d f m d_{fm} dfm 是该机器的输入特征的维度。之后,来自所有机器的特征可以表示为 x = [ x 1 , . . . , x ∣ M ∣ ] \mathbf x =[x_1,...,x_{|\mathcal M|}] x=[x1,...,xM],其中 x ∈ R d x \mathbf x ∈ R^{d_x} xRdx d x d_x dx 是所有机器的特征维数,并且 ∣ M ∣ |\mathcal M| M 是计算机的总数。此外,第 j j j 阶段包含 d s j d_{s_j} dsj 个测量(或任务),这些测量是需要预测的变量,可以形式化为 y s j ∈ R d s j y_{s_j} \in \mathbb R^{d_{s_j}} ysjRdsj。然后,所有阶段的测量值可以表示为 y = [ y 1 , … , y ∣ S ∣ ] y=[y_1,…,y_{|\mathcal S|}] y=[y1,,yS],其中 ∣ S ∣ |\mathcal S| S 是阶段的总数。此外,还根据[16]构造了机器依赖图 G \mathcal G G,其第 i i i 个实例的邻接矩阵为 A i ∈ R ∣ M i ∣ × ∣ M i ∣ A_i \in \mathbb R^{|\mathcal M_i|×|\mathcal M_i|} AiRMi×Mi。最终目标基于来自所有机器 x \mathbf x x 和机器依赖图 G \mathcal G G 的特征预测多个阶段 y \mathbf y y 中的所有任务(测量或标签)。由于小样本质量预测是本工作的重点,因此在[16]中可以找到多阶段制造过程中质量预测的更详细定义。

  根据小样本学习的定义[17],我们将多阶段制造过程(FSQP)中的小样本质量预测定义如下。FSQP任务中给出了一个非常小的K支持集(例如100、50、20、10,甚至0),标记为实例 S ( s , t ) = { ( x 1 , G 1 , y 1 ( s , t ) ) , . . . , ( x K , G K , y K ( s , t ) ) } S^{(s,t)}=\{(\mathbf x_1,\mathcal G_1,y_1^{(s,t)}),...,(\mathbf x_K,\mathcal G_K,y_K^{(s,t)})\} S(s,t)={(x1,G1,y1(s,t)),...,(xK,GK,yK(s,t))} ,其中 y i ( s , t ) y_i^{(s,t)} yi(s,t) 表示第 s 阶段和第 t 任务(位于yss中的第t项)的注释标签。此外,对应于第s阶段和第t任务的具有未标记实例的查询集合 Q ( s , t ) = { ( x 1 , G 1 ) , . . . , ( x N q , G N q ) } Q^{(s,t)}=\{(\mathbf x_1,\mathcal G_1),...,(\mathbf x_{N_q},\mathcal G_{N_q})\} Q(s,t)={(x1,G1),...,(xNq,GNq)} 用作预测模型的输入,其中 N q N_q Nq是查询实例的数目。之后,FSQP任务的目标是基于支持集 S ( s , t ) S^{(s, t)} S(s,t) 中的非常少的K个标记实例来预测查询集 Y ~ ( s , t ) = { y ~ 1 ( s , t ) , . . . , y ~ N q ( s , t ) } \tilde{Y}^{(s,t)}=\{\tilde{y}_1^{(s,t)},...,\tilde{y}_{N_q}^{(s,t)}\} Y~(s,t)={y~1(s,t),...,y~Nq(s,t)} 中的实例的结果。

  通常,质量预测数据集通常被划分为多个集合:训练集、验证集和测试集,它们分别用于模型的训练、验证和测试。在FSQP中,包含在不同集合中的任务(不同阶段的测量)是互斥的。此外,测试集中具有相同任务的注释实例很少。考虑到来自不同集合的实例属于不同的任务,并且测试集合中具有相同任务的实例非常少,因此很难构建高质量的深度学习方法来实现测试集合中的质量预测。因此,在大多数情况下,允许训练集包含基于先前测量收集的足够实例和任务[17],这也符合制造过程中数据集的特征。在多阶段生产过程中,不同质量相关变量的测量难度不同[19]。例如,在第IV-A节的实验中使用的公共数据集中,在不同任务的实例中,最大实例数是最小实例数的21.4倍。因此,我们假设在训练集中有足够的样本和任务。然后,在小样本学习方法的帮助下,这些易于测量的任务可以被用来生成先验知识,并帮助实现对测试集中的实例从看不见的任务的质量预测。

  形式上,在训练集、验证集和测试集中分别存在来自 S \mathcal S S 中不同阶段的 N t r a i n N_{train} Ntrain N v a l i d N_{valid} Nvalid N N N 个任务,其中 S \mathcal S S 表示阶段集合。此外,还对训练集和验证集中的实例进行了注释。对于训练集中的实例,在每一步训练中,我们往往随机抽取训练集中的N个任务和K个实例作为支持集,再从抽取的任务中抽取另一批实例作为查询集。这形成了 N-way K-shot 质量预测任务的输入数据集,将在第III-E1节中详细描述。对于验证集中的注释实例,K个实例被采样作为验证集的支持集,其余的实例作为查询集。此外,对于测试集中的实例,测试集中有K个注释实例作为支持集,其中K非常小。FSQP的目标是基于测试集中的K个标注实例以及从训练集和验证集中提取的先验知识,实现测试集中未标注实例的质量预测。

III 对比解码器发生器

A. 总体框架

  CDG主要由三个模块组成:机器特征编码器(MFE)、对比级和任务特征生成器(CFG)以及实例特定解码器生成器(IDG)。首先,引入MFE来编码来自各种机器的特征,考虑它们在制造过程中的依赖关系,这将在第III-B节中详细描述。第二,CFG采用对比学习方法来生成关于包含在来自MFE的输出隐藏表示中的阶段和任务的先验知识,如我们将在第III-C节中解释的。最后,在第III-D节中给出的IDG被设计成在解码器中生成参数并实现质量预测。我们方法的总体框架如图1所示。

你可能感兴趣的:(少样本学习,论文阅读,人工智能,深度学习)