基于生成对抗网络的分类方法

经典论文阅读笔记:

        最初的生成对抗网络是用于数据生成的,近些年也有一些研究者将生成对抗网络应用于分类任务中。例如在文献【1】中,作者设计了一种基于生成对抗网络的特征分离框架Exchange-GAN。该框架比较有意思,通过部分特征交换,中心损失、内容损失、分类损失和对抗损失的约束实现了类别相关特征和类别无关特征的高纯度分离。然后在分类过程中,忽略类别无关特,仅根据分离出来的类别相关特征进行分类,这样可以极大克服无关特征对分类任务的影响,提高分类的准确率。

        这篇文章中所提的基于生成对抗网络的特征分离框架Exchange-GAN的网络结构如图1所示,首先从训练集中随机挑选两个不同的样本作为输入,然后通过生成器中的编码器对样本进行特征提取,接着根据特征分离比 r 将提取的特征分割为两个部分,然后保持类别无关特征不变,将两个输入样本的类别相关特征进行交换。为了约束生成器中的编码器并提高分离的类别相关特征的纯度,此处引入了Central loss的约束。接着解码器根据重组后的类别相关特征和类别无关特征生成新的样本,为了保证特征交换操作能够实现两个输入样本的类别相关特征交换,而类别无关特征保持不变,此处引入了Content loss。最后分别将生成样本和真实样本输入到判别器中,进行真假判断和分类,通过对抗损失来保证生成样本与真实样本高度相似,通过分类损失确保部分特征交换的过程中,两个输入样本的类别相关实现了交换。该框架特征分离的实现得依靠多种损失函数的约束,论文中给出了该框架中各种损失函数的数学表达式。

图1 Exchange-GAN的网络结构

       该图中Gen表示生成器中的编码器,Gde表示生成器中的解码器,D表示该Exchange-GAN框架的判别器。在表情分类任务中,生成器中编码器和解码器的具体结构为如图2所示。

图2 生成器中编码器和解码器的具体结构

在表情分类任务中,判别器的具体结构如图3所示。

图3 判别器的具体结构

在这篇论文的实验部分,作者通过真实图像、生成图像和约束图像的展示(如图4所示),证明所提出的基于生成对抗网络的特征分离方法可通过部分特征张量交换实现表情类别的交换,这说明与表情类别相关的特征收敛到了参与交换的部分特征张量中。生成图像出表情之外的其他特征都保持不变,这说明与表情类别无关的张量收敛到了没有参与交换的那部分特征张量中。这也证明了这篇文章所提出的特征分离框架Exchange-GAN可以实现特征类别相关特征和类别无关特征分离。

图4 输入图像,生成图像和约束图像

       最后,通过将基于Exchange-GAN的表情分类方法在三个表情分类数据集上的准确率同当前state-of-the-art方法作比较,证明这种基于Exchange-GAN进行特征分离的分类方法可以极大克服与类别无关特征对分类任务的干扰,极大提高分类的准确率。在很多分类任务中个体差异问题是限制分类准确率提高的重要因素之一,这种基于Exchange-GAN的分类方法为克服个体差异问题提供一种新的思路。


参考文献:

[1] Yang L , Tian Y , Song Y , et al. A novel feature separation model exchange-GAN for facial expression recognition[J]. Knowledge-Based Systems, 2020, 204:106217.

你可能感兴趣的:(基于生成对抗网络的分类方法)