Multi-view Multi-label Learning with Sparse Feature Selection for Image Annotation 论文笔记

Multi-view Multi-label Learning with Sparse Feature Selection for Image Annotation (TMM2018 )

论文链接:https://ieeexplore.ieee.org/document/8960273

1.论文主要贡献

提出了一种多视图多标签稀疏特征选择(MSFS)方法,以跨多个视角特征和多个类标签选择区分特征。F-norm penalty 执行 high-level 的特征选择以保留信息丰富的视图,而 L2,1-norm penalty 进行 low-level 的特征选择以去除噪声特征。

2.论文主要内容:

2.1. Introduction

现有的多视图特征选择方法,主要依靠三种类型的策略:(1).连接策略;(2).分离策略;(3).交叉视角策略
对于连接策略,将多个特征空间串联到一个统一的特征空间中进行特征选择,其中不同特征空间之间的差异将被忽略;对于分离策略,传统的特征选择方法是在每个单视图特征空间上分别执行的,其中不同的特征空间被认为是独立的。但是,各个视图功能具有内在的关联性,它们通常为有效的学习任务相互提供补充信息;因此,这两种策略显然不适用于多视图特征选择,根据多视图数据的特点,开发了多种基于交叉视角策略的方法。例如,自适应无监督多视图特征选择(AUMFS)方法提出了一种鲁棒的稀疏回归模型,可以从整个特征空间中选择信息特征,利用了多个视角之间的相关性。

2.2. Related Work

A. Multi-view Multi-label Learning
多视角学习方法可以分为三个类别,(1).协同训练方法(通过最大化两个不同视角之间的一致性,可以很好地解决具有两个视角的数据);(2).多内核学习方法(更倾向于选择线性组合内核的方法,而不是使用单个内核);(3).子空间学习方法(假设各个视角之间条件独立,最终学习多视角数据的潜在表达)。但是,这些方法是为仅具有一个显式标签的学习任务而设计的,不能直接应用于多标签数据。
针对多标签任务,有两类方法:(1).问题转换方法(将多标签学习问题转换为其他公认的学习范例,例如转换成多个二分类问题)和算法适应方法(例如 the ranking-based support vector machine,将传统的 SVM 算法应用到多标签任务中)。

B. Sparsity-based Feature Selection
通常都是利用 F-norm and an L2,1-norm regularization 分层提取特征。但是传统的稀疏特征选择方法使用存在错误的多标签信息(noisy feature),而且忽略了所有特征空间的局部几何结构。

2.3. 本文方法

考虑到数据特征(即多视角特征和多个相互依赖的类标签),并提出了一种多视图多标签稀疏特征选择方法,该方法学习了多标签信息的潜在语义并加以利用。不同特征空间的局部几何结构,以分层方式找到更多可辨别特征的子集。
目标函数: 在这里插入图片描述
其中,Yn×k表示多标签表示空间,Vn×c表示一个 low-rank 标签表示矩阵,Bc×k表示系数矩阵,|| − ||这个过程类似于 NMF 降维过程,n 表示样本数,k 表示标签数,c 表示降维后的维度,c<d(n 个样本,d 维特征)表示样本空间,Wdc表示特征选择矩阵;||W||2,1用作 low-level 的特征选择;||W||F用作 high-level 的特征选择。W 一旦学习出来,根据|| wi ||通过对所有 d 个特征进行排序来选择排名靠前的 r个特征(i = 1,…,d)降序排列,这个过程类似于PCA。
为了方便对目标函数的优化,将在这里插入图片描述在这里插入图片描述 分别用 在这里插入图片描述在这里插入图片描述代替,让他们变得可导,C、D 都是对角矩阵在这里插入图片描述 =1 2||||
(谁能教教我怎么编辑公式!!!这排版有点难受)
目标函数变为在这里插入图片描述
之后采用梯度下降法,对 W、V、B 交替优化即可,其中采用 Armijo rule自适应调整每一次迭代步长。

2.4. 实验设置

Data Sets

在这里插入图片描述
其中 GIST 表示空间包络特征;CM 表示颜色矩。

Baseline Methods

CSFS: 凸半监督多标签特征选择方法设计用于解决大规模多标签特征选择问题;
SFUS: 具有稀疏性的子特征发现方法是用于多标签特征选择的基于稀疏性的模型,该模型为原始特征发现了共享子空间;
MIFS: 多标签信息特征选择方法探索潜在标签相关性以执行多标签特征选择;
MDFS: 多种正则化鉴别特征选择方法利用局部和全局标签相关性进行多标签特征选择;
F2L21F: block-row 稀疏多视图多标签学习方法是一种进行多视图多标签特征选择的分层稀疏模型;
MSFS:本文方法。

Evaluation

Hamming loss;
Ranking loss;
Average precision;
Macro-averaging area under the curve (AUC): 基于每个标签的 AUC 的计算。

你可能感兴趣的:(机器学习)