论文链接:https://ieeexplore.ieee.org/document/8960273
提出了一种多视图多标签稀疏特征选择(MSFS)方法,以跨多个视角特征和多个类标签选择区分特征。F-norm penalty 执行 high-level 的特征选择以保留信息丰富的视图,而 L2,1-norm penalty 进行 low-level 的特征选择以去除噪声特征。
现有的多视图特征选择方法,主要依靠三种类型的策略:(1).连接策略;(2).分离策略;(3).交叉视角策略。
对于连接策略,将多个特征空间串联到一个统一的特征空间中进行特征选择,其中不同特征空间之间的差异将被忽略;对于分离策略,传统的特征选择方法是在每个单视图特征空间上分别执行的,其中不同的特征空间被认为是独立的。但是,各个视图功能具有内在的关联性,它们通常为有效的学习任务相互提供补充信息;因此,这两种策略显然不适用于多视图特征选择,根据多视图数据的特点,开发了多种基于交叉视角策略的方法。例如,自适应无监督多视图特征选择(AUMFS)方法提出了一种鲁棒的稀疏回归模型,可以从整个特征空间中选择信息特征,利用了多个视角之间的相关性。
A. Multi-view Multi-label Learning
多视角学习方法可以分为三个类别,(1).协同训练方法(通过最大化两个不同视角之间的一致性,可以很好地解决具有两个视角的数据);(2).多内核学习方法(更倾向于选择线性组合内核的方法,而不是使用单个内核);(3).子空间学习方法(假设各个视角之间条件独立,最终学习多视角数据的潜在表达)。但是,这些方法是为仅具有一个显式标签的学习任务而设计的,不能直接应用于多标签数据。
针对多标签任务,有两类方法:(1).问题转换方法(将多标签学习问题转换为其他公认的学习范例,例如转换成多个二分类问题)和算法适应方法(例如 the ranking-based support vector machine,将传统的 SVM 算法应用到多标签任务中)。
B. Sparsity-based Feature Selection
通常都是利用 F-norm and an L2,1-norm regularization 分层提取特征。但是传统的稀疏特征选择方法使用存在错误的多标签信息(noisy feature),而且忽略了所有特征空间的局部几何结构。
考虑到数据特征(即多视角特征和多个相互依赖的类标签),并提出了一种多视图多标签稀疏特征选择方法,该方法学习了多标签信息的潜在语义并加以利用。不同特征空间的局部几何结构,以分层方式找到更多可辨别特征的子集。
目标函数:
其中,Yn×k表示多标签表示空间,Vn×c表示一个 low-rank 标签表示矩阵,Bc×k表示系数矩阵,|| − ||这个过程类似于 NMF 降维过程,n 表示样本数,k 表示标签数,c 表示降维后的维度,c<
为了方便对目标函数的优化,将 和 分别用 和 代替,让他们变得可导,C、D 都是对角矩阵,
(谁能教教我怎么编辑公式!!!这排版有点难受)
目标函数变为
之后采用梯度下降法,对 W、V、B 交替优化即可,其中采用 Armijo rule自适应调整每一次迭代步长。
其中 GIST 表示空间包络特征;CM 表示颜色矩。
CSFS: 凸半监督多标签特征选择方法设计用于解决大规模多标签特征选择问题;
SFUS: 具有稀疏性的子特征发现方法是用于多标签特征选择的基于稀疏性的模型,该模型为原始特征发现了共享子空间;
MIFS: 多标签信息特征选择方法探索潜在标签相关性以执行多标签特征选择;
MDFS: 多种正则化鉴别特征选择方法利用局部和全局标签相关性进行多标签特征选择;
F2L21F: block-row 稀疏多视图多标签学习方法是一种进行多视图多标签特征选择的分层稀疏模型;
MSFS:本文方法。
Hamming loss;
Ranking loss;
Average precision;
Macro-averaging area under the curve (AUC): 基于每个标签的 AUC 的计算。