多标签分类的学习感悟

多标签学习

  1. 问题来源
  2. 定义
  3. 背景
  4. 分类算法
  5. 应用前景
  6. 最新进展

博主也是刚开始接触多标签分类相关的学习,如果有不正确的地方希望大家指正

1.问题来源

        多标签学习概念的提出源于文档分类中遇到的多义性问题。



2.定义

         有多标签分类,肯定就有单标签分类,那么和单标签分类有什么区别,下面我从定义开始出发:

         1. 单标签分类:在传统的单标签分类中,训练集中的每一个样本只有一个相关的标签 l ,这个标签来自于一个不重合的标签集合L,|L| > 1.当|L|=2 时,这就是一个二分类问题,或文本和网页数据的过滤(filtering)问题。当|L| > 2 时是多类分类问题,标签与标签之间互斥。如对人的性别进行分类,一个人不是男,就是女。当然很明显这属于一个二分类问题。

               2.多标签分类:简单的说就是同一个实例,可以有多个标签, 或者被分为多个类。和多分类的区别是, 多分类中每个实例只有一个标签,标签与标签之间存在某种关系。如下面一副图片,可以同时标注“蓝天”、“河”、“山”,甚至“树木”等标签。

多标签分类的学习感悟_第1张图片



3.背景

          单标签分类分类已经不能满足人们的需求了,所以多标签分类也就自然而然的出现了。



4.分类算法

           依据:解决问题的角度

           1.基于问题转化的方法

              转化问题数据,使之适用于现有算法,代表算法有LP、BR、CLR等


           2.算法适应的方法

                      针对某一特定的算法进行扩展,从而能够直接处理多标签数据;
              多标签学习算法的策略大致分为以下三类:
              “一阶”策略:逐一考察单个标记而忽略标记之间的相关性,如将多标记学习问题分解为独立二分类问代         表性算法ML-KNN(该方法将“惰性学习(lazy learning )”算法k近邻进行改造以适应多标记数据)
“二阶”策略:考察两两标记之间的相关性,如相关标记与无关标记之间的排序问题,两两标记之间的交互关系等,代表性算法Rank-SVM(该方法将“核学习(kernel learning )”算法SVM进行改造以适应多标记数据)、
“高阶”策略:考察高阶标记的相关性,如处理任一标记对其它所有标记的影响,代表算法LEAD(该算法将“贝叶斯学习(Bayes learning)算法”Bayes网络进行改造以适应多标记数据)



5.应用前景

     可以应用在蛋白质分类、音乐分类、语义场景分类和疾病诊断,图像视频自动标注,情感分类;对多标记学习的研究主要围绕降低特征空间和标记空间的复杂性,提高多标记分类算法的精度而展开。

你可能感兴趣的:(多标签分类的学习感悟)