多标签分类问题

大致上,解决multilabel的方法有两种

1)转化问题。把问题转化为一个或多个单目标分类问题,或是回归问题。

2)算法适应。修改学习算法使得能直接处理multilabel的数据。

多标签分类问题_第1张图片

问题转化方法 dubbed PTx法。包括

多标签分类问题_第2张图片

  • PT1 对有多标签的数据随机选取一个标签
    多标签分类问题_第3张图片
     
  • PT2 直接把标签数大于1的都丢掉


  • PT3 对标签集合进行排列组合,即组合好的成为一个新的单标签
    多标签分类问题_第4张图片
  • PT4 把一个含有L个标签的训练转化为L个二分类的训练
    多标签分类问题_第5张图片
  • PT5 把含有多个标签的样本分成多个新样本,用 coverage-based classifier
    多标签分类问题_第6张图片
  •  PT6把含有多个标签的样本对标签集合分成多个新样本
    多标签分类问题_第7张图片

结论是PT3效果很好,PT4较好也应用比较广泛,PT6由于数据不平衡(如果标签密度太小会导致大量的-1)。


另外,以下几个问题是需要关注和进一步研究的

  • Dimensionality Reduction 降维
  • Label Dependence 标注依赖
  • Active learning 主动学习
  • Multi-instance multi-label learning (MIML) 多实例多标签
  • Multi-view learning. 多视角
  • Multi-task learning (MTL) 多任务
  • Hierarchical multi-label classification (HMC) 多层多标签

reference
[1] https://www.researchgate.net/profile/Grigorios_Tsoumakas/publication/273859036_Multi-Label_Classification_An_Overview/links/574575e308aea45ee8539026/Multi-Label-Classification-An-Overview.pdf

[2] https://www.researchgate.net/profile/Sebastian_Ventura/publication/270337594_A_Tutorial_on_Multi-Label_Learning/links/54bcd8460cf253b50e2d697b/A-Tutorial-on-Multi-Label-Learning.pdf

[3] https://users.ics.aalto.fi/jesse/talks/Multilabel-Part01.pdf 
https://users.ics.aalto.fi/jesse/talks/Multilabel-Part02.pdf


你可能感兴趣的:(Deep,Learning,机器学习,深度学习)