硬标签、软标签、单标签、多标签的概念

  • 硬标签:用于单一分类任务中,一般用在二分类任务中。对于一个类别,只有属于或不属于。
  • 软标签:用概率分布表示属于某个类别的概率。例如,对于一个三分类任务,一个样本的软标签可以是[0.3, 0.5, 0.2],表示样本属于三个类别的可能性分别为30%、50%和20%。
  • 单标签:每个样本只有一个明确的类别,比如一个三分类任务,一个样本的单标签可以是[1,0,0] 、[0,1,0]或[0,0,1],表示样本明确属于哪一个类别。
  • 多标签:一个样本可以有多个标签。比如在情感分析中(高兴、兴奋、快乐、抑郁、悲伤五分类),一个样本由3个专家给出标签,由于专家们意见不统一,三个专家分别认为是高兴、兴奋、快乐。因此该样本的标签为[1,1,1,0,0]

值得注意的是,软标签与多标签类似,他们都是允许一个样本可以归属不同类别,不同的是,软标签以概率的形式,表示有多大可能属于这个类别;多标签则是只要有专家认为样本属于这个类别,那么这个样本就属于这个类别。

硬标签与单标签是相似的,硬标签强调该样本是否属于该类别确定的(该类别:如三分类中,A,B,C三类,A对于这个样本来说就是该类别,硬标签一定给出属于还是不属于,软标签却是用概率描述样本属于这个类别有多大可能);单标签表示样本有多个类别,但一个样本只能属于一个类别,如:如三分类中,A,B,C三类,样本的单标签只能为A或B或C类,如果样本的单标签为A,那么样本对于A的硬标签是:样本属于A,样本不属于B,样本不属于C;这里可以看出硬标签与单标签是可以同时使用的,为了加以区分,我们在二分类任务中用硬标签这种术语,在三分类及以上用单标签描述样本属于那个类别

你可能感兴趣的:(人工智能,全文检索)