如何理解伪标签中的置信度

伪标签中常常有置信度这一说法,通过置信度,我们可以筛选出质量高的伪标签(直观来说是像素),那比如说预测结果为一个2×256×256的概率图,那针对一个像素的两个通道值,怎样才算质量高或者低呢?

answer:

预测结果是一个 2×256×256 的概率图,其中两个通道代表的是对应像素为某两个类别的概率。如果采用置信度过滤器,并且设置阈值为 0.9,那么对于每个像素,您会检查这两个通道的概率值。

通常,在二分类问题中(比如变化检测,类别可以是变化/未变化),两个通道的概率值是互补的,即一个通道的概率值越高,另一个通道的值就越低。因此,通常只有一个通道的概率值会接近或超过置信度阈值。

在案例中:

  • 如果一个像素的两个通道的概率值都小于 0.9,这意味着模型对于这个像素属于任一类别都不够自信。
  • 如果至少有一个通道的概率值大于或等于 0.9,这意味着模型对于这个像素属于相应类别有较高的自信。

因此,在应用置信度过滤器时:

  • 如果希望保证高置信度的决策,应该只保留那些至少有一个通道概率值大于或等于 0.9 的像素作为高质量的标签。
  • 对于那些两个通道的概率值都小于 0.9 的像素,可以认为模型对这些像素的分类不够自信,因此可以将这些像素的标签视为低质量,并在损失函数计算中排除它们。

你可能感兴趣的:(人工智能)