李沐实用机器学习——数据标注

一、半监督学习

(一)无标签数据的假设

  • 相似特征同label
  • 同一类同label
  • 流行假设:数据的复杂度往往比呈现出的小得多,因此可以做降维处理

(二)怎样处理无标签数据?

1、self-training

self-training是一种典型的半监督学习算法
先训练,再预测,再融合。关键在于保证高置信度,可以用到复杂的模型。
李沐实用机器学习——数据标注_第1张图片

2、Active Learning+Self-training

李沐实用机器学习——数据标注_第2张图片

你可能感兴趣的:(机器学习,深度学习)