远程监督、弱监督、有监督、半监督到底怎么区分

最近火起来的远程监督到底和过去的半监督有什么区别?我的总结如下:

监督学习主要分为以下三类(强化学习等没有考虑):

1.有监督:用有标签的数据训练
2.无监督:用无标签的数据训练
3.弱监督:用含有噪声的有标签数据进行训练

半监督:同时用有标签 和 无标签的数据训练。现有小规模的有标签数据训练模型,再将该模型用于预测无标签数据的伪标签。将带伪标签的数据用于训练生成最终模型,属于弱监督
远程监督:利用现有知识库(维基百科、知识图谱、百度百科等)生成词典,将词典与非结构化文本进行匹配生成弱标签数据,用弱标签训练模型,属于半监督的一种方法,那自然也属于弱监督

注意:各个概念的分类并不是严格互斥的

你可能感兴趣的:(个人总结心得,人工智能,知识图谱,自然语言处理,数据挖掘)