LDA主题模型,生成模型VS判别模型

LDA主题模型

LDA主题模型是一种文档主题生成模型,是一种非监督机器学习技术,通过模拟文档生成过程,可以用于识别大规模文档集或语料库中潜藏的主题信息。
LDA主题模型,生成模型VS判别模型_第1张图片

生成模型VS判别模型

监督学习方法可分为两大类,即生成方法与判别方法,它们所学到的模型称为生成模型与判别模型

生成模型的特点

1.从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度
2.生成方法的学习收敛速度更快,即当样本容量增加的时候,学到的模型可以更快地收敛于真实模型
3.当存在隐变量时,仍然可以用生成方法学习,此时判别方法不能用

判别方法的特点

1.判别方法寻找不同类别之间的最优分类面,反应的是异类数据之间的差异
2.判别方法利用了训练数据的类别标识信息,直接学习的是条件概率 P(Y|X)或者决策函数f(x);直接面对预测,往往学习的准确率更高
3.由于直接学习条件概率P(Y|X)或者决策函数f(x),可以对数据进行各种程度上的抽象,定义特征并使用特征,因此可以简化学习问题
4.缺点是不能反映训练数据本身的特性

你可能感兴趣的:(机器学习)