半监督学习(semi-supervised learing)

1  未标记样本

    【假设】 数据分布信息和类别标记的联系。【常见假设】聚类假设(cluster assumption):同一族的样本属于同一个类别。

                                                                                               流形假设:数据分布在流形结构上:邻近的样本有相似的输出值。

     【半监督学习的划分】纯半监督:

                                         直推学习(dransductive learning)

2 生成式方法(generative methods)

    标记与未标记样本,都有一个潜在的模型“生成”:比如基于极大似然估计求解EM算法

    常见的生成式:判别式分析(线性模型);朴素贝叶斯(监督);k近邻(KNN);混合高斯EM;HMM(隐马尔科夫);MRF(马尔科夫随机场)贝叶斯网络(半监督);sigmoid belif network &深度信念网络(既可以用于非监督学习,类似于一个自编码机;也可以用于监督学习,作为分类器来使用);

    【扩展-判别式模型】:线性回归(linear regression);逻辑斯蒂回归(logistic regression);神经网络(nn);支持向量机(svm);高斯过程(Gaussian Process);条件随机(CRF,监督,概率图部分知识);CART(classification and regression tree)“半监督:通用决策树”。

3 半监督SVM

4 图半监督学习

【假设】若两个样本之间的相似度很高,则对应的节点之间存在一条边

【迭代标记传播算法】

5 多分歧的方法(disagreement-based methods)【基于多样性】

  【基于单学习器】:半监督SVM,图半监督学习,生成式方法

  【基于多学习器】:集成学习或者多分类器系统:【其他常见】基于若学习器的【boosting】;基于并行集成的【bagging and 随机森林】【多学习器结合的策略】平均法,投票法,学习法。

6  半监督聚类

你可能感兴趣的:(学习记录)