一、机器学习的定义
机器学习是一门从数据中研究算法的多领域交叉学科,研究计算机如何模拟或实现人类的学习行为,根据已有的数据或以往的经验进行算法选择、构建模型,预测新数据,并重新组织已有的知识结构使之不断改进自身的性能。
二、机器学习的分类
1、有监督学习SL(Supervised Learning)
用已知某种特性的样本(x,y)做为训练集,建立一个数学模型,求解f:x->y,预测未知样本。
1)判别式模型(Discriminative Model)
对条件概率p(y|x)进行建模,如线性回归、决策树、SVM、KNN、神经网络等。
2)生成式模型(Generative Model)
对联合概率p(x,y)进行建模,如HMM、Naive Bayes、GMM、LDA等。
2、无监督学习UL(Unsupervised Leaning)
训练集数据只有x没有标签y,目的是试图提取数据中隐含的结构和规律,常见的算法有K-means、降维、文本处理(特征抽取)等。
无监督学习一般作为有监督学习的前期数据处理,功能是从原始数据集中抽取出必要的标签信息。
3、半监督学习SSL(Semi-Supervised Learning)
前两者的结合,利用少量标注了的样本和大量未标注的样本进行训练和测试。SSL的三种基本假设:
1)平滑假设(Smoothness Assumption):位于稠密数据区域的两个距离很近的样例的类标签类似。
2)聚类假设(Cluster Assumption):当两个样例位于同一聚类簇时,它们在很大概率下有相同的类标签。
3)流形假设(Manifold Assumption):将高维数据嵌入到低维流形中,当两个样例位于低维流形中的一个小局部邻域内时,它们具有相似的类标签。
4、强化学习RL(Reinforcement Learning)
系统(autonomous agent)通过从环境States到行为Actions映射的学习,以使强化信号Rewards函数值达到最大,即改进行动方案Policy以适应环境。
RL 与SL、UL的一个重要区别是:后两者需要满足数据是服从独立同分布的,而RL则不满足这个条件,因为Agent和环境交互过程中状态是不断变化的,RL本质是对连续序列做决策的过程。
课堂笔记:
导数:
环境: