监督学习(回归、分类问题)与无监督学习(聚类问题)

文章目录

      • 监督学习及分类、回归问题
          • 监督学习(Supervised learning)
            • 回归问题(Regression)
            • 分类问题(Classification)
      • 无监督学习及聚类问题
          • 无监督学习(Unsupervised learning)
            • 聚类问题(K-means)

在机器学习中,根据训练的样本是否具备标签Label,或者是否对样本数据进行类别标记,分为 监督学习方式和 无监督学习方式。

监督学习及分类、回归问题

监督学习(Supervised learning)

简单来说,监督学习方式需要事先准备样本数据,这些样本数据具备标签(Label即状态标注)和一定的特征(target可用向量组表示)。根据已经存在的样本数据进行训练从而得到一个最优的模型,例如身高和体重的关系、面部状态点与表情的关系等,样本数据结果一般为一个函数的集合(可想象为二次函数曲线上离散的点或者特定函数分割的区域),通过抽象或者分析设计出函数模型,模型即为最优的函数关系,之后将所有的输入样本根据模型映射输出结果,从而实现特定的目标。

回归问题(Regression)

回归问题通常应用于现实世界中的结果预测,如已有前几十个月的销售额样本,以监督学习方式,根据样本数据训练生成最优模型函数,从而对次月的销售额进行智能预测。常见的回归问题应用有房价预测、票房预测等。

分类问题(Classification)

分类问题也是我们在现实生活中常常遇到的一类问题,通过大量标本数据进行训练标记,生成最优模型,根据输入进行输出分类结果。例如某些网站安全验证的检测手段,判断一个图片内容是否为公交车,分类判断是否为垃圾邮件,情感的分类等,均是根据已有的模型对输入数据进行智能分类判断

无监督学习及聚类问题

无监督学习(Unsupervised learning)

无监督学习又称为无导师学习,指的是无需提前准备标签(Label)和特征(Target),没有标签的一种学习方式,根据样本数据直接对数据进行聚类,对于具备相同特性或状态的数据会聚集为块状,为一组类别。目前在无监督学习领域取得了很多的研究成果,包括次胜者受罚竞争学习算法、K-means学习算法、密度学习算法、谱图聚类算法等。

聚类问题(K-means)

无监督学习的聚类算法通过学习训练出的模型,对样本数据进行聚类,根据相同特征的数据群体进行划分,例如Google新闻的实时热点新闻类聚,具备相同关键词或者近似实事进行推荐,给予用户良好体验,包括人体DNA图谱、关系网分析、相似用户推荐等现实的应用。

你可能感兴趣的:(机器学习,聚类,学习,回归)