机器学习(三)——机器学习方法的分类

有监督学习

  • 数据集中的样本带有标签,有明确目标(数据样式: 其中Y是答案,X就是标签,例如生病中的症状,特征,从这样的数据去学习Y和X的对应关系)
  • 回归(Y是连续的值)和分类(数据做分组,Y是离散的值)
  • 目标:找到样本到标签的最佳映射,(就是把F找到)
  • 典型方法
    • 回归模型:线性回归、岭回归、LASSO和回归样条等
    • 分类模型:逻辑回归、K近邻、决策树、支持向量机等
  • 应用场景:垃圾邮件分类、病理切片分类、客户流失预警、客户风险评估、房价预测等。

无监督学习

  • 数据集中的样本没有标签,没有明确目标(学习的时候只有X没有Y),根据数据本身的分布特点,挖掘反应数据的内在特性
  • 聚类:将数据集中相似的样本进行分组,使得:
    • 同一组对象之间尽可能相似
    • 不同组对象之间尽可能不相似
  • 典型方法:聚类(数据做分组)、降维、排序、密度估计、关联规则挖掘
  • 应用场景:
    • 基因表达水平聚类:根据不同基因表达的时序特征进行聚类,得到基因表达处于信号通路上游还是下游的信息
    • 篮球运动员划分:根据球员相关数据,将其划分到不同类型(或者不同等级)的运动员阵营中
    • 客户分析:把客户细分到不同客户群,每个客户群有相似行为,做到精准营销

强化学习

强化学习又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。整个过程如下图,智能体不断跟环境做交互,环境会处于不同的状态,智能体根据环境不同的状态采取某一种动作,然后环境反馈给其一个信息,通过过程模拟和观察来不断学习/提高决策能力。

机器学习(三)——机器学习方法的分类_第1张图片

总结

有监督、无监督学习预先都要搜集好一个数据集,基于数据集去学习,而强化学习最开始没有搜集数据,它可以通过模拟和观察来生成数据,更接近人类的学习模式。

你可能感兴趣的:(机器学习,机器学习,分类,python)