机器学习01:绪论

机器学习的定义

机器学习是人工智能的核心研究领域之一,其研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。
目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习需要运用机器学习技术对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。

机器学习与数据挖掘

当人们在讨论机器学习的时候,经常会想到另一种智能数据分析技术:数据挖掘。
所谓数据挖掘就是:“识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程”。顾名思义,数据挖掘就是试图从海量数据中找出有用的知识。
机器学习与数据挖掘的联系可以通过以下两本数据挖掘的教材来理解:
机器学习01:绪论_第1张图片
机器学习01:绪论_第2张图片

  • 可见,数据挖掘的教材和课程主要讲解各种不同的数据挖掘任务。比如:分类、回归、聚类、关联分析、异常分析、演变分析等等。
  • 数据挖掘可以视为机器学习和数据库的交叉,它主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。
  • 二者既有区别又有联系,整体来说,机器学习偏理论,数据挖掘偏应用。

机器学习技术

  • 第1章,讲解机器学习的定义、与数据挖掘的区别与联系、本课程的授课思路与内容安排、教材及参考书
  • 第2章,讲解模型评估的方法、指标和比较检验。
  • 第3-9章,讲解机器学习的基础技术:以线性回归开始,讲解线性学习;以K均值聚类收尾,讲解无监督学习;中间包括支持向量机学习、神经网络学习、决策树学习、贝叶斯学习、以及最近邻学习。
  • 第10-13章,讲解机器学习的进阶技术:具体包括集成学习、代价敏感学习、演化学习、以及强化学习。

分类的定义

  • 分类就是构建一个分类模型,即分类器,然后通过分类器将数据对象映射到某个给定的类别中的过程。分类过程可以分为两步:
  • 第一步使用已知类标记的训练数据集学习分类模型。这一步称为分类器的训练阶段。
  • 第二步是对学到的模型进行性能测试评估(这一步称为分类器的测试阶段),如果模型的性能可以接受,才可以用它来对未知类标记的对象进行分类。
  • 第三步应用分类模型对未知类标记的对象进行分类。这一步称为分类器的工作阶段。
  • 分类是一个三步走的过程:训练→测试→工作。

教材及特别说明

教材

机器学习01:绪论_第3张图片

特别说明

本博客为笔者的学习笔记,主要内容来源于机器学习_中国地质大学MOOC,由笔者业余时间整理、记录,仅供学习、复习使用,不得用作商业用途,不得转载,以下为本课程授课教师。
机器学习01:绪论_第4张图片

你可能感兴趣的:(机器学习,机器学习,数据挖掘,人工智能)