【机器学习基础】机器学习基础引入

机器学习是什么

“机器学习”是人工智能的核心研究领域之一, 其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。
事实上,由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一。
机器学习是构建复杂系统的一种方法,也许依靠我们的脑力把处理一个问题的所有规则写成程序可能不容易做到,那么我们就让机器自己去根据数据和资料进行学习,自己去处理问题。

机器学习和数据挖掘的关系

数据挖掘可被认为是识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。其实顾名思义,数据挖掘就是试图从海量数据中找出有用的知识。大体上看,数据挖掘可以视为机器学习和数据库的交叉,它主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。
用一句话来概括,机器学习是人工智能的一个方向,机器学习是数据挖掘的一种实现方式。

机器学习和统计的关系

统计是利用数据来对一个未知的过程进行推测的活动,是实现机器学习的一种方法。
传统统计学更加关注数学方面的推论,而不像机器学习技术关注计算机如何计算出来推论的结果。

机器学习的应用场景

  • 当我们不可能通过手动编程实现的系统,即不可能穷尽所有规则的情况下
  • 当我们无法轻松定义答案的情况下
  • 当需要进行快速决定的情况,这种情况人类无法做到,比如股票市场的超高频率交易
  • 当针对很广泛的用户个性化服务,比如针对消费者的营销策略

机器学习的关键

  1. (Pattern)存在某种潜在的模式或规则可以被学习到
  2. (Definition)无法轻松通过编程实现
  3. (Data)具有关于某种模式的数据资料

机器学习的实际定义

机器学习实际定义

由上图所示,由于我们不知道f,我们于是把手上的资料D,通过机器学习的算法A,得到一个推荐使用的函数g,我们希望g和理想的目标函数f越接近越好。
我们可以把很多可能的公式放到一个“假说”的集合H(即包含了各种可能的g),机器学习算法所要做的事情是要从H中选择一个它觉得最好的假说,即g。
这里,我们给出一个机器学习更加清楚的定义:机器学习就是,我们从数据出发,通过机器学习算法,算出一个假说g,希望g能够很接近我们更渴望的理想模型f。

可以得出一个简洁的步骤:

  1. 得到一个有限的训练数据集合
  2. 确定包含所有可能的模型的假设空间,即学习模型的集合
  3. 确定模型选取的准则,即学习的策略
  4. 实现求解最优模型的算法,即学习的算法
  5. 通过学习方法选择最优模型
  6. 利用学习的最优模型对新数据进行预测或分析

接下来

接下来,我会根据在线学习的课程陆续整理日常学习的机器学习算法,并结合实际问题,多做实验,力求得到更好的学习效果,我一定会坚定信念,更加努力,追赶优秀的步伐。

转载请注明作者Jason Ding及其出处
Github主页(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)

你可能感兴趣的:(【机器学习基础】机器学习基础引入)