機器學習基石第一周学习笔记

1 . 什么是机器学习?
机器从给定的data中进行学习,并习得一定的技巧,这些技巧必须对我们有提升的作用。

2.什么时候需要机器学习?
当我们不能把规则详细的定义下来时,比如识别一棵树,我们并不能规定什么样的东西是一颗树,树的所有特征,但是我们却能认识一棵树,所以我们能让机器看很多树,然后让它认识树。
当做快速决定的时候。
当大规模的个性化服务时。

3.什么样的问题能够使用机器学习?
该问题存在潜在的模式能够被学习,如果没有规律,机器在怎么学也没用。
我们不知道怎么将该问题的规则写出来,这时候我们才需要机器学习,比如识别出一个图里面的一个圆,我们自己就能编程实现,我们就不需要机器学习。
存在一定的数据供机器去学习。
以上便是机器学习的三要素。

4.机器学习的组成成分

  1. 输入:x(一组特征)
  2. 输出:结果(根据输入特征判断该输入是好是坏)
  3. f :x->y(这个映射关系是我们希望学到的,理想的函数,但是我们并不知道这个函数)
  4. 数据:训练数据,以前的例子,机器用来学习f的数据
  5. g:x->y(机器实际学习到的映射关系,这个g和f越像越好)
  6. 假设空间H(g属于H,H是机器所能学习的所有可能的g的组合,我们的目标就是从这个H中学习一个最接近f的g)
  7. 学习模型:用来从H中学得g所用的算法模型

五.机器学习与数据挖掘,人工智能,统计的区别与联系
机器学习:用数据去学习一个假设函数g,这个假设函数非常的接近理想的目标函数f。
数据挖掘:在大量的数据中寻找出一些非常有意思的性质。
这两个概念非常相像
人工智能:通过计算使得机器做一些具有智能的行为,比如机器下棋。
统计:使用数据去做一些推论。

你可能感兴趣的:(机器学习基石学习笔记)