机器学习实战(基于Scikit-Learn和TensorFlow)

第一部分机器学习基础

第一章-机器学习概览

本章是机器学习的最初级入门,这里会介绍很多的机器学习相关术语,应当熟记于心。

1 什么是机器学习:

笔者:直观而言,机器学习就是让机器去学习。学什么呢?学习人类的思维方式,让计算机具备学习能力;

官方:一个计算机程序在完成任务Task之后,获得一定的经验Experience,其表现效果为Performance,同时

          如果该任务Task的性能Performance会随着经验Experience的增加而增加,则该 计算机具备学习的能力。

举例:生活中,我们会经常收到莫名的邮件,我们往往会丢到垃圾回收站里面,那么垃圾邮件过滤器会学习垃圾                                           回收站里面的邮件,比如学到了大多数被回收的邮件里面有敏感词汇“骗”等,那么如果下次来的邮件也有                                           该词汇“骗”,则垃圾邮件回收器会自动把该邮件归类为垃圾邮件。

2 为什么使用机器学习:

首先因为他太火了,很智能!

如图1.如果用一个传统的编程技术编写一个垃圾邮件过滤器,那么我们会自己看垃圾邮件是什么样子,然后找出来大多数垃圾邮件里面多数共有的敏感单词或者模式,然后你再为没有单词或者模式编写一个程序,如果程序检测到下一个邮件有这个模式或者单词,那么就会自动归类为垃圾邮件,然后不断的测试这个程序,直到最好。但是你的程序会越来越复杂,不好维护。

图1

如果我们使用机器学习的方法,,那么垃圾和过滤器会自动比对垃圾邮件和常规邮件,自动的检测垃圾邮件中经常出现的单词或者模式,自动的学习哪些单词或者模式可以作为垃圾邮件的预测因素,这样的程序会简单容易维护,从某种意义上来说,可能会更准确。可以使用深度学习模型对垃圾邮件和常规邮件进行训练,动态的学习。如图2。

图2

3 机器学习的种类(4类)

监督学习:用的训练数据有标签(标签具有分类的作用) 例如分类和回归都是监督学习

非监督学习:用的训练数据没有标签(所以不是分类的任务)

半监督学习:用的训练数据既有有标签的(少数)也有没有标签的(多数)

强化学习:学习系统能够根据环境,做出选择,执行操作,并获得回报或者惩罚

 

 

 

你可能感兴趣的:(机器学习实战(基于Scikit-Learn和TensorFlow))