《python机器学习基础教程》笔记(第1章)

这篇文章是为了在读完《Python机器学习基础》后对书本内容进行整理,我也是最近(不到两个月)才开始学习机器学习,不足错误之处肯定有,我很倾佩写这种某领域经典书籍的人,写的东西从不拖泥带水却又非常准确,有时候去解释一样东西,尤其是自己很熟悉的东西的时候,就不自觉的废话多了起来,生怕别人听不懂,但是你说可以这样废话多一点,写出来的话还是好多圈话就让读的人容易一头雾水,本来清楚的都被你说的懵逼了。希望有朝一日也能成长为可以写出这种书的那一类人。这本书写的确实不错,慢慢的我已经接受了一个事实,你在网站博客上翻来覆去寻找到的东一块西一块的知识点,其实在某本书中已经在某一页非常清楚的写着了,又清晰又简洁又权威,没有一点的废话。
好了开始第一章整理:
再回过头去看第一章,反倒是感觉并没有什么内容了,主要是介绍了机器学习是什么,能解决什么问题,以及后面每一章都要用到的scikit-learn库。还介绍了一个简单的机器学习中的分类问题,关于鸢(yuan)尾花的分类。
再回过头看第一章真的不知道有什么值得记录的,我们不妨就以回答问题的形式来总结好了

Q:什么是机器学习,机器学习可以解决什么问题?

A:机器学习并没有那么神乎其技,无非就是搭建一个模型,通过学习,这个模型可以告诉我们你这张图片是男还是女,那么机器如何学习呢,就是通过所谓的“训练”,先给我10000张人的照片,以及告诉我这10000张人脸都分别是难是女,然后我将会在我的模型中不断调整模型中的大量参数,直到学习到某个类似“ 这个图片只要怎么怎么样,我就认为是男”这样的东西,这个机器学习模型就搭建好了。当然图像的识别已经是稍微复杂一点的机器学习了,因为我需要想办法去找到图片中的特征信息,那我们换个简单的例子,就是书中给出的鸢尾花的例子,同样的,我需要先让模型来进行学习(训练),我给出了10000个例子,每个例子包括4个特征:花瓣的长度和宽度,花萼的长度和宽度(这4个特征将决定鸢尾花的品种)。然后,给出这10000个特征例子对应的鸢尾花品种,接着把这些数据丢给模型让它去找规律,找到花瓣花萼和花品种之间的关系。学习完以后,就可以通过你新给的花瓣花萼长度和宽度,从而得出这是什么鸢尾花品种啦。那么机器学习可以解决的问题大概分两类,一个是分类问题,顾名思义,就是对数据分类,一个是回归问题,这个给出的结果不是属于哪个类,而是一个连续的值,比如预测房价这种问题(又废话了)

Q:无监督学习和监督学习是什么

A:前面说到,要让模型可以识别这个鸢尾花是鸢尾花的什么品种,我需要先让模型找到花瓣花萼长度宽度和鸢尾花品种的关系,为此我需要提过10000个的学习数据,这种提供学习数据的叫做监督学习,那么无监督就是不提供学习数据,自己在学习中找到规律,可能会很疑问,这怎么搞?我举个例子就明白了,比如进行人脸的聚类,就是把一堆人脸中相同的聚类到一起去,这种就没法提供学习数据了,就是无监督学习。当然还有什么半监督学习等等

Q:很需要数学知识吗?

A:还是要的,虽然库里有很多很好用的API,但是我感觉数学知识还是要的,很多说不需要什么高深的数学知识,只要有基础的数学知识就可以学机器学习甚至深度学习的,那是因为在大神看来那些不是高深的数学知识,而是基础的数学知识,大神对数学知识的分类和很多人不一样…

一不小心又废话了,哎又舍不得删,就这样吧

你可能感兴趣的:(机器学习)