机器学习 自学书本推荐(中文书) ---入门与基础

我现在也是正在学习机器学习,在学习的时候其实受过不少人指导的,现在机器学习非常火热,但其实机器学习理论已经有半个世纪以上的历史了,所以其实市面上很多学习的数目以及一些其他的引导方法。博主现在知道的几本比较好的书本,它们分别是 《统计学习方法 --李航 著 --清华大学出版社》、
《机器学习 --周志华著 --清华大学出版社》(被称为西瓜书)、
《模式识别与机器学习 --马春鹏 译》(对应的英文原版为《Pattern Recognition and Machine Learning 》,英文原版的作者为微软剑桥研究院实验室主任 Christopher Bishop)、
《机器学习实战 --李锐 译》
我觉得,自学机器学习确实需要花比较多的功夫,而且机器学习书本基本上是铺天盖地的理论,比较枯燥,即使以上这些书举了比较生动的例子,有些时候,还是非常难懂。机器学习理论,属于一种体系,这么多年来,不断被完善扩充,所以我们现在要面对的是前辈们总结的经验而成的书,知识量是非常大的。

现在来说说学习顺序吧,上面的几本书其实现在在京东、淘宝之类的书店里卖的挺火的,一方面这些书籍写的确实很好,另一方面,对于入门者来说,这些书的体系比较完善,深度适中,其实不是初学者,阅读这几本书也挺有用的。
我假设初学者是有基本的线性代数理论和概率理论的知识体系的。

对于初学者,我推荐的学习顺序是
1,《机器学习 --周志华》
2,《统计学习方法 --李航》
3,《机器学习实战 -李锐》
4,《模式识别与机器学习》
下面我来说说理由,
《机器学习 -周志华》这本书它可以分为两大部分:第一部分为第1章~第2章,讲的是机器学习的术语与将来在算法会用到的工具理论;第二部分为第3章 ~第16章,是讲的各类型的机器学习方法,各章节联系不大,可以不按顺序来,只是有时会在章节中提到前面章节讲过的内容(不会有很大联系)。在介绍机器学习的方法时,是一类的机器学习方法,介绍了应用场景,比较有体系,也有例子来帮助理解。

《统计学习方法 --李航》,这本书从书名上看,像是数学书,但其实机器学习的理论就是以数学理论中的概率论、线性代数(主要是矩阵理论)理论为基础的,因此这里提一下,学习机器学习,需要有比较深厚的概率论以及线性代数理论基础的,这样的话,学习的时候才不会处处碰壁。这本书呢,也可以分为两部分,第一部分是是第1章,统计学习方法概论,这一章主要是介绍统计学习方法(其实就是可以看成机器学习)是一个什么样的架构,研究的问题是啥,以及研究问题使用的比较公共的理论工具;第二部分为第2章~第11章,这一部分每章讨论了一个或若干机器学习的比较具体的算法,这些算法在《机器学习 --周志华》书里也有提,但是《统计学习方法 --李航》它的每章是我们通常所直接使用的算法,没有介绍应用场景。这本书可以当做是以具体算法为“字”的字典。

《机器学习实战 --李锐》这本书是用Python 2.7来对机器学习系算法进行实用化的,但要注意的是,它使用的是Python 2.7,所以此书只具有参考意义,因为Python 2.7版本非常陈旧,与Python3.x版本很多不兼容,而Python3.x是大势所趋。另一个问题是,即使你不介意本书内容的陈旧,本书有Python 2.7的大量代码,但是一些实例数据集文件获取困难(我没有买这本实体书,所以不知道正版实体书会不会附带数据集文件和源代码(数据集比源代码在你学习时更重要)),也就是空有算法,没有使用的地方。

《模式识别与机器学习 --马春鹏》这本书讲的挺详细的。也可以把书分为两部分:第一部分是第1章,先导概念;第二部分是第2章~第14章,讲的是机器学习的算法里的处理过程。它具有《机器学习 --周志华》的详细有实例和《统计学习方法 --李航》算法具体的特点,但每章内容比较多,每讲一个知识点,内容一大片,需要非常大的精力消化。这本书就像是字典一样,这本书的“字”是算法的详实的处理过程,我们可以从里面找到比较详实的处理方法,也就是说相较于周志华老师那本书的偏介绍,这本书偏处理,这两本数其实在高校都是作为教材使用的。

你可能感兴趣的:(机器学习,Python,机器学习)