谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了

谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了_第1张图片
来源 | 异步 | 文末赠书

在美国亚马逊网站上,机器学习的图书如浩如烟海,但是在这个领域竟有一本书仅凭百页内容就成功跻身图书销售总榜单前1000名,在亚马逊的官网,这本书也长期位于亚马逊机器学习图书排行榜的领先位置,并获得4.5星好评,成为美亚在机器学习领域最畅销的图书之一。这本书就是《机器学习精讲》 。

谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了_第2张图片

本书作者安德烈·布可夫(Andriy Burkov)是一位机器学习专家,目前居住于加拿大魁北克省。他拥有人工智能博士学位,尤其擅长自然语言处理技术。目前,他是高德纳(Gartner)咨询公司机器学习开发团队的主管。

为何要了解机器学习

从人工智能诞生开始,这门技术就不断的被人们寄予颠覆传统、创造未来的厚望。今天的企业和个体都正在经历工业化以来最重大的变革。人工智能的技术不断地被落地应用,很多企业因此突破原有的商业版图。

不论你接不接受,一个属于人工智能的时代已经来临。Gartner预测到2020年人工智能将创造230万个工作岗位,同时消除180万个工作岗位。对于个体来说,既然不能抗拒时代的潮流,就需要顺应变化。而机器学习——作为人工智能重要的驱动力,目前这一领域的专家还很少,雇主们都在为ML技术人才而战。所以,了解机器学习,是进入人工智能领域的一种有效策略。

这本书讲了什么?

人工智能的核心是机器学习。《机器学习精讲》一书中囊括了机器学习的精髓,为读者系统而精炼地讲解机器学习的基本原理。

具体内容包含了监督和非监督学习、支持向量机、神经网络、集成算法、梯度下降、聚类分类、降维、自编码器、迁移学习、特征工程以及超参数调试等方面的知识。

谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了_第3张图片

《机器学习精讲》

作者: [加拿大] 安德烈·布可夫(Andriy Burkov)

译者: 韩江雷

书中既有数学公式,又有图解说明,一应俱全。 通过这本书,你将了解到机器学习是如何工作的。并可以在项目初期的头脑风暴阶段进行实践,比如评估机器学习是否适用于解决某个技术或业务问题,以及具体的解决思路。

译者有话说

我与“机器学习”的初次邂逅是在5年前,那时我刚刚决定于新加坡南洋理工大学攻读计算机博士学位。比起计算机学院的主流课程,如数据库、软件开发、嵌入式系统等,“机器学习”这个“新领域”既令人好奇,又让人望而生畏。当时,“学习”还没那么深度, “数据科学家”刚刚被《哈佛商业评论》宣布为“二十一世纪最吸引人的职业”。回头看来,差不多同一时间,“人工智能”正在为一次空前的崛起积累能量、蓄势待发。

我在新加坡南洋理工大学的研究项目属于工业界的应用问题,因此得以接触各种工业界数据和工具,并在研究工作中尝试部分机器学习模型。与此同时,与机器学习相关的各种文献、资料、开源项目在网络上大量涌现。

在本书之前,我接触过一些关于机器学习技术的教科书。这些书的共同特点是:深、厚、难。首先,它们普遍内容深奥,阅读门槛较高。严谨的论证和详细的数学推导,需要很强的理论基础才能看懂。其次,很多教科书篇幅动辄上千页,让刚入门的读者望而却步。最后,实现书中所介绍的算法所需要的工程量较大,很难快速应用于实际问题。

相比专业教科书,本书更像是一本科普读物,任何具备基本代数知识的读者都可以理解其大部分内容。本书篇幅较短、章节清晰,适合通读与精读。书中介绍的很多实用技巧也可以帮助读者快速上手实践。

对我个人来说,翻译一本专业著作是个全新的挑战。当时主要的考量有二:一方面,将原书内容翻译成另一种语言的过程,也是加深对各种技术概念的印象、在精读中发现新的视角和问题的过程;另一方面,随着越来越多的行业正加入人工智能的革新浪潮,对机器学习人才的需求会继续增加,我也希望通过自己的绵薄之力,让更多对机器学习感兴趣却又望而却步的中文读者接触到这本书。

初学者入门机器学习的第一个困难

对初学者来说,想要用机器学习来解决实际问题,面临的第一个问题就是——该如何根据具体问题选用适合的算法。这就需要考量数据的大小、质量和性质、可用计算时间、任务的紧迫性和数据的,新手小白往往会在这一步受阻。

异步君分享书中内容,为初学者在选择学习算法的时候提供了理论指导。

选择一个机器学习算法并不是一项轻松的任务。如果时间很充裕,我们应该试遍所有的算法。不过,一般情况下,我们解决一个问题的时间是有限的。在开始解决一个问题前,我们可以先回答几个问题,并根据答案缩小可选算法的范围,再试验于我们的数据。

l 可解释性

针对非技术性受众,我们的模型是否需要具有可解释性?很多准确度很高的学习算法都是所谓的“黑箱”算法。它们可以学得一个极少犯错的模型,但是做出一个特定预测的理由可能很难理解,更难解释。例如,神经网络模型和集成模型。

另外,由k近邻、线性回归或决策树算法生成的模型并不一定最准确,但它们预测的理由却很直截了当。

l 内存中vs.内存外

我们的数据集是否可以完全被载入服务器或个人计算机的内存中?如果可以,那么我们可选的算法范围比较大;否则,我们可能需要考虑使用增量学习算法(incremental learning algorithm),通过逐步增加数据来提高模型的表现。

l 特征数与样本数

我们的数据集中有多少训练样本?每个样本有多少个特征?有的算法可以处理大量样本以及百万级别的特征,包括神经网络和梯度下降(我们稍后具体考虑二者);有的算法容量就逊色得多,如SVM。

l 类型特征vs.数值特征

我们的数据是否只包含类型特征或只包含数值特征,还是两者混合?根据具体答案,有的算法可能无法直接应用于我们的数据集,需要先将类型特征转换为数值特征。

l 数据的非线性

我们的数据是否线性可分隔?或者是否可以用一个线性模型建模?如果是,使用线性核的SVM、对率或线性回归可能效果都不错;否则,深度神经网络或集成算法可能更适合。我们会在第6章、第7章中分别具体讲解这两种算法。

l 训练时间

我们希望一个学习算法花多少时间构建一个模型?神经网络的训练速度是出了名的慢。简单的算法,如对率回归、线性回归或决策树,都快得多。一些算法的专用库中整合了非常高效的实现方法。我们上网做些研究便可找到这些库。有的算法(如随机森林)可以借助多核处理器(CPU)的超强性能减少构建模型所需的时间。

l 预测时间

我们希望一个模型多快可以生成预测结果?模型是否会被用于需要超高吞吐量的生产环境?诸如SVM、线性回归、对率回归以及(一些)神经网络模型,预测速度特别快。其他的,比如k近邻、集成算法还有非常深或循环的神经网络,则相对较慢[2]。

如果我们不想凭空猜测哪一个算法用于我们的数据效果最好,一种很流行的选择方法是在验证集上测试。我们下面就会讲到。另一种方法是,如果使用scikit⁃learn库,我们可以使用它们的算法选择图,如图所示。

谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了_第4张图片

scikit⁃learn专用机器学习算法选择图

多位人工智能专家推荐

作者完成了一项非常重要但是难度巨大的任务——将所有机器学习内容浓缩到100多页的篇幅中。他选择的主题,无论从理论还是实践角度,都对从业者很有帮助。初学者阅读本书后,可以为读懂更多专业文献打好基础。

——Peter Norvig,谷歌研究主任

本书的篇幅很短,但涵盖了非常广泛的主题,作者并没有省略数学公式。我很欣赏作者用简洁的语言解释核心概念的能力。本书不仅能给入门者以帮助,还能为有一定机器学习基础的读者提供了一个全方位的视角。

——Aurélien Géron,高级AI工程师

这是一本精简的机器学习入门手册,我认为它将会成为学习者和从业者的重要参考资料。简短的篇幅使得读者可以快速读完本书。即使如此,本书也涵盖了机器学习的绝大部分内容,从经典的线性和对数概率回归,到现代的支持向量机、深度学习、提升法、随机森林等,本书详细介绍了这些方法。

阅读本书不需要深入了解数学、统计学或者编程知识。本书适合每一位刚开始接触机器学习的博士生阅读。本书通过代码诠释一些算法,所采用的Python语言是机器学习应用中常用的编程语言。如果你是机器学习的初学者,或者是想要扩充知识储备的从业者,我强烈推荐本书。

——Gareth James,南加州大学马歇尔商学院统计学教授

本书是为那些想要在工作中应用机器学习技术但又没有太多时间去学习的工程师量身打造的。

——Deepak Agarwal,LinkedIn人工智能副总监

一本很好的机器学习入门读物。

——Karolis Urbonas,Amazon数学科学主管

多希望在我读研究生刚接触机器学习时,能有这样的一本书。

——Chao Han,Lucidworks 研究开发主管、副总监

本书从第一页开始便省略细枝末节,直达主题,效果不错。

——Sujeet Varakhedi,eBay 工程主管

这本书有什么特色?

适合人群

首先,本书是为机器学习的初学者所量身打造的。随着外界与机器学习相关的各种文献、资料、开源项目在网络上大量涌现,那些想在工作中应用机器学习技术的工程师或者研究者,一方面受益于大量信息所带来的便利,另一方面却也时常因为信息量太大而不知从何入手。

通过阅读本书,初学者能够较全面地了解机器学习的基础知识,为理解该领域的复杂问题和进一步深入研究打好基础。与此同时,本书也为有从业经验的读者提供了多种自我进修的方向。作为一本工具书,它同样也适用于项目初期的头脑风暴阶段,比如评估机器学习是否适用于解决某个技术或业务问题,可以为这部分读者提供具体的解决思路。

谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了_第5张图片

《机器学习精讲》

作者: [加拿大] 安德烈·布可夫(Andriy Burkov)

译者: 韩江雷

图书特色

● 精简并直入主题——篇幅短小,从第一页开始便省略细枝末节,直达主题,仅用100页的内容读者就可以快速读完并掌握机器学习技术的精髓。

● 易读,适合初学者——阅读本书不需要深入了解数学、统计学或者编程知识。书中通过代码诠释了部分法,所采用的Python语言也是机器学习应用中常用的编程语言。非常适合机器学习的初学者,或者是想要扩充知识储备的从业者阅读学习。

● 配套网页——本书配有持续更新的网页,对书中内容进行补充,包括问答、代码、推荐阅读材 料、工具以及其他相关内容。扫描书中二维码即可查看。

● 全彩印刷——色彩丰富,阅读轻松。

-END-

今日福利

谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了_第6张图片

《机器学习精讲》

作者: [加拿大] 安德烈·布可夫(Andriy Burkov)

译者: 韩江雷

如何获得:访问【异步图书】微信公众号,在同名文章中 在看+参与话题留言+转发本文至朋友圈,1月15日,异步君将抽取2名读者赠送《机器学习精讲》。

今日互动话题:

“你了解过哪些机器学习的算法呢?”

你可能感兴趣的:(谷歌人工智能专家力荐!美亚4.5星,这本机器学习畅销书火了)