图源来自Pexels
有人说,学AI意味着 30k 打头的月薪,有了”科学家”的虚名,赶上了工业革命的时髦。
但也有人说,这是人工智能撒下的弥天大谎,不然那些工业界的大牛学者为啥都离开?
众说纷纭,恐怕没有一个准确的说法让你信服吧,无论是趋利或是基于兴趣,最重要的还是自己的感受和选择,就像《漫谈人工智能》作者在书中写道的那样。
“
加入这个兴趣小组已经五年,我们五年前聚餐时在餐巾纸上画下的图谱计划没有丝毫进展,我知道这个行业(数据流的哲学研究)可能研究十年也不会前进一步,甚至有可能抱憾终生。而且随着我从一个学生渐渐变为一个职业科学家,我理想主义驱动的思考现在已越来越多的让位于务实主义的科研计划。我没什么抱怨,这是大多像我一样的中等资质的科学家必然经历的科研生命周期。
但希望看到这本书的你能关注我们,在茫茫宇宙的璀璨星河中,我们总想找到更多灵魂中燃烧着不可言说之火的人。
”这份书单结合各大高校AI专业的课程规划,分别从读者口碑,销量,行业影响力三方考量,从科普认知,到底理论实践,逐步拓宽你对AI的认知边界。希望,在这份书单里你能找到想要的答案。
历史回顾
获选第13届“文津图书奖”
获评“南方都市报2017年度十大好书”
有位大师说过,学科的历史就是学科本身。所以,要了解和理解一个学科,就要了解这个学科的历史。而且对于人工智能这一点又格外重要,因为人工智能是个众说纷纭、极有起伏、极富争议,极富哲理性,从而也极富故事性的学科。但是,要把人工智能的历史和背后的哲理讲得既准确又明白易懂,进一步还要有趣,那又是一项十分艰巨的任务。
这本书所提供的知识量实在有点惊人。我有个习惯,在阅读好书时凡遇感到重要之处就用颜色笔做上记号,所以我用过的书一般是不能作为二手书出售的。尼克的这本书,我一遍通读下来,再回头去看,竟已被我画的“惨不忍睹”。
当然,这也跟我的专业方向并非人工智能有关,但是不管怎么说我毕竟也是专门修过人工智能的研究生课程的,当年为拿学分和应付考试也啃过厚厚三本《人工智能手册》,再加堪称海量的“苛捐杂税”,也做过那些作业。
回首当年与尼克从学校出来分手之后的历程,尽管不时提醒自己可别埋头拉车也得抬头看路,但是触目所及只是自己所处山谷中的景色。而他却好像是在山顶俯瞰四周,并把山外的古往今来一一道来,让我受益匪浅。当然,车还得拉,但是却“睁眼看世界”了。这里我就不说青蛙和大鸟什么的了,因为那二者其实都是用来比喻大人物的。
书评原文:(浙大网新科技首席科学家毛德操)
https://mp.weixin.qq.com/s/mGMLsAHi_DGmQn7RqKz9Cw
机器学习从入门到实战
豆瓣评分8.6,俗称“西瓜书”
机器学习入门第一书
纯自学第一遍读最好不超过两月,读不懂的跳过去,不求甚解。对一个发展迅速、知识尚未固化、外延极广的学科,先搭建大体框架要紧,开头不要试图弄懂所有细节。否则要么两年下来仍懵懵懂懂,要么对少量内容有了解、其他无知,失去进一步学习中触类旁通的机会。像画油画一样,一层层往上刷,后面再细琢。
——以上来自周老师本人对学习“西瓜书”的一些建议
豆瓣评分8.1
最易读的项目实验指导书
最近我和一对夫妇共进晚餐,他们问我从事什么职业,我回应道:“机器学习。”妻子回头问丈夫:“亲爱的,什么是机器学习?”她的丈夫答道:“T-800型终结者。”在《终结者》系列电影中,T-800是人工智能技术的反面样板工程。不过,这位朋友对机器学习的理解还是有所偏差的。
——《机器学习实战》第一章
这本书能让你明白:
那些被吹捧得出神入化的分类算法,竟然实现起来如此简单;
那些看是高深的数学理论,其实一句话就能道明其本质;
一切复杂的事物,出发点都是非常简单的想法。
我说不出这本书适合什么样的读者,但是却明白它不适合谁:
学过一点机器学习或者模式识别或者数据挖掘,完全不具备统计推断和凸优化知识,又想找一条捷径,想从菜鸟摇身一变成大师的人;
对编程不感兴趣的人,或者没有动手实践习惯的人;
不喜欢独立思考,希望别人把答案摆在自己面前的人。
书评原文:
https://book.douban.com/review/6249619/
理论与实践兼备
TensorFlow最佳实践手册
精彩! 理论与实践兼备,Know-How、Know-What, Know-Why的优秀融合。作者功底深厚,横跨产学研。本书并不像学术书籍沉迷于公式和调参,也不像工程书籍沉醉于API的介绍和调用。
本书在介绍模型和包的同时,还介绍了模型背后的思想。让你看到,前人在解决现有模型存在的问题时,为了哪怕在外人看来微不足道的进步,都做了哪些漂亮的工作,提出了什么优美的解法。在拟合(偏差)和泛化(方差)间完美权衡,这只能是艺术。
"人脑是一个神奇的发现规律的系统,这意味着大脑非常容易发生过拟合"。"模型是观察的简化版本。简化意味着舍弃无法进行推广的表面细节。但是,要确定舍弃什么数据、保留什么数据,必须要做假设。如果不对数据做假设,就没有理由选择一个模型而不选另一个。这称作没有免费午餐(NFL)公理"。
书评原文:
https://book.douban.com/subject/26840215/comments/
从零开始学深度学习
本书最大的特点是“剖解”了深度学习的底层技术。正如美国物理学家理查德·费曼(Richard Phillips Feynman)所说:“What I cannot create, I do not understand.”只有创造一个东西,才算真正弄懂了一个问题。本书就是教你如何创建深度学习模型的一本书。并且,本书不使用任何现有的深度学习框架,尽可能仅使用最基本的数学知识和 Python 库,从零讲解深度学习核心问题的数学原理,从零创建一个经典的深度学习网络。
本书的日文版曾一度占据了东京大学校内书店(本乡校区)理工类图书的畅销书榜首。各类读者阅读本书,均可有所受益。对于非 AI 方向的技术人员,本书将大大降低入门深度学习的门槛;对于在校的大学生、研究生,本书不失为学习深度学习的一本好教材;即便是对于在工作中已经熟练使用框架开发各类深度学习模型的读者,也可以从本书中获得新的体会。
译者序:
https://www.ituring.com.cn/book/tupubarticle/21858
豆瓣评分9.6
Keras之父、Google人工智能研究员François Chollet著作
深度学习with python作为标题建议介绍深度学习使用Python编程语言和开源Keras库,它允许简单快速的原型设计。
关于这本书的伟大之处在于作者非常有吸引力,这使得本书非常易读。正因为如此,人工智能和深度学习的一些更具挑战性的方面的布局简单易懂。
本书还避免了数学符号,而是专注于通过代码片段(其中有30多个)解释概念。
在Python深度学习中, 你将从一开始就学习深度学习,你将学习所有关于图像分类模型,如何使用深度学习获取文本和序列,甚至可以学习如何使用神经网络生成文本和图像。
本书是为那些具有Python技能的人员编写的,但你不必在机器学习,Tensorflow或Keras方面有过任何经验。你也不需要先进的数学背景,只有基础的高中水平数学应该让你跟随和理解核心思想。
面向Java的深度学习入门书籍
与本综述中的其他书不同,本书重点介绍Deep Learning For Java(DL4J),它是用于训练和实施深度神经网络的Java框架/库。
现在大多数人工智能研究都是用Python进行的,因为快速原型开发通常更快,但随着更多组织(其中许多使用Java)拥抱AI,我们可能会看到更多的AI算法转向Java,如DL4J。
本书首先是关于深度学习的初学者书籍,但如果你已经具备Java或深度学习的经验,那么你可以直接查看示例。
如果你在深度学习方面没有经验,但是有丰富的Java经验,那么你应该从封面阅读。如果你根本不了解Java,那么我强烈推荐阅读其中一本 Java初学者书籍。
通过阅读本书,你将总体了解机器学习概念,特别关注深度学习。你将了解深度神经网络是如何从基础神经网络发展而来的,你还将了解一些深层网络架构,如卷积神经网络和循环神经网络。
如果你熟悉Hadoop和Spark,那么你将能够了解如何使用DL4J本身的这些技术。
零基础入门自然语言处理
手把手教你使用NLTK
NLP入门读物
记得2007年上半年,最初读到这本书的时候还是草稿,用了整个一个暑假来仔细研究这本书,现在已经和以前的有很大不同了!
如果你要是自然语言学或语言信息处理相关专业的学生,又对python与nltk感兴趣的话,就看这本书吧,可以当做入门读物来看,整本书即涉及到了语料库的操作,也对传统的基于规则的方法有所涉及。全书包括了分词(tokenization)、词性标注(POS)、语块(Chunk)标注、句法剖析与语义剖析等方面,是nlp中不错的一本实用教程。
当然缺点还是有的。算是鸡蛋挑骨头吧。首先、对理论介绍不够,这可能与本书实用性很强的写作风格有关,如果你要想了解更多的理论,可以看专门讲理论的书籍;其次、对中文介绍不多,bird好像是澳洲人……所以,如果各位要是想为中文信息处理做贡献的话,还是在看本书的同时,看看中文的paper吧,网上资料很多,不多说了;另外,这本书可能并不能涉及到NLTK中的全部模块与语料,所以在研究时,可借助NLTK的网站文档来学习。
这本书最早是作为NLTK的在线教程出现的,每次都随着NLTK的变化来改变,所以与NLTK关系很是“暧昧”,呵呵。总之,这本书可以说是学习NLTK的不二之选!
书评原文:
https://book.douban.com/review/2039313/
Java 与 Python 双实现
助你零起点上手自然语言处理
书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型;书中不是对他人开源代码的堆砌,而是工业级开发经验的分享。
我以 HanLP 作者的身份,从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。通过对多种算法的讲解和实现,比较各自的优缺点和适用场景。这些实现并非教学专用,而是生产级别的成熟代码,可以直接用于实际项目。
理解这些热门问题的算法之后,本书会引导你根据自己的项目需求拓展新功能,最终达到理论和实践上的同步入门。
书中还会穿插一些你在网络资料中难得一见的实现技巧,巧妙运用的话会成为你高效开发的秘诀。读完本书后,你不光会理解理论、掌握接口,还能成长为自然语言处理类库的设计者。
无论是书还是代码,我都坚持“递归深入”“延迟加载”(lazy loading)的思想,即只在使用的时候才去加载必要的资料。也就是说,全书是自顶而下循序渐进的:
你首先看到的是一个摸得着的实际问题,为了解决该问题才去接触一个具体方案;
为了理解这个方案,才会介绍必要的背景知识;
为了实现这个方案,才会介绍相关细节;
为了克服这个方案的问题,才会过渡到新的方案。
作者前言:
https://www.ituring.com.cn/book/tupubarticle/28289
编程与数学基础
一本书掌握深度学习数学基础知识
图解经典
神经网络运用的数学理论是非常简单的,基本上是比较基础的数学知识。然而,很多文献大量使用公式和专业术语,令人难以看透神经网络的本质,这对于今后人工智能的发展是莫大的不幸和障碍。本书作为人工智能的入门书,打破了这种障碍,让所有人都能够体会到神经网络的趣味性。是一本很友好的书,可读性很强。
书评原文:
https://mp.weixin.qq.com/s/mGMLsAHi_DGmQn7RqKz9Cw
久负盛名的Python入门经典
中文版累计销量200 000+册
真的很好的一本书,该说的说得清楚,不该说的轻轻点到,读者想要网上查找的时候也有迹可循,轻重把握很好。
说说后面十个例子,的确不错,让人能快速有很好的理解。
建议阅读顺序:先看个最前面,按照序言里面作者建议的,然后不管学没有学过,直接啃十个例子,什么不会再到前面查找,然后看一遍它的例子,动手敲一遍,然后合住书想,自己默写出来,理清逻辑,想清语法,搞清面向对象的设计思路...我就是这么搞得,效果不错,全书读完用了15天差不多。
加油,共勉。
书评原文:
https://book.douban.com/review/5542249/
本周图书特惠 7.31-8.1 天猫电竞节,限时2天
除《Python编程从入门到实践》
图灵全品类图书5折售!直达????