机器学习是近年来渐趋热门的一个领域,同时 Python 语言经过一段时间的发展也已逐渐成为主流的编程语言之一。本书结合了机器学习和 Python 语言两个热门的领域,通过利用两种核心的机器学习算法来将 Python 语言在数据分析方面的优势发挥到极致。
全书共有 10 章。第 1 章讲解了 Python 机器学习的生态系统,剩余 9 章介绍了众多与机器学习相关的算法,包括各类分类算法、数据可视化技术、推荐引擎等,主要包括机器学习在公寓、机票、IPO 市场、新闻源、内容推广、股票市场、图像、聊天机器人和推荐引擎等方面的应用。
本书适合 Python 程序员、数据分析人员、对算法感兴趣的读者、机器学习领域的从业人员及科研人员阅读。
Alexander T. Combs 是一位经验丰富的数据科学家、策略师和开发人员。他有金融数据抽取、自然语言处理和生成,以及定量和统计建模的背景。他目前是纽约沉浸式数据科学项目的一名全职资深讲师。
谈到为什么要翻译这本书,还是一段机缘巧合。那是2015年的下半年,当时我正在撰写自己的原创书籍《大数据架构商业之路:从业务需求到技术方案》。在那本书中,我希望结合一个创业的故事,展示各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析。其中,最挑战的部分莫过于案例的分析到技术方案,再到框架编码的逐步展开。因为之前对于这种写作模式没有相关的经验,让人很是苦恼。我也搜寻了市面上相关的中英文书籍,可惜并未发现特别好的范例作为参考。
一次偶然的机会,我在 Amazon.com 上发现了 Alexander T. Combs 的《Python Machine Learning Blueprints》。当时此书尚未出版,还是试读本。在阅读样章之后我发现这种写作模式就是我想要的,没有太多的理论和说教,而是结合我们日常生活都会经历的方方面面,包括房产、金融、旅游和电子商务等,提供了可以直接上手的教学内容,让读者可以身临其境,乐在其中,轻松了解机器学习的实用知识。这正是我想要学习的风格!于是我采纳了这种模式,并结合自己的项目经验,一口气完成了《大数据架构商业之路:从业务需求到技术方案》一书。上市之后,读者对这种理论和案例相结合的方式很是赞许。所以,我对《Python Machine Learning Blueprints》一书心存感激,对它何时上市也很是关注。
终于,2016年的7月底,该书的英文版正式发行。我迫不及待地阅读完了原版,和当初试读的感觉一样,这是一本很有创意的书,而且 Python 和机器学习都是最近几年的技术热点,如果能将这么棒的内容介绍给广大国内的读者,那是多么令人激动的事情!于是,我抱着试试看的心态,联系了人民邮电出版社的编辑陈冀康老师。很幸运,当时此书还没有译者,陈老师审阅我的试译稿之后也表示满意,于是我很荣幸地成为了此书的译者。
不过在翻译的过程中,我也发现了不少细节上的疑问,于是我主动联系了原书的作者 Alexander,他总是非常仔细地解答这些问题,使得我信心大增,可以确保译文尽可能地贴近原文。而编辑陈老师也对此举表示了充分的肯定。在此,我要对 Alexander 和陈老师的帮助表示衷心的感谢。当然,我也要感谢父母和妻儿的支持,为了此书,我陪伴你们的时间更少了,而你们丝毫没有怨言,让我可以安心地完成每次的写作。
在翻译此书的岁月中,Python、机器学习及其应用在国内外都获得了空前的关注,相关的社区也保持了非常好的活跃度,相信这个技术方向在将来还有很大的空间。希望本书能帮助到每一位热爱 Python 和机器学习的朋友,为中国的人工智能事业尽一份绵薄之力。如果您对本书中的技术细节感兴趣,可以通过如下渠道联系我,很期待和大家的互动和交流。
QQ 36638279
微信 18616692855
LinkedIn https://cn.linkedin.com/in/shuang790228
扫一扫就能微信联系作者:
个人
公众号
机器学习正在迅速成为数据驱动型世界的一个必备模块。许多不同的领域如机器人、医学、零售和出版等,都需要依赖这门技术。在这本书中,你将学习如何一步步构建真实的机器学习应用程序。
通过易于理解的项目,你将学习如何处理各种类型的数据,如何以及何时应用不同的机器学习技术,包括监督学习和无监督学习。
本书中的每个项目都同时提供了教学和实践。例如,你将学习如何使用聚类技术来发现低价的机票,以及如何使用线性回归找到一间便宜的公寓。本书以通俗易懂、简洁明了的方式,教你如何使用机器学习来收集、分析并操作大量的数据。
第1章,Python 机器学习的生态系统,深入 Python,它有一个深度活跃的开发者社区,而且许多开发者来自科学社区。这为 Python 提供了丰富的科学计算库。在本章中,我们将讨论这些关键库的特性以及如何准备你的环境,以最好地利用它们。
第2章,构建应用程序,发现低价的公寓,指导我们构建第一个机器学习应用程序,我们从一个最小但实际的例子开始:建设应用程序来识别低价的公寓。到本章结束,我们将创建一个应用程序,使得寻找合适的公寓变得更容易点。
第3章,构建应用程序,发现低价的机票,演示了如何构建应用程序来不断地监测票价。一旦出现异常价格,应用程序将提醒我们,可以快速采取行动。
第4章,使用逻辑回归预测 IPO 市场,展示了我们如何使用机器学习决定哪些 IPO 值得仔细研究,而哪些可以直接跳过。
第5章,创建自定义的新闻源,介绍如何构建一个系统,它会了解你对于新闻的品味,而且每天都可以为你提供个性化的新闻资讯。
第6章,预测你的内容是否会广为流传,检查一些被大家广泛分享的内容,并试图找到这种内容相对于其他人们不愿分享的内容有哪些特点。
第7章,使用机器学习预测股票市场,讨论如何构建和测试交易策略。当你试图设计属于自己的系统时,有无数的陷阱要避免,这是一个几乎不可能完成的任务。但是,这个过程有很多的乐趣,而且有的时候,它甚至可以帮你盈利。
第8章,建立图像相似度的引擎,帮助你构建高级的、基于图像的深度学习应用。我们还将涵盖深度学习的算法来了解为什么它们是如此的重要,以及为什么它们成为了最近研究的热点。
第9章,打造聊天机器人,演示如何从头构建一个聊天机器人。读完之后,你将了解更多关于该领域的历史及其未来前景。
第10章,构建推荐引擎,探讨不同类型的推荐系统。我们将看到它们在商业中是如何实现和运作的。我们还将实现自己的推荐引擎来查找 GitHub 资料库。
你需要的是 Python 3.x 和建立真实机器学习项目的渴望。你可以参考随本书的详细代码列表。
本书的目标读者包括了解数据科学的 Python 程序员、数据科学家、架构师,以及想要构建完整的、基于 Python 的机器学习系统的人员。
在这本书中,你会发现许多文本样式,以区分不同种类的信息。这里是某些样式的例子和它们的含义。
文本中的代码、数据库表名称、文件夹名称、文件名、文件扩展名、路径名、虚构的 URL、用户输入和 Twitter 句柄如下所示:“这点可以通过在我们的数据框上调用.corr()来实现。”
代码块的格式设置如下。
I LIKE TURTLES I feel like this whole turle thing could be a problem. What do you like about them?
任何命令行输入或输出的写法如下。
sp = pd.read_csv(r'/Users/alexcombs/Downloads/spy.csv')sp.sort_values('Date', inplace=True)
新术语和重要词语以粗体显示。
我们非常欢迎读者的反馈。让我们知道你对这本书有什么想法——你喜欢哪些内容或不喜欢哪些内容。读者的反馈对我们而言很重要,因为它有助于我们打造各种主题,而且让你获益更多。
对于一般的反馈,通过电子邮件 [email protected] 发送,并在消息的主题中提及书的标题。
如果你擅长某个专业的主题,并且你有兴趣撰写或合著一本书,请参阅我们的作者指南 www.packtpub.com/authors。
现在你是一名自豪的 Packt 书籍所有者,我们将做一些事情来帮助你从这次购买中获得最大收益。
在 http://www.packtpub.com,你可以通过自己的账户来下载此书的示例代码文件。如果你在其他地方购买此书,你可以访问 http://www.packtpub.com/support 并注册,我们将文件直接发送给你。
你可以通过以下步骤下载代码文件。
1.使用你的电子邮件地址和密码登录或注册我们的网站。
2.将光标指针悬停在顶部的 SUPPORT 选项卡上。
3.单击 Code Downloads & Errata。
4.在搜索框 Search 中输入书籍的名称。
5.选择你要下载代码文件的图书。
6.在下拉菜单中,选择你在哪里购买的此书。
7.单击 Code Download。
在 Packt Publishing 的网站上,你也可以单击该书主页上的 Code Files 按钮来下载代码文件。可以在搜索框中输入图书的名称来访问其主页。请注意,你需要登录到你的 Packt 账户。
一旦文件下载完毕,请确保使用以下软件的最新版本来解压缩或提取文件夹。
Windows 版 WinRAR/7-Zip。
Mac 版 Zipeg/iZip/UnRarX。
Linux 版 7-Zip/PeaZip。
该书的代码包也托管在 GitHub 上:https://github.com/packtpublishing/pythonmachinelearningblueprints。我们还有丰富的来自其他书籍的代码包和视频,位于https://github.com/PacktPublishing/。去看一下吧!
虽然我们已经采取一切谨慎的措施,以确保内容的准确性,但错误在所难免。如果你在我们的书中发现一个错误——也许在正文中,也许在代码中——请向我们报告,我们将非常感激。这样,你可以让其他读者避免挫折,并帮助我们改进本书的后续版本。如果你发现任何错误,请访问这个链接进行报告:http://www.packtpub.com/submit-errata,选择你的书,单击 Errata Submission Form 链接,然后输入错误的详细信息。一旦此勘误通过验证,你的提交将被接受,勘误信息将被上传到我们的网站或添加到任何该主题 Errata 部分现有的勘误表。
要查看以前提交的勘误,请访问 https://www.packtpub.com/books/content/support 并在搜索字段中输入书籍的名称。所需信息将出现在 Errata 部分中。
在互联网上出现正版材料的盗版,是所有媒体面临的一个持续性的问题。在 Packt,我们非常重视版权和许可的保护。如果你在互联网上,发现我们作品任何形式的非法副本,请立即向我们提供地址或网站名称,以便我们请求补偿。
请通过 [email protected] 与我们联系,并提供疑似盗版材料的链接。
我们感谢你的帮助,这样可以保护我们的作者,并让我们继续为你提供宝贵的内容。
如果你对本书的任何方面有问题,可以通过 [email protected] 与我们联系,我们将尽最大努力解决这个问题。
阅读全文: http://gitbook.cn/gitchat/geekbook/5b95ed60780fdb5e97d395c5