2023 年最值得阅读的三本数据科学书籍

2023 年要读的四本令人惊叹的数据科学书籍(如果你在 2022 年不读的话)。

2023 年最值得阅读的三本数据科学书籍_第1张图片

简介

2022对于全球机器学习社区来说,这真是令人惊叹的一年!许多期待已久的游戏已经或即将发布,包括历史经典的新版本。

在这篇文章中,我想与您分享我认为今年特别值得(不仅)阅读的三本 2022 年书籍。

你可以留言获得每本书相关的一系列链接,包括电子书硬拷贝免费拷贝代码存储库(如果有)。

1

概率机器学习:简介(2022 年版)

2023 年最值得阅读的三本数据科学书籍_第2张图片

Kevin Murphy (2022) 的“概率机器学习:简介”的扉页和封面。图片由您真实提供。

一种由麻省理工学院出版社出版的Kevin P. Murphy真正经典的新版本。

全新版本包含 Python 代码(在随附的存储库中),涵盖了从基本概率到图神经网络的无数主题。而且……所有主题都是从概率的角度呈现的!这本书长达 750 多页(不包括附录和参考资料),包含丰富的数学解释、有用的图表和启发性练习。

我喜欢墨菲的写作风格,即使他讨论复杂的话题,我也觉得它清晰而吸引人。这本书可能具有挑战性,但它也相当独立。无论何时需要更多背景,作者都会为我们提供有用的参考资料。这本书附带了一个极其丰富的参考书目,将近 33 页。

本书的续集——“概率机器学习:高级主题”——将深入探讨贝叶斯推理、生成模型、因果关系和结构发现等主题。就个人而言——我迫不及待地想要得到它!

如果你想拓宽、深化或组织你的统计和机器学习知识,《概率机器学习:简介》是一本很棒的书。如果您需要对某些主题进行复习,或者您正在努力对您在日常工作中使用的概念进行更深入的数学理解,这是一个极好的资源。它也是一个非常丰富的参考资料和鼓舞人心的代码来源。

对如何集成概率建模神经网络感兴趣?查看Python中关于概率神经网络的系列文章:

使用 TensorFlow Probability 对神经网络中的不确定性进行建模

2

Python 中的贝叶斯建模和计算

2023 年最值得阅读的三本数据科学书籍_第3张图片

Martin 等人的“Python 中的贝叶斯建模和计算”。(2022 年)。图片由您真实提供。

“Bayesian Modeling and Computation in Python ” 由Osvaldo A. Martin、Ravin Kumar和Junpeng Lao于 2022 年初由 CRC Press 出版。本书为您提供超过 380 页的精彩内容,包括丰富的附录和参考书目。

这是一个很好的资源,可以帮助您巩固有关贝叶斯推理和工作流程的知识。每章最后都附有实际例子和一套练习。这本书涵盖了贝叶斯推理、模型探索性分析、线性模型(包括分层和混合效应模型)、样条曲线、贝叶斯时间序列和回归树、端到端贝叶斯工作流程等基础知识。

建模的实际方面是本书的核心。丰富的视觉内容有助于建立对模型内部工作的直观理解,这在调试复杂架构的上下文中非常有用。

作者使用PyMC3 和TensorFlow Probability作为本书中的主要概率框架,并简要讨论了其他概率语言,如Stan和NumPyro。内容严重依赖ArviZ——一个用于对贝叶斯模型进行探索性分析的非凡 Python 库。该代码可在本书和随附的存储库中找到。

丰富的附录为我们提供了理论基础的坚实概述,但如果缺少某些内容,您可以随时参考 Kevin Murphy 的“概率机器学习:简介”。有趣的是,Kevin Murphy 为《Python 中的贝叶斯建模与计算》写了前言。两本书相得益彰,并行阅读是一种快乐的体验!

3

图形深度度学习

2023 年最值得阅读的三本数据科学书籍_第4张图片

Yao Ma & Jiliang Tang (2020) 的“图上的深度学习”。图片由您真实提供。

W这本书由马尧和唐继良撰写,王一奇、金伟、马尧和唐继良的中文版由剑桥大学出版社于 2021 年 9 月出版,是一本在图上使用深度学习技术的综合指南。

这本书涵盖了从图形和深度学习基础到图形神经网络 (GNN) 的高级主题的所有内容。作者为所讨论的概念提供了可靠、清晰的数学和直观的解释。您会发现这里讨论的 GCN、GAT 或 GraphSAGE 等流行架构以及不太流行(但绝对不是不那么有趣)的主题,例如图上的变分自动编码器。

这本书整齐地分为四个主要部分:(1)基础,(2)方法,(3)应用和(4)进展。您可能认为阅读它的最佳方式是遵循此结构,但根据您的背景和目标,作者提出的线性建议较少。这些建议具有……图表的形式:

2023 年最值得阅读的三本数据科学书籍_第5张图片

如何阅读马尧和唐继良的“图上的深度学习”(2020)。

这本书提供了 GNN 的坚实基础。如果您想更深入地研究给定的主题,每个部分的末尾都有一个非常有用的进一步阅读列表。

如果您想对您的 GNN 学习经验进行三角测量,可以查看或者联系我们获取Jure Leskovec的精彩系列讲座和关于 GNN 的精彩播放视频。

需要每本书的电子书硬拷贝免费拷贝代码存储库(如果有),可以关注我们私信获取。

你可能感兴趣的:(数据科学,python,大数据,算法)