l7H9JA4

【留言送书】SIGAI创始人全新力作，程序员想要学好数学，从认真读这本书开始...

关注我们丨文末赠书

数学对于机器学习乃至整个人工智能的重要性是众所周知的，这是一个数学密集型的领域。无论你是做学术，还是从事产品研发等工程性的工作，它都是一道绕不过去的坎。

相信不少读者在学习《深度学习》、《统计学习方法》、《Pattern Recognition and Machine Learning》等经典教材以及阅读本领域论文、开源代码的时候都曾经为那些数学符号和公式、定理感到困惑和苦恼。数学是对大家掌握机器学习造成障碍的最主要原因之一，没有扎实的数学基础，真正掌握机器学习谈何容易？

如何解决机器学习领域的数学问题？打下坚实的数学基础，是很多初学者乃至进阶者关心的话题。我们把这个问题拆解成下面几个问题：

1. 为什么需要数学？

2. 机器学习究竟用到了哪些数学知识？

3. 如何掌握这些数学知识？

接下来我们将逐一解答这些问题，给出学好数学的一个合理方案。

作者：雷明

京东购5折

为什么需要数学

对于机器学习来说，上至理论层面如统计学习理论，下至典型的具体算法，在算法的推导与实现过程中，都大量的以数学作为工具。

01 机器学习算法离不开数学

机器学习的具体算法，包括有监督学习、无监督学习、半监督学习，以及强化学习，无不需要数学作为支撑。这表现在下面几个方面：

1. 算法模型的构造如假设函数（对于有监督学习）、策略函数（对于强化学习）需要数学。

2. 目标函数的构造需要数学，对于有监督学习、无监督学习、半监督学习、强化学习都是如此。如果构造出了目标函数，你就成功了一半。

3. 最优化问题的求解/训练算法的设计，需要数学，比如梯度下降法，牛顿法，拟牛顿法，SMO算法。

02 机器学习算法的理论分析需要数学

很多时候我们需要分析机器学习算法的特性和问题，并有针对性的给出一些解决方案。除了实验之外，最有力的工具就是理论分析，这通常依赖于数学。

以经典的万能逼近定理为例，我们如何证明多层神经网络能拟合闭区间上的任意连续函数？请看部分证明过程：

生成对抗网络（GAN）在训练过程中会出现令人讨厌的模式坍塌问题，为什么会出现这种问题？如何解决此问题？这同样需要从数学层面进行分析。

对有监督学习模型的泛化误差分析等任务，就更离不开数学。

03 机器学习的理论指导需要数学

除了少数从事偏理论方向学术研究的人，绝大部分人都不会去了解机器学习理论。但机器学习理论对这个领域具有提纲挈领的作用。它可以回答诸如下面一些基本的问题：

1. 什么样的任务是可以学习的？

2. 机器学习模型能够学习到何种程度，即在训练集，测试集上的误差上界是多少？

3. 模型假设与泛化误差上界存在何种关系？

这些晦涩的理论研究，更离不开数学这个工具。

04 做好“调参侠”也需要数学

你也许会说，我只需要调用开源库或使用开源软件，学会调参就够了。除非你是跨专业的人，只是偶尔把机器学习当做工具使用而不靠它吃饭，否则这种思想是要不得的。不掌握算法的原理尤其是某些数学知识，你恐怕连做“调参侠”都很困难。试看下面几个问题：

1. 梯度下降法中为什么需要学习率？

2. 梯度下降法能保证在每次迭代时目标函数值一定下降吗？随机梯度下降法呢？

3. 为什么在训练GAN时会有模式坍塌问题，如何解决？

4. 支持向量机中的惩罚因子C应该怎么设置？核函数该如何选择？

虽然现在有AutoML等自动化机器学习工具（如贝叶斯优化等算法）来实现自动调参，但在有些时候它们不一定能满足你的实际要求。

机器学习究竟用到了哪些数学知识

很多同学认为学了本科3门数学课-高等数学，线性代数，概率论与数理统计，就足以学好机器学习了，这种观点其实是不准确的。且不说最优化方法，随机过程等课程大部分人并没学过，即使是这3门课，机器学习中所用的数学知识也经常会超出工科乃至数学系教材的范畴。下面我们来一一分析。

01 微积分

微积分可以进一步分为一元函数微积分，多元函数微积分两部分，它是整个高等数学的基石。通常情况下，机器学习需要得到一个函数（模型或者说假设），既然是函数，那自然就离不开微积分了。它为我们研究函数的性质，包括单调性，凹凸性，以及极值提供了理论依据。同时它也是学习概率论、信息论、最优化方法等课程的基础。

总体来说，机器学习中所用的微积分知识，本科工科微积分教材基本上已经讲了，除了下面这些内容：

1. 上/下确界

2. 李普希茨连续性

3. 雅克比矩阵

4. Hessian矩阵

5. 多元函数的凹凸性

6. 多元函数的极值

7. 多元函数的泰勒公式

8. 多重积分的换元法

如果你真的学好了本科微积分，上面这些内容并不难理解。

02 线性代数

线性代数对于机器学习是至关重要的。机器学习算法的输入、输出、中间结果，通常为向量，矩阵，张量。使用线性代数可以简化问题的表达，用一个矩阵乘法，比写成多重求和要简洁明了得多。线性代数是学习后续数学课程的基础。它可以与微积分结合，研究多元函数的性质。线性代数在概率论中也被使用，比如随机向量，协方差矩阵。线性代数在图论中亦有应用-比如图的邻接矩阵，拉普拉斯矩阵。在随机过程中它同样有应用-比如状态转移矩阵。

机器学习中所用的线性代数知识，有不少超出了一般线性代数乃至高等代数教材的范畴，对于很多读者来说说陌生的。下面是典型的例子：

1. 向量的范数

2. 矩阵的范数

3. Householder变换

4. QR算法

5. 广义特征值

6. 瑞利商

7. 矩阵的条件数

8. 矩阵分解，包括Cholesky分解，QR分解，奇异值分解（SVD）

这些知识在教材和论文中频繁出现。

03 概率论

概率论对于机器学习来说也是至关重要的，这是一种重要的工具。如果将机器学习算法的输入、输出看作随机变量/向量，则可以用概率论的观点对问题进行建模。概率论的一个好处是可以对不确定性进行建模，这对于某些问题是非常有必要的。另外，它还可以挖掘变量之间的概率依赖关系，实现因果推理。概率论为某些随机算法-如蒙特卡洛算法，遗传算法，以及随机数生成算法-包括基本随机数生成，以及采样算法提供了理论依据和指导。最后，概率论也是信息论，随机过程的先导课程。

工科的概率论与数理统计教材，已经讲述了机器学习所需的大部分概率论知识，只有以下的知识点除外：

1. 条件独立性

2. Jensen不等式

3. 某些概率分布如多项分布，拉普拉斯分布，t分布等

4. 概率分布变换

5. 多维正态分布

6. 多维概率分布变换

7. 某些参数估计方法，包括最大后验概率估计，贝叶斯估计等

8. 随机数生成算法，包括逆变换采样，拒绝采样等算法

04 最优化方法

最优化方法在机器学习中处于中心地位，遗憾的是很多读者并没有系统的学过这门课程，包括线性规划，凸优化，非线性规划，在一般的数值分析课程中，只讲述了最优化方法的小部分内容。

几乎所有机器学习算法最后都归结于求解最优化问题，从而确定模型参数，或直接获得预测结果。前者的典型代表是有监督学习，通过最小化损失函数或优化其他类型的目标函数确定模型的参数；后者的典型代表是数据降维算法，通过优化某种目标函数确定降维后的结果，如主成分分析。

05 信息论

信息论是概率论的延伸，在机器学习与深度学习中通常用于构造目标函数，以及对算法进行理论分析与证明。这同样是很多读者没有学习过的课程。

在机器学习尤其是深度学习中，信息论的知识随处可见：

1. 某些决策树的训练过程中需要使用熵作为指标。

2. 在深度学习中经常会使用交叉熵，KL散度，JS散度，互信息等概念。

3. 变分推断的推导需要以KL散度为基础。

4. 距离度量学习，流形降维等算法也需要信息论的知识。

06 随机过程

随机过程同样是概率论的延伸，这也是大部分读者没有学习过的课程。它被广泛用于序列数据分析。在机器学习中，随机过程被用于概率图模型，强化学习建模，以及贝叶斯优化等问题。不理解马尔可夫过程，你将对MCMC采样算法一头雾水。

07 图论

图论似乎只有计算机相关专业在本科时学过，而且还不完整，比如谱图理论。在机器学习中，概率图模型是典型的图结构。流形降维算法与谱聚类算法均使用了谱图理论。神经网络的计算图也是图的典型代表，图神经网络作为一种新的深度学习模型，与图论也有密切的关系。因此补充图论的知识也是很有必要的。

在有些论文和问题上，可能使用了更高级的数学知识，包括微分几何，实变函数，泛函分析，拓扑学等，不过对一般人来说，这不是必要的，因此我们不做过多介绍。

《机器学习的数学》给你带来了什么

为了帮助机器学习乃至人工智能领域的读者扫清数学这一障碍，我们编写了《机器学习的数学》这本书。此书适用于下面的读者：

1. 可作为人工智能（智能科学与技术）、计算机、电子工程、自动化、数学等相关专业的教材与教学参考书；

2. 可用作人工智能领域的工程技术人员，如算法工程师、产品经理的参考书；

3. 广大数学与应用数学爱好者也可以阅读

下面来介绍本书的特点。

每满100减50元

点击封面购买

01 用最小的篇幅精确覆盖机器学习的数学

从前面已经看到，机器学习使用了至少7门课的数学知识，我们是否需要把这些课程完整的学习一遍？答案显然是否定的，对于绝大多数读者来说，时间和精力也不允许，且不说能不能完全学懂。

如何用最小的篇幅覆盖机器学习领域常用的数学知识，是我们在编写此书时考虑的第一个问题。对此，笔者结合自己在机器学习领域的背景知识进行了精心的设计，通过分析各机器学习算法，以及重要的理论所需的数学知识，我们最终圈定了一个合理的范围，并对章节和顺序进行了科学的设计。总体原则是：非必要的知识尽量不讲或少讲！下面请看这本书的完整目录：（????上下滑动查看）

第1 章一元函数微积分1

1．1 极限与连续 1

1．1．1 可数集与不可数集 1

1．1．2 数列的极限 3

1．1．3 函数的极限 7

1．1．4 函数的连续性与间断点 9

1．1．5 上确界与下确界 11

1．1．6 李普希茨连续性 12

1．1．7 无穷小量 13

1．2 导数与微分 14

1．2．1 一阶导数 14

1．2．2 机器学习中的常用函数 20

1．2．3 高阶导数 22

1．2．4 微分 24

1．2．5 导数与函数的单调性 25

1．2．6 极值判别法则 26

1．2．7 导数与函数的凹凸性 28

1．3 微分中值定理 29

1．3．1 罗尔中值定理 29

1．3．2 拉格朗日中值定理 29

1．3．3 柯西中值定理 31

1．4 泰勒公式 31

1．5 不定积分 33

1．5．1 不定积分的定义与性质 33

1．5．2 换元积分法 35

1．5．3 分部积分法 36

1．6 定积分 37

1．6．1 定积分的定义与性质 38

1．6．2 牛顿-莱布尼茨公式 39

1．6．3 定积分的计算 40

1．6．4 变上限积分 41

1．6．5 定积分的应用 42

1．6．6 广义积分 44

1．7 常微分方程 45

1．7．1 基本概念 45

1．7．2 一阶线性微分方程 46

第2 章线性代数与矩阵论49

2．1 向量及其运算 49

2．1．1 基本概念 49

2．1．2 基本运算 51

2．1．3 向量的范数 53

2．1．4 解析几何 55

2．1．5 线性相关性 57

2．1．6 向量空间 58

2．1．7 应用——线性回归 61

2．1．8 应用——线性分类器与支持

向量机 62

2．2 矩阵及其运算 65

2．2．1 基本概念 65

2．2．2 基本运算 67

2．2．3 逆矩阵 72

2．2．4 矩阵的范数 78

2．2．5 应用——人工神经网络 78

2．2．6 线性变换 81

2．3 行列式 82

2．3．1 行列式的定义与性质 83

2．3．2 计算方法 91

2．4 线性方程组 92

2．4．1 高斯消元法 92

2．4．2 齐次方程组 93

2．4．3 非齐次方程组 95

2．5 特征值与特征向量 97

2．5．1 特征值与特征向量 97

2．5．2 相似变换 105

2．5．3 正交变换 106

2．5．4 QR 算法 110

2．5．5 广义特征值 112

2．5．6 瑞利商 112

2．5．7 谱范数与特征值的关系 114

2．5．8 条件数 114

2．5．9 应用——谱归一化与谱正则化 115

2．6 二次型 116

2．6．1 基本概念 116

2．6．2 正定二次型与正定矩阵 116

2．6．3 标准型 119

2．7 矩阵分解 121

2．7．1 楚列斯基分解 121

2．7．2 QR 分解 123

2．7．3 特征值分解 127

2．7．4 奇异值分解 128

第3 章多元函数微积分133

3．1 偏导数 133

3．1．1 一阶偏导数 133

3．1．2 高阶偏导数 134

3．1．3 全微分 136

3．1．4 链式法则 136

3．2 梯度与方向导数 138

3．2．1 梯度 138

3．2．2 方向导数 139

3．2．3 应用——边缘检测与HOG

特征 139

3．3 黑塞矩阵 140

3．3．1 黑塞矩阵的定义与性质 141

3．3．2 凹凸性 141

3．3．3 极值判别法则 143

3．3．4 应用——最小二乘法 145

3．4 雅可比矩阵 146

3．4．1 雅可比矩阵的定义和性质 146

3．4．2 链式法则的矩阵形式 148

3．5 向量与矩阵求导 150

3．5．1 常用求导公式 150

3．5．2 应用——反向传播算法 154

3．6 微分算法 156

3．6．1 符号微分 156

3．6．2 数值微分 157

3．6．3 自动微分 158

3．7 泰勒公式 159

3．8 多重积分 161

3．8．1 二重积分 161

3．8．2 三重积分 164

3．8．3 n 重积分 167

3．9 无穷级数 170

3．9．1 常数项级数 170

3．9．2 函数项级数 173

第4 章最优化方法176

4．1 基本概念 176

4．1．1 问题定义 177

4．1．2 迭代法的基本思想 179

4．2 一阶优化算法 180

4．2．1 梯度下降法 180

4．2．2 最速下降法 183

4．2．3 梯度下降法的改进 184

4．2．4 随机梯度下降法 186

4．2．5 应用——人工神经网络 187

4．3 二阶优化算法 188

4．3．1 牛顿法 188

4．3．2 拟牛顿法 189

4．4 分治法 193

4．4．1 坐标下降法 193

4．4．2 SMO 算法 194

4．4．3 分阶段优化 195

4．4．4 应用——logistic 回归 196

4．5 凸优化问题 198

4．5．1 数值优化算法面临的问题 198

4．5．2 凸集 199

4．5．3 凸优化问题及其性质 200

4．5．4 机器学习中的凸优化问题 201

4．6 带约束的优化问题 202

4．6．1 拉格朗日乘数法 202

4．6．2 应用——线性判别分析 204

4．6．3 拉格朗日对偶 205

4．6．4 KKT 条件 208

4．6．5 应用——支持向量机 209

4．7 多目标优化问题 213

4．7．1 基本概念 213

4．7．2 求解算法 215

4．7．3 应用——多目标神经结构搜

索 215

4．8 泛函极值与变分法 216

4．8．1 泛函与变分 217

4．8．2 欧拉—拉格朗日方程 218

4．8．3 应用——证明两点之间直线

最短 220

4．9 目标函数的构造 221

4．9．1 有监督学习 221

4．9．2 无监督学习 224

4．9．3 强化学习 225

第5 章概率论228

5．1 随机事件与概率 229

5．1．1 随机事件概率 229

5．1．2 条件概率 233

5．1．3 全概率公式 234

5．1．4 贝叶斯公式 235

5．1．5 条件独立 236

5．2 随机变量 236

5．2．1 离散型随机变量 236

5．2．2 连续型随机变量 237

5．2．3 数学期望 240

5．2．4 方差与标准差 242

5．2．5 Jensen 不等式 243

5．3 常用概率分布 244

5．3．1 均匀分布 244

5．3．2 伯努利分布 246

5．3．3 二项分布 247

5．3．4 多项分布 248

5．3．5 几何分布 249

5．3．6 正态分布 250

5．3．7 t 分布 252

5．3．8 应用——颜色直方图 253

5．3．9 应用——贝叶斯分类器 254

5．4 分布变换 254

5．4．1 随机变量函数 254

5．4．2 逆变换采样算法 256

5．5 随机向量 258

5．5．1 离散型随机向量 258

5．5．2 连续型随机向量 260

5．5．3 数学期望 261

5．5．4 协方差 262

5．5．5 常用概率分布 265

5．5．6 分布变换 268

5．5．7 应用——高斯混合模型 269

5．6 极限定理 271

5．6．1 切比雪夫不等式 271

5．6．2 大数定律 271

5．6．3 中心极限定理 273

5．7 参数估计 273

5．7．1 最大似然估计 274

5．7．2 最大后验概率估计 276

5．7．3 贝叶斯估计 278

5．7．4 核密度估计 278

5．7．5 应用——logistic 回归 280

5．7．6 应用——EM 算法 282

5．7．7 应用——Mean Shift 算法 286

5．8 随机算法 288

5．8．1 基本随机数生成算法 288

5．8．2 遗传算法 290

5．8．3 蒙特卡洛算法 293

5．9 采样算法 295

5．9．1 拒绝采样 296

5．9．2 重要性采样 297

第6 章信息论298

6．1 熵与联合熵 298

6．1．1 信息量与熵 298

6．1．2 熵的性质 300

6．1．3 应用——决策树 302

6．1．4 联合熵 303

6．2 交叉熵 305

6．2．1 交叉熵的定义 306

6．2．2 交叉熵的性质 306

6．2．3 应用——softmax 回归 307

6．3 Kullback-Leibler 散度 309

6．3．1 KL 散度的定义 309

6．3．2 KL 散度的性质 311

6．3．3 与交叉熵的关系 312

6．3．4 应用——流形降维 312

6．3．5 应用——变分推断 313

6．4 Jensen-Shannon 散度 316

6．4．1 JS 散度的定义 316

6．4．2 JS 散度的性质 316

6．4．3 应用——生成对抗网络 317

6．5 互信息 320

6．5．1 互信息的定义 320

6．5．2 互信息的性质 321

6．5．3 与熵的关系 322

6．5．4 应用——特征选择 323

6．6 条件熵 324

6．6．1 条件熵定义 324

6．6．2 条件熵的性质 325

6．6．3 与熵以及互信息的关系 325

6．7 总结 326

第7 章随机过程328

7．1 马尔可夫过程 328

7．1．1 马尔可夫性 329

7．1．2 马尔可夫链的基本概念 330

7．1．3 状态的性质与分类 333

7．1．4 平稳分布与极限分布 337

7．1．5 细致平衡条件 342

7．1．6 应用——隐马尔可夫模型 343

7．1．7 应用——强化学习 345

7．2 马尔可夫链采样算法 348

7．2．1 基本马尔可夫链采样 349

7．2．2 MCMC 采样算法 349

7．2．3 Metropolis-Hastings 算法 351

7．2．4 Gibbs 算法 353

7．3 高斯过程 355

7．3．1 高斯过程性质 355

7．3．2 高斯过程回归 355

7．3．3 应用——贝叶斯优化 358

第8 章图论363

8．1 图的基本概念 363

8．1．1 基本概念 363

8．1．2 应用——计算图与自动微分 365

8．1．3 应用——概率图模型 370

8．1．4 邻接矩阵与加权度矩阵 371

8．1．5 应用——样本集的相似度图 372

8．2 若干特殊的图 373

8．2．1 联通图 373

8．2．2 二部图 374

8．2．3 应用——受限玻尔兹曼机 374

8．2．4 有向无环图 376

8．2．5 应用——神经结构搜索 376

8．3 重要的算法 380

8．3．1 遍历算法 380

8．3．2 最短路径算法 381

8．3．3 拓扑排序算法 382

8．4 谱图理论 384

8．4．1 拉普拉斯矩阵 385

8．4．2 归一化拉普拉斯矩阵 388

8．4．3 应用——流形降维 390

相信这一章节安排对于大部分读者来说是非常科学合理的，也极大地降低了大家的学习成本。下面是本书的总体章节结构图。

02 从机器学习的角度讲述数学，从数学的角度看待机器学习

专门的数学教材通常不会讲授机器学习的相关内容，而专门的机器学习教程又不会再去详细讲解数学知识，二者之间存在一个鸿沟。从更大的层面看，不知数学有何用，不知学了怎么用，是很多读者面临的一个问题。

针对这一问题，本书也给出了很好的答案：从机器学习的角度讲授数学，从数学的角度看待机器学习，这是本书的一大特色。这本书实现了机器学习与数学的无缝衔接。对于很多数学知识，我们会讲到它在机器学习中的应用，而对于很多机器学习算法，我们也会讲清它的数学原理，包括：

线性回归

线性分类器

人工神经网络

支持向量机

谱归一化与谱正则化

反向传播算法

微分算法

Logistic回归

Softmax回归

线性判别分析

多目标神经结构搜索

贝叶斯分类器

高斯混合模型

EM算法

最大后验概率估计，贝叶斯估计

核密度估计与mean shift算法

遗传算法

蒙特卡洛算法

采样算法

决策树

流形降维

变分推断

生成对抗网络

特征选择问题

隐马尔可夫模型

马尔可夫决策过程

马尔可夫链采样算法

贝叶斯优化

计算图与自动微分

概率图模型

受限玻尔兹曼机

神经结构搜索（NAS）

这些内容已经涵盖了机器学习，深度学习，强化学习的核心基础知识。读完本书，读者对机器学习算法也基本上也有了一个整体的理解。

03 让数学不再抽象

数学抽象难懂，是几乎所有读者都会面临的一个问题。如何把一些概念、理论清晰地讲述出来，是一个非常有挑战的问题。在这一方面，作者进行了大量的思考与设计，力求用浅显易懂的语言把晦涩的知识讲述清楚，并用实例和图表等形式把抽象的知识具象化，确保读者理解起来无困难。下面来看几个例子。

1. 使用图表等方式降低理解难度。

很多读者觉得反向传播算法不易理解，不清楚为什么要这样做，到底解决了什么问题。书中条理清晰地阐述了反向传播算法的原理，推导简洁而易懂，同时附以下面的图让读者理解算法的核心步骤与本质。

2. 使用实际例子降低理解难度

书中大量使用了在机器学习中、实际生活中的例子进行讲解，化抽象为具体。以马尔可夫决策过程为例。强化学习中的马尔可夫决策过程一直让很多读者觉得难解。相信很多读者会有下面的疑问：

1. 强化学习中为什么需要用马尔可夫决策过程进行建模？

2. 为什么需要用状态转移概率？

3. 为什么奖励函数与状态转移有关？

4. 确定性策略，非确定性策略到底是怎么回事？

书中对马尔可夫决策过程进行了清晰的阐述，并以人工降雨这种大家都能理解的生活例子进行说明。

3. 对难以理解的知识点有清晰、透彻的解释

机器学习中所用的数学知识，有不少是公认的难以理解的。比如正交变换，QR算法，奇异值分解，拟牛顿法，拉格朗日对偶，概率分布变换等。这些数学概念的定义，推导中的关键步骤，以及为何要这样做，在很多教材中并没有交代。本书对这些难点的讲解进行了精心的设计。

以Householder变换为例，它在矩阵分解、特征值计算等任务中具有重要的作用。不少读者在学习矩阵分析、数值分析等课程的时候可能会有这样的疑问：

1. 为什么用Householder变换可以将矩阵变换为近似对角的矩阵？

2. Householder变换的变换矩阵是怎样构造的，为什么要这么构造？

3. 为何不直接将对称矩阵变换为对角矩阵？

对于这些问题，本书都有清晰的交代。

4. 结合python程序，直观的给出数学结论的结果。

对于某些数学知识点，我们给出了python代码，让读者能够通过程序直接看到数学结论和结果，降低理解难度。

04 讲清难点问题-知细节

对于读者普遍感到难以理解的知识，如QR算法，矩阵分解，反向传播算法，拟牛顿法，支持向量机，拉格朗日对偶，EM算法，变分推断，MCMC采样算法，贝叶斯优化等，本书都有深入浅出的讲解。并给出详细的推理过程和应用实例。下面举例说明。

1. 拟牛顿法

2. 变分推断

3. 贝叶斯优化

05 理清整体知识节结构-观全局

在宏观层面，本书也对各章的知识结构进行了总结和梳理，让读者不仅能理解细节，更能知全局，从全局层面把握数学知识，加深理解。

下图是最优化方法的知识体系：

下图是信息论的知识体系：

本书配套的资源

为了帮助读者更高效地学习本书，本书后续将推出配套的讲解视频。为了帮助读者以及高校老师使用本书，特意配备了本书的PPT教学资源，将会免费公开。

本书目前已经在京东上线，点击封面直接购买

作者：雷明

本书的目标是帮助读者全面、系统地学习机器学习所必须的数学知识。全书由8章组成，力求精准、最小地覆盖机器学习的数学知识。包括微积分，线性代数与矩阵论，最优化方法，概率论，信息论，随机过程，以及图论。本书从机器学习的角度讲授这些数学知识，对它们在该领域的应用举例说明，使读者对某些抽象的数学知识和理论的实际应用有直观、具体的认识。本书内容紧凑，结构清晰，深入浅出，讲解详细。

本书的内容，可以看下图的简介（上下滑动查看）：

-END-

规则说明

*.规则说明：

1.所有参与送书活动的小伙伴必须加管理员微信号：L1592694212，或者扫描下方二维码，在活动截止前未加好友的为无效参与。

2.书籍送完为止，先到先得，数量有限，按实际公平情况寄送。
3.本次活动01月28日20:00截止，中奖名单会及时公布，第一时间送出礼物。
5.本次活动最终解释权归“机器学习算法工程师”公众号团队所有

玩法

：留言有奖

在文末留言，讲讲你和我们公众号的故事！

公众号留言区精彩评论将获得本书，

我会准时截图哦！加下方管理员二维码第一时间获取获奖信息！

感谢金主

博文视点

大力赞助本次活动

END

机器学习算法工程师

一个用心的公众号

戳阅读原文购书

你可能感兴趣的:(算法,概率论,机器学习,人工智能,深度学习)

【论文笔记ing】Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem Booksort online笔记论文论文阅读 transformer 深度学习
论文中使用一个PointerFormer模型编码器部分：可逆残差模型堆叠解码器部分：指针网络自回归对于一次任务而言，推理阶段：编码器部分：一次解码器部分：循环N次，直至任务结束在训练阶段，使用强化学习，对于一个N个节点的TSP实例，算法中会以不同的起点，跑N次，得到N个轨迹，以满足TSP的对称特性，表示这都是属于一个TSP问题的（真实）解然后会计算这样表示归一化奖励，得到一个advantage,然
【题解-Acwing】1057. 股票买卖 IV X CODE 算法练习题解算法动态规划状态机模型
题目：1057.股票买卖IV题目描述给定一个长度为NNN的数组，数组中的第iii个数字表示一个给定股票在第iii天的价格。设计一个算法来计算你所能获取的最大利润，你最多可以完成kkk笔交易。注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。一次买入卖出合为一笔交易。输入格式第一行包含整数NNN和kkk，表示数组的长度以及你可以完成的最大交易笔数。第二行包含NNN个不超过10000
大模型——什么是 Vibe Coding？从零开始学习 AI 辅助编程不二人生大模型学习人工智能大模型辅助编程
大模型——什么是VibeCoding？从零开始学习AI辅助编程VibeCoding：代码消失，直觉驱动的软件开发新浪潮？生成式人工智能的指数级增长正不断重塑各个行业，软件开发领域也不例外。大约在2025年初，一股源自美国硅谷的新思潮开始引起关注：开发者似乎可以借助AI工具，在几乎不直接编写代码的情况下构建产品。这种依赖直觉、跳脱传统编码苦役的开发方式，被赋予了一个颇具时代感的名字——VibeCod
Redis 分布式锁实现与实践佑瞻数据库与知识图谱 redis 分布式数据库
在分布式系统架构中，多个独立进程对共享资源的并发访问控制是常见需求，分布式锁作为解决这一问题的关键技术，在缓存更新、任务调度、库存管理等场景中发挥着重要作用。本文将从基础原理出发，详细阐述基于Redis的分布式锁实现方案，包括单实例模式与Redlock算法，并探讨其在实际应用中的关键考量。分布式锁核心概念分布式锁是一种跨进程、跨机器的同步机制，用于保证多个分布式节点对共享资源的互斥访问。一个可靠的
脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
【动手学深度学习】4.10 实战Kaggle比赛：预测房价 XiaoJ1234567 《动手学深度学习》深度学习人工智能
目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛.1）数据预处理读取数据importpandasaspdtrain_data=pd.read_csv('../data/kaggle_house_pred_train.csv')test_da
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个
专栏导读本专栏收录于《华为OD机试（JAVA）真题（B卷+A卷+C卷+D卷+E卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 华为OD机试 2025B卷
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
【全网首发】华为OD机试 2025B卷机考真题库清单（全真题库）含考点说明哪吒搬砖工逆袭Java架构师华为od java 2025B卷华为OD机试
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【2025B卷首发】华为OD机试真题+全流程解析+备考攻略+经验分享+Java最佳实现
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
后端领域的自然语言处理技术应用大厂资深架构师 Spring Boot 开发实战自然语言处理 easyui 人工智能 ai
后端领域的自然语言处理技术应用关键词：后端领域、自然语言处理、技术应用、算法原理、实际案例摘要：本文聚焦于后端领域中自然语言处理技术的应用。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述核心概念与联系，通过文本示意图和Mermaid流程图展示其原理和架构。详细讲解了核心算法原理并给出Python源代码示例，同时介绍了数学模型和公式。通过项目实战，展示代码实际案例并进行详细解释。分析了自然语
企业内网系统：从传统开发到智能赋能的进化之路飞算JavaAI开发助手科技人工智能大数据 java
在当今数字化浪潮中，企业内网系统作为支撑日常运营的核心基础设施，其开发效率与质量直接关系到企业的竞争力。传统开发模式下，程序员需要手动完成需求分析、架构设计、代码编写、测试调试等全流程工作，不仅耗时费力，还容易因人为疏忽导致质量隐患。而随着人工智能技术的突破性进展，以飞算JavaAI为代表的智能开发工具正在重塑企业内网系统的开发范式，为程序员提供从设计到落地的全链路智能支持。一、传统企业内网系统开
Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析一起搞IT吧数码相机算法数据结构人工智能 android 图像处理计算机视觉
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析目录一、libcvface_api.so数据结构详细注释解析一、libcvface_api.so数据结构详细注释解析///@brief人脸信息结构体typedefstructcv_face_t{cv_r
颠覆人机交互！多模态 AI Agents 大模型如何用 5 大模式开启智能新时代？
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列七颠覆人机交互！多模态AIAgents大模型如何用5大模式开启智能新时代？一、从“单一感知”到“多模态融合”：A
四、Actor-Critic Methods 沈夢昂志 DRL深度强化学习 python 深度学习
由于在看DRL论文中，很多公式都很难理解。因此最近在学习DRL的基本内容。再此说明，非常推荐B站“王树森老师的DRL强化学习”本文的图表及内容，都是基于王老师课程的后自行理解整理出的内容。目录A.书接上回1、Reinforce算法B.State-ValueFunctionC.PolicyNetWork（Actor）D.ActionValueNetwork(Critic)E.TraintheNeur
实操 SpringBoot+MCP！清风孤客 spring boot 后端 java 人工智能
引言随着人工智能的飞速发展，大语言模型(LLM)正在革命性地重塑用户与软件的交互范式。想象一下这样的场景：用户无需钻研复杂的API文档或者在繁琐的表单间来回切换，只需通过自然语言直接与系统对话——“帮我查找所有2023年出版的图书”、“创建一个新用户叫张三，邮箱是[email protected]”。这种直观、流畅的交互方式不仅能显著降低新用户的学习曲线，更能大幅削减B端系统的培训成本和实施
如何学习智能体搭建
如何学习智能体搭建前言随着人工智能的发展，智能体（Agent）成为自动化、交互式应用和自主决策系统中的核心角色。本书将从零基础出发，系统讲解智能体的基本原理、常见框架、实战搭建与进阶技巧，帮助你快速上手并应用于实际项目。目录智能体基础认知智能体的核心组成主流智能体开发框架本地智能体与云端智能体选型智能体的任务自动化与插件集成智能体的知识检索与上下文管理智能体的多模态扩展智能体安全与可控性智能体实战
板凳-------Mysql cookbook学习（十一--------4)
唐宇迪机器学习实战课程笔记https://blog.csdn.net/weixin_54338498/article/details/128818007?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ECtr-1-12881
Char Studio 使用入门：高效构建企业级对话系统的实战指南 charles666666 人工智能产品经理语言模型自然语言处理架构
数字化浪潮推动下，企业与用户的交互模式正经历深刻变革，对话系统作为核心交互手段，其重要性日益凸显。然而，众多企业在构建对话系统时，却深陷诸多困境，难以自拔。一、开篇痛点场景：企业对话系统开发的典型困境企业在自行开发对话系统时，往往面临预算超支、周期漫长以及维护成本居高不下等问题。开发团队需要投入大量时间和精力进行底层技术架构的搭建，例如自然语言处理算法的研究、对话逻辑的设计等，这不仅消耗了大量的人
AAAI—24—Main—paper（关于Multi—Modal的全部文章摘要）
我们生活在一个由多种模态（Multimodal）信息构成的世界，包括视觉信息、听觉信息、文本信息、嗅觉信息等等，当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态学习多模态机器学习旨在处理学习（视觉，听觉，语言等）不同模态融合交织的信息。下游任务（1）视觉问答1.视觉问答(visualquestionanswering,VQA).给予视觉输入(图像或视频),VQA代表了正确提供一个问题
神经网络初步学习3——数据与损失 X Y O 神经网络学习人工智能
一、传统机器学习与神经网络前言：该部分需要一定的机器学习与数学基础（很浅的基础），如果有不理解的地方可以自行查阅。（1）区别这里不妨以图像识别为例子：（1）在传统的机器学习视角中：我们需要人工手动去设置并提取我们的特征量，例如常见的SIFT、SURF和HOG等，随后需要我们选择合适的分类器（例如：SVM、KNN等分类器）,接着把我们的参数训练出来。（2）而在神经网络的视角中：我们只需要把图片喂给它
AI驱动的个人工作革命：基于DeepSeek构建全场景智能工作助理（含源代码+多应用场景） AI_DL_CODE DeepSeek深度应用人工智能 DeepSeek 个人智能助理 LangChain 任务自动化知识管理大模型应用
摘要：本文详细阐述基于DeepSeek大模型构建个人工作助理的完整技术方案，通过LangChain实现任务分解、知识检索与工具调用的智能协同。方案融合向量数据库、多模态交互与个性化学习算法，构建涵盖邮件处理、会议管理、文档生成等15大核心工作场景的自动化系统。文中提供可运行代码、完整部署指南及效能测试数据，实现邮件处理效率提升13倍、会议纪要生成时间缩短100%、任务安排错误率降低83%的显著优化
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
[特殊字符] AlphaGo：“神之一手”背后的智能革命与人机博弈新纪元大千AI助手人工智能 Python #OTHER 人工智能算法数据挖掘机器学习 alphago google 围棋
从围棋棋盘到科学前沿的通用人工智能范式突破本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与历史意义AlphaGo是由谷歌DeepMind团队开发的围棋人工智能程序，其里程碑意义在于：首破人类围棋壁垒：2016年以4:1击败世界冠军李世石九段，成为首个在完整对局中战胜人类顶尖棋手的AI。
PageRank：互联网的马尔可夫链平衡态大千AI助手人工智能 Python #OTHER 人工智能机器学习条件概率贝叶斯 PageRank 马尔科夫链 MC
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！PageRank算法本质上是一个在网页图上定义的离散时间马尔可夫链（DTMC），其核心思想是将网页间的链接关系转化为状态转移概率。以下是详细分析：一、马尔可夫链的核心要素在PageRank中的体现马尔可夫链要素PageRank对应数学描述状态空间网页集
MCMC：高维概率采样的“随机游走”艺术大千AI助手人工智能 Python #OTHER 人工智能数据挖掘机器学习算法 MCMC 马尔科夫概率论
MCMC（马尔可夫链蒙特卡洛）是一种从复杂概率分布中高效采样的核心算法，它解决了传统采样方法在高维空间中的“维度灾难”问题。以下是其技术本质、关键算法及实践的深度解析：本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、MCMC要解决的核心问题目标：从目标分布(π(x)\pi(\mathbf{x})
LeetCode 刷题：数据结构与算法的实战经验分享
LeetCode刷题：数据结构与算法的实战经验分享关键词：LeetCode、数据结构、算法、刷题经验、实战摘要：本文将围绕LeetCode刷题展开，深入探讨数据结构与算法在实际刷题过程中的应用。通过分享实战经验，帮助读者更好地理解和掌握数据结构与算法知识，提升解题能力。文章将从背景介绍入手，阐述刷题的目的和意义，接着详细解释核心概念，分析它们之间的关系，然后介绍核心算法原理和具体操作步骤，结合数学
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc