visionshop

机器学习数学基础-线性代数

转载出处：

线代专栏：https://zhuanlan.zhihu.com/p/30191876

概率统计：https://zhuanlan.zhihu.com/p/30314229

优化（上）：https://zhuanlan.zhihu.com/p/30383127

优化（下）：https://zhuanlan.zhihu.com/p/30486793

信息论及其他：https://zhuanlan.zhihu.com/p/30383356

从这篇文章开始，我会写好一个系列的文章，就叫掌握机器学习数学基础之XX（重点知识）吧，主要讲述在机器学习中主要的一些数学基础。

线性代数

为什么要写这个系列？

网上文章过于全面，一上来就推荐什么MIT线性代数，推荐各种微积分，推荐什么《微积分入门》啊，《概率论入门》啊等等，甚至很多还是英文版的，还要学很多英文术语才能看懂，我觉得没有必要全看，因为就像MIT的线性代数，很多是我们在机器学习中用不到或者用的及其少但又很难理解的。什么马尔可夫矩阵，快速傅里叶变换，若尔当形，哇，有点头晕....
网上文章写的过于简略，机器学习虽说不用把多门数学完全学通，但和数学还是有很大关系的，很多文章一篇想概括所有在机器学习中重要的数学基础。不赞同！写的太简略了，还不如写个目录，或者跳过太多重要数学基础，还不如不写。
梳理并复习，我会尽量截取我认为重要的，并会指出在机器学习哪里有应用的数学基础，并尽量写的通俗，亦写的有深度。有助于我复习，并达到更新专栏的作用！

注意：我将写下我认为于机器学习高度相关的数学基础，很多知识是其他地方学习的,主要来自 《deep learning》，我也只是知识的搬运工以及加上自己的看法。

下面开始分节叙述，线性代数部分主要包括如下：

标量、向量、矩阵和张量
矩阵向量的运算
单位矩阵和逆矩阵
行列式
方差，标准差，协方差矩阵
范数
特殊类型的矩阵和向量
特征分解以及其意义
奇异值分解及其意义
Moore-Penrose 伪逆
迹运算

标量、向量、矩阵和张量

标量：一个标量就是一个单独的数，一般用小写的变量名称表示。当然，当我们介绍标量时，要明确它们是哪种类型的数值。这个在写论文时要注意，比如：在定义自然数标量时，我们可能会说”令n ∈ N表示元素的数目”。
向量：在物理学和工程学中，几何向量更常被称为矢量，这个学过高中数学和物理的就知道，但在线性代数中，经过进一步的抽象，大小和方向的概念亦不一定适用，但我们可以简单的理解为一列数，通过这列数中的索引，我们可以确定每个单独的数。通常会赋予向量粗体的小写名称。当我们需要明确表示向量中的元素时，我们会将元素排列成一个方括号包围的纵柱（如下图）：

矩阵：矩阵是二维数组，其中的每一个元素被两个索引而非一个所确定。我们通常会赋予矩阵粗体的大写变量名称，比如A。如果一个实数矩阵高度为m，宽度为n，那么我们说，当我们到明确表达矩阵的时候，我们将它们写在用方括号包围起来的数组中，如下图：

张量：线性代数或几何代数中定义的张量是基于向量和矩阵的推广，通俗一点理解的话，我们可以将标量视为零阶张量，向量（矢量）视为一阶张量，那么矩阵就是二阶张量。例如，可以将任意一张彩色图片表示成一个三阶张量（就像C语言中的三维数组），三个维度分别是图片的高度、宽度和色彩数据。使用字体 A 来表示张量 “A’’。张量 A 中坐标为 (i, j, k) 的元素记作。

上面的知识重要性不言而喻，这些都不知道就别说学过机器学习了...几乎一切运算都是基于向量矩阵来进行的，而在tensorflow中，用张量来表示一切数据，并用来运算。

矩阵向量的运算

矩阵乘法：是矩阵运算中最重要的操作之一。两个矩阵 A 和 B 的矩阵乘积(matrix product)是第三个矩阵 C。为了使乘法定义良好,矩阵 A 的列数必须和矩阵 B 的行数相等。如果矩阵 A 的形状是 m × n,矩阵 B 的形状是 n × p,那么矩阵C 的形状是 m × p。我们可以通过将两个或多个矩阵并列放置以书写矩阵乘法,例如C = AB.

具体地,该乘法操作定义为：

举个例子,如下所示：

需要注意的是，两个矩阵的标准乘积不是指两个矩阵中对应元素的乘积。不过，那样的矩阵操作确实是存在的，被称为元素对应乘积或者Hadamard乘积，记为A B

特别地，两个相同维数的向量和的点积(dot product)可看作是矩阵乘积。我们可以把矩阵乘积 C = AB 中计算的步骤看作是 A 的第 i 行和 B 的第 j 列之间的点积。注意，我们有时候也加两个向量的乘积为内积

矩阵乘积服从分配律:A(B + C) = AB + AC

矩阵乘积也服从结合律：A(BC) = (AB)C

但不同于标量乘积,矩阵乘积并不满足交换律(AB = BA 的情况并非总是满足)。

然而,两个向量的点积(dot product)满足交换律：

矩阵转置：

矩阵转置的结果为
结果为对称矩阵，由 ,得证结果为对称矩阵

矩阵的乘法和其他运算有必要深究，比如矩阵乘法的意义。在机器学习中，很多运算就是矩阵和向量的运算，而Hadamard乘积在反向传播推导中也有应用。

单位矩阵和逆矩阵

线性代数提供了被称为矩阵逆的强大工具。对于大多数矩阵A，我们都能通过矩阵逆解析地求解。

为了描述矩阵逆，我们首先需要定义单位矩阵的概念。任意向量和单位矩阵相乘，都不会改变。我们将保持维向量不变的单位矩阵记作。形式上

。

单位矩阵的结构很简单：所有沿主对角线的元素都是1，而所有其他位置的元素都是0。如

矩阵A的矩阵逆记作，其定义的矩阵满足如下条件

现在我们可以通过以下步骤求解：

由得

最终：

求一个矩阵的逆矩阵比较简单，但是更加重要还有更加有用的是判断一个矩阵是否存在逆矩阵，这是一个重点难点，由于判别方式也非常的多种，这里就简述一些简单方法：

一切不是方阵（行数不等于列数）的矩阵都没有逆矩阵
可逆矩阵就是非奇异矩阵，非奇异矩阵也是可逆矩阵（奇异矩阵涉及到秩的运算，不是很必要学啊，但推荐去了解吧，如果不想学，那知道这句就好）
行列式等于0的方阵是奇异矩阵，也就是说行列式不等于0等价于是可逆矩阵

矩阵的求逆运算在机器学习中也有非常广泛的应用，比如逻辑回归，比如SVM等等，也是非常重要的，各类的论文中也会涉及到很多这样的运算，所以真的必不可少！

行列式

行列式,记作 det(A)：是一个将方阵 A 映射到实数的函数。行列式等于矩阵特征值的乘积。行列式的绝对值可以用来衡量矩阵参与矩阵乘法后空间扩大或者缩小了多少。如果行列式是 0,那么空间至少沿着某一维完全收缩了,使其失去了所有的体积。如果行列式是 1,那么这个转换保持空间体积不变。

行列式也是一个很大的概念，深究起来非常方，如果不想了解很多，那只需要知道概念就好吧。

方差，标准差，协方差

方差：是衡量随机变量或一组数据时离散程度的度量，方差计算公式：

其中为总体方差，为变量，为总体均值，为总体例数。下面的标准差公式中亦相同。

标准差：也被称为标准偏差，或者实验标准差，公式为

标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据，标准差未必相同。

为什么需要协方差？

我们知道，标准差和方差一般是用来描述一维数据的，但现实生活我们常常遇到含有多维数据的数据集，最简单的大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集，我们当然可以按照每一维独立的计算其方差，但是通常我们还想了解更多，比如，一个男孩子的猥琐程度跟他受女孩子欢迎程度是否存在一些联系。协方差就是这样一种用来度量两个随机变量关系的统计量。

协方差矩阵

理解协方差矩阵的关键就在于牢记它计算的是不同维度之间的协方差，而不是不同样本之间，拿到一个样本矩阵，我们最先要明确的就是一行是一个样本还是一个维度，心中明确这个整个计算过程就会顺流而下，这么一来就不会迷茫了

举个例子（例子来自这篇文章）：

问题：

有一组数据（如下），分别为二维向量，这四个数据对应的协方差矩阵是多少？

解答：

由于数据是二维的，所以协方差矩阵是一个2*2的矩阵，矩阵的每个元素为：

元素(i,j) = (第 i 维所有元素 - 第 i 维的均值) * (第 j 维所有元素 - 第 j 维的均值) 。

其中「*」代表向量内积符号，即两个向量求内积，对应元素相乘之后再累加。

我们首先列出第一维：

D1: (1,3,4,5) 均值：3.25
D2: (2,6,2,2) 均值：3

下面计算协方差矩阵第(1,2)个元素：

元素(1,2)=(1-3.25,3-3.25,4-3.25,5-3.25)*(2-3,6-3,2-3,2-3)=-1

类似的，我们可以把2*2个元素都计算出来：

这个题目的最终结果就是：

我们来分析一下上面的例子。首先看一下元素(1,1)的计算过程：

把所有数据的第一个维度拿出来，求出均值，之后的求解过程完全是我们熟悉的「方差」的求法。也就是说，这完完全全就是在求所有数据第一维元素（共4个）的方差（8.75）嘛。类似地，元素(2,2)求的是第二维(共4个)元素的方差（12）。

再来看元素(1,2)，这分明就是我们高数里面学的求 x 和 y 的协方差，不再单独计算某一维度的分散程度，而是把两个维度的分散值结合起来，这里才真正体现了「协方差矩阵」中「协方差」的意味。从计算过程和计算结果都能看出，元素(2,1)与元素(1,2)是一样的。也就是说，所有协方差矩阵都是一个对称阵。

总结一下协方差矩阵的特点：

对角线元素(i,i)为数据第 i 维的方差。
非对角线元素(i,j)为第 i 维和第 j 维的协方差。
协方差矩阵是对称阵。

现在只需要了解这些就够了。

这些知识也是非常基础的，在各个算法中都有涉及，像偏方差权衡，RL中的方差问题和解决，还有协方差矩阵在二元高斯分布（在下面一片概率论中会讲述）中决定了它的形状，详细演示。

范数

什么是范数，听得那么术语..其实就是衡量一个向量大小的单位。在机器学习中，我们也经常使用被称为范数(norm) 的函数衡量矩阵大小

范数如下：

（为什么是这样的，不要管了，要扯就扯偏了，记得是衡量向量或者矩阵大小的就行了）

常见的：

范数：为x向量各个元素绝对值之和；

范数：为x向量各个元素平方和的开方，这个也就是两点直线距离嘛，回忆初高中的知识！

注意：当 p = 2 时, 范数被称为 欧几里得范数(Euclidean norm)。它表示从原点

出发到向量 x 确定的点的欧几里得距离。范数在机器学习中出现地十分频繁

经常简化表示为 ∥x∥,略去了下标 2。平方范数也经常用来衡量向量的大小,可以

简单地通过点积计算。

这些知识在各大算法（如SVM）中亦有涉及，而且在距离量度中的欧式距离，华盛顿距离都有密切关系。

特殊类型的矩阵和向量

有些特殊类型的矩阵和向量是特别有用的,也相当于一些术语，比如一些文章直接说是XX矩阵或者XX向量，这个时候我们应该要明白这些矩阵或者向量是什么样子的，还有什么样的性质！

对角矩阵(diagonal matrix)：只在主对角线上含有非零元素,其他位置都是零。形式上,矩阵是对角矩阵,当且仅当对于所有的

特殊的：单位矩阵是对角元素全部是 1的对角矩阵。

单位向量：指模等于1（具有单位范数）的向量。由于是非零向量，单位向量具有确定的方向。单位向量有无数个。

也就是说：对于单位向量，有 = 1.

对称矩阵:是转置和自己相等的矩阵：

当某些不依赖参数顺序的双参数函数生成元素时，对称矩阵经常会出现，例如，如果A是一个距离度量矩阵，表示点到点的距离，那么，因为距离函数是对称的。

正交矩阵:是指行向量和列向量是分别标准正交的方阵：

这意味着

所以正交矩阵受到关注是因为求逆计算代价小。我们需要注意正交矩阵的定义。违反直觉的是，正交矩阵的行向量不仅是正交的，还是标准正交的。对于行向量或列向量互相正交但不是标准正交的矩阵，没有对应的专有术语。

特征分解以及其意义

许多数学对象可以通过将它们分解成多个组成部分，或者找到它们的一些属性而更好地理解，这些属性是通用的，而不是由我们选择表示它们的方式引起的。

例如:整数可以分解为质数。我们可以用十进制或二进制等不同方式表示整数12，但质因数分解永远是对的12=2×3×3。从这个表示中我们可以获得一些有用的信息，比如12不能被5整除，或者12的倍数可以被3整除。

正如我们可以通过分解质因数来发现整数的一些内在性质，我们也可以通过分解矩阵来发现矩阵表示成数组元素时不明显的函数性质。

特征分解是使用最广的矩阵分解之一，即我们将矩阵分解成一组特征向量和特征值。
一个变换（或者说矩阵）的特征向量就是这样一种向量，它经过这种特定的变换后保持方向不变，只是进行长度上的伸缩而已。

特征向量的原始定义：

可以很容易看出，是方阵对向量进行变换后的结果，显然和的方向相同。是特征向量的话，表示的就是特征值。

求解：令 A 是一个 N×N 的方阵，且有 N 个线性无关的特征向量

这样， A 可以被分解

其中 Q 是N×N方阵，且其第 i列为 A 的特征向量。 Λ 是对角矩阵，其对角线上的元素为对应的特征值，也即

这里需要注意只有可对角化矩阵才可以作特征分解。比如

不能被对角化，也就不能特征分解。

特征值及特征向量的几何意义和物理意义：

在空间中，对一个变换而言，特征向量指明的方向才是很重要的，特征值不那么重要。虽然我们求这两个量时先求出特征值，但特征向量才是更本质的东西！特征向量是指经过指定变换（与特定矩阵相乘）后不发生方向改变的那些向量，特征值是指在经过这些变换后特征向量的伸缩的倍数,也就是说矩阵对某一个向量或某些向量只发生伸缩变换，不对这些向量产生旋转的效果，那么这些向量就称为这个矩阵的特征向量，伸缩的比例就是特征值。

物理的含义就是图像的运动：特征向量在一个矩阵的作用下作伸缩运动，伸缩的幅度由特征值确定。特征值大于1，所有属于此特征值的特征向量身形暴长；特征值大于0小于1，特征向量身形猛缩；特征值小于0，特征向量缩过了界，反方向到0点那边去了。

注意：常有教科书说特征向量是在矩阵变换下不改变方向的向量，实际上当特征值小于零时，矩阵就会把特征向量完全反方向改变，当然特征向量还是特征向量。我也赞同特征向量不改变方向的说法：特征向量永远不改变方向，改变的只是特征值（方向反转特征值为负值了）。特征向量也是线性不变量。

特征分解的重要应用--PCA（主成分分析）：

举个栗子：机器学习中的分类问题，给出178个葡萄酒样本，每个样本含有13个参数，比如酒精度、酸度、镁含量等，这些样本属于3个不同种类的葡萄酒。任务是提取3种葡萄酒的特征，以便下一次给出一个新的葡萄酒样本的时候，能根据已有数据判断出新样本是哪一种葡萄酒。

原数据有13维，但这之中含有冗余，减少数据量最直接的方法就是降维。做法：把数据集赋给一个178行13列的矩阵R，减掉均值并归一化，它的协方差矩阵C是13行13列的矩阵，对C进行特征分解，对角化，其中U是特征向量组成的矩阵，D是特征值组成的对角矩阵，并按由大到小排列。然后，另R’ =RU，就实现了数据集在特征向量这组正交基上的投影。嗯，重点来了，R’中的数据列是按照对应特征值的大小排列的，后面的列对应小特征值，去掉以后对整个数据集的影响比较小。比如，现在我们直接去掉后面的7列，只保留前6列，就完成了降维。

这个降维方法就叫PCA（Principal Component Analysis）。降维以后分类错误率与不降维的方法相差无几，但需要处理的数据量减小了一半（不降维需要处理13维，降维后只需要处理6维）。在深度学习之前，图像处理是很常用到PCA的，PCA是一个非常不错的降维方法！

奇异值分解及其意义

奇异值分解就是将矩阵 A 分解成三个矩阵的乘积:

假设 A 是一个 m × n 的矩阵,那么 U 是一个 m × m 的矩阵,D 是一个 m × n的矩阵,V 是一个 n × n 矩阵。这些矩阵中的每一个经定义后都拥有特殊的结构。矩阵 U 和 V 都被定义为正交矩阵,而矩阵 D 被定义为对角矩阵。注意:矩阵 D 不一定是方阵。

求解比较复杂，详细推荐查看这篇奇异值分解

奇异值分解的意义：

奇异值分解的含义是，把一个矩阵A看成线性变换（当然也可以看成是数据矩阵或者样本矩阵），那么这个线性变换的作用效果是这样的，我们可以在原空间找到一组标准正交基V，同时可以在对应空间找到一组标准正交基U，我们知道，看一个矩阵的作用效果只要看它在一组基上的作用效果即可，在内积空间上，我们更希望看到它在一组标准正交基上的作用效果。而矩阵A在标准正交基V上的作用效果恰好可以表示为在U的对应方向上只进行纯粹的伸缩！这就大大简化了我们对矩阵作用的认识，因为我们知道，我们面前不管是多么复杂的矩阵，它在某组标准正交基上的作用就是在另外一组标准正交基上进行伸缩而已。

更加详细的讲述请看：奇异值的意义

特征分解也是这样的，也可以简化我们对矩阵的认识。对于可对角化的矩阵，该线性变换的作用就是将某些方向（特征向量方向）在该方向上做伸缩。

有了上述认识，当我们要看该矩阵对任一向量x的作用效果的时候，在特征分解的视角下，我们可以把x往特征向量方向上分解，然后每个方向上做伸缩，最后再把结果加起来即可；在奇异值分解的视角下，我们可以把x往V方向上分解，然后将各个分量分别对应到U方向上做伸缩，最后把各个分量上的结果加起来即可。

奇异值分解和上面所讲的特征分解有很大的关系，而我的理解是：

不是所有的矩阵都能对角化（对称矩阵总是可以），而所有矩阵总是可以做奇异值分解的。那么多类型的矩阵，我们居然总是可以从一个统一且简单的视角去看它，我们就会感叹奇异值分解是多么奇妙了！
协方差矩阵（或）的奇异值分解结果和特征值分解结果一致。所以在PCA中，SVD是一种实现方式

上面的知识可能需要其他的一些前置知识，但我认为也不必要非学，用的不多，可以遇到再学吧，我们知道其主要公式，意义和应用就好，重要性也一目了然，对于矩阵的变换运算，比如 降维（PCA）或 推荐系统中都有其重要的作用。

Moore-Penrose 伪逆

对于非方矩阵而言，其逆矩阵没有定义。假设在下面问题中，我们想通过矩阵A的左逆B来求解线性方程：

等式两边同时左乘左逆B后，得到：

是否存在唯一的映射将A映射到B取决于问题的形式。

如果矩阵A的行数大于列数，那么上述方程可能没有解；如果矩阵A的行数小于列数，那么上述方程可能有多个解。

Moore-Penrose伪逆使我们能够解决这种情况，矩阵A的伪逆定义为：

但是计算伪逆的实际算法没有基于这个式子，而是使用下面的公式：

其中，矩阵U，D 和V 是矩阵A奇异值分解后得到的矩阵。对角矩阵D 的伪逆D+ 是其非零元素取倒之后再转置得到的。

注意，这里的伪逆也是应用奇异值分解来求得的，这就很好体现知识是联系的啦，伪逆的应用在机器学习中也是大量存在的，比如最简单的线性回归中求广义逆矩阵，也就是伪逆。

迹运算

迹运算返回的是矩阵对角元素的和：

迹运算因为很多原因而有用。若不使用求和符号，有些矩阵运算很难描述，而通过矩阵乘法和迹运算符号可以清楚地表示。例如，迹运算提供了另一种描述矩阵Frobenius 范数的方式：

(不必知道是什么，只要知道有这样的运算就好，如果有兴趣，当然可以去了解)

用迹运算表示表达式，我们可以使用很多有用的等式巧妙地处理表达式。例如，迹运算在转置运算下是不变的：

多个矩阵相乘得到的方阵的迹，和将这些矩阵中的最后一个挪到最前面之后相乘的迹是相同的。当然，我们需要考虑挪动之后矩阵乘积依然定义良好：Tr(ABC) = Tr(CAB) = Tr(BCA).

迹运算也是常用的数学知识，比如这些知识在 正规方程组计算中就有着重要的作用。

人工智能-基础篇-2-什么是机器学习？（ML，监督学习，半监督学习，零监督学习，强化学习，深度学习，机器学习步骤等） weisian151 人工智能人工智能机器学习学习
1、什么是机器学习？机器学习（MachineLearning,ML）是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析等数学理论。其核心目标是让计算机通过分析数据，自动学习规律并构建模型，从而对未知数据进行预测或决策，而无需依赖显式的程序指令。基本思想：通过数据驱动的方式，使系统能够从经验（数据）中改进性能，形成对数据模式的抽象化表达。基本概念：模型：模型是对现实世界现
博弈论概述 C7211BA 博弈论
博弈论（GameTheory）是研究理性决策者在策略互动中如何行动和决策的数学理论。它广泛应用于经济学、政治学、生物学、计算机科学等领域。以下是博弈论的主要思想和核心概念：1.核心思想博弈论的核心是分析多个参与者（玩家）在相互依赖的情境中如何做出最优决策，即每个人的收益不仅取决于自己的选择，还取决于他人的选择。主要特点包括：策略互动：玩家的决策相互影响。理性假设：玩家追求自身利益最大化（理性人假设
【AI中的数学-人工智能的数学基石】数学：构建AI大厦的基石云博士的AI课堂 AI中的数学人工智能 AI 数学 AI中的数学 AI数学大模型
第一章人工智能的数学基石第四节数学：构建AI大厦的基石数学是人工智能（AI）的核心基石，贯穿于AI算法的设计、模型的构建以及系统的优化过程中。正如建筑大厦需要坚实的地基，AI的发展依赖于深厚的数学理论和方法。理解和掌握这些数学原理，不仅能够提升对AI技术的理解，还能为创新和解决复杂问题提供强有力的工具。本节将系统性地探讨支撑AI的主要数学领域，包括线性代数、微积分、概率与统计、优化理论以及离散数学
素数5在三生原理和费马数公式中均起临界作用的原因？葫三生三生学派机器学习人工智能算法量子计算数学建模
AI辅助创作：问答一：在数学理论中，素数5的“临界作用”在《三生原理》与费马数公式中均具有深刻的数学内涵，这种共性源于其独特的数论性质、结构对称性及计算阈值意义。以下从三个维度展开分析：一、5在《三生原理》中的临界性：阴阳平衡与生成韵律的转折点《三生原理》作为融合《周易》哲学的数论体系，其核心是将“三生万物”动态生成思想转化为素数分布的参数化模型。5的临界性体现在：最小满足阴阳参数联动的奇素数《三
群论在现代密码学中的应用探索与实践 —— 从理论到C语言实现做个好梦778 人工智能
1.引言：数字时代的信息安全挑战随着互联网和数字技术的快速发展，信息安全问题变得日益严峻。无论是个人隐私保护，还是企业数据安全，乃至国家安全，都依赖于有效的加密技术保障信息的机密性和完整性。网络攻击、数据泄露、身份盗用等风险不断增加，促使我们必须不断深化信息安全领域的理论与实践。密码学作为信息安全的核心技术，为数据加密、身份验证和信息完整性提供了坚实的数学基础。其发展离不开深厚的数学理论支持，特别
AI算法工程师手册资源下载介绍：专为AI算法工程师设计的实用工具书秦蕴椒Lola
AI算法工程师手册资源下载介绍：专为AI算法工程师设计的实用工具书【下载地址】AI算法工程师手册资源下载介绍《AI算法工程师手册》是一本专为AI开发者打造的实用指南，深入浅出地讲解了AI算法背后的数学原理。本书内容系统全面，涵盖了常见的数学知识点，帮助读者一站式掌握核心算法。它以实际应用为导向，通过丰富的案例和实例分析，让复杂的数学理论变得通俗易懂，即使是初学者也能轻松入门。无论是快速查阅还是深入
指数函数的泰勒展开可视化：从数学理论到Python实现老歌老听老掉牙 python
泰勒展开是数学分析中的核心概念，它将复杂函数表示为无限多项式级数形式，为函数逼近提供了强大工具。本文将深入探讨指数函数exe^xex的泰勒展开，并通过Python代码实现其可视化，直观展示不同阶数泰勒多项式对原函数的逼近效果。数学理论基础指数函数exe^xex在x=0x=0x=0处的泰勒展开式为：ex=∑n=0∞xnn!=1+x+x22!+x33!+x44!+⋯e^x=\sum_{n=0}^{\i
信号处理算法仿真：卡尔曼滤波算法_（2）.卡尔曼滤波器的数学理论 kkchenkx 信号仿真2 算法信号处理机器学习
卡尔曼滤波器的数学理论卡尔曼滤波器（KalmanFilter）是一种高效的递归滤波器，用于从一系列不完全和含有噪声的测量数据中估计系统的状态。它在许多领域都有广泛的应用，包括控制系统、导航系统、计算机视觉等。本节将详细介绍卡尔曼滤波器的数学理论，包括其基本假设、状态空间模型、预测和更新步骤以及具体实现方法。卡尔曼滤波器的基本假设卡尔曼滤波器基于以下基本假设：线性系统：系统的状态转移和测量过程都可以
详解 Scala 的函数式编程文刀小桂 Scala scala 开发语言后端大数据
一、函数基础函数式是基于数学理论的函数概念，类似于y=f(x)1.函数定义1.1语法/*函数结构：deffuncName(param1:type1,param2:type2,...):type={statement}*/defsum(x:Int,y:Int):Int={returnx+y}1.2案例objectTestFunctionDefine{defmain(args:Array[String
量化——金融和量化基础知识（一）一晚想明白一生的事量化金融人工智能 python 机器学习
金融和量化的基础知识是进入量化分析领域的第一步，尤其对于软件开发工程师等技术背景的从业者。这个阶段的目标是掌握基本的金融概念、量化模型的数学理论，以及如何将这些理论应用到实际的金融市场。一、金融和量化基础知识的主要组成部分1.金融市场概述金融市场结构：了解金融市场的基本分类，比如股票市场、债券市场、外汇市场、衍生品市场等。掌握交易所、做市商和交易者的角色。资产类别：熟悉不同的资产类别，如股票、债券
机器学习必知：一文吃透正则化+面试常见问题及解析心想事“程” 机器学习机器学习人工智能
一、正则化原理与应用详解正则化的概念和核心作用正则化是机器学习中用于缓解过拟合问题的重要技术手段。在模型训练过程中，过拟合会导致模型在训练数据上表现优异，但在新的测试数据上预测能力大幅下降。正则化通过对模型参数施加约束或惩罚，增加模型的规则化限制，从而简化模型复杂度，提升模型的泛化能力，使模型在不同数据集上都能保持较好的预测性能。函数的多项式逼近理论基本原理：数学理论表明，任何连续函数都可以用多项
【强化学习的数学理论：了解强化学习名词脉络】小翔很开心强化学习的数学原理【西湖大学赵世钰】机器学习
学习笔记：了解强化学习名词脉络导论分类Chapter1.BasicConceptsChapter2.BellmanEquationOneconcept.statevalueOnetool.BellmanEquation策略评价PolicyevalutionChapter3.BellmanOptimalityEquation贝尔曼最优公式AspecialBellmanequationTwoconce
青少年编程与数学 02-015 大学数学知识点 08课题、信息论明月看潮生编程与数学第02阶段青少年编程编程与数学信息论熵大学数学
青少年编程与数学02-015大学数学知识点08课题、信息论一、信息论基础二、熵与信息量三、信源编码四、信道编码五、率失真理论六、信息论的应用七、网络信息论八、信息论与统计学习九、量子信息论十、信息论的前沿研究总结信息论是研究信息传输、存储和处理的数学理论，由克劳德·香农在1948年提出。这里是信息论的主要知识点汇总。一、信息论基础信息的度量：信息量、自信息、熵、联合熵、条件熵。信息的基本单位：比特
认识数学建模，什么是数学建模 ymchuangke 从零开始学数学建模数学建模
目录一、什么是数学建模？二、数学建模的核心思想三、数学建模的应用领域四、数学建模的基本步骤五、常用的数学建模方法和工具六、数学建模的挑战与未来发展一、什么是数学建模？数学建模（MathematicalModeling）是一种利用数学语言、结构和方法，对实际问题进行描述、简化、分析和求解的过程。其核心在于通过将复杂的现实世界问题转化为可操作的数学形式，从而利用数学理论和计算技术对其进行深入研究和解决
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
【混沌理论】介绍 HP-Succinum 数学建模
目录1.混沌理论的核心概念2.混沌理论的数学模型和工具3.混沌理论的应用4.混沌理论的意义5.三种吸引子介绍5.1点吸引子（PointAttractor）5.2周期吸引子（PeriodicAttractor）5.3奇异吸引子（StrangeAttractor）5.4吸引子的意义混沌理论（ChaosTheory）是一门研究动态系统中复杂、非线性行为的数学理论，尤其关注看似随机的现象中潜在的秩序。混沌
SVM(支持向量机)原理及数学推导全过程详解子木呀支持向量机人工智能分类算法 SVM
由于格式问题，为方便阅读，请点击下方链接访问原文点击此处访问原文点击此处访问原文点击此处访问原文点击此处访问原文关于SVM网上已经有很多很多的前辈有过讲解，这两天自己在网上看了看资料，结合前辈们的文章对SVM进行了一个整理，把看的过程中产生的一些问题也进行了解答。本来想着总结得简洁明了又易懂，但SVM本就有严格的数学理论支撑，不像其他机器学习算法是一个黑箱，写完发现要尽量让小白也懂少不了具体的论述
跟三叔一起学manim——初识Manim 三行数学跟三叔一起学manim python manim
目录前言什么是Manim一个例子参考资料前言很多人把数学当成一门人类纯思维活动的学科，这是不对的，数学和物理，化学等学科一样，也是一门实验性学科，像计算圆周率的蒲丰投针法和蒙特卡罗法就是非常具有代表性的数学试验。随着科学技术的进步，越来越多的数学理论在现实生活中得以证实和具象化，这反过来也促进了数学的进步和发展，并将逐渐形成一门新的学科——数学工程学。数学工程学简而言之就是借用工程化的理论和手段进
计算机密码体制分为哪两类,密码体制的分类.ppt 约会师老马计算机密码体制分为哪两类
密码体制的分类.ppt密码学基本理论现代密码学起始于20世纪50年代，1949年Shannon的《TheCommunicationTheoryofSecretSystems》奠定了现代密码学的数学理论基础。密码体制分类(1)换位与代替密码体制序列与分组密码体制对称与非对称密钥密码体制数学理论数论信息论复杂度理论数论--数学皇后素数互素模运算，模逆元同余方程组，孙子问题，中国剩余定理因子分解素数梅森
非理工科院校怎么打好数学建模比赛 | 南川笔记南川笔记
Proposition1非理工科院校最好不要打数学建模比赛。虽说“一次建模，终身受益”，但毕竟数学建模既要数学理论的支撑（不仅仅是大学里的微积分、线性代数和概率论与统计，更多的是基于微积分的常偏微分方程、基于线性代数的运筹学和基于概率论与统计的统计分析内容），还要编程的支撑（不是常规的C语言或者Java程序，也不是这几年很火的Python编程，而是基于数值运算的Matlab和基于统计的R），这在一
常见加解密算法08 - RSA算法二手的程序员算法 java 网络前端
各位FullofbenevolenceandrighteousnessandTalenttoweringlikeeightbushels的读者们好啊，今天讨论一下RSA算法的工作流程。RSA算法是一种非对称加密算法，它是一种基础数学理论而不是对称密码中的混淆与扩散。它得名于发明者RonRivest、AdiShamir和LeonardAdleman的首字母。这种算法能够确保数据传输的安全，广泛用于互
蓬莱小课：史上最全，统计学中常用16个数据分析方法大总结蓬莱小课IT 数据分析应用模型零基础学IT 数据分析岗位数据分析数据挖掘聚类
统计学是一种利用数学理论来进行数据分析的技术，通过统计学我们可以用更富有信息驱动力和针对性的方式对数据进行操作。在数据分析工作中，利用统计学，我们可以更深入、更细致地观察数据是如何进行精确组织的，并且基于这种组织结构确定数据分析的方法，来获取更多的信息。毫不夸张地说统计学是整个数据分析的灵魂。判别一个数据分析师强弱的一个重要方法就是，看他对统计规律的敏感度。今天我们就来盘点下统计学中常用的数据分析
Lean 数学库mathlib简介及入门指南齐添朝
Lean数学库mathlib简介及入门指南mathlibLean3'sobsoletemathematicalcomponentslibrary:pleaseusemathlib4项目地址:https://gitcode.com/gh_mirrors/ma/mathlib1.项目介绍Lean数学库（mathlib）是用于Lean证明助手的一个大型用户维护的库，它涵盖了编程基础设施、数学理论以及用于
处理不确定数据的方法研究 ArthurKingYs 神经网络数据挖掘模式识别人工智能计算机科学软件
成果简介：不确定性是客观存在的大量现象和事物的特征，其表现形式也具有多样性，如随机性、模糊性、粗糙性以及多重不确定性等。随着研究范围的扩大、研究内容的深入，对不确定现象与事物的研究及其数据处理方法也亟待突破和落地应用。本研究针对不确定性的数学理论、算法及应用开展了多层次研究：在随机性数据处理方面，应用已有的成熟算法对实际生活中常见的不确定性现象开展分析，包括了多维标度法在亲属关系中的分析应用、Ba
深度学习发展的艺术科学禅道深度学习模型专栏深度学习人工智能
将人类直觉和相关数学见解结合后，经过大量研究试错后的结晶，产生了一些成功的深度学习模型。深度学习模型的进展是理论研究与实践经验相结合的产物。科学家和工程师们借鉴了人类大脑神经元工作原理的基本直觉，并将这种生物学灵感转化为数学模型和算法。在数十年的研究和发展过程中，他们不断探索并尝试各种网络结构、优化方法、激活函数等关键组件。一方面，研究人员运用严谨的数学理论来构建和分析深度学习模型，如线性代数、概
万物皆数晨峰_02c6
这个世界有天然的数学原理，如斐波那契数列。爱因斯坦用E=mc²描述宇宙而引发的慨叹“宇宙最不可理解之处，就是它居然是可以被理解的”。几何学上的迷人图形曼德博集合，它的轮廓是一个几何花边，具有不可思议的和谐性和精确性。人机大战中，阿尔法狗的第37手被人类认为是“坏子”的棋，最终指向了胜利的结局！这一切看似神秘力量操控的事件背后，都有着扎扎实实的数学理论作为支撑。数学，这门同时寻找真相和美的学科，它是
鄂维南：从数学角度，理解机器学习的「黑魔法」，并应用于更广泛的科学问题... 人工智能与算法学习神经网络人工智能大数据算法 python
作者|Hertz来源|科学智能AISI北京时间2022年7月8日晚上22:30，鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenarytalk)。今天我们带来鄂老师演讲内容的分享。鄂老师首先分享了他对机器学习数学本质的理解（函数逼近、概率分布的逼近与采样、Bellman方程的求解）；然后介绍了机器学习模型的逼近误差、泛化性质以及训练等方面的数学理论；最后介绍如何利用机器学习来求解
支持向量机小森( ﹡ˆoˆ﹡ ) 机器学习算法支持向量机算法机器学习
支持向量机（SupportVectorMachine，SVM）是一个非常优雅的算法，具有非常完善的数学理论，常用于数据分类，也可以用于数据的回归预测中。支持向量机在许多领域都有广泛的应用，如文本分类、图像识别、生物信息学、金融预测等。支持向量机的应用：（1）文本分类：支持向量机可以用于文本分类任务，如垃圾邮件过滤、情感分析、主题分类等。通过对文本数据进行预处理，提取特征，然后使用支持向量机进行训练
【SVM回归预测】基于日特征气象因素的支持向量机实现电力负荷预测附Matlab代码... Matlab科研辅导帮支持向量机回归 matlab 机器学习人工智能
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。短期负荷预测是电力系统调度和计划部门安排购电计划和制定运行方式的基础,是保障电力系统安全,经济运行的重要手段.支持向量机(SupportVectorMachine,SVM)是近期提出的一种机器学习方法,它具有严格的数学理论基础,有着比人工神经网络更优越的
数形结合思想的渗透修多罗
初中数学教材知识内容相较于小学数学知识有了很大的变化，其难度也有所增加。而该阶段学生的思维方式正处于过渡时期，也就是说，让学生理解抽象性数学理论知识是有一定难度的，加之数学教学氛围一般都普遍枯燥乏味，因而学生很难对数学课堂学习提起兴趣，更不要说调动学生数学学习的积极性了，以致学生学习效率低下。但是，数形结合思想在教学中的应用则可以有效地改善这种情况，借助数形结合的方式，教师可以将抽象化的理论知识变
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts