pdcxs007

EM算法及高斯混合模型（含Mathematica实现代码）

- 高斯混合模型
- Jensens Inequality
- EM算法
- 混合高斯模型的EM算法
- 实现

模式识别课程中已经学习了EM算法和高斯混合模型，但是听课的时候感觉十分茫然，课程中乃至的概率论等内容和数学中的内容有些脱节，直接套用数学中的内容甚至会导致前后矛盾。课后反复研究之后，发现是不正规的甚至是错误的数学语言的使用导致的公式晦涩难懂。因此在此做一些笔记，努力让公式简单一些。

高斯混合模型

从一个例子说起。

一片树林中有A、B、C三种树木，每种树木的叶子的面积与最大宽度分别服从联合高斯分布（具体参数未知）。如何通过收集一定量的树叶（不知道这些树叶属于哪种树木），试对这些树叶进行分类，并估算出三种树木的联合高斯分布的参数。

首先要对这个例子进行数学描述。每个叶子可以用一个二维向量表示： x=(x1,x2) ，其中的 x1,x2 分别为树叶的面积和最大宽度。叶子属于哪种树用三维向量表示： z=(z1,z2,z3) ，其中， z1,z2,z3 中有且仅有一个为1，其余两个为0. z1 为1表示该树叶属于树木A， z2,z3 与此含义相同。总共采集了 m=100 片叶子，则第 i 片叶子记为 xi ，类别为 zi ，对于 zi ， z(i) 表示 zi 中第几个分量为1，比如，若 z5=(0,1,0) ，则 z(5)=2 。树A、B、C的树叶的分布分别为 N(μi,Σi),i=1,2,3 ，注意，其中的 μi 是一个二维向量， Σi 是一 2×2 的矩阵。

例如，以下Mathematica代码实现了500个示例数据的生成（三种树木的概率分别为0.2，0.3，0.5）：

图1 Mathematica代码，用于生成高斯混合模型的示例数据。

效果如图2所示：

图2 高斯混合模型示例数据

在了解了实际例子后，展示一下“官方”的高斯混合模型的定义，并指明其含混和错误的地方。

Suppose that we are given a training set {x(1),…,x(m)} as usual. Since we are in the unsupervised learning setting, these points do net come with any labels.

We wish to model the data by specifying a joint distribution p(x(i),z(i))=p(x(i)|z(i))p(z(i)) . Here, z(i)∼Multinomial(ϕ) , (where ϕj≥0,∑kj=1ϕj=1 , and parameter ϕj gives p(z(i)=j) ,) and x(i)|z(i)∼N(μj,Σj) . We let k denote the number of values that the z(i) ’s can take on. Thus our model posits that each x(i) was generated by randomly choosing z(i) from {1,…,k} , and then x(i) was drawn from one of k Gaussians depending on z(i) . This is called the mixture of Gaussians model.

大体一看会有很多难以理解的地方，这里做一下说明。首先，训练集用的是小写字体加目标的形式，不符合常理。且不加粗会误认为是标题，因此改用上文的方式，训练集记为： {x1,…,xm} ，第 k 个训练数据的各个分量记为 (xk1,xk2,…,xkc) （这里的 c 表示训练数据的维数，后面并没有用到）。

“官方文档”中的 z(i) 和 zi 是混用的。本身这两个变量是可以一一对应的，但是一个是标量一个是向量，太容易让人迷惑了，而且很多地方严格的来说是错误的。文中提到了一个多项式分布（Multinomial Distribution），这是一个怎样的分布呢？这是一个二项式分布的推广分布，对于一个实验，有 k 各可能的结果，各个结果发生的可能分别为 p1,…,pk ，进行了 n 次独立实验之后，这 k 个结果分别发生了 a1,…,ak 次的概率为：

p (a 1, \dots, a k; n, p 1, \dots, p k) = ⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ (n a 1 , \dots , a k) p a 1 1 \dots p a k k, 0, \sum i = 1 k a i = n otherwise

式中，

(na1,…,ak)=n!a1!…ak! 表示将

n 个物品分成

k 个组，每个组分别有

a1,…,ak 个物品的分组方式的总数目。当

k=2 时，多项式分布退化为二项式分布。

由此，可以注意到，多项式分布的变量显然是一个 k 维的变量，“官方文档”中说的 z(i) 服从多项式分布是错误的，且没有指明 n 这个参数。通过开始时候举的例子，可以看到，实际上应该这样说：

zi∼Multinomial(1,ϕ) ，其中， ϕ=(ϕi1,…,ϕik) ，其中的 ϕj 代表 xi 属于第 j 类（即 z(i)=j ）的概率。此时，显然有 ∑kj=1ϕj=1

当 n=1 时，总共进行了一次实验，因此在所有的实验结果中，有且仅有一种结果出现，这才是分类想要表达的内容。

另外，对于某个具体分类的数据，都服从联合高斯分布（因为数据一般是多维的）。这就是混合高斯模型了：有若干个分类，每一类都服从联合高斯分布，每次实验数据都是这些实验的结果，服从 n=1 的多项式分布。

Jensen’s Inequality

在介绍Jensen不等式之前，先要说明一下凸函数。凸函数的数学定义为，函数 f 的定义域为 X ，若 X 为凸集，且有：

f (t x 1 + (1 - t) x 2) \leq t f (x 1) + (1 - t) f (x 2), \forall x 1, x 2 \in X, \forall t \in [0, 1]

注意，凸函数的图像在直观的印象中是“凹”的，如下图：

图3 凸函数是“凹”的。

以上式子很容易的可以推广：

f (λ 1 x 1 + λ 2 x 2 + \dots + λ n x n) = f (\sum i = 1 n λ i x i) \leq \sum i = 1 n λ i f (x i), where \sum i = 1 n λ i = 1, λ i \geq 0, i = 1, \dots, n (1)

推广思路展示由2到3的推广，可以用归纳法得到一般情形。

f (λ 1 x 1 + λ 2 x 2 + λ 3 x 3) = f [λ 1 x 1 + (λ 2 + λ 3) (λ 2 λ 2 + λ 3 x 2 + λ 3 λ 2 + λ 3 x 3)] \leq λ 1 f (x 1) + (λ 2 + λ 3) f (λ 2 λ 2 + λ 3 x 2 + λ 3 λ 2 + λ 3 x 3) \leq λ 1 f (x 1) + (λ 2 + λ 3) [λ 2 λ 2 + λ 3 f (x 2) + λ 3 λ 2 + λ 3 f (x 3)] = λ 1 f (x 1) + λ 2 f (x 2) + λ 3 f (x 3)

式

(1) 即为Jensen不等式的离散形式，可以扩展至连续形式，为：

f (\int x p (x) d x) \leq \int f (x) p (x) d x (2)

(1) 式和

(2) 式可以统一记为：

f [E (X)] \leq E [f (X)] (3)

注意，

X 是一个随机变量，

E(X) 是

X 的期望，是一个数字，因此，

(3) 中的不等式左侧部分是很好理解的。比较难以理解的是

f(X) ，如果对于一个随机变量取函数值，隐含的意义是将这个随机变量的所有值通过函数映射成另一个值。由此，

f(X) 是一个随机变量，是点一些要注意，因此才有了对

f(X) 求期望的操作。比如，如果

X 是

[0,1] 是分布的均匀分布，且

f(x)=3x2+4 ，则

f(X) 是一个在

[4,7] 上的分布，具体概率密度可以通过概率变换公式得到，不在此处的讨论范围内。

f[E(X)]=f(0.5)=4.75 ，

E[f(X)]=∫10(3x2+4)⋅1dx=5 ,可以看到此时

(3) 式成立。

EM算法

现在的问题是，我们抽取到一堆叶子的数据，但是不知道这些抽取到的叶子分别属于哪种树木，同时也不知道各个树木树叶的面积与最大宽度的统计规律（只知道服从什么分布，如高斯分布，但不知道该分布的具体参数）。那么可以将每个叶子自动分类，并对各种树木的叶子的分布参数作出估计吗？

乍一听是很难完成的任务，如此多的未知量，如何进行估计？EM算法便是解决这样的问题。首先，假定数据各个类别的参数都已经知道，记为 θ （一般意义上， θ 是一个向量，如在例子中的3个 μ 与3个 Σ ）。那么给定一个 x ，便可以计算 x 发生的概率，给定一组 {x1,…,xm} ，就可以计算这组采样发生的概率为：

p (x 1; θ) p (x 2; θ) \dots p (x m; θ)

要分析这个概率的最大值，需要进行求导操作，而多个变量连乘的导数特别复杂，因此对这个连乘进行取对数运算，将乘法变换为加法，基于这种思路定义了Likelihood函数：

l (θ) = \sum i = 1 m ln p (x i; θ)

具体求

p(xi,θ) 时，都是利用了全概率公式，例如，在例子中，求一个采样数据出现的概率（在各个树木的高斯分布参数已知的前提下），就是分别计算如果其属于A种树木其出现的概率，如果其属于B种树木其出现的概率以及C种树木。所以，

l(θ) 可以进一步写为：

l (θ) = \sum i = 1 m ln \sum j = 1 k p (x i, z (i) = j; θ)

此时，对数函数内求和又使得问题变得非常复杂，因此，利用上文提到的Jensen不等式，注意这里是凹函数，不等号方向要改变。但是还不能直接使用，需要再做如下变形：

l (θ) = \sum i = 1 m ln \sum j = 1 k p (z (i) = j) p ( x i , z ( i ) = j ; θ ) p ( z ( i ) = j ) = \sum i = 1 m ln E (p ( x i , z ( i ) ; θ ) p ( z ( i ) ))

可以将

l(θ) 放缩并简化为：

l (θ) \geq \sum i = 1 m E (ln p ( x i , z ( i ) ; θ ) p ( z ( i ) )) = \sum i = 1 m \sum j = 1 k p (z (i) = j) ln p ( x i , z ( i ) ; θ ) p ( z ( i ) ) (4)

在上面的变换中，有一个不好理解的地方。我们将

p(xi,z(i);θ)p(z(i)) 看作是随机变量

z(i) 的函数，以前接触的随机变量函数中，只是对随机变量的取值作变换，而在对

l(θ) 的变换中，涉及到了随机变量在对应值处的概率。这实际上是没有问题的，概率其实可以看作是随机变量取值的一个函数，而函数的函数是复合函数，依然是一个函数，并不会对Jensen不等式产生影响。

注意，现在的假设是 θ 已知，而 p(z(i)) 是未知的。那么很自然的就会想到，通过猜测的方式，将 p(z(i)) 设置成合适的值，使得 l(θ) 尽可能大（也就是采样数据出现的可能性最大）。注意到 (4) 式的不等号中取得等号，当且仅当随机变量可能的取值只有1个（即为常数，记为 c ），则可以得到：

p ( x i , z ( i ) ; θ ) p ( z ( i ) ) = c p (z (i)) \propto p (x i, z (i); θ)

又因为

∑kj=1p(z(i)=j)=1 ，所以可以得到：

p (z (i) = j) = = = p ( x i , z ( i ) = j ; θ ) \sum k j = 1 p ( x i , z ( i ) = j ; θ ) p ( x i , z ( i ) = j ; θ ) p ( x i ; θ ) p (z (i) = j | x i; θ)

即，第

i 个观测样本属于

j 类的概率，定义为已知各个类别分布情况下(

θ 已知)，在

xi 发生的前提下，该样本属于

j 类的概率。

在确定了 p(zi) 后，可以反过来调整 θ 参数（因为这也是未知的），通过反复调整，可以逐渐得到最大的 l(θ) ，同时也就确定了各个观测值属于各个类型的概率以及各个类型分布参数的估计。

EM算法描述如下：

重复直到收敛 {

(E-Step) 对于每个观测值 xi ，令

$p (z (i) = j) : = p (z (i) = j | x i; θ), j = 1, \dots, k$

(M-Step) 令

$θ : = arg max θ \sum i = 1 m \sum j = 1 k p (z (i) = j) ln p ( x i , z ( i ) = j ; θ ) p ( z ( i ) = j )$

}

注意在重复开始前需要给 θ 赋一个初值。

EM算法能够保证收敛吗？假设 θt 和 θt+1 是两次连续的EM步骤产生的 θ 值，则可以证明 l(θt)≤l(θt+1) ，又因为 l(θ)≤0 ，所以有上界且单调递增，算法收敛。

l (θ t) = \sum i = 1 m \sum j = 1 k p t (z (i) = j) ln p ( x i , z ( i ) ; θ t ) p t ( z ( i ) = j )

且有：

l (θ t + 1) \geq \geq = \sum i = 1 m \sum j = 1 k p t (z (i) = j) ln p ( x i , z ( i ) ; θ t + 1 ) p t ( z ( i ) = j ) \sum i = 1 m \sum j = 1 k p t (z (i) = j) ln p ( x i , z ( i ) ; θ t ) p t ( z ( i ) = j ) l (θ t)

上式中的第一个不等式是因为E-Step对于

p(z(i)) 的最大化，第二个不等式是M-Step对于

θ 参数的最大化（参数最大化）。

混合高斯模型的EM算法

代入混合高斯模型后，EM算法中的计算公式都可以具体化。

E-Step是比较容易的，直接可以计算得到：

w i j = p (z (i) = j) = p ( z ( i ) = j , x i ; ϕ , μ j , Σ j ) \sum j = 1 k p ( z ( i ) = j , x i ; ϕ , μ j , Σ j )

在M-Step中，将

l(θ) 展开，得到：

= = \sum i = 1 m \sum j = 1 k p (z (i) = j) ln p ( x i , z ( i ) = j ; ϕ , μ j , Σ j ) p ( z ( i ) = j ) \sum i = 1 m \sum j = 1 k p (z (i) = j) ln p ( x i | z ( i ) = j ; μ j , Σ j ) p ( z ( i ) = j ; ϕ ) p ( z ( i ) = j ) \sum i = 1 m \sum j = 1 k w i j ln 1 ( 2 π ) n 2 | Σ j | 1 2 exp ( - 1 2 ( x i - μ j ) T Σ - 1 j ( x i - μ j ) ) \cdot ϕ j w i j

对

μj 求偏导，可以得到：

μ j = \sum m i = 1 w i j x i \sum m i = 1 w i j

ϕi 仅与

wij 有关，因此仅需要求以下式子即可：

max \sum i = 1 m \sum j = 1 k w i j ln ϕ j

又疏于

∑kj=1ϕj=1 ，所以构造拉格朗日算子，并最终得到：

ϕ j : = \sum m i = 1 w i j m

同理，对于

Σj ，有：

Σ j : = \sum m i = 1 w i j ( x i - μ j ) ( x i - μ j ) T \sum m i = 1 w i j

实现

初始值设置为： ϕ=(0.3,0.3,0.4),μ1=(0,0) , μ2=(1,0),μ3=(0,1) , Σ1=Σ2=Σ3=(1001) .

Mathematica代码实现如下：

源代码为：

Clear["`*"];
m = 1000;
\[Mu] = {{1.5, 1.5}, {3.5, 2.5}, {5.5, 1.5}};
\[Sigma] = {({
     {0.2, 0},
     {0, 0.2}
    }), ({
     {0.1, 0.05},
     {0.05, 0.1}
    }), ({
     {0.1, 0.08},
     {0.08, 0.2}
    })};
z = Table[t = RandomReal[]; Which[t < 0.2, 1, t < 0.5, 2, True, 3], m];
x = Table[
   RandomVariate[
    MultinormalDistribution[\[Mu][[z[[i]]]], \[Sigma][[z[[i]]]]]], {i,
     m}];
ListPlot[{Pick[x, z, 1], Pick[x, z, 2], Pick[x, z, 3]},
 PlotLegends -> Placed[{"A", "B", "C"}, {Right, Top}], 
 PlotMarkers -> Automatic]
guessPhi = {0.3, 0.3, 0.4};
guessMu = {{0, 0}, {1, 0}, {0, 1}};
guessSigma = {({
     {1, 0},
     {0, 1}
    }), ({
     {1, 0},
     {0, 1}
    }), ({
     {1, 0},
     {0, 1}
    })};
t = 1;
While[True,
  w = Table[Table[N@
       guessPhi[[j]] PDF[
        MultinormalDistribution[guessMu[[j]], guessSigma[[j]]], 
        x[[i]]]/Sum[
        guessPhi[[j]] PDF[
          MultinormalDistribution[guessMu[[j]], guessSigma[[j]]], 
          x[[i]]], {j, 1, 3}], {j, 1, 3}], {i, 1, m}];
  updateGuessMu = 
   Table[Sum[w[[i, j]] x[[i]], {i, 1, m}], {j, 1, 3}]/Total[w];
  updateGuessPhi = Total[w]/m;
  updateGuessSigma = 
   Table[Sum[
     w[[i, j]] Outer[Times, x[[i]] - updateGuessMu[[j]], 
        x[[i]] - updateGuessMu[[j]]]/Total[w[[All, j]]], {i, 1, 
      m}], {j, 1, 3}];
  (*Print[t,updateGuessMu,updateGuessPhi,updateGuessSigma];*)
  If[Fold[And, Thread[Flatten[updateGuessMu - guessMu] < 0.001]] && 
    Fold[And, Thread[Flatten[updateGuessPhi - guessPhi] < 0.001]] && 
    Fold[And, 
     Thread[Flatten[updateGuessSigma - guessSigma] < 0.001]], Break[]];
   guessMu = updateGuessMu;
  guessPhi = updateGuessPhi;
  guessSigma = updateGuessSigma;
  t = t + 1;
  ];
guessZ = Flatten@Table[Position[w[[i]], Max[w[[i]]]], {i, m}];
ListPlot[{Pick[x, guessZ, 1], Pick[x, guessZ, 2], Pick[x, guessZ, 3]},
  PlotLegends -> 
  Placed[{"Auto Class A", "Auto Class B", "Auto Class C"}, {Right, 
    Top}], PlotMarkers -> Automatic]
updateGuessMu
updateGuessPhi
Map[MatrixForm, updateGuessSigma, 1]

原始数据图像：

学习到的分类图像：

学习到的参数及原参数的对比：

注意，由于算法自动分类，类型B和类型C是反着的，不过不影响算法的使用。

以上就是EM算法与高斯混合模型的笔记啦。

【C++篇】排队的艺术：用生活场景讲解优先级队列的实现 far away4002 C++c++stl 优先级队列向下（向上）调整算法
文章目录须知欢迎讨论：如果你在学习过程中有任何问题或想法，欢迎在评论区留言，我们一起交流学习。你的支持是我继续创作的动力！点赞、收藏与分享：觉得这篇文章对你有帮助吗？别忘了点赞、收藏并分享给更多的小伙伴哦！你们的支持是我不断进步的动力！分享给更多人：如果你觉得这篇文章对你有帮助，欢迎分享给更多对C++感兴趣的朋友，让我们一起进步！深入理解与实现：C++优先级队列的模拟实现1.引言在算法和数据结构中
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
量子密码学技术架构解析与程序员视角算法
量子计算威胁模型分析传统公钥密码体系（RSA/ECC）的安全假设基于：大数分解问题的计算复杂度（RSA）椭圆曲线离散对数问题（ECC）有限域离散对数问题（DSA）Shor算法的时间复杂度为O((logN)^3)，当量子比特数达到阈值时：2048位RSA可在8小时内破解（理论值）ECC-256的破解时间将降至多项式级别Grover算法对对称密码的影响：AES-256的有效安全性降至2^128哈希函数
【初学者】请介绍一下线性与非线性的区别？ lisw05 计算科学线性代数图论数学建模
李升伟整理线性与非线性是数学和科学中常用的概念，主要区别如下：1.定义线性：系统或函数满足叠加性和齐次性。叠加性指输入的和导致输出的和，齐次性指输入按比例缩放时，输出也按相同比例缩放。非线性：不满足叠加性或齐次性的系统或函数。2.数学表达线性：形式为y=ax+b，其中a和b为常数。非线性：形式多样，如y=x2、y=sin(x)、y=ex等。3.图形表现线性：图形为直线。非线性：图形为曲线，如抛物线
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
什么是hessian矩阵红廉骑士兽矩阵线性代数算法机器学习 numpy
Hessian矩阵是一个数学概念，是用来表示函数关于其自变量的二阶偏导数的矩阵。它是一个实对称矩阵，对于多元函数来说，每一个元素是对应自变量关于该函数的二阶偏导数。Hessian矩阵在优化算法和最优化等领域有着重要的应用。
HPC综合-心得与笔记【19】 sakura_sea HPC and 3D Graphics Engine 线性规划
Dijkstra算法【2】基础距离数组dist，设置起点距离为0，其他节点距离为无穷大（∞）用最小堆创建优先队列，将起点放入队列。从队列中取出当前距离最小的节点u。遍历u的每个邻接节点v，计算从起点到v的路径长度：alt=dist[u]+weight(u,v)。如果altdist[u]:continue#遍历邻接节点forv,weightingraph[u].items():alt=dist[u]
Hessian 矩阵（海森矩阵） Chen_Chance 矩阵算法机器学习
Hessian矩阵（海森矩阵）是一个包含二阶偏导数信息的方阵，在数学和优化中起着重要作用。对于一个多元函数，其Hessian矩阵是由其各个变量的二阶偏导数组成的矩阵。假设有一个函数f(x1,x2,…,xn)f(x_1,x_2,\dots,x_n)f(x1,x2,…,xn)，其Hessian矩阵(H)的元素是：Hij=∂2f∂xi∂xjH_{ij}=\frac{\partial^2f}{\parti
高通成都linux engineer intern 一面面经 han_xue_feng java
题解|#KNN算法#在*******里有个叫《题解--2024华南理工校赛.pdf》的文件高通成都linuxengineerintern一面面经两个面试官共25min就结束了，面试氛围还可以，问的很快。1.自我介绍2.问对高通了解多少3.对牛客鼠人传（第四十四集，2024/4/22）刷题：尝试补昨天D，题解看了半天似懂非懂，遂放弃改天再补。做题老是把复杂的问题想简单，简单的问题想复京东物流管理培训
《算法笔记》9.4小节——数据结构专题(2)-＞二叉查找树（BST）问题 A: 二叉排序树圣保罗的大教堂《算法笔记》算法
题目描述输入一系列整数，建立二叉排序数，并进行前序，中序，后序遍历。输入输入第一行包括一个整数n(1#include#include#include#include#include#include#include#include#include#include#include#include#include#defineINF0x3f3f3f3f#definedb1(x)coutleft);Fre
js逆向第4例：猿人学1初识-送分题，AES算法魔改，md5算法魔改，环境检测我是花臂不花 js逆向100例 javascript 算法开发语言
第二届猿人学js逆向大赛，本以为送分题分分钟搞定，没想到第一题就这么难。查看请求存在token加密参数，接下就是打断点找到加密点破解直接进入下一步函数可以看到如下代码vare=Date['now'](),f=a('crypto-js'),g='666yuanrenxue66',h=f['AES']['encrypt'](e+String(d),g,{'mode':f['mode']['ECB'],
deepseek具体应用场景 ahyouxiang 人工智能
DeepSeek的具体应用场景非常广泛，涵盖了多个领域和行业。以下是基于证据的详细总结：金融领域DeepSeek在金融领域的应用表现突出，例如通过其大语言模型（如DeepSeekLLM67Bt）提供数学、逻辑推理等能力，帮助金融机构提升服务效率。此外，DeepSeek还被应用于智能安全体产品中，通过安全大模型实现个性化开发和优化。医疗领域在医疗领域，DeepSeek的技术被用于辅助诊断和患者记录管
【高考志愿】数学大雨淅淅程序人生高考
目录一、数学专业概述1.1学科特点1.2课程设置1.3学习方法1.4数学专业的分类二、就业前景三、填报建议四、注意事项五、数学专业排名一、数学专业概述1.1学科特点数学专业作为一门基础学科，具有高度的抽象性、逻辑性和精确性。它要求学生具备良好的数学基础、逻辑思维能力和解决问题的能力。因此，选择数学专业的学生需要有较强的数学兴趣和扎实的数学基础。1.2课程设置数学专业的课程设置通常包括数学分析、高等
五、AIGC大模型_08Agent基础知识学不会lostfound AI 人工智能 agent 不同生命周期的知识用AI处理 AIGC
0、概述根据知识的生命周期分类，我们通常会采取不同的方法（微调、RAG、Agent）来将知识融入到AI中0.1长生命周期知识这类知识通常具有较高的稳定性和通用性，不会因时间的推移而轻易改变。它们是知识体系中的“基石”，在较长时间内保持有效性和价值。特点：稳定性强：如数学定理、物理公式等，这些知识经过长期验证，具有高度的确定性和普适性基础性强：往往是学习和研究其他知识的基础，例如教科书中的基础知识更
谈高考真题的使用（数学） weixin_34116110 python 测试
2019独角兽企业重金招聘Python工程师标准>>>在高三数学复习中，大家常说“以本为本，以纲为纲，高考真题当主粮”，就是以教材内容为根本，以“考试大纲”为准绳，以高考真题的训练为主线；抓住了本，把握了纲，训练有的放矢，我们的复习就会事半功倍。高考数学试题难度相对稳定，考查形式的变化却是异彩纷呈，而变化中又有着一定的规律：全国试题与各省市试题的考试要求基本一致；题型除上海和江苏外，全国和其他各省
SMOTE算法的改进与扩展 Java 第一深情不平衡数据分类机器学习人工智能
一、SMOTE的改进算法1、Boderline-SMOTE只考虑分布在分类边界附近的少数类样本，并将其作为根样本首先通过k-NN方法将原始数据中的少数类样本划分成“Safe”、“Danger”和“Noise”3类，其中“Danger”类样本是指靠近分类边界的样本。对属于“Danger”类少数类样本进行过采样，可增加用于确定分类边界的少数类样本。这样做可以增加这些关键区域的少数类样本数量，使得模型在
DeepSeek的实际应用场景：AI技术如何赋能多领域创新 2501_91189350 人工智能
DeepSeek作为新一代智能技术平台，凭借其强大的算法能力和灵活的部署方式，正在多个行业掀起效率革命。本文将从真实案例出发，解析DeepSeek在不同场景中的落地应用。‌场景一：金融风控建模‌在信贷风险评估领域，传统模型存在数据维度单一、更新滞后等问题。某银行引入DeepSeek的‌动态特征工程模块‌，通过实时整合用户行为数据、社交网络信息等100+维度特征，成功将坏账识别准确率提升至98.5%
力扣算法Hot100——75. 颜色分类飞奔的马里奥算法 leetcode java
解法1：当然可以冒泡排序，时间复杂度O(n2n^2n2)解法2：单指针循环两次，第一次循环将所有的0交换到前面；第二次循环将所有的1交换到0的后面classSolution{publicvoidsortColorsBySinglePointer(int[]nums){intzeroCnt=0,p=0;for(inti=0;i
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
基于Docker 搭建Redis三主三从分布式集群 DBA学习之路 docker redis 容器
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、分布式系统规划二、准备配置文件1.创建redis集群目录三、启动Redis容器四、创建分布式系统1.创建集群2.查看节点信息总结前言提示：这里可以添加本文要记录的大概内容：本次搭建的为”三主三从“的分布式系统，分布式系统中节点存放的数据可以是不同的。当有数据写入请求到达分布式系统后，系统会采用虚拟槽分区算法将数据写入相
TikTokenizer 开源项目教程邱纳巧Gillian
TikTokenizer开源项目教程tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目介绍TikTokenizer是一个基于Python的开源项目，旨在提供一个高效、灵活的文本分词工具。该项目利用先进的算法和数据结构，能够快速准确地对文本进行分词处
洛谷P2678[NOIP2015]跳石头(二分算法) 猪猪成 C++笔记洛谷算法 c++
题目：AC通过图如下简短的AC代码如下：#include#includeusingnamespacestd;intmain(){intl,n,m;cin>>l>>n>>m;intarr[50001];intnow,left,right,mid;left=0;right=l;//给2位置变量初始化数值;for(inti=1;i>arr[i];}arr[0]=0;intsum;//记录搬走的石块总和;
《炫动漫》杂志社炫动漫杂志社炫动漫编辑部2024年第1期目录 QQ296078736 python
理论新知探究中职班主任德育能力提升策略(1)叶荣琳基于核心素养下以问题为驱动的高中数学教学评一体化的课堂教学探究(4)鹿园园农村初中英语作业设计与批阅方式的创新使用(7)侯成英新课改背景下初中物理教学方法创新策略探究(10)李传荣“双减”背景下构建初中数学高效课堂的策略(13)陈苏婷精神医学本科生参加心理剧团体课程的教学效果研究(16)查莉珺;王语含;陈虹;屈远;胡华提质增效：《机械识图》高职复习
宇树科技纯技能要求总结极梦网络无忧杂谈科技
一、嵌入式开发与硬件设计核心技能嵌入式开发：精通C/C++，熟悉STM32、ARM开发熟悉LinuxBSP开发及驱动框架（SPI/UART/USB/FLASH/Camera/GPS/LCD）掌握主流平台（英伟达、全志、瑞芯微等）硬件设计：精通数字/模拟电路设计，熟悉PCB绘制工具（Altium等）掌握MOS驱动电路、变压器设计及EMC优化熟悉制板/贴片流程及焊接扩展技能电机控制：熟悉有感FOC算法
链表操作：分区与回文判断共享家9527 数据结构数据结构 c语言开发语言 leetcode 链表
目录链表分区（Partition）功能概述代码实现要点与难点注意事项链表回文判断（PalindromeList）功能概述代码实现要点与难点注意事项总结在链表相关的算法问题中，理解链表的基本结构和操作至关重要。今天我们深入探讨两个经典的链表问题：链表分区和链表回文判断，通过详细分析代码实现，理解其中的要点、难点和注意事项。作者主页：共享家9527-CSDN博客链表分区（Partition）功能概述链
文本纠错（Text Correction） dundunmm 人工智能数据挖掘文本纠错人工智能数据挖掘文本纠错深度学习
文本纠错（TextCorrection）是自然语言处理（NLP）中的一个重要任务，旨在自动检测并修正文本中的错误，包括拼写、语法、语义等层面的错误。其核心目标是通过算法模型将错误文本转换为符合语言规范的表达。该任务在自动写作辅助、搜索引擎优化、智能客服、教育等多个领域具有广泛应用。输入：包含错误的原始文本（如“我明天要去北京，希望天汽好。”）输出：修正后的规范文本（如“我明天要去北京，希望天气好。
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
Tree of Thought Prompting（思维树提示）大数据追光猿大模型人工智能大数据深度学习语言模型计算机视觉
TreeofThoughtPrompting（思维树提示）是一种新兴的提示工程技术，旨在通过模拟人类解决问题时的多步推理过程，提升大型语言模型（LLM）在复杂任务中的表现。与传统的线性提示方法不同，思维树提示将问题分解为多个可能的推理路径，并以树状结构探索这些路径，从而找到最优解或生成更高质量的结果。这种方法特别适用于需要多步推理的任务，例如数学问题求解、逻辑推理、规划和创造性写作等场景。它结合了
halcon里3d平面度检测程序_激光三角测量法在工业视觉检测上的应用 jiago 王佳东fr
点击上方“3D视觉工坊”，选择“星标”干货第一时间送达激光三角测量法，是工业视觉领域较为常用也是比较容易理解的一种3D检测算法。本文主要从应用层次来阐述，包括相机和激光选型、搭接方式的优劣点分析、软件开发过程中的注意事项等。1.原理及演示将一条单线细激光光线投射到物体表面，由于物体表面高度发生变化，使得激光线发生了弯曲，根据这个线的变形，可以计算出精确的物体表面三维轮廓。如下图所示，基本组成结构有
并查集实现算法 C嘎嘎嵌入式开发算法算法服务器 c++
畅通工程2题目描述：某省调查城镇交通状况，得到现有城镇道路统计表，表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通（但不一定有直接的道路相连，只要互相间接通过道路可达即可）。问最少还需要建设多少条道路？输入描述：测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数，分别是城镇数目N(#include#include#include#includ
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

EM算法及高斯混合模型（含Mathematica实现代码）

高斯混合模型

Jensen’s Inequality

EM算法

混合高斯模型的EM算法

实现

你可能感兴趣的:(算法,数学随笔)