三翼鸟数字化技术团队

机器学习：手撕 EM 算法

本文首次发表于知乎，欢迎关注作者。

1. 前言

EM 算法是求解带有隐变量的最大似然估计的方法。常见的需要 EM 求解的模型有 GMM，HMM。甚至 K-mean 的迭代过程，也是 EM 的一个特例。本文尝试说明 EM 算法的基本原理，以及它在几个不同模型上的应用。学习 EM 的过程中比较曲折，经常出现” 翻开书，马冬梅；合上书，马冬啥” 的现象。对 EM 的理解一直不够深入，记得曾经老师对 EM 总结时说：EM 算法就像古代武林中的轻功，高手们左脚踩右脚，右脚踩左脚便不断的拔地而起了。当时理解不了这句话。整理出这篇文章，希望加深对 EM 的理解。文本尝试说明：

隐变量给 MLE 带来哪些困难；
EM 算法的主要原理，包括 EM 算法的动机，以及如何求解 E 步和 M 步；
解释 EM 算法中常见两种 q（z）形式为什么是等价；
用 EM 如何求解 GMM 模型；
解释为什么 k-meams 是 GMM 的特例；
用 EM 如何求解 HMM 模型；

如果不知道如何从 EM 的角度解释封面这张图，那么读完本文后，便知道封面这张图的含义了。

2. 隐变量给 MLE 带来的困难

在机器学习任务中，常常会遇到概率密度估计的任务：即给我们一个数据集，其中数据集中每个元素 x ∈，我们需要找到一个模型和模型的一组参数 θ，可以很好的描述数据集的概率密度 P（x|θ）。MLE（MaximumLikelihood Estimation）是解决这类问题的方法之一，MLE 将密度估计问题看做一个优化问题，然后搜索到模型的一组参数，使模型对数据的拟合达到最好：

θ* 表示最优的参数，l(D|θ) 表示数据集 D 的对数似然函数。实际求解时会对式 2-1 取负号变为 NLL（negative log likelihood），从而将最大化转化为最小化的问题，然后采用基梯度（gradient-based）的优化方法，求解出式 2-1 的一个局部极小点。这里为了叙述方便，我们以 MLE 的原始形式说明。

但是 MLE 有一个天然的限制，它适用于“完全可观测”的数据集，即数据集中的元素 x ∈ 包含了与问题相关的所有变量。与“完全可观测”数据集相对应的是“部分可观测”的数据集，即与问题相关的所有变量，只有部分变量是可观测的，存在一部分变量不可观测，其中不可观测的变量叫做隐变量。

当 MLE 遇到带有隐变量 z（ z∈ ）的数据集 D 时，优化问题转化为如下形式：

式 2-2 相当于引入隐变量 z，然后用全概率公式消掉参数 z。相比于式 2-1，在式 2-2 中 log 里面多出了对 z 的求和项（若 z 是连续变量，则是对 z 的积分），从而形成 logsum 的形式。因为 logsum 的出现，使式 2-2 不论在求和还是在=求导上，都会变得不方便计算。若是在计算过程中，不考虑隐变量 z，虽然避免了计算上的不便，但对于明确存在隐变量的问题，在求解时不去考虑隐变量，那么求出的 p（x|θ）效果也不会太好。

面对如式 2-2 这种不容易计算的 MLE 公式时，采用 EM 算法可以很方便的解决这个问题。

3. EM 算法的主要原理

3.1 EM 算法背后的动机

在介绍 EM 算法前，把式 2-2 中的 log-likelihood 提取出来：

为了方便说明，我们从数据集 D 中抽取一条数据 x，计算一条数据的 log-likelihood:

现在，我们假设存在一个关于隐变量 z 的概率质量分布 q（z）（如果是 z 是连续变量，则是概率密度函数），我们在式 3-4 中同时乘一个 q（z）和除一个 q（z），不改变结果：

在式 3-5 中 log 后面的部分可以看做是变量 $\frac{P(x,z|\theta )}{q(z)}$ 关于分布 q（z）的期望。这时，可以借用 Jenson’s inequality 在凹函数下形式"期望的函数大于等于函数的期望"，便可以将 log 放到 ∑ 内部：

式 3-6 中红色的部分有一个专有名字 ELBO（Evidence lower bound），即：

很容易看出 ELBO 是 $l(x|\theta )$ 的一个下界，即：

我们知道求解如式 3-4 这种 logsum 的形式比较困难，但求解式 3-7 这种 sumlog 的形式相对容易些。所以我们不再直接求解 log p（x|θ），而是通过最大化 $l(q|\theta )$ ，近似最大化 log p（x|θ）的值。这样优化问题也由原来：

转化为如下形式：

式 3-10 将最大化 ELBO 转化为两个子问题。第一个子问题，在 θ 固定的情况下，寻找一个 q（z）使 $L(q|\theta )$ 最大，这步这称作 Expectation Step，即 E 步：

第二个子问题固定 q（z），寻找一个 θ 使 $L(q|\theta )$ 最大，这步称作 Maximization Step，即 M 步：

这两个子问题不断循环迭代，直到 ELBO 收敛。

3.2 如何求解 q（z）

在求解 q（z）前，我们先进一步对 $L(q|\theta )$ 进行展开。由概率相关知识可知：

于是我们可以对 ELBO 进一步推导：

通过式 3-14 我们可以得到 $L(q|\theta )$ 和 log p（x|θ）的等式关系：

通过散度的定义我们知道 KL ≥ 0，结合式 3-15 我们知道当 KL = 0 时：

此时 $L(q|\theta )$ 取得最大值。由散度的相关知识可知，当

时，有：

这样我们便求解出 q（z）。

3.3 如何求解 θ

接下来在 $\hat{q}(z)$ 已知的情况下，如何求解 θ，为了方便区分我们将 $\hat{q}(z)$ 的参数用 $\theta ^{old}$ 表示。把 $L(q|\theta )$ 以另外一种方式展开：

式 3-18 第三行的第二项是 $\hat{q}(z)$ 的熵，它是一个常数量，与参数 θ 无关，所以可以舍去，得到第四行的表达式。第四行是“完全可观测”数据 log-likelihood 的表达式，所以可以用基于梯度的优化方法求解 θ。

3.4 EM 算法思路总结

首先带有隐变量的 log-likelihood 难以计算，EM 的思想是找到 log-likelihood 的下界 ELBO，然后通过最大化 ELBO，间接增大 log-likelihood。然后在增大 ELBO 的过程中，通过两步迭代计算。通过上面的叙述，我们可以看到，在 E 步：

式 3-19 是在 θ， x 已知的条件下，对隐变量的推断，这是推断过程。同理当已知 q（z），在 M 步我们求得：

式 3-20 是求解参数 θ 的过程，而且在求解过程中，必须求解“完全可观测”数据的 log-likelihood，这个过程叫做学习过程。其中我们将式 3-20 中的最大化项定义为 Q 函数，即：

式 3-21 表示“完全可观测”数据的 log-likelihood 相对于分布 q（z）的期望。

在有的文献中，会看到 $\hat{q}(z) = p(z,x| \theta )$ ，其实这种表述与式 3-19 等价。若将 ELBO 直接看成散度：

最大化式 3-22 便可以得到 $\hat{q}(z) = p(z,x|\theta)$ 。相应的 Q 函数变为

式 3-14 的推导过程相比式 3-22，不仅可以求出 q（z），而且还可以得到 ELBO 与 p（x|θ）的定量关系（如式 3-15 所示）。后面我们以 $\hat{q}(z) = p(z,x|\theta)$ 的表达形式说明。

图 3-1 经常出现在 EM 相关文档中，我们也借助图 3-1 来说明下 EM 过程。图中，横坐标是 θ 值，纵坐标是对数似然值。

4. EM 求解 GMM 模型

4.1 GMM 介绍

GMM（Gaussian Mixture Model）是由多个高斯分布组成的混合分布，我们需要求它的概率密度。它的参数有三类：

每个高斯模型占整体的比重，这是一个标量： $\pi=\{\pi_1,\pi_2,\pi_3,...,\pi_K\}$ ；
每个高斯模型的均值，它的维度和 x 的维度相同： $\mu=\{\mu_1,\mu_2,\mu_3,...,\mu_K\}$ ；
每个高斯模型的协方差矩阵： $\Sigma =\{\Sigma _1,\Sigma _2,\Sigma _3,...,\Sigma _K\}$ ；

其中 K 是高斯混合模型的个数。在 GMM 中，可观测数据是 x ∈ ，其中数据对应的隐变量的分布 q（z）记作，表示数据来自每个高斯分布的概率分布：

根据的定义，对于每一个数据点，我们有：

我们需要学习出一组参数 π， µ， Σ，估计出整体概率密度：

有可观测数据集 $D=\{x_1,x_2,x_3,...,x_K\}$ ，我们先计算下 GMM 的 log-likelihood:

可以看到 GMM 的 log-likelihood 式 4-27 化简出 log − sum 的形式，不方便直接计算。

4.2 求解 GMM

4.2.1 E 步

我们采用 EM 算法求解 GMM。根据 EM 算法，先初始化一组参数 $\theta ^0=\{\pi ^0,\mu ^0,\Sigma ^0\}$ ，先求隐变量的分布 q（z），E 步：

对应到 GMM 模型中，是数据来自各个高斯分布的概率分布。比如求来自第 k 个高斯分布的概率 :

在已知 $\theta ^{t-1}$ 时，由式 4-29 可以很容易的求出。

4.2.2 M 步

接下来我们计算 M 步，即已知 q（z）时，求解参数 θ：

对应到 GMM 中是已知，求解 {π， µ， Σ}，我们先计算 GMM 的完全数据的 log-likelihood 的期望 Q，为了更好的理解 GMM 解的含义，我们记作 Q 为整个数据集 D 上的完全数据的 log-likelihood 的期望：

因为数据集 D 中，任意 2 条数据相互独立，他们在求 log-likelihood 时没有耦合，所以对他们的“对数似然的和求期望”，等价于“分别求期望后的和”，于是第一行的 $\Sigma _i$ 可以提到最左侧。对于 GMM 模型，当知道完全数据（x， z）时，完全数据的概率：

所以有了式 4-31 中第三行到第四行的变换。又因为 $p(z_i =k|x_i,\theta _{t-1})$ 已经在 E 步计算求出，直接带入，便得到式 4-31 的第五行，然后按照 log 的运算法则，得到式 4-31 最后一行。

求参数 π 通过式 4-31 可以看到参数 π 和参数 µ， Σ 相互独立，所以我们可以分别求解。由式 4-30，我们可以将 $\pi _k$ 转化下面这个优化问题的解：

式 4-33 的拉格朗日函数：

其中 λ 是拉格朗日乘子，然后分别对 $\pi _k$ ，求导，并令导数为 0:

将式 4-35 变形得：

将式 4-36 前 K 个方程等号左右两边分别相加：

然后结合式 4-25，可以求出：

其中 N 为数据总数。将式 4-38 代入 4-36，求出 $\pi _k$ :

求参数 $\mu _k$ ， $\Sigma _k$ ：因为参数 $\mu _k$ ， $\Sigma _k$ 没有额外的约束，比较容易求解，由式 4-31，可以将 $\mu _k$ ， $\Sigma _k$ 转化为下面这个优化问题的解（忽略常数项）：

分别对 $\mu _k$ ， $\Sigma _k$ 求偏导数，并令偏导数为 0：

在求解 $\Sigma _k$ 的偏导数时，用到了矩阵代数的相关知识，具体可以参考 [1]。求解式 4-41 可得：

总结一下，在第 t 轮迭代中，GMM 的参数求解公式如下：

在式 4-43 中，包含和 E 步和 M 步，每次新求的参数用于下次迭代。

4.3 K-means 是 GMM 的特例

本小节主要解释为什么人们常说“K-means 是 GMM 的特例”。我们先回顾下 K-means 的计算过程：

现在我们给 GMM 模型填加一个约束：每个高斯的形状为“圆形”，即在每个维度上数据分散程度一致，且具有相同的协方差矩阵，即 $\Sigma =\delta ^2I$ 。然后我们让 $\delta ^2$ → 0，直观上每个高斯分布的概率质量更集中，如图 4-2。当 $\delta ^2$ 小到一定程度，会出现每个点在某个特定的高斯分布上概率特别大，在其他高斯分布上概率很小，几乎为 0，此时 4-43 中的退化为 one-hot 向量：

当为 one-hot 时，式 4-43 其他参数求解为：

式 4-45 中表示落在第 k 个高斯分布中的点的个数，N 表示所有点的个数。 $\mu _k$ 退化为第 k 个高斯分布中点的均值（重心）。这时 EM 算法中的 E 步，即式 4-44 中的求解过程对应 Kmeans 算法的“计算每个样本所属的类别”，EM 算法的 M 步，即式 4-45 中 $\mu _k$ 的求解过程对应 Kmeans 算法的“更新类别中心”。此时受约束的 GMM 退化为 Kmeans 算法，所以说 Kmeans 算法是 GMM 算法的特例。

5. EM 求解 HMM 模型

5.1 HMM 基本概念

首先我们来回顾下 HMM 的基本概念。HMM 的模型如图 5-3 所示。HMM 是关于随机变量 {O1， O2， O3， ..., OT , Q1, Q2, Q3, ...， QT } 的联合概率密度模型。其中 Qt 表示隐变量，它是离散型数值。Ot 是观测变量，它既可以是离散的数值也可以是连续的数值。HMM 引入 2 个假设，使问题变得简化，容易求解：

在以上两种假设下，HMM 可以用三组参数表示：

转移概率矩阵 $A=\{a_{i,j}\}=p(Q_t=j|Q_{t-1}=i)$ ，表示 2 个隐变量的转移概率。若 Q 的取值有 N 种，则 A 是一个 N × N 的矩阵；
初始状态概率向量 $\pi =\{p(Q_1=i)\}$ ，在 t =0 时刻，隐变量每个状态的概率。其中 π 的维度为 N；
观测概率矩阵 $B=\{b_j(o_t)\}=p(O_t=o_t|Q_t=j)$ 。表示在 t 时刻，隐变量为 j 的条件下，观测变量为的概率。其中既可以是离散值也可以是连续值，为了方便说明问题，这里我们规定为离散值，且维度为 M，则 B 是 N × M 的矩阵；

这样 HMM 表示的概率密度可以写成：

因为隐变量序列 q 是 T 维度的向量，所以式中第二行是每个维度都展开后的表示，方便进一步理解。围绕 HMM 模型有三个基本的问题：

概率计算。给定模型参数 $\lambda=\{A,B,\pi \}$ 和观测数据 $O=\{o_1,o_2,...o_T\}$ ，求观测数据的概率 $p(O|\lambda )$ ；
学习模型参数。已知观测数据 $O=\{o_1,o_2,...o_T\}$ ，学习一组模型参数 $\lambda =\{A,B,\pi \}$ ，使观测数据 O 出现的概率 $p(O|\lambda )$ 最大；
预测隐变量。给定模型参数 λ 和观测序列 O，求出最有可能的隐变量序列 $q=\{q_1,q_2,q_3,...q_T\}$ ；

本文我们主要讲 EM 算法，所以我们只关注问题 2，看看通过 EM 算法，如何学习 HMM 的参数。

5.2 求解 HMM

5.2.1 E 步

我们先初始化一组参数 $\lambda ^0=\{A^0,B^0,\pi ^0\}$ 。然后根据式 3-19 求解隐变量序列分布 q（z）。因为在 HMM 中我们已经用 q 表示隐变量序列了，所以我们改用 p（q）表示隐变量序列 q 的分布（注意这里的 q 是 T 维的向量）：

当知道前一时刻的参数 λ′ 和观测数据 O，对于指定的任意一个隐变量序列 q，很容易求出概率 p（q|λ′， O）：

这样我们完成 E 步的求解，接下来求解 M 步。

5.2.2 M 步

由式 3-20 和式 3-21。我们先计算 HMM 的 Q 函数：

在式 5-51 中：

第一行为 Q 函数的定义，可由式 3-21 推出；
将式 5-48 带入第一行，便得到第二行的形式；
根据 log 的运算法则，便得到第三行；
将第三行的括号打开，便得到第四行的表达形式；

通过式 5-51，我们看到 Q 函数可以表示为 3 个独立项的和，对 Q 函数求最大，可以分别表示为对每一项单独求最大。

求初始状态 π : 因为 π 表示的取值概率，所以 π 的维度和的取值数量相同为 N。其中式 5-51 第一项可以化简为：

又因为 $\Sigma ^N_{k=1}\pi _k=1$ ，所以我们将求解 $\pi _k$ 转化为下面这个优化问题：

式 5-53 的拉格朗日函数：

其中式 $\alpha$ 是拉格朗日乘子，然后分别对式 5-54 中的 $\pi _i$ ，求导，得：

变形可得：

将式 5-56 的前 N 个方程左右两边分别相加，结合 $\Sigma ^N_{k=1}\pi _k=1$ 可得：

将式 5-57 代入式 5-56，求得：

由式 5-58 和式 5-59 便可以计算出所有的 π 值：

求转移矩阵 $A=\{a_{i,j}\}$ 我们化简式 5-51 中第二项（关于 A 的项）:

在式 5-59 中 $p(q_{t-1}=i,q_t=j|\lambda ',O)$ ，可以通过全概率公式消掉隐变量序列 $q_{1:t-2},q_{t+1:T}$ ，求解：

另外结合约束 $\Sigma ^N_j a_{i,j}=1$ ，得到关于 A 的优化问题：

式 5-62 的拉格朗日函数：

同理，然后分别对式 5-63 中的 $a_{i,j}$ ， $\alpha _i$ 求导，得：

求解方法与式 5-56 相同，求解式 5-64 可得：

通过式 5-65 可以求出状态转移矩阵 A。

求观测矩阵 $B=\{b{q_t}(o_t)\}$ 我们化简式 5-51 中第三项（关于 B 的项）:

根据 B 的定义，我们易知 $\Sigma ^M_j b_i(j)=1$ ，所以关于矩阵 B 的优化问题是：

同理式 5-67 的拉格朗日函数：

然后分别对式 5-68 中的， $\alpha _i$ 求导，其中注意式中的红色字体部分是观测数据 O 在 t 时刻的状态，所以在求导时，若与被求导变量一致，则导数为 1，否则为 0，用指示函数 $\Pi \{b_i(j)=b_i(o_t)\}$ 表示。综上得：

求解式 5-69 可得（解方法与式 5-56 相同，这里省了）：

在式 5-70 中，在求解 $\alpha _i$ 时，如红色字体所示，对于每一个时刻 t，都存在一个 j 使，所以指示函数 $\Pi$ 可以去掉，得到 $\alpha _i$ 的最终表达式。至此我们求解出参数 B。然后我们通过 EM 算法不断的迭代，直到算法收敛，HMM 的所有参数 λ = {A， B， π} 将全部求解出来。

总结在第 k 轮 EM 迭代中，HMM 的参数求解公式如下：

6. 结束

本文主要探讨了 EM 算法的背景和原理。并应用 EM 算法求解机器学习中常用的 GMM 和 HMM 模型。本文侧重 EM 算法在 GMM 和 HMM 上的应用，希望大家对 EM 的原理有更进一步的理解，对 GMM 和 HMM 没有过细的分析。作者能力有限，文中难免存在理解不正确，或者描述不清的地方。欢迎留言讨论。

参考文献

[1] Bilmes: A Gentle Tutorial of the EM Algorithm and its Application to

Parameter Estimation for Gaussian Mixture and Hidden Markov Models

http://imaging.mrc-cbu.cam.ac.uk/methods/BayesianStuff?action=AttachFile&do=get&target=bilmes-em-algorithm.pdf

[2] Yida.Xu: Expectation Maximization

roboticcam/machine-learning-notes

[3] LongMingsheng lecture

Mingsheng Long - Tsinghua University

[4] David Rosenberg: Expectation Maximization Algorithm

https://davidrosenberg.github.io/mlcourse/Archive/2016/Lectures/14a.EM-algorithm.pdf

[5] What is the difference between K-means and the mixture model of

Gaussian?

https://www.quora.com/What-is-the-difference-between-K-means-and-the-mixture-model-of-Gaussian

[6] Murphy: Machine Learning A Probabilistic Perspective

华为OD机考2025B卷 - 特殊的加密算法（Java & Python& JS & C++ & C ）算法大师最新华为OD机试真题华为OD机试真题 (Java/JS/Py/C)华为od java python 华为OD机考2025B卷 javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看2025华为od机试2025B卷-华为机考OD2025年B卷题目描述有一种特殊的加密算法，明文为一段数字串，经过密码本查找转换，生成另一段密文数字串。规则如下：明文为一段数字串由0~9组成密码本为数字0~9组成的二维数组需要按明文串的数字顺序在密码本里找到同样的数字串，密码本里的数字串是由相邻的单元格数字组成，上下和左右是相邻
数据库领域下的时序数据库并发控制数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库时序数据库 ai
时序数据库并发控制：原理、实现与最佳实践关键词：时序数据库、并发控制、MVCC、时间戳排序、乐观并发控制、分布式事务、性能优化摘要：本文深入探讨时序数据库中的并发控制机制，从基本原理到实际实现进行全面剖析。文章首先介绍时序数据库的特点和并发控制挑战，然后详细分析MVCC、时间戳排序等核心算法原理，并通过代码示例展示实现细节。接着探讨分布式环境下的特殊考量，提供性能优化策略和实际应用案例。最后展望未
普通话的调域中值音元系统语音识别自然语言处理语言模型 python
普通话调域中值测算为五度标调法的3.81及其取整为4的准确性与合理性研究摘要本研究通过对比分析不同计算方法得出的普通话调域中值，探讨了将调域中值测算为3.81并取整为4的准确性与合理性。研究比较了本中值算法与刘俐李(2004)算法的差异，结合石锋(1986)等实证研究数据，验证了3.81作为调域中值的科学性。结果表明，该取值不仅符合普通话声调的实际分布特征，也为五度标调法的应用提供了更精确的参考标
ros学习之路径规划许卿768503 学习
一、全局路径规划中的地图1、栅格地图（GridMap）2、概率图（CostMap）3、特征地图（FeatureMap4、拓扑地图（TopologicalMap）二、全局路径规划算法1、Dijkstra算法2、最佳路径优先搜索算法（BFS）3、A*搜索算法双向A*搜索算法重复A*搜索算法AnytimeRepairingA*(ARA*)搜索算法实时学习A*搜索（LRTA*）算法实时适应性A*搜索（RT
学而思编程周赛语言普及奠基组 | 2025年春第15周T1 新二进制热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
学而思编程周赛语言普及奠基组 | 2025年春第15周T2 散步热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
ROS常用的路径规划算法介绍 Xian-HHappy 机器人-Robot 算法机器人路径规划 ROS
在ROS中，常用的路径规划算法主要有以下几种：全局路径规划算法A*算法：在Dijkstra算法基础上加入启发式函数，如曼哈顿距离或欧氏距离，优先探索靠近目标的节点，效率更高。需使用可容许的启发式函数以保证最优性，其通过配置启发式权重可平衡最优性与速度。在ROS中，nav2_planner中的SmacPlanner支持2D/3D的A*算法。Dijkstra算法：代价地图中的基础路径搜索方法，采用广度
遥感影像数据处理-大图滑窗切分为小图 GIS潮流遥感语义分割
功能需求据所周知，遥感影像的尺寸有大有小，大的达到几万x几万像素，而图像分割算法模型在训练中尺寸适中，比如256x256，512x512，1024x1024等等，如果直接将遥感影像的原图输入模型中进行训练，大概率会提示内存和显存不足，因此针对遥感影像的模型训练，一般都需要将影像裁剪为小图。裁剪后的效果图如下：解决思路基于上面的需求，写了一套裁剪算法流程。主要考虑的是在裁剪过程中，从左往右、从上到下
数据结构学习——KMP算法 uwvwko 算法数据结构学习 c++kmp
//KMP算法#include#include#include#includeusingnamespacestd;//next数组值的推导voidgetNext(string&str,vector&next){intstrlong=str.size();//next数组的0位为0next[0]=0;//i为当前字符的位置，从1位（第2个开始）inti=1;//length为当前字符之前的最长匹配子
基于django+Spark+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等) 阿勇学长大数据项目实战案例 Java精品毕业设计实例 Python数据可视化项目案例大数据 django spark 国漫推荐与可视化平台毕业设计 Java
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
文本生成新纪元：解锁大模型的企业级应用密码
数字化浪潮席卷各行业的当下，文本生成技术正经历着翻天覆地的变革，这场变革的幕后功臣正是大模型。今天，咱们就来深入探讨大模型在文本生成领域的奥秘，看看它如何赋能企业，又该怎样规避风险，实现价值最大化。技术跃迁：从笨拙规则到智能生成回首往昔，文本生成依靠规则模板与关键字替换，虽能实现基础自动化，却如机械舞者，动作生硬、缺乏灵动。业务稍有变动，规则需全面重构，耗时费力。随着N-gram等统计机器学习方法
【零基础学AI】第10讲：线性回归 1989 0基础学AI 人工智能线性回归算法 python 回归 numpy 开源
本节课你将学到理解线性回归的原理和应用场景掌握最小二乘法的基本思想使用Python构建房价预测模型学会评估回归模型的性能指标开始之前环境要求Python3.8+JupyterNotebook或任何PythonIDE需要安装的包pipinstallscikit-learnpandasmatplotlibseabornnumpy前置知识第9讲：机器学习概述基本的Python和数据处理能力核心概念什么是
【零基础学AI】第9讲：机器学习概述 1989 0基础学AI 人工智能机器学习 python numpy devops 开源
本节课你将学到理解什么是机器学习，以及它与传统编程的区别掌握监督学习、无监督学习的基本概念使用scikit-learn完成你的第一个机器学习项目构建一个完整的iris花朵分类器开始之前环境要求Python3.8+JupyterNotebook或任何PythonIDE需要安装的包pipinstallscikit-learnpandasmatplotlibseaborn前置知识基本的Python语法（
python递归实现乘法_算法-递归 weixin_39817012 python递归实现乘法
我们在前面学习过递归函数，递归函数采用的就是递归算法，前面我们通过最常见的菲波那切数列去学习了递归函数，这一节我们再来详细了解一下递归算法。1.递归算法递归算法(英语：recursionalgorithm)在计算机科学中是指一种通过重复将问题分解为同类的子问题而解决问题的方法。递归式方法可以被用于解决很多的计算机科学问题，因此它是计算机科学中十分重要的一个概念，递归算法有三个特点：1)递归的过程一
自然语言处理(NLP)中的文本生成控制技术 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据自然语言处理 easyui 人工智能 ai
自然语言处理(NLP)中的文本生成控制技术关键词：文本生成、可控生成、语言模型、Prompt工程、解码策略、条件控制、评估指标摘要：本文深入探讨自然语言处理中文本生成控制技术的最新进展。我们将从基础概念出发，系统分析各种控制方法的原理和实现，包括Prompt设计、解码策略优化、条件控制机制等核心内容。文章将结合数学模型、算法实现和实际案例，全面展示如何实现高质量、可控的文本生成，并探讨该领域面临的
算法-基础算法-枚举算法（Python）总裁余(余登武) 算法与数据结构算法 leetcode
文章目录前言解题思路题目1两数之和2计数质数前言枚举算法（EnumerationAlgorithm）：也称为穷举算法，指的是按照问题本身的性质，一一列举出该问题所有可能的解，并在逐一列举的过程中，将它们逐一与目标状态进行比较以得出满足问题要求的解。在列举的过程中，既不能遗漏也不能重复。枚举算法的核心思想是：通过列举问题的所有状态，将它们逐一与目标状态进行比较，从而得到满足条件的解。由于
NLP随机插入 Humbunklung 机器学习自然语言处理人工智能 python nlp
文章目录随机插入示例Python代码示例随机插入随机插入是一种文本数据增强方法，其核心思想是在原句中随机选择若干位置，插入与上下文相关的词语，从而生成新的训练样本。这种方法能够增加句子的多样性，提高模型对不同词序和表达方式的鲁棒性。示例原句：机器学习可以提升数据分析的效率。随机插入后（插入“显著”）：机器学习可以显著提升数据分析的效率。Python代码示例下面是一个简单的随机插入实现，假设我们有一
论软件设计方法及其应用怎么可能-怎么可能系统架构软件设计方法
20250427-作题目软件设计（SoftwareDesign，SD)根据软件需求规格说明书设计软件系统的整体结构、划分功能模块、确定每个模块的实现算法以及程序流程等，形成软件的具体设计方案。软件设计把许多事物和问题按不同的层次和角度进行抽象，将问题或事物进行模块化分解，以便更容易解决问题。分解得越细，模块数量也就越多，设计者需要考虑模块之间的耦合度。请围绕“论软件设计方法及其应用”论题，依次从以
从 O(n³) 到按需计算：Swift 玩转稀疏矩阵乘法网罗开发 Swift swift 矩阵开发语言
文章目录摘要描述解题思路代码实现（Swift）分析这个代码是怎么做的？示例测试与输出结果时间复杂度空间复杂度总结摘要在大多数算法题里，矩阵乘法都不算太陌生了。但一旦题目提示“稀疏矩阵”——也就是大部分值都是0的那种，这就提示我们：有优化空间。这篇文章就用Swift带大家一步步搞懂怎么写一个更高效的稀疏矩阵乘法逻辑，顺便聊聊背后的思路。描述我们手上有两个矩阵，A和B，想把它们乘起来。和普通乘法不同的
使用SQL-Ollama与自然语言交互SQL数据库的指南 antja_ 数据库 sql
#使用SQL-Ollama与自然语言交互SQL数据库的指南##技术背景介绍随着人工智能技术的发展，能够使用自然语言与SQL数据库交互的需求越来越大。这种技术可以帮助用户轻松访问和操作数据库，而无需深刻理解SQL语法。SQL-Ollama是一个专门设计的模板，利用Zephyr-7b模型，通过Ollama在本地运行推理，使这一过程变得简单而高效。##核心原理解析SQL-Ollama通过将自然语言转换为
java 签名 ecdsa_数字签名算法ECDSA 哈全文 java 签名 ecdsa
一介绍ECDSA：EllipticCurvDigstalSignatureAlgorithm椭圆曲线数字签名算法。速度快、强度高、签名短二参数说明三代码实现packagecom.imooc.security.ecdsa;importjava.security.KeyFactory;importjava.security.KeyPair;importjava.security.KeyPairGene
java 签名 ecdsa_Java数字签名——ECDSA算法随缘惜情 java 签名 ecdsa
ECDSA例如微软产品的序列号的验证算法。EllipticCurveDigitalSignatureAlgorithm，椭圆曲线数字签名算法。速度快，强度高，签名短——————————————————————————————————密钥长度112～571默认256——————————————————————————————————NONEwithECDSA签名长度：128实现方：JDK/BCRIP
什么是对称加密和非对称加密 MonkeyKing.sun 网络服务器运维
对称加密和非对称加密是现代密码学中的两大核心技术体系，它们用于保护数据的机密性、完整性和安全性，是构建区块链、电子支付、SSL、VPN、数字签名等系统的基础。一、什么是对称加密（SymmetricEncryption）？定义：加密和解密使用同一把密钥，称为“对称密钥”。工作原理：明文+密钥→加密算法→密文密文+同样密钥→解密算法→明文示例算法：算法简要说明AES（高级加密标准）最常用、快速、安全D
ECDSA数字签名
ECDSA算法（深入浅出密码学笔记）ECDSA标准中的步骤与DSA方案的步骤在概念上紧密相连，但ECDSA中的离散对数问题是在椭圆曲线群中构建起来的。因此，实际计算一个ECDSA签名所执行的算术运算与DSA中的完全不同。ECDSA标准是针对素数域Zp\mathbb{Z}_pZp和有限域GF(2m)GF(2^m)GF(2m)上的椭圆曲线定义的密钥生成使用椭圆曲线EEE，其中：模数为ppp；系数为aa
计算机系统中隐藏的‘时间陷阱’——为什么你的代码总比预期慢10倍？尤物程序猿 java 开发语言
引言大家经常遇到一个诡异现象：明明算法时间复杂度算得好好的，为什么实际运行速度总比预期慢得多？你以为是数据库查询的锅，优化了SQL却收效甚微；你怀疑是网络延迟，但抓包数据又显示一切正常。这背后可能隐藏着计算机系统中鲜为人知的“时间陷阱”——那些未被计入传统性能分析，却真实吞噬效率的底层机制。本文将揭示5个最典型的陷阱，从CPU缓存失效到操作系统调度暗坑，并用真实案例展示如何绕过它们。陷阱1：CPU
【学习】《算法图解》第九章学习笔记：迪杰斯特拉算法程序员
一、迪杰斯特拉算法概述迪杰斯特拉算法（Dijkstra'salgorithm）是一种解决带权有向图上单源最短路径问题的贪心算法，由荷兰计算机科学家艾兹赫尔·迪杰斯特拉（EdsgerW.Dijkstra）于1956年提出。该算法常用于路由协议，也可以用作其他图算法的子程序。（一）算法适用场景迪杰斯特拉算法适用于：带权有向图（每条边都有权重）所有权重都为非负值（不能有负权边）需要找出从一个顶点到图中所
【TVM 教程】PAPI 入门
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/性能应用程序编程接口（PerformanceApplicationProgrammingInterface，简称PAPI）是一个可在各种平台上提供性能计数器的库。在指定的运行期间，性能计数器提供处理器行为的准确底层信息，包含简单的指标，如总
文心大模型4.5及X1重磅上线，真实测评
2025年3月16日，人工智能领域迎来一场重要盛事——百度文心大模型4.5如期正式发布。与此同时，百度还惊喜推出了另一款全新模型——文心大模型X1。目前，文心大模型4.5和X1已在文心一言官网（https://yiyan.baidu.com/）正式上线，并免费向用户开放。其中，文心大模型4.5面向企业用户和开发者，用户可以通过登录百度智能云千帆大模型平台，轻松调用文心大模型4.5的API接口，快速
机器学习在智能供应链中的应用：需求预测与库存优化 Blossom.118 机器学习与人工智能机器学习人工智能机器人深度学习 python 神经网络 sklearn
在当今全球化的商业环境中，供应链管理的效率和灵活性对于企业的竞争力至关重要。智能供应链通过整合先进的信息技术，如物联网（IoT）、大数据和机器学习，能够实现从原材料采购到产品交付的全流程优化。机器学习技术在智能供应链中的应用尤为突出，尤其是在需求预测和库存优化方面。本文将探讨机器学习在智能供应链中的应用，并分析其带来的机遇和挑战。一、智能供应链中的需求预测准确的需求预测是供应链管理的核心。需求预测
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round