wjbwjbwjbwjb

Kmeans和GMM参数学习的EM算法原理和Matlab实现

本文整理自JerryLead的博文“《K-means聚类算法》 ”，“《（EM算法）The EM Algorithm 》”，“《混合高斯模型（Mixtures of Gaussians）和EM算法》”，以及自己编写的关于GMM的Matlab实现。
好的博文还有：
pluskid的《漫谈 Clustering (3): Gaussian Mixture Model》和《漫谈 Clustering (番外篇): Expectation Maximization》。

K-means和EM

K-means是聚类算法中最简单的一种，但是里面包含的思想却是不一般。聚类属于无监督学习，朴素贝叶斯、SVM等都是有类别标签 y 的，即已经给出了样本的分类。而聚类的样本中却没有给定 y ，只有特征 x 。聚类的目的是找到每个样本 x 潜在的类别 y ，并将同类别 y 的样本 x 放在一起。
在聚类问题中，给定训练样本 {xi}Ni=1 ，每个 xi∈Rn ，没有类别标签 y 。
K-means算法是将样本聚类成 K 个簇（cluster），具体算法描述如下：

1、随机选取 K 个聚类质心点为 {μk}Kk=1,μk∈Rn 。
2、重复下面过程直到收敛{
对于每一个样例 i ，计算其应该属于的类

$z i = a r g min j | | x i - μ j | | 2$
对于每一个类 j ，重新计算该类的质心
$μ j = \sum N i = 1 1 { z i = j } x i \sum N i = 1 1 { z i = j }$
}

其中， K 是事先给定的聚类数， zi∈1,2,..,K 代表样例 i 与 K 个类中距离最近的那个类， μj 代表对属于同一个类的样本的质心。要将所有的样本聚成 K 类，首先随机选取 K 个点作为 K 个类的质心，第一步对于每一个样本计算其到 K 个质心的距离，选取距离最近的那个类作为 zi （经过第一步每个样本都有了所属的类）；第二步对于每一个类，重新计算它的质心 μj （对里面所有的样本坐标求平均）。重复迭代第一步和第二步直到质心不变或者变化很小。
K-means如何保证收敛?
K-means算法中强调结束条件就是收敛，可以证明的是K-means完全可以保证收敛性。下面定性的描述一下收敛性，定义畸变函数：

J (z, μ) = \sum i = 1 N | | x i - μ z i | | 2

函数

J 表示每个样本点到其质心的距离平方和。K-means就是要将

J 调整到最小。假设当前

J 没有达到最小值，那么可以首先固定每个类的质心

μj ，调整每个样例的所属类别

zi 来让

J 函数减少，同样固定

zi ，调整

μj 也可以使

J 减小。这两个过程就是内循环中使

J 单调递减的过程。当

J 递减到最小时，

μ 和

z 也同时收敛。由于畸变函数

J 是非凸函数，意味着不能保证取得的最小值是全局最小值，也就是说K-means对质心初始位置的选取比较敏感，但一般情况下K-means达到的局部最优已经满足需求。
K-means与EM的关系
K-means算法目的是将样本分成

K 个类，即求每个样例

x 的隐含类别

y ，然后利用隐含类别将

x 归类。由于事先不知道类别

y ，那么可以先对每个样例假定一个

y ，但是怎么知道假定的对不对呢？怎么评价假定的好不好呢？在此，可以使用样本的极大似然估计来度量，即

x 和

y 的联合分布

p(x,y) 。如果找到的

y 能够使

p(x,y) 最大，那么找到的

y 就是样例

x 的最佳类别，

x 同时就聚类了。但是第一次指定的

y 不一定会让

p(x,y) 最大，而且

p(x,y) 还依赖于其他未知参数。当然在给定

y 的情况下，可以调整其他参数让

p(x,y) 最大；调整完参数后，发现有更好的

y 可以指定，那么重新指定

y 。反复迭代直至没有更好的

y 可以指定。
这个过程有几个难点：第一，怎么假定

y ？是每个样例硬指派一个

y 还是不同的

y 有不同的概率，概率如何度量？第二，如何估计

p(x,y) ，

p(x,y) 还可能依赖很多其他参数，如何调整里面的参数让

p(x,y) 最大。
这可以采用EM的思想解决，E步就是估计隐含类别

y 的期望值，M步调整其他参数使得在给定类别

y 的情况下，极大似然估计

p(x,y) 能够达到极大值。然后在其他参数确定的情况下，重新估计

y ，周而复始，直至收敛。
对应于K-means，最开始对于每个样例

xi 随便指定一个

zi ，然后为了让

p(x,y) 最大（让

J 最小），求给定

zi 情况下最小时的

μj （前面提到的其他未知参数），然而此时发现，可以有更好的

zi （质心与样例

xi 距离最小的类别）指定给样例

xi ，那么

zi 得到重新调整，上述过程就开始重复了，直到没有更好的

zi 指定。可见K-means里体现了EM思想，E步是确定隐含类别变量

z ，M步更新其他参数

μ 来使

J 最小化。K-means隐含类别变量指定方法比较特殊，属于硬指定，即从

K 个类别中硬选出一个给样例，而不是对每个类别赋予不同的概率。总体思想还是一个迭代优化过程，有目标函数，也有参数变量，只是多了个隐含变量，确定其他参数估计隐含变量，再确定隐含变量估计其他参数，直至目标函数最优。

EM算法

下面介绍EM的整个推导过程：

Jensen不等式

设 f 是定义域为实数的函数，如果对于所有的实数 X ， f′′(x)≥0 ，那么 f 是凸函数。当 x 是向量时，如果其Hessian矩阵 H 是半正定的，那么 f 是凸函数。如果 f′′(x)>0 ，那么称 f 是严格凸函数。
Jensen不等式表述如下：如果 f 是凸函数， X 是随机变量，那么

E [f (x)] \geq f (E [X])

特别地，如果

f 是严格凸函数，那么

E[f(x)]=f(E[X]) 当且仅当

p(x=E(X))=1 ，也就是说

X 是常量。
如果用图表示会很清晰：

图中实线

f 是凸函数，

X 是随机变量，有0.5的概率是a，有0.5的概率是b，

X 的期望值就是a和b的中值了，图中可以看到

E[f(x)]≥f(E[X]) 成立。
当

f 是（严格）凹函数当且仅当

−f 是（严格）凸函数。
Jensen不等式应用于凹函数时，不等号方向反向，即

E[f(x)]≤f(E[X]) 。

EM算法

给定独立同分布训练样本 {xi}Ni=1 ，寻找到每个样例隐含的类别 z ，能使得 p(x,z) 最大。 p(x,z) 的最大似然估计如下：

L (θ) = \sum i = 1 N l o g p (x i; θ) = \sum i = 1 N l o g \sum z i p (x i, z i; θ)

该式直接求

θ 一般比较困难，因为有隐藏变量

z 存在，但是一般确定了

z 后，求解就容易了。
EM是一种解决存在隐含变量优化问题的有效方法。既然不能直接最大化

L(θ) ，那么就不断地建立

L(θ) 的下界（E步），然后优化下界（M步）。即对于每一个样例

i ，让

Q(zi) 表示该样例隐含变量

zi 的某种分布，且

∑ziQ(zi)=1 ，

Q(zi)≥0 。由Jensen不等式得：

L (θ) = \sum i = 1 N log \sum z i p (x i, z i; θ) = \sum i = 1 N log \sum z i Q (z i) p ( x i , z i ; θ ) Q ( z i ) \geq \sum i = 1 N \sum z i Q (z i) log p ( x i , z i ; θ ) Q ( z i )

其中，

log(x) 是凹函数且

∑ziQ(zi)p(xi,zi;θ)Q(zi)
是

[p(xi,zi;θ)/Q(zi)] 的期望。
这个过程可以看作是对

L(θ) 求了下界。对于

Q 的选择，有多种可能，那种更好的？假设

θ 已经给定，那么

l(θ) 的值就决定于

Q(zi) 和

p(xi,zi) 了。通过调整这两个概率使下界不断上升，以逼近

L(θ) 的真实值，那么什么时候算是调整好了呢？当不等式变成等式时，说明调整后的概率能够等价于

L(θ) 。按照这个思路，要找到等式成立的条件。根据Jensen不等式，要想让等式成立，需要让随机变量变成常数值，即：

p ( x i , z i ; θ ) Q ( z i ) = c

其中，

c 为常数，不依赖于

zi 。由于

∑zQ(z)=1 ，所以

∑zip(xi,zi;θ)=1 ，（多个等式分子分母相加不变，这个认为每个样例的两个概率比值都是

c ），那么有下式：

Q (z i) = p ( x i , z i ; θ ) \sum z p ( x i , z ; θ ) = p ( x i , z i ; θ ) p ( x i ; θ ) = p (z i | x i; θ)

至此，导出了在固定其他参数

θ 后，

Q(zi) 就是后验概率，解决了

Q(zi) 如何选择的问题。这一步就是E步，建立

L(θ) 的下界。
接下来的M步，就是在给定

Q(zi) 后，调整

θ ，去极大化

L(θ) 的下界。那么一般的EM算法的步骤如下：

循环重复直到收敛 {
（E步）对于每一个 i ，计算

$Q (z i) = p (z i | x i; θ)$
（M步）计算
$θ = arg max θ \sum i = 1 N \sum z i Q (z i) log p ( x i , z i ; θ ) Q ( z i )$

那么究竟怎么确保EM收敛？假定 θt 和 θt+1 是EM第 t 次和第 t+1 次迭代后的结果。如果 L(θt)≤L(θt+1) ，也就是说极大似然估计单调增加，且 L(θ) 有界，那么迭代会到达最大似然估计的最大值。下面证明 L(θt)≤L(θt+1) ：
固定 θt 后，E步

Q t (z i) = p (z i | x i; θ t)

该步保证了在给定

θt 时，Jensen不等式中的等式成立，即

L (θ t) = \sum i = 1 N \sum z i Q t (z i) log p ( x i , z i ; θ t ) Q t ( z i )

固定

Qt(zi) ，M步：
将

θt 视作变量，对

L(θt) 求导等于零可得到

θt+1 ，则下式成立：

L (θ t) = \sum i = 1 N \sum z i Q t (z i) log p ( x i , z i ; θ t ) Q t ( z i ) \leq \sum i = 1 N \sum z i Q t (z i) log p ( x i , z i ; θ t + 1 ) Q t ( z i ) \leq \sum i = 1 N \sum z i Q t + 1 (z i) log p ( x i , z i ; θ t + 1 ) Q t + 1 ( z i ) = L (θ t + 1)

证毕。
如果定义

J (Q, θ) = \sum i = 1 N \sum z i Q (z i) log p ( x i , z i ; θ ) Q ( z i ),

则

J(Q,θ) 是

L(θ) 的下界。EM可以看作是

J 的坐标上升法，E步固定

θ ，优化

Q ，M步固定

Q 优化

θ 。

EM和GMM

给定训练样本 {xi}Ni=1 ，隐含类别标签用 zi 表示。与K-means硬指定不同，GMM认为 zi∈{1,2,...,K} 满足多项式分布 zi∼M(ϕ) ，其中 p(zi=j)=ϕj ， ϕj≥0 ， ∑Kj=1ϕj=1 。假定在给定 zi 的条件下 xi 满足多值高斯分布，即 (xi|zi=j)∼N(μj,σj) ，则联合分布 p(xi,zi)=p(xi|zi)p(zi) 。
GMM：

\sum j = 1 K ϕ j N (μ j, σ j)

对于每个样例

xi ，先从

K 个类别中按多项式分布抽取一个

zi ，然后根据

zi 对应高斯分布生成样例

xi ，该过程称作混合高斯模型。注意：

zi 是GMM的隐含随机变量，

θ=(ϕ,μ,σ) 是GMM的参数，其中：

ϕj 是样本类别中

zi=j 的比率，

μj 是类别为

j 的样本特征均值，

σj 是类别为

j 的样本特征方差。对数似然函数：

L (ϕ, μ, σ) = log \prod i = 1 N p (x i; ϕ, μ, σ) = \sum i = 1 N log p (x i; ϕ, μ, σ) = \sum i = 1 N log \sum z i = 1 K p (x i, z i; ϕ, μ, σ) = \sum i = 1 N log \sum z i = 1 K p (x i | z i; μ, σ) p (z i; ϕ)

该式不存在闭合解。考虑EM的思想，第一步是猜测隐含类别变量，第二步是更新其他参数，以获得最大的最大似然估计。
E步：固定 θ=(ϕj,μj,σj) ，求

w i (j) = Q (z i = j; θ) = p (z i = j | x i; θ) = p ( x i , z i = j ; θ ) p ( x i ; θ ) = p ( x i | z i = j ; μ , σ ) p ( z i = j ; ϕ ) \sum K l = 1 p ( x i | z i = l ; μ , σ ) p ( z i = l ; ϕ ) = 1 2 π \sqrt σ j exp ( - ( x i - μ j ) 2 2 σ 2 j ) \cdot ϕ j \sum k = 1 K 1 2 π \sqrt σ k exp ( - ( x i - μ k ) 2 2 σ 2 k ) \cdot ϕ k

即每个样例 xi 的隐含类别 zi 为 j 的概率可以通过后验概率计算得到。对比K-means发现，每个样例分配的类别 zi 是有一定的概率的，每个样例 i 都要计算属于每一个类别 j 的概率。
M步：固定 wi(j) ，最大化

J (θ) = \sum i = 1 N \sum z i Q (z i) log p ( x i , z i ; θ ) Q ( z i ) = \sum i = 1 N \sum j = 1 K Q (z i = j) log p ( x i , z i ; θ ) Q ( z i = j ) = \sum i = 1 N \sum j = 1 K w i (j) log 1 2 π \sqrt σ j exp ( - ( x i - μ j ) 2 2 σ 2 j ) \cdot ϕ j w i ( j )

求参数 θ=(ϕj,μj,σj) 。
对 μj,σj 求导，得

\partial J ( θ ) \partial μ j = \partial \partial μ j ⎛ ⎝ \sum i = 1 N \sum j = 1 K w i (j) ⎡ ⎣ log 1 w i ( j ) + log 1 2 π - - \sqrt σ j - ( x i - μ j ) 2 2 σ 2 j + log ϕ j ⎤ ⎦ ⎞ ⎠ = \sum i = 1 N w i (j) [1 σ 2 j (μ j - x i) μ j]

\partial J ( θ ) \partial σ j = \partial \partial σ j ⎛ ⎝ \sum i = 1 N \sum j = 1 K w i (j) ⎡ ⎣ log 1 w i ( j ) + log 1 2 π - - \sqrt + log 1 σ j - ( x i - μ j ) 2 2 σ 2 j + log ϕ j ⎤ ⎦ ⎞ ⎠ = \sum i = 1 N w i (j) [- 1 σ j + 1 σ 3 j (x i - μ j) 2]

令其等于0，解得：

μ j = \sum N i = 1 w i ( j ) x i \sum N i = 1 w i ( j ) σ 2 j = \sum N i = 1 w i ( j ) ( x i - μ j ) 2 \sum N i = 1 w i ( j )

同时，由于

ϕj≥0 ，且

∑Kj=1ϕj=1 ，故建立拉格朗日函数

L (ϕ j) = \sum i = 1 N w i (j) log ϕ j + β (\sum K j = 1 ϕ j - 1)

其中，

ϕj 相关的常数被省略了。对

ϕj 求导等于0，结合

∑Kj=1ϕj=1 可解得：

β = - \sum i = 1 N w i ( j ) ϕ j = - \sum j = 1 K \sum i = 1 N w i ( j ) \sum j = 1 K ϕ j = - \sum i = 1 N \sum j = 1 K w i (j) = - \sum i = 1 N 1 = - N

即：

ϕ j = 1 N \sum i = 1 N w i (j)

算法过程如下：

循环下面步骤，直到收敛：{
（E步）对于每一个 i 和 j 计算

$w i (j) = 1 2 π \sqrt σ j exp ( - ( x i - μ j ) 2 2 σ 2 j ) \cdot ϕ j \sum k = 1 K 1 2 π \sqrt σ k exp ( - ( x i - μ k ) 2 2 σ 2 k ) \cdot ϕ k$
（M步），更新参数：
$ϕ j = 1 N \sum i = 1 N w i (j) μ j = \sum N i = 1 w i ( j ) x i \sum N i = 1 w i ( j ) σ 2 j = \sum N i = 1 w i ( j ) ( x i - μ j ) 2 \sum N i = 1 w i ( j )$
}

E步中，将其他参数 ϕ,μ,σ 看作常量，计算 zi 的后验概率，也就是估计隐含类别变量。估计好后，利用上面的公式重新计算其他参数，计算好后发现最大化最大似然估计时， wi(j) 值又不对了，需要重新计算，周而复始，直至收敛。

GMM示例

给定由三个高斯的组成的混合模型（ K=3 ），其中：第一个高斯的均值 μ1=5 、方差 σ1=3 ，第二个高斯的均值 μ2=20 、方差 σ2=5 ，第三个高斯的均值 μ3=50 、方差 σ3=10 ，且三个高斯出现的概率为 ϕ1=0.2 、 ϕ1=0.4 、 ϕ1=0.4 。由该GMM生成10000个样本（ N=10000 ），并根据样本和给定的初始参数 ϕ=[0.33,0.33,0.34] 、 μ=[0,5,10] 、 σ=[5,5,5] ，迭代学习50次结果后收敛到 ϕ=[0.1969,0.4082,0.3950] 、 μ=[4.9686,20.0338,50.0925] 、 σ=[3.0639,5.0977,10.1096] 。下图给出了10000个样本的分布和50次迭代学习参数变化情况。

Matlab代码：

% 生成过程
phi1 = 0.2; mu1 = 5; sigma1 = 3;
phi2 = 0.4; mu2 = 20; sigma2 = 5;
phi3 = 0.4; mu3 = 50; sigma3 = 10;

N = 10000;
x = zeros(N,1);
for i = 1 : N
    rate = rand;
    if rate <= phi1
        x(i) = normrnd(mu1,sigma1);
    elseif rate <= phi1+phi2
        x(i) = normrnd(mu2,sigma2);
    else
        x(i) = normrnd(mu3,sigma3);
    end
end

figure(1); subplot(2,2,1); hist(x,1000);

% 学习过程
mu = [0, 5, 10];
sigma = [5, 5, 5];
phi = [0.33, 0.33, 0.34];
w = zeros(N,3);

T = 50;
mu_ = zeros(T+1,3);
sigma_ = zeros(T+1,3);
phi_ = zeros(T+1,3);
mu_(1,:) = mu;
sigma_(1,:) = sigma;
phi_(1,:) = phi;
for t = 1 : T
    % Expectation
    for k = 1 : 3
        w(:,k) = phi(k)*normpdf(x,mu(k),sigma(k));
    end
    w = w./repmat(sum(w,2),[1 3]);

    % Maximization
    for k = 1 : 3
        mu(k) = w(:,k)'*x / sum(w(:,k)); sigma(k) = sqrt(w(:,k)'*((x-mu(k)).*(x-mu(k))) / sum(w(:,k)));
        phi(k) = sum(w(:,k)) / N;
    end
    mu_(t+1,:) = mu;
    sigma_(t+1,:) = sigma;
    phi_(t+1,:) = phi;
end
figure(1); subplot(2,2,2); plot(phi_); title('\phi');
figure(1); subplot(2,2,3); plot(mu_); title('\mu');
figure(1); subplot(2,2,4); plot(sigma_); title('\sigma');

前端aes专用秘钥加解密_前端AES算法加密解密原理及实现 weixin_39955825 前端aes专用秘钥加解密
对代码进行重构，页面跳转的时候总是提示参数错误，仔细检查了好几遍，确定就是那几个参数，最后找出原始页面对比，原来必须要加密传输才可以。事实上，在平时的项目开发中，经常要考虑到对数据进行加密传输的问题。数据在传输的过程中，如果使用原始数据，就可能会出现被监听、被截获、被篡改的情况，会产生非常大的安全隐患。因此开发人员需要在客户端对传输数据进行加密，然后在服务器端进行解密！看了看原来的代码，确定了他们
【2025A卷】华为OD机试九日集训第1期 - 按算法分类，由易到难，循序渐进，提升编程能力和解题技巧，从而提高机试通过率（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od 算法 python 华为OD机试 2025A卷
目录一、适合人群二、本期训练时间三、如何参加四、数据结构与算法大纲五、华为OD九日集训第1期第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、逻辑分析第5天、逻辑分析第6天、逻辑分析第7天、双指针第8天、二叉树第9天、动态规划六、集训总结国内直接使用ChatGPT4o、o4-mini（支持DeepResearch深入研究）、o4-mini-high、o3、GPT4.1、GPT-4.5、671
华为OD机试 - 最长公共前缀（Python/JS/C/C++ 2025 A卷 100分）哪吒华为od python javascript 华为OD机试 2025A卷
2025A卷华为OD机试统一考试题库清单（持续收录中）以及考点说明（Python/JS/C/C++）。专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述编写一个函数
Unity引擎开发：物理引擎与碰撞检测_物理引擎的数学原理 chenlz2007 游戏开发 unity 游戏引擎材质交互 ar
物理引擎的数学原理在Unity引擎开发中，物理引擎是模拟和处理游戏世界中物理现象的核心组件。物理引擎依赖于一系列数学原理和算法来实现真实的物理效果，包括刚体动力学、碰撞检测、约束求解等。本节将详细介绍这些数学原理，帮助开发者更好地理解和利用Unity物理引擎。刚体动力学基础刚体动力学是物理引擎中最基础的部分，它描述了刚体在力的作用下的运动状态。刚体是指在运动过程中形状和大小不变的物体。在Unity
华为OD机试 - 数字游戏（Python/JS/C/C++ 2025 A卷 100分）哪吒华为od 游戏 python
2025华为OD机试题库（按算法分类）：2025华为OD统一考试题库清单（持续收录中）以及考点说明（Python/JS/C/C++）。专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随
Faster R-CNN 算法详解 reset2021 目标检测 Faster R-CNN 目标检测
FasterR-CNN是在R-CNN和FastR-CNN的基础上进一步优化的一种目标检测算法。它通过引入RegionProposalNetwork(RPN)将区域建议和目标检测整合到一个统一的框架中，大幅提高了检测效率。以下是对FasterR-CNN算法的详细解析：1.概述FasterR-CNN主要由三部分组成：深度特征网络（BackboneNetwork）：用于提取图像的高层次特征，比如VGG或
【数据通信完全指南】从物理层到协议栈的深度解析满怀1015 计算机网络 CRC校验 QAM调制滑动窗口 5G 数据封装
目录1.通信技术演进与核心挑战1.1从电报到5G的技术变迁1.2现代通信系统的三大瓶颈2.通信系统架构深度解构2.1OSI七层模型运作原理2.2TCP/IP协议栈实战解析3.物理层关键技术实现3.1信号调制技术演进路线3.2信道复用方案对比4.数据传输可靠性保障4.1CRC校验算法数学推导4.2自动重传请求(ARQ)机制6.现代通信安全架构混合加密系统设计7.5G与量子通信前沿展望5GNR关键技术
算法篇之-----滑动窗口(尺取法) 落春只在无意间算法算法滑动窗口
滑动窗口(尺取法1.介绍2.滑动窗口法的大体框架4、最小覆盖子串5、窗口数量6、最小值1.介绍滑动窗口法，也叫尺取法（可能也不一定相等，大概就是这样=。=），可以用来解决一些查找满足一定条件的连续区间的性质（长度等）的问题。由于区间连续，因此当区间发生变化时，可以通过旧有的计算结果对搜索空间进行剪枝，这样便减少了重复计算，降低了时间复杂度。往往类似于“请找到满足xx的最x的区间（子串、子数组）的x
GESP认证C++编程真题解析 | P11965 [GESP202503 七级] 等价消除热爱编程的通信人 c++算法数据结构
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
B3969 [GESP202403 五级] B-smooth 数题解辛姜_千尘红回算法数据结构 c++笔记 c语言
题目传送门解题思路这道题目的数据范围有点大，暴力算法的时间复杂度是O(n2)O(n^2)O(n2)的，明显超时，于是我们可以先预处理出1∼n1\simn1∼n的所有数的最大质因子。但是暴力找到最大质因子也是很慢的，所以我们可以先筛出每个数的最大质因子，最后统计一下即可。为什么可以用筛法呢？因为例如数字6
基于人工智能的智能健身评分系统方案编码追梦人 AI人工智能人工智能 python
以下是智能健身评分系统的技术方案设计，涵盖人体关键点识别、动作识别与评分计数功能，可应用于智能硬件、健身APP或在线课程平台：一、系统架构设计二、核心技术选型1.人体关键点检测算法选择：PP-TinyPose：百度飞桨轻量化模型，FP16精度下实现122FPS检测速度，COCO数据集AP达51.8%。MoveNetThunder：Google轻量级模型，支持移动端实时推理，关键点检测精度80.6%
算法导论 - 基于 C# 的栈和队列实现东城十三算法导论算法 c#开发语言
算法导论-基于C#的栈和队列实现栈（Stack）和队列（Queue）是两种基础的数据结构，在算法设计和计算机程序中广泛使用。栈是一种后进先出（LIFO,LastInFirstOut）的数据结构，而队列是一种先进先出（FIFO,FirstInFirstOut）的数据结构。本文将介绍如何在C#中实现和使用栈和队列。栈（Stack）栈是一种只允许在一端进行插入和删除操作的线性表，操作受限于表的一端，这一
免费体验100度算力包，极速部署不蒸馏满血版DeepSeek-R1！九章云极DataCanvas 人工智能 AI编程 deepseek
1.背景介绍DeepSeek-R1：你的智能新伙伴DeepSeek-R1不仅仅是一个拥有6710亿参数的大模型，它更是一个在数学、编程和复杂推理任务中表现卓越的智能助手。无论是解决复杂的算法难题，还是编写高效的代码，DeepSeek-R1都能助你一臂之力，其性能已经可以与市面上那些顶级的闭源大模型平分秋色。开启分布式推理的新时代为了让每个团队和个人都能享受到DeepSeek-R1带来的无限可能，我
统计学-什么是置信度？阿桨数据分析知识问答数据分析
置信度，也称为置信水平，它反映了特定个体对特定命题真实性的相信程度。在统计学和概率论中，置信度是对某个样本统计量所构造的总体参数估计区间的可信程度或把握程度的度量。简而言之，它表示的是我们有多大信心认为某个估计或预测是准确的。具体来说，在研究和评估中，置信度是衡量数据或结果的可靠性和可信度的一种指标，它反映了被评估对象的真实性或有效性。例如，在机器学习和人工智能中，置信度是指算法对某个预测结果的置
SAR雷达动目标成像技术与应用韦臻
本文还有配套的精品资源，点击获取简介：合成孔径雷达（SAR）是一种先进的远程成像技术，能够在各种天气和光线下工作，广泛应用于军事、地质、环境监测等领域。动目标成像是SAR技术中的关键研究领域，涉及识别和定位移动目标，如车辆和船舶。动目标成像需要处理多普勒频移、距离徙动和运动模糊等问题。点面目标模拟对于理解SAR图像质量和优化成像算法至关重要。提供的一系列MATLAB脚本文件将帮助深入理解SAR信号
软件设计师考试真题解析与思路韦臻软件设计师考试真题解析考点理解设计原理实际操作技能
软件设计师考试真题解析与思路背景简介在软件开发领域，软件设计师考试是对专业知识和实际应用能力的一次全面检验。考试内容涵盖广泛，包括软件工程、数据结构、算法设计等多个方面。本文将基于一系列软件设计师考试的真题，进行深入解析，并探讨其背后的设计原理和解题思路。标题1：软件设计与数据结构子标题：控制结构与逻辑判断在软件开发中，控制结构和逻辑判断是构建程序逻辑的基石。考试中常见的题目包括条件语句和循环结构
JVM垃圾回收器cms详解 bjzw JVM jvm java 算法
关于serial,parnew,parallel等回收器的介绍可以参考上一篇jvm垃圾回收算法以及垃圾回收器，如何选择_bjzw的博客-CSDN博客下面具体介绍一下cms，jdk8之后就已经废弃了cms垃圾回收器，为什么要还要详解cms呢首先，cms的回收思想需要我们了解其次，G1回收器也复用了cms的一部分思想一、CMS回收CMS是在老年代的垃圾回收算法，全程为ConcurrentMarkSwe
基于STM32、HAL库的ATECC608B安全验证及加密芯片驱动程序设计 colin工作室安全验证及加密芯片驱动程序设计 stm32 安全嵌入式硬件
一、简介：ATECC608B是Microchip公司生产的一款安全加密芯片，提供以下主要特性：基于硬件的高安全性加密算法ECCP-256加密引擎SHA-256哈希算法AES-128加密真随机数生成器(TRNG)16KB安全存储空间I²C接口(最高1MHz)低功耗设计，适合物联网应用二、硬件接口：ATECC608B引脚STM32L4XX引脚说明SDAPB7/PB9I2C数据线SCLPB6/PB8I2
别再被流量困住！SEO 营销到底是啥？全在这里了！ SEO_juper SEO 数字营销 Google seo 谷歌seo seo优化数字营销搜索引擎
SEOMarketing是SearchEngineOptimizationMarketing的首字母缩写词，是增强网站在线形象的基础。SEO营销作为一个战略工具包，具有广泛的技术，例如关键字优化、内容优化和链接构建。对于旨在提高搜索引擎上有机（非付费）知名度的网站所有者来说，这是一项必不可少的做法，最终吸引目标受众。通过理解和实施SEO营销原则，企业不仅可以克服搜索引擎算法的困难，还可以战略性地定
从 “步步惊心” 到 “步步为赢”：揭秘线性动态规划的神奇魔法菜鸟破茧计划动态规划动态规划算法
在C++算法的江湖里，线性动态规划就像是一门高深的“步步为营”的武学秘籍。它能让你在面对复杂问题时，通过一步步的推导，找到最优解。今天，就让我们一起揭开它神秘的面纱！什么是线性动态规划？线性动态规划，简单来说，就是在一个线性结构（比如数组）上，通过分析子问题的最优解，推导出整个问题的最优解。它的核心思想可以用一句话概括：“大事化小，小事化了”。就像你要攀登一座高山，不用一下子考虑怎么登顶，而是先考
「C/C++」C/C++经验篇之函数命名Ask和Get的使用情况分析何曾参静谧 c语言 c++开发语言
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
使用手机录制rosbag包吃水果不削皮视觉组合导航智能手机数码相机
文章目录简介录制工具录制步骤录制设置设置IMU录制频率设置相机分辨率拍照模式录制模式数据制作获取数据数据转为rosbag查看rosbag简介ROS数据包（rosbag）是ROS系统中用于记录和回放传感器数据的重要工具，通常用于算法调试、系统测试和数据采集。传统上，rosbag依赖于ROS环境下的传感器（如激光雷达、摄像头、IMU等）进行录制，但借助移动设备的强大传感器和灵活的网络通信能力，我们也可
实验三：Java迷宫生成废旧螺栓机甲 java
实验内容1.迷宫游戏是非常经典的游戏，在该题中要求随机生成一个迷宫，并求解迷宫；2.要求查找并理解迷宫生成的算法，并尝试用两种不同的算法来生成随机的迷宫。3.要求迷宫游戏支持玩家走迷宫，和系统走迷宫路径两种模式。玩家走迷宫，通过键盘方向键控制，并在行走路径上留下痕迹；系统提示迷宫路径要求基于A*算法实现，输出玩家当前位置到迷宫出口的最优路径。设计交互友好的游戏图形界面。实现过程：使用深度优先算法生
day27 第八章贪心算法 part01 mvufi 贪心算法算法
455.分发饼干排序，以饼干为中心，从大到小算classSolution{public:intfindContentChildren(vector&g,vector&s){sort(g.begin(),g.end());sort(s.begin(),s.end());intindex=s.size()-1;intcount=0;for(inti=g.size()-1;i>=0;i--){if(in
day29 第八章贪心算法 part03 mvufi 贪心算法算法
134.加油站“可以换一个思路，首先如果总油量减去总消耗大于等于零那么一定可以跑完一圈，说明各个站点的加油站剩油量rest[i]相加一定是大于等于零的。每个加油站的剩余量rest[i]为gas[i]-cost[i]。i从0开始累加rest[i]，和记为curSum，一旦curSum小于零，说明[0,i]区间都不能作为起始位置，因为这个区间选择任何一个位置作为起点，到i这里都会断油，那么起始位置从i
华为OD机试 - 任务处理/可以处理的最大任务数 - 贪心算法（Java 2024 D卷 100分）哪吒华为od 贪心算法 java
一、题目描述在某个项目中有多个任务（用tasks数组表示）需要您进行处理，其中tasks[i]=[si,ei]，你可以在si<=day<=ei中的任意一天处理该任务。请返回你可以处理的最大任务数。注：一天可以完成一个任务的处理。二、输入描述第一行为任务数量n，1<=n<=100000。后面n行表示各个任务的开始时间和终止时间，用si和ei表示，1<=si<=ei<=100000。三、输出描述输出为
使用c++实现一个简易的量子计算，并向外提供服务这个懒人量子计算 c++
实现一个简易的量子计算模拟器并提供服务是一个相对复杂的过程，涉及到量子计算的基本概念、C++编程以及网络服务的搭建。以下是一个简化的步骤指南，帮助你开始这个项目：步骤1:理解量子计算基础在开始编码之前，你需要对量子计算有基本的理解，包括量子比特（qubits）、量子叠加、量子纠缠、量子门（如Hadamard门、CNOT门等）以及量子算法（如量子叠加算法、量子傅里叶变换等）。步骤2:设计量子计算模拟
常用回环检测算法对比（SLAM）具身小站算法人工智能技术人工智能算法人工智能回环检测 SLAM
回环检测本质上是一种数据相似性检测算法，原理是通过识别机器人是否回到历史位置，建立位姿约束以优化全局地图，纠正长期的里程计漂移实现全局地图的一致性，简单讲就是识别场景中的重复特征以修正累积误差。1.概述算法类别原理特点优势劣势词袋模型特征聚类为单词，TF-IDF加权相似度依赖手工特征，倒排索引加速检索实时性高，适合移动端忽略空间信息，误判相似场景概率改进模型贝叶斯滤波动态更新概率分布结合里程计与场
C++八股文--STL详解女程序员jingyu c++开发语言
STL六大组件容器详解算法详解迭代器详解仿函数详解适配器详解空间配置器STL常用代码STL六大组件标准模板库（StandardTemplateLIbrary），是C++的一个软件库。STL提供了六大组件：容器：各种数据结构，例如vector，list，deque，set，map等，是类模板算法：各种常用算法，例如sort，search，copy，erase等，是函数模板迭代器：容器算法耦合剂，泛型
OpenCV的grabCut算法分割图像夏天又到了 OpenCV计算机视觉 opencv 人工智能计算机视觉
OpenCV计算机视觉开发实践：基于QtC++-商品搜索-京东基本概念使用grabCut算法可以用最小程度的用户交互来分解前景。从用户角度来看，grabCut算法是怎么工作的呢？首先画一个矩形方块把前景图圈起来，前景区域应该完全在矩形内；然后算法反复进行分割以达到最好的效果。但是，有些情况下分割得不是很好，比如把前景标成背景了，这种情况下用户需要再润色，就是在图像上有缺陷的地方画几笔。这几笔的意思
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

Kmeans和GMM参数学习的EM算法原理和Matlab实现

K-means和EM

EM算法

Jensen不等式

EM算法

EM和GMM

GMM示例

你可能感兴趣的:(算法,EM-GMM)