@李忆如

机器学习——K-means（聚类）与人脸识别

系列文章目录

一、K-means聚类算法的原理、过程与分析

1.K-means算法原理

2.K-means算法流程

3.K-means算法分析

1.优点

2.缺点

二、K-means聚类的简单实践及可视化

三、K-means实现人脸与物体聚类及可视化

1.数据导入

2.K-means聚类

3.LDA降维

4.降维与可视化

5.结果与分析

5.1 可视化结果

5.2 数据集与K对聚类精度的影响

5.3 K-means优化前后的比较

四、创新聚类算法设计

五、K-means聚类出现的一些问题分析与优化

① 聚类不准确

② 程序出现死循环

③ K值的选择

④ 程序容易产生空蔟（最终聚类数量少于K）

六、其他

1. 数据集及资源

2. 参考资料

总结

系列文章目录

本系列博客重点在机器学习的概念原理与代码实践，不包含繁琐的数学推导（有问题欢迎在评论区讨论指出，或直接私信联系我）。

第一章机器学习——PCA（主成分分析）与人脸识别_@李忆如的博客-CSDN博客

第二章机器学习——LDA (线性判别分析) 与人脸识别_@李忆如的博客-CSDN博客

第三章机器学习——LR（线性回归）、LRC（线性回归分类）与人脸识别_@李忆如的博客

第四章机器学习——SVM（支持向量机）与人脸识别_@李忆如的博客

第五章机器学习——K-means（聚类）与人脸识别

梗概

本篇博客主要介绍K-means（聚类）算法，包括算法原理、流程、分析，利用经典K-means实现简单聚类及可视化，并利用K-means及其优化实现人脸识别及其可视化（内附数据集与matlab代码）

一、K-means聚类算法的原理、过程与分析

1.K-means算法原理

K-means是一种无监督的学习，主要通过不断地取离种子点(质心)最近均值的数据，自动将相似的对象归到同一个簇中（共聚类k个簇），常用于聚类分析。K-means中所用最重要方法即求点群中心的算法：即欧氏距离，公式（以n维数据为例）如下：

K-Means算法的简单示例（K=2）如下图：

2.K-means算法流程

1.随机选择数据集中 k 个样本作为初始聚类中心α=α1，α2，……，αk；

2.针对数据集中每个样本xi，计算它到 k 个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中；

3.针对每个类别aj，重新计算它的聚类中心 $a_{j}=\frac{1}{\left|c_{i}\right|} \sum_{x \in c_{i}} x$ （即属于该类的所有样本的质心）；

4.重复上面2，3两步操作，直到达到某个中止条件（最大迭代次数、最小误差变化（质心的位置变化小于指定的阈值（默认为 0.0001））等），以此确定最优的聚类中心。

3.K-means算法分析

1.优点

① 算法简单，容易理解，聚类效果不错

② 处理大数据集的时候，该算法可以保证较好的伸缩性

③ 当簇近似高斯分布的时候，效果相对较好

2.缺点

① K值需要人为设定，不同 K 值对实验结果影响较大

② 对初始的簇中心敏感，不同选取方式对实验结果影响较大

③ 对异常值敏感

④ 每个样本只能归为一类，不适合多分类任务

⑤ 不适合太离散的分类、样本类别不平衡的分类、非凸形状的分类

二、K-means聚类的简单实践及可视化

① 问题描述：为更熟练掌握K-means聚类算法与结果的展示，做一个2维或三维空间中的2~3类点（每个类有10个点）聚类实验，把聚类结果用不同的颜色与符号表示。

② 算法实现核心：首先利用mvnrnd函数生成3组满足高斯分布的数据（聚类效果相对较好），再按1.2中的K-means算法流程（或调库）对生成k个蔟质心进行迭代确定，实现聚类。

③ 手敲代码如下（也可调库实现）：

clear;
clc;
times = 0;
N = input('请设置聚类数目：');%设置聚类数目
%% 第一组数据
mu1=[0 0];  %均值
S1=[0.1 0 ; 0 0.1];  %协方差
data1=mvnrnd(mu1,S1,10);   %产生高斯分布数据
%% 第二组数据
mu2=[-1.25 1.25];
S2=[0.1 0 ; 0 0.1];
data2=mvnrnd(mu2,S2,10);
%% 第三组数据
mu3=[1.25 1.25];
S3=[0.1 0 ; 0 0.1];
data3=mvnrnd(mu3,S3,10);
%% 显示数据
plot(data1(:,1),data1(:,2),'b+');
hold on;
plot(data2(:,1),data2(:,2),'b+');
plot(data3(:,1),data3(:,2),'b+');
%%  初始化工作
data = [data1;data2;data3];
[m,n] = size(data); % m = 30,n = 2
center = zeros(N,n);% 初始化聚类中心，生成N行n列的零矩阵
pattern = data;     % 将整个数据拷贝到pattern矩阵中
%% 算法
for x = 1 : N
    center(x,:) = data(randi(3,1),:); % 第一次随机产生聚类中心 randi返回1*1的(1,300)的数
end
while true
distence = zeros(1,N);   % 产生1行N列的零矩阵
num = zeros(1,N);        % 产生1行N列的零矩阵
new_center = zeros(N,n); % 产生N行n列的零矩阵
%% 将所有的点打上标签1 2 3...N
for x = 1 : m
    for y = 1 : N
        distence(y) = norm(data(x,:) - center(y,:)); % norm函数计算到每个类的距离
    end
    [~,temp] = min(distence); %求最小的距离 ~是距离值，temp是第几个
    pattern(x,n + 1) = temp;         
end
times = times+1;
k = 0;
%% 将所有在同一类里的点坐标全部相加，计算新的中心坐标
for y = 1 : N
    for x = 1 : m
        if pattern(x,n + 1) == y
           new_center(y,:) = new_center(y,:) + pattern(x,1:n);
           num(y) = num(y) + 1;
        end
    end
    new_center(y,:) = new_center(y,:) / num(y);
    if norm(new_center(y,:) - center(y,:)) < 0.0001 %设定最小误差变化（阈值）
        k = k + 1;
    end
end
if k == N || times > 10000 % 设置终止条件（加入最大迭代次数限制）
     break;
else
     center = new_center;
end
end
[m, n] = size(pattern); %[m,n] = [30,3]
 
%% 最后显示聚类后的数据
figure;
hold on;
for i = 1 : m
    if pattern(i,n) == 1 
         plot(pattern(i,1),pattern(i,2),'r*');
         plot(center(1,1),center(1,2),'ko');
    elseif pattern(i,n) == 2
         plot(pattern(i,1),pattern(i,2),'g*');
         plot(center(2,1),center(2,2),'ko');
    elseif pattern(i,n) == 3
         plot(pattern(i,1),pattern(i,2),'b*');
         plot(center(3,1),center(3,2),'ko');
    elseif pattern(i,n) == 4
         plot(pattern(i,1),pattern(i,2),'y*');
         plot(center(4,1),center(4,2),'ko');
    else
         plot(pattern(i,1),pattern(i,2),'m*');
         plot(center(5,1),center(5,2),'ko');
    end
end

④ 使用K-means聚类（终止条件为质心的位置变化小于指定的阈值（0.0001）或迭代次数大于阈值（10000）），K=2与K=3结果如下图所示：

Tips：同色为K-means聚类同簇，原点为最优质心

K=2的聚类前后

K=3的聚类前后

分析：由以上两图可看出，程序按人工设置好的K值进行聚类，效果较好。

三、K-means实现人脸与物体聚类及可视化

问题描述：实现人脸图像（取前2~3个人的人脸图像）与旋转物体（在COIL20数据集中取前2~3个类的图像）聚类实验，把结果用不同的颜色与符号表示，并把对应的图像放在相应点的旁边，同时列表给出其在不同数据库在不同K时的聚类精度。

1.数据导入

利用imread批量导入人脸或物体数据库，或直接load相应mat文件，并在导入时不断将人脸拉成一个个列向量组成reshaped_faces，并取出2~3类作为待聚类数据，将导入数据抽象成框架，可以匹配不同数据集的导入（本实验框架适配ORL、AR、FERET、COIL20数据集）。

Tips:代码可见本系列第二篇文章（LDA与人脸识别），基本一致。

2.K-means聚类

K = 3; % 设置K-means的K
% K-means训练
test_data = reshaped_faces(:,1:pic_num_of_each * 3);
[idx,center] = kmeans(test_data',K); %idx是分类类别，center是质心集

3.LDA降维

代码与本系列第二篇文章（LDA与人脸识别），基本一致，降维方法本实验选择的是伪逆的LDA。

4.降维与可视化

% 降维与可视化
class_num_to_show = 3;
pic_num_in_a_class = pic_num_of_each;
pic_to_show = class_num_to_show * pic_num_in_a_class;
m = 3; % 制定可视化维数
% 取出相应数量特征向量
    project_matrix = eigen_vectors(:,1:m);
    % 投影
    projected_test_data = project_matrix' * (reshaped_faces - all_mean);
    projected_test_data = projected_test_data(:,1:pic_to_show);
    pattern = projected_test_data';

%可视化
if(m ==2)
figure;
[max_xy,index]=max(pattern); %用于在图像上标记未聚类原类别
for i = 1 : pic_num_of_each * 3
    if(i <= pic_num_of_each)
        if idx(i,1) == 1 
         scatter(pattern(i,1),pattern(i,2),'o','r*');
    elseif idx(i,1) == 2
         scatter(pattern(i,1),pattern(i,2),'o','g*');
    elseif idx(i,1) == 3
         scatter(pattern(i,1),pattern(i,2),'o','b*');
    elseif idx(i,1) == 4
         scatter(pattern(i,1),pattern(i,2),'o','y*');
        end
    elseif(i <= pic_num_of_each * 2)
        if idx(i,1) == 1 
         scatter(pattern(i,1),pattern(i,2),'^','r*');
    elseif idx(i,1) == 2
         scatter(pattern(i,1),pattern(i,2),'^','g*');
    elseif idx(i,1) == 3
         scatter(pattern(i,1),pattern(i,2),'^','b*');
    elseif idx(i,1) == 4
         scatter(pattern(i,1),pattern(i,2),'^','y*');
        end
    elseif(i <= pic_num_of_each * 3)
        if idx(i,1) == 1 
         scatter(pattern(i,1),pattern(i,2),'x','r*');
    elseif idx(i,1) == 2
         scatter(pattern(i,1),pattern(i,2),'x','g*');
    elseif idx(i,1) == 3
         scatter(pattern(i,1),pattern(i,2),'x','b*');
    elseif idx(i,1) == 4
         scatter(pattern(i,1),pattern(i,2),'x','y*');
        end
    end 
hold on;
end
text(max_xy(1,1)-10,max_xy(1,2),'第一类：o');
text(max_xy(1,1)-10,max_xy(1,2)-15,'第二类：▲');
text(max_xy(1,1)-10,max_xy(1,2)-30,'第三类：x');
end

if(m==3)
figure
[max_xyz,index]=max(pattern); %用于在图像上标记未聚类原类别
for i = 1 :pic_num_of_each * 3
    if(i <= pic_num_of_each)
         if idx(i,1) == 1 
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'o','r*');
    elseif idx(i,1) == 2
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'o','g*');
    elseif idx(i,1) == 3
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'o','b*');
    elseif idx(i,1) == 4
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'o','y*');
         end
    elseif(i <= pic_num_of_each * 2)
         if idx(i,1) == 1 
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'^','r*');
    elseif idx(i,1) == 2
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'^','g*');
    elseif idx(i,1) == 3
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'^','b*');
    elseif idx(i,1) == 4
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'^','y*');
         end
    elseif(i <= pic_num_of_each * 3)
         if idx(i,1) == 1 
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'x','r*');
    elseif idx(i,1) == 2
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'x','g*');
    elseif idx(i,1) == 3
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'x','b*');
    elseif idx(i,1) == 4
         scatter3(pattern(i,1),pattern(i,2),pattern(i,3),'x','y*');
         end
    end 
    hold on;
end    
text(max_xyz(1,1)-10,max_xyz(1,2),max_xyz(1,3),'第一类：o');
text(max_xyz(1,1)-10,max_xyz(1,2)-15,max_xyz(1,3)-15,'第二类：▲');
text(max_xyz(1,1)-10,max_xyz(1,2)-30,max_xyz(1,3)-30,'第三类：x');
end

5.结果与分析

本实验所用数据集：人脸（ORL5646、AR5040）、物体（COIL20），代码适用于其他数据集

5.1 可视化结果

对不同数据集使用K-means聚类（K=2、K=3），聚类二维及三维可视化结果如下图所示（K=2以AR数据集为例，K=3以ORL数据集为例）：

Tips：同色为K-means聚类同簇，同形状为原数据集同一类

AR数据集K=2的聚类二维可视化

AR数据集K=2的聚类三维可视化

ORL数据集K=3的聚类二维可视化

ORL数据集K=3的聚类三维可视化

分析：由以上四图可以看出，对于AR与ORL数据集，K-means能够将不同人脸进行较正确聚类（不同形状对应不同颜色），聚类精度较高，效果较好。

5.2 数据集与K对聚类精度的影响

在不同数据集与不同K下对K-means进行聚类测试，每个数据集每个K进行20次实验取平均聚类精度分析，结果如下：

分析：由以上两图可以看出，K的选择与数据集的不同都会对聚类效果有影响，与理论分析一致。在本实验中，COIL20数据集下K-means的聚类精度远低于另外两个数据集，且随着K增大精度降低，原因与K-means聚类难以处理旋转物体有关。而对于ORL与AR数据集，聚类精度随K有小波动，但平均精度较高，聚类效果较好。

5.3 K-means优化前后的比较

在不同数据集（K=3）下分别使用K-means、K-means++、前文提到的创新聚类方法进行聚类测试，以此探究不同聚类算法的效率与聚类精度，每个数据集进行20次实验取平均聚类精度分析，结果如下：

分析：由以上两图可以看出，K-means++与创新K-means作为K-means的优化版本，在不同数据集下相对K-means在效率与聚类精度下均有较大提升，尤其是前文提到的创新聚类算法，通过实验与比较可以分析出其相对经典K-means及其优化的优越性，效率、聚类效果与稳定性均有明显提升。

四、创新聚类算法设计

① 经典K-means的不足：K值选择与初始质心确定的困难、对数据的分布有要求、对异常值敏感、不适合样本多分类问题。

② 已有改进：K-means++、Xmeans、ISODATA、核K-means等等

③ 创新聚类算法简述：

一．选择K：由于K-means算法受K值影响较大，舍弃人为选择，使用Gap statistic法优化，确定最优K值。

二．初始聚类中心点：由于K-means算法受初始中心点影响较大，舍弃传统K-means的随机选择质心，先将数据采用层次聚类的方法预处理，得到的k个中心点作为K均值算法的中心点。

三．质心迭代：传统的聚类中心点更新是在结束一次循环后，本方法的聚类中心采用实时更新策略，即每次将一个模式归于一个新的聚类中心时，即立刻更新的所属中心和原属聚类中心的中心值，增强算法的收敛性。

四．增加不定K选择：为达到类内方差最小化，类间方差最大化这一原则，考虑到往往设定的K值不一定能很好实现聚类效果，故将以往的固定聚类中心改为一浮动区间。原有K为最小聚类中心个数，另设一聚类中心个数上限maxK。其具体实现如下：

4.1）当一待聚类的模式得到其最近中心时，计算该聚类中心类内方差和将此模式归于该中心之后的类内方差，如果两者差别大于某设定阈值，则以该模式数据为基础，得到一新的聚类中心。

4.2）在当前聚类中心个数等于设定的最大聚类中心时，合并最相邻的两个聚类。为使得到的聚类效果更为均衡，应该优先合并维度较小的聚类类别。

五. 终止判断：为防止聚类不准确及出现死循环等问题，同时使用最大迭代次数与最小误差变化（小阈值）作为终止判断条件，若满足某一条件，即输出聚类图像与结果。

五、K-means聚类出现的一些问题分析与优化

对理论分析与实验中出现的K-means存在的问题总结与优化如下：

① 聚类不准确

聚类不准确的情况示例如下：

分析：对于右边的样本集，我们用肉眼观察很明显聚类应该如红框所示，但是使用K-Means聚类后得到的结果与预期差异较大，存在多种原因，包括但不限于数据集的随机分布程度、阈值的设置、K的选择。

优化：减小阈值（即质心的位置变化），以达到更加精确的聚类

② 程序出现死循环

分析：对于一个数据集，可能的聚类方式不止一种，并且存在确实无法达到所有的聚类中心差都小于阈值的情况。

优化：加一个变量times用于记录执行了多少次while循环（迭代），当times达到一个很大的值而依旧没有停止程序，可以判断出现了死循环，直接输出结果，不再计算。

③ K值的选择

分析：不同 K 值对实验结果影响较大，但K值在经典K-means中是人为选择。

优化：使用手肘法（核心：取距离和曲线变化的拐点对应的K值）或Gap statistic法代替直接的人为选择，Gap statistic法核心优化问题如下（最大Gap（K）对应的K）：

$\operatorname{Gap}(K)=E\left(\log D_{k}\right)-\log D_{k}$

其中Dk为损失函数，这里E（logDk）指的是logDk的期望（通过蒙特卡洛模拟产生）。

④ 程序容易产生空蔟（最终聚类数量少于K）

分析：经典K-means容易受初始质心的影响，可能收敛到局部最小值。因此算法聚类时，容易产生空簇。

优化：使用K-Means++代替K-means，或使用其它优化初始质心的方法。

六、其他

1. 数据集及资源

本实验所用数据集：ORL5646、AR5040、COIL20。

常用人脸数据集如下（不要白嫖哈哈哈）

链接：https://pan.baidu.com/s/12Le0mKEquGMgh5fhNagZGw
提取码：yrnb

K-means与简单实践完整代码：李忆如/忆如的机器学习 - Gitee.com

2. 参考资料

1.【机器学习】K-means（非常详细） - 知乎 (zhihu.com)

2.K-Means算法实现（Matlab）_数学家是我理想的博客-CSDN博客_k-means++ matlab

3.k 均值聚类 - MATLAB kmeans - MathWorks 中国

4.【机器学习】K-Means算法及多种优化改进算法，聚类模型评估_Day-yong的博客-CSDN博客

5.模式识别中的K均值算法改进_k均值算法的改进-C++代码类资源-CSDN文库

总结

K-means作为经典的聚类算法，通过迭代确定最优质心将数据分为k个簇，实现聚类。如今仍然在机器学习许多领域（数据聚类、语言图像处理、推荐系统）有不错表现。且K-means算法原理简单，实现难度较低。但K-means作为一种无监督学习方法，未利用数据的原有信息，仍存在聚类不准确、容易出现空簇、受质心选择、k值影响等问题，另外，K-means假设的数据属性在现实世界的问题中往往难以达到，从而影响实验结果，本博客已提出一些优化方法与思路，后续博客会分析其他算法优化或解决上述问题。

QCC系列显示交互层的自研技术突破与实践 TengTaiTech QCC308X/QCC518X QCC3091 /QCC3095 qcc304x 蓝牙 QCC ldac
在音频设备智能化进程中，显示交互的流畅度与兼容性已成为用户体验的核心指标。传统方案中，TFT彩屏与多语言适配常面临硬件驱动冲突、功耗失控、字符显示错乱等问题。作为高通平台十年级方案商，腾泰技术在QCC系列中聚焦显示交互层的自研技术突破，形成了一套完整的软硬件协同方案。自研屏显驱动框架：从硬件适配到算法创新腾泰QCC系列的核心竞争力集中在显示交互层的全栈自研技术，其架构可通过「屏显驱动技术栈架构图」
深入理解设计模式：策略模式的艺术与实践 vvilkin的学习备忘设计模式设计模式策略模式
在软件开发中，我们经常会遇到需要根据不同情况选择不同算法或行为的场景。传统的做法可能是使用大量的条件语句（if-else或switch-case），但随着需求的增加和变化，这种硬编码的方式会导致代码难以维护和扩展。策略模式（StrategyPattern）正是为了解决这类问题而诞生的一种优雅的设计模式。策略模式属于行为型设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以相互替换。这种模
嵌入式开发王明列 zynq fpga开发
逻辑开发与软件开发，皆为高度专业化的技术领域，能在两者之间自由穿梭、解决复杂问题的工程师，凤毛麟角。然而，“精通”本身并无边界。在实际工程中，无论是算法实现、高速接口，还是雷达系统、电机控制，每一个方向都深邃如海，足以让人终身钻研。真正重要的，从来不是“掌握一切”，而是在关键问题域中，构建起可闭环的解决路径，持续迭代，稳步积累。因为：再庞大的系统，也由一个个“可掌握的知识点”组成；再高的门槛，也能
OpenCV直线段检测算法类cv::line_descriptor::LSDDetector 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类用于实现LSD(LineSegmentDetector)直线段检测算法。LSD是一种快速、准确的直线检测方法，能够在不依赖边缘检测的前提下直接从图像中提取出直线段。它是OpenCV的line_descriptor模块的一部分，常用于计算机视觉任务如图像拼接、S
分布式锁特点、以及用python3实现redis分布式锁数据知道 python3案例和总结分布式 redis 数据库 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录一、Redis分布式锁核心原理1.1Redis锁机制1.2锁释放二、基础实现代码2.1使用`redis-py`客户端2.2分布式锁类三、使用示例3.1基础锁操作3.2装饰器模式四、高级特性实现4.1Redlock算法（高可用方案）五、生产环境最佳实践5.1锁粒度控制5.2异常处理5.3监控与调试5.4重试机制六、测试代码6.1并发测试6
云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
OpenCV-光流估计
文章目录一、光流估计介绍1.光流估计的基本概念2.光流估计的原理3.光流估计的前提4.OpenCV中的光流估计算法5.参数设置与调整二、代码实现三、注意事项OpenCV中的光流估计是计算机视觉领域中的一项重要技术，它通过分析图像序列中像素点的运动，来估计物体的运动信息。以下是对OpenCV中光流估计的详细解析：一、光流估计介绍1.光流估计的基本概念光流是空间运动物体在观测成像平面上的像素运动的“瞬
HMAC API 接口签名 Message安全验证潘多编程 java高级哈希算法算法
什么是HMAC？HMAC全称（Hash-basedMessageAuthenticationCode，即基于Hash的消息的认证码）。-基本过程为对某个消息，利用提前共享的对称密钥和Hash算法进行加密处理，得到HMAC值。-该HMAC值提供方可以证明自己拥有共享密钥的对称密钥，并且消息自身可以利用HMAC确保未经篡改。为什么需要API接口签名？对外开放的API接口都会面临一些安全问题，例如伪装攻
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
华为OD机试2025C卷 - 小明的幸运数 (C++ & Python & JAVA & JS & GO) 无限码力华为od 华为OD机试2025C卷华为OD2025C卷华为OD机考2025C卷
小明的幸运数华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述小明在玩一个游戏，游戏规则如下：在游戏开始前，小明站在坐标轴原点处（坐标值为0）.给定一组指令和一个幸运数，每个指令都是一个整数，小明按照指令前进指定步数或者后退指定步数。前进代表朝坐标轴的正方向走，后退代表朝坐标轴的负方向走。幸运数为一个整数，如果某个
基于单片机汽车尾气检测/有害气体检测/空气质量检测系统小新单片机单片机设计库单片机嵌入式硬件空气质量 51单片机 stm32
传送门其他作品题目速选一览表其他作品题目功能速览概述本设计实现了一种基于单片机的气体检测系统，专用于汽车尾气或环境有害气体浓度的实时监测。系统核心由微控制器（如STM32/51单片机）、多类型气体传感器阵列（如MQ系列/电化学传感器检测）、显示单元（OLED/LCD）及报警模块构成。传感器采集目标气体浓度并输出模拟/数字信号。单片机通过ADC或数字接口读取数据，经滤波、标定补偿（温湿度补偿）及算法
华为OD 机试 2025 B卷 - 周末爬山 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机考2025B卷华为OD机试2025B卷华为OD机试
周末爬山华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷200分题型题目描述周末小明准备去爬山锻炼，0代表平地，山的高度使用1到9来表示，小明每次爬山或下山高度只能相差k及k以内，每次只能上下左右一个方向上移动一格，小明从左上角(0,0)位置出发输入描述第一行输入mnk(空格分隔)。代表m*n的二维山地图，k为小明每次爬山或下山高度
用 K-means 算法实现水果分堆 wh_xia_jun AI+医疗算法 kmeans 机器学习
先看运行效果：importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeans#生成模拟数据（两个高斯分布的混合点集）np.random.seed(42)X1=np.random.randn(100,2)+np.array([2,2])#第一簇数据，中心在(2,2)X2=np.random.randn(100,2)
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架（原创创新算法）
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架项目背景随着深度学习技术的快速发展，目标检测在各个领域都取得了显著的进展。然而，现有的监督学习方法在实际应用中面临着标注数据稀缺、泛化能力不足等挑战。特别是在火灾烟雾检测、工业质检等特定场景中，获取大量高质量标注数据的成本极高。为了解决这一问题，本项目基于最新发布的YOLOv13架构，结合EfficientTeacher半监督学习框架，
蓝桥杯算法心得——巧克力（贪心）晴天学长算法算法蓝桥杯 java
大家好，我是晴天学长，这是一道国赛题，其中贪心的思想值得学习（逆向思维），写比较器也非常的实用，需要的小伙伴请自取哦！1）巧克力2).算法思路每一天都选保质期内最便宜的注意：这里一定要从最后一天开始选择，这样才可以将保质期这一条件充分利用起来我也是受了其它题解的启发：如果有保质期很长，价格很低，但你很早就吃完了，后面不得不选择昂贵的巧克力，也就是说它原本可以在很多天之后吃就行，现在却在前几天就吃了
USB串口通信、握手协议、深度学习等技术要点深度学习教程, 深度学习人工智能网络协议
基于OpenMV的智能车牌识别系统：从硬件到算法的完整实现前言本文将详细介绍一个基于OpenMV微控制器的智能车牌识别系统的设计与实现。该系统集成了嵌入式视觉处理、串口通信协议、深度学习OCR识别等多种技术，实现了从图像采集到车牌识别的完整流程。系统架构概述整体设计思路该车牌识别系统采用分布式架构设计，将计算密集型任务与嵌入式控制分离：┌─────────────┐USB串口通信┌────────
初探贪心算法 -- 使用最少纸币组成指定金额是小V呀 C++贪心算法算法 c++python
python实现：#对于任意钱数，求最少张数n=int(input("money:"))#输入钱数bills=[100,50,20,10,5,2,1]#纸币面额种类total=0forbinbills:count=n//b#整除面额求用的纸币张数ifcount>0:print(f"{b}纸币张数{count}")n-=count*b#更新剩余金额total+=count#累加纸币数量print(f
数据结构与算法-09贪心算法&动态规划阿诚学java 数据结构与算法学习记录贪心算法动态规划 ios
贪心算法&动态规划1贪心算法介绍贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是全局最好或最优的算法。贪心算法通常用于解决优化问题，如最小化成本、最大化收益等。然而，贪心算法并不总是能够得到全局最优解，但它具有直观、高效、易于实现等优点，因此在许多实际问题中得到了广泛应用。基本思想贪心算法总是从问题的某一个初始解出发。
代码随想录算法Day35(2)||贪心算法-LeetCode406根据身高重建队列
学习内容参考卡哥代码随想录，有文字学习资料（代码随想录网站）和视频讲解（b站）2.根据身高重建队列题目力扣题目链接(opensnewwindow)假设有打乱顺序的一群人站成一个队列，数组people表示队列中一些人的属性（不一定按顺序）。每个people[i]=[hi,ki]表示第i个人的身高为hi，前面正好有ki个身高大于或等于hi的人。请你重新构造并返回输入数组people所表示的队列。返回的
算法第26天|贪心算法：用最少数量的箭引爆气球、无重叠区间、划分字母区间孟大本事要学习算法学习算法贪心算法
今日总结用最少数量的箭引爆气球题目链接：452.用最少数量的箭引爆气球-力扣（LeetCode）代码随想录整体思路：1、统一度量：将所有区间按照左端点进行排序：用到了二维的sort，在类中需要定义静态成员函数cmp，从小到大排列2、进行区间合并（1）如果没有气球，就是0箭（2）如果有气球，至少1箭（3）按照排序从小到大遍历，比较当前位置的左端点是否在前边位置的范围内（&a,vector&b){if
贪心算法（基础算法） breeze_phantom 算法 c++贪心算法
1.引言ok啊，拖更这么长时间也是没有压力（doge）不说啥，直接进入正题。2.概念这个贪心算法呢，看名字就知道，不就是每个步骤都挑最好的嘛，有啥难的。这么说的话......其实确实，你如果真的能很快找出贪心策略那就可以这么说，但还是那句话，策略怎么找是个问题。讲这么多，还没讲一下定义（虽然不讲感觉也能猜出来）：贪心算法就是在特定问题中每一次计算都做出最好的选择，举个例子：本蒟蒻去商店买东西，这商
数据结构与算法----贪心王嘉俊925 算法算法数据结构 C++贪心算法
##贪心算法1.核心思想贪心算法通过每一步的局部最优选择，逐步推导出全局最优解。它的特点是不回溯，即一旦做出选择，就不再修改。2.适用条件贪心算法适用于满足以下两个条件的问题：贪心选择性质：每一步的局部最优选择能够导致全局最优解。最优子结构：问题的最优解包含子问题的最优解。3.贪心算法的证明方法贪心算法的正确性通常需要通过以下方法证明：归纳法：证明每一步的贪心选择都能导致全局最优。交换论证：假设存
零基础数据结构与算法——第五章：高级算法-贪心算法-基础&示例
5.2贪心算法（GreedyAlgorithm）5.2.1贪心算法的基本概念什么是贪心算法？贪心算法是一种在每一步选择中都采取当前状态下最好或最优的选择，从而希望导致结果是最好或最优的算法。生活例子：想象你在超市购物，手里有100元钱，想买尽可能多的零食。如果你采用贪心策略，你会怎么做？你可能会先选择最便宜的零食，然后是第二便宜的，以此类推，直到钱用完。这就是一种贪心策略——每次都选择当前看起来最
【Python】Gym 库：于开发和比较强化学习（Reinforcement Learning, RL）算法彬彬侠 Python基础 python Gym 强化学习 RL Gymnasium
Gym是Python中一个广泛使用的开源库，用于开发和比较强化学习（ReinforcementLearning,RL）算法。它最初由OpenAI开发，提供标准化的环境接口，允许开发者在各种任务（如游戏、机器人控制、模拟物理系统）中测试RL算法。Gym的设计简单且灵活，适合学术研究和工业应用。2022年，Gym被整合到Gymnasium（由FaramaFoundation维护）中，成为主流的强化学习
【LeetCode 1695. 删除子数组的最大得分】解析李昊_ LeetCode leetcode 算法数据结构
目录LeetCode中国站原文原始题目题目描述示例1：示例2：提示：讲解滑动窗口的艺术：寻找无与伦比的“纯净”子数组第一部分：算法思想——可伸缩的“探索边界”1.问题的核心：找到最“值钱”的“纯净”片段2.滑动窗口：一个能屈能伸的“探索框”第二部分：代码实现——滑动窗口的“装备”完整代码展示代码精讲LeetCode中国站原文https://leetcode.cn/problems/maximum-
力扣热题100 - 矩阵：矩阵置零菲英的学习笔记力扣热题100 leetcode 矩阵算法 c++go
本题主要考察代码能力。题目描述：题号：73给定一个mxn的矩阵，如果一个元素为0，则将其所在行和列的所有元素都设为0。请使用原地算法。解题思路：思路一：利用第一行第一列记录0算法思路：1、用2个变量记录矩阵第1行、第1列有没有02、遍历矩阵，如果遇到0则将其对应的第1行和第1列元素置03、遍历矩阵，若元素对应的第1行或第1列元素为0则将其置0时间复杂度：O(N)空间复杂度：O(1)C++//C++
2025 睿抗机器人开发者大赛CAIP-编程技能赛-本科组（省赛）题解弥彦_ 睿抗算法 c++
目录前言RC-u1早鸟价考察算法：思路：注意点：accode：RC-u2谁进线下了？III考察算法：思路：注意点：accode：RC-u3点格棋评价：考察算法：思路：注意点：accode：RC-u4TreeTree的考察算法：思路：注意点：accode：RC-u5游戏设计师考察算法：思路：注意点：accode：前言被t3折磨坏了，几乎全部时间都在调t3，最后只拿了36分，呜呜呜。RC-u1早鸟价考
力扣Leetcode热题100-二分查找解题思路分享花卷321 Leetcode 热门100 leetcode 职场和发展 java 开发语言
1.搜索插入位置题目如下：给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间复杂度为O(logn)的算法。思路分析与最基本的二分查找算法类似，但是基础的二分查找在找不到值的时候一般情况下返回-1，找到的值返回索引，下面先展示最基本的二分查找的Java代码：publicstaticintbinarySearch(in
初识opencv
文章目录1.什么opencv，它的优势点2.opencv安装和环境配置3.了解数字图像的基本概念：像素、彩色图像、灰度图像、二值图像、图像算数操作4.练习numpy中array的基本操作5.练习图像的加载、保存、以及算术操作参考文献1.什么opencv，它的优势点OpenCV是Intel®开源计算机视觉库。它由一系列C函数和少量C++类构成，实现了图像处理和计算机视觉方面的很多通用算法。OpenC
swift5分钟语法速记开发之家 iOS iOS
如果你依然在编程的世界里迷茫，不知道自己的未来规划，小编给大家推荐一个IOS高级交流群：458839238里面可以与大神一起交流并走出迷茫。小白可进群免费领取学习资料，看看前辈们是如何在编程的世界里傲然前行！群内提供数据结构与算法、底层进阶、swift、逆向、整合面试题等免费资料附上一份收集的各大厂面试题（附答案）!群文件直接获取各大厂面试题又把swift相关语法部分看了一遍，并整理了swift语
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

机器学习——K-means（聚类）与人脸识别

系列文章目录

一、K-means聚类算法的原理、过程与分析

1.K-means算法原理

2.K-means算法流程

3.K-means算法分析

1.优点

2.缺点

二、K-means聚类的简单实践及可视化

三、K-means实现人脸与物体聚类及可视化

1.数据导入

2.K-means聚类

3.LDA降维

4.降维与可视化

5.结果与分析

5.1 可视化结果

5.2 数据集与K对聚类精度的影响

5.3 K-means优化前后的比较

四、创新聚类算法设计

五、K-means聚类出现的一些问题分析与优化

① 聚类不准确

② 程序出现死循环

③ K值的选择

④ 程序容易产生空蔟（最终聚类数量少于K）

六、其他

1. 数据集及资源

2. 参考资料

总结

你可能感兴趣的:(机器学习实践,matlab,算法,机器学习)