@李忆如

最优化方法——K-means实现手写数字图像聚类

系列文章目录

一、问题

二、实验思路综述

（1）实验工具

（2）实验数据

（3）实验目标

（4）实验步骤

三、K-means聚类算法的原理与算法过程

（1）K-means算法原理

（2）K-means算法流程

（3）K-means算法分析

四、手写数字图像聚类

（1）导入并处理MNIST数据集

（2）K-means聚类

（3）结果可视化

3.1 PCA

3.2 LDA

五、存在问题与优化及创新聚类算法设计

六、结果与分析

（1）复杂度分析

（2）样本数对聚类效果的影响

（3）可视化结果展示

（4）编程语言对于聚类效果的影响

（5）算法优化前后聚类效果对比

（6）实验小结

七、其他

1. 数据集及资源

2. 参考资料

系列文章目录

本系列博客重点在最优化方法的概念原理与代码实践，不包含繁琐的数学推导（有问题欢迎在评论区讨论指出，或直接私信联系我）。

~~代码可以全抄~~ 大家搞懂原理与流程去复现才是有意义的！！！

第一章最优化方法——K-means实现手写数字图像聚类

梗概

本篇博客主要介绍K-means算法的原理与流程，降维算法的优化问题解决与使用，并分别使用Matlab、Pycharm分别实现了使用K-means算法在实际问题中（对MNIST手写数字数据集）的聚类并进行分析，并分别使用了PCA与LDA对其进行了降维可视化（内附数据集和python及matlab代码）。

一、问题

手写数字图像数据分类问题：文件train_images.mat包含大小为28*28的手写数字图像，共60000张；文件train_labels.mat是其对应的数字标签。文件数据的具体读写和数据格式，请参考附件DataRead.m文件。实验要求对手写数字图像进行聚类，并讨论其性能：

(MNIST DATABASE下载网址: http://yann.lecun.com/exdb/mnist/)

(1) 对train_images.mat的前100张手写数字图像进行聚类，共10类；

图1. 文件前100张手写数字图像

(2) 对train_images.mat的前1000张手写数字图像进行聚类，共10类；

(3) 根据实际情况，讨论k-Means能对多少张手写图像进行聚类，性能如何？

二、实验思路综述

（1）实验工具

本次实验分别使用Matlab、Pycharm分别实现了使用K-means算法对MNIST数据集聚类并进行分析。

（2）实验数据

MNIST数据集是机器学习领域中一个经典数据集，由 60000 个训练样本和 10000 个测试样本组成，每个样本都是一张 28 * 28 像素的灰度手写数字图片。本次实验使用到MNIST的手写体的图像数据（train_images.mat）和图像数据对应的标签（train_labels.mat）。

（3）实验目标

本次实验要求使用K-means算法建立模型，对手写体进行聚类，再对聚类的结果进行性能对比和分析。

（4）实验步骤

本次实验大致步骤如表1所示：

表1 实验1大致步骤

1．读取并处理MNIST数据集

2. 使用K-means算法对手写体进行聚类

3. 使用降维算法对聚类结果进行可视化

4. 对聚类结果进行性能分析

三、K-means聚类算法的原理与算法过程

（1）K-means算法原理

K-means是一种无监督的学习，主要通过不断地取离种子点(质心)最近均值的数据，自动将相似的对象归到同一个簇中（共聚类k个簇），循环往复执行，直到满足聚类的收敛条件为止。常用于聚类分析。K-means中所用最重要方法即求点群中心的算法：即欧氏距离，公式（以n维数据为例）如下：

K-means算法的简单示例（K=2）如下图2：

图2 K-means算法的简单示例

（2）K-means算法流程

经典 K-means 算法的基本工作流程基本与（1）中原理描述相适应，具体的执行步骤如表2所示：

表2 K-means算法流程

（3）K-means算法分析

K-means优点如下：

① 算法简单，容易理解，聚类效果不错

② 处理大数据集的时候，该算法可以保证较好的伸缩性

③ 当簇近似高斯分布的时候，效果相对较好

K-means缺点如下：

① K值需要人为设定，不同 K 值对实验结果影响较大

② 对初始的簇中心敏感，不同选取方式对实验结果影响较大

③ 对异常值敏感

④ 每个样本只能归为一类，不适合多分类任务

⑤ 不适合太离散的分类、样本类别不平衡的分类、非凸形状的分类

四、手写数字图像聚类

（1）导入并处理MNIST数据集

①导入：实验所给的手写体文件数据集是以mat格式来存储的。如果使用matlab实验，使用拖拽文件导入或使用DataRead.m中的DataRead函数（代码如下）进行导入均可，若使用Python进行实验，需要使用相关的工具库进行导入，例如scipy.io中的函数loadmat。导入成功后，其中一张手写体图片如图3所示。

function DataRead()

load ./train_images.mat    % Read image data

load ./train_labels.mat       %Read lable of images

ImgNum = 1; 
GetOneImg = train_images(:,:,ImgNum);
figure(1);
imshow(GetOneImg,[ ]);   %Show the image


 disp(['The number of Image is :  ',num2str(train_labels(ImgNum))]);
end

图3 手写体图片样例展示

②处理：为方便后续操作，应对相关参数（k、right_num、num_sample等）进行设置，并在实验前对数据进行处理。导入后的数据库为28 * 28 * 60000的三维矩阵，使用reshape函数将每张图片拉成一个列向量，前期处理的核心代码如下：

k = 5; % 设置k
right_num = 0; %正确个数
num_sample = 1000; %待聚类个数
train = reshape(train_images,784,60000);
train_data = train(:,1:num_sample); %取前n列做训练

（2）K-means聚类

根据表2中K-means的算法流程与上文提到的算法原理，对实验代码进行编写。

①初始化：处理完数据后，对K-means所需一些参数进行初始化，包括获取数据库的行列与相关信息，对迭代次数times的定义，并使用randperm函数对K个初始聚类中心进行随机初始化，相关代码如下：

data = train_data;
times = 0;
N = k;
%%  初始化工作
[n,m] = size(data); % m = 列,n = 行
center = zeros(n,N);% 初始化聚类中心，生成n行N列的零矩阵
pattern = data;     % 将整个数据拷贝到pattern矩阵中
%% 算法
for x = 1 : N
    % 第一次随机产生聚类中心 randperm随机取数
    center(:,x) = data(:,randperm(num_sample,1)); 
end
while true
distence = zeros(1,N);   % 产生1行N列的零矩阵
num = zeros(1,N);        % 产生1行N列的零矩阵
new_center = zeros(n,N); % 产生n行N列的零矩阵

②聚类与质心更新：对K-means对应参数与初始质心初始化完后，不断重复以下过程：计算出每一张手写体图片与聚类中心的距离，挑选出每张手写体图片距离最近的聚类中心，并把聚类中心的下标按顺序储存到数组C中；接着继续更新质心。重新计算质心后，若质心改变，则更新质心，这时候迭代次数times+1。直到所有质心均不发生移动或迭代次数大于阈值，代码如下：

%% 将所有的点打上标签1 2 3...N
for x = 1 : m
    for y = 1 : N
        distence(y) = norm(data(:,x) - center(:,y)); % norm函数计算到每个类的距离
    end
    [~,temp] = min(distence); %求最小的距离 ~是距离值，temp是第几个
    pattern(n + 1,x) = temp;         
end
times = times+1;
tag = 0;
%% 将所有在同一类里的点坐标全部相加，计算新的中心坐标
for y = 1 : N
    for x = 1 : m
        if pattern(n + 1,x) == y
           new_center(:,y) = new_center(:,y) + pattern(1:n,x);
           num(y) = num(y) + 1;
        end
    end
    new_center(:,y) = new_center(:,y) / num(y);
    if norm(new_center(:,y) - center(:,y)) > 0.0001 %设定最小误差变化（阈值）
        tag = 1;
    end
end
if tag == 0 || times > 10000 % 设置终止条件（加入最大迭代次数限制）
     break;
else
     center = new_center;
end
end

拓展：K-means聚类算法在matlab、Python中均有集成，可直接调用，如在matlab中可使用[idx,C] = kmeans(___)命令实现聚类，idx即聚类后各数据的标签，C为聚类后的质心集合，详细用法见：k 均值聚类 - MATLAB kmeans - MathWorks 中国

③正确率计算：手写数字数据集MNIST为带标签数据集，本实验标签在train_labels中。但由于K-means为无监督算法，并不能匹配相应的标签，所以需要人为计算聚类正确率。计算方法核心为：利用mode函数统计聚类中每类出现的最多的标签数作为该类预测标签，并根据如下公式计算正确率。

代码如下：

% 聚类正确率
 idx = pattern(785:785,:);
%idx = idx_pc'; % 调库正确率分析
for i = 1:k
    num_i = 0;
    index = zeros(1,num_sample);
    index_label = zeros(1,num_sample);
    for j = 1:num_sample
      if idx(1,j) == i
         num_i = num_i + 1;
         index(num_i) = j;
         index_label(num_i) = train_labels(:,j) + 1;
      end    
    end
    %找出第二多出现的数
    test = mode(index_label);
      index_label(index_label==test) = [];
      [test2,n] = mode(index_label);
        right_num = right_num + n;
end

（3）结果可视化

为使聚类结果更加清晰具体，可以使用降维算法将结果可视化，本实验以PCA与LDA为例。

3.1 PCA

PCA（主成分分析）为主流的一种线性降维算法。以“最小重构误差”为目标导向，通过降维（投影），用数据中相对重要（最主要）的信息表达（代替）原数据，从而达到降维的目的。原理就是其协方差矩阵对应的特征向量，按照对应的特征值大小进行排序，最大的特征值就是第一主成分，其次是第二主成分，依次类推。PCA优化问题如公式1所示，算法流程如表3所示：

3.2 LDA

LDA（线性判别分析）为主流的一种线性降维算法。以“最小化类内方差，最大化类间方差”为目标导向，通过投影，达到降维的目的更好地将样本分类，原理就是通过对目标函数的特征分解达到原理的目的。LDA优化问题如公式2所示，算法流程如表4所示：

Matlab样例使用PCA代码如下：

% %%PCA降维可视化
% % 2.图像求均值，中心化
% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% mean_data = mean(data,2);
% centered_data = (data - mean_data);
% % 3.求协方差矩阵、特征值与特征向量并排序
% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% 
% cov_matrix = centered_data * centered_data';
% [eigen_vectors, dianogol_matrix] = eig(cov_matrix);
% 
% % 从对角矩阵获取特征值
% eigen_values = diag(dianogol_matrix);
% 
% % 对特征值按索引进行从大到小排序
% [sorted_eigen_values, index] = sort(eigen_values, 'descend'); 
% 
% % 获取排序后的征值对应的特征向量
% sorted_eigen_vectors = eigen_vectors(:, index);
% 
% all_eigen_data = sorted_eigen_vectors;
% 
% %可视化
% 
% eigen_data = all_eigen_data(:,1:i);
% i = 3; %降维数
%     % 投影
%     projected_test_data = eigen_data' * (data - mean_data);
% 
%     color = [];
%     for j=1:num_sample
%         color = [color floor((j-1)/4)*5];
%     end
% 
%     if (i == 2)
%         waitfor(scatter(projected_test_data(1, :), projected_test_data(2, :), [], color));
%     else
%         waitfor(scatter3(projected_test_data(1, :), projected_test_data(2, :), projected_test_data(3, :), [], color));
%     end

详细PCA教程与使用（Matlab）可见：机器学习——PCA（主成分分析）与人脸识别_@李忆如的博客-CSDN博客_pca人脸识别

详细LDA教程与使用（Matlab）可见：

机器学习——LDA（线性判别分析）与人脸识别_@李忆如的博客-CSDN博客_lda

补充：PCA与LDA均可调库与手动实现，本实验中笔者在matlab中手动实现PCA与LDA，在Python中使用对应库函数（参考使用他人代码），例如PCA使用的是Python的sklearn库，调用decomposition.PAC加载PCA进行降维，使用参数n_components指定主成分的个数（降维个数）。

五、存在问题与优化及创新聚类算法设计

详情见机器学习——LR（线性回归）、LRC（线性回归分类）与人脸识别_@李忆如的博客-CSDN博客_lr线性回归

六、结果与分析

（1）复杂度分析

K-means优化问题如图4所示：

图4 K-means算法的优化问题

（2）样本数对聚类效果的影响

为探究样本数对聚类效果的影响，需要确定k = 10，改变num_sample，探究过程与结果分析如下（以matlab为例）：

①num_sample = 100

首先设置参数，num_sample=100(即取data的前100列做训练)，k=10，time_while=100，将前100张手写数字图像聚成10类，并且重复运行100次做统计分析，得到如图5所示的可视化图表。可以看到，100次聚类测试中，聚类的平均正确率为58.14%，最高达到68%，最低为45%，方差为0.003，每次聚类的平均时间为0.049s。

图5 num_sample=100，k=10，time_while=100时的正确率

补充：为探究聚类后具体参数（聚类中心、迭代次数、时间、正确率等）并分析，笔者在实验时选取5次实验结果进行详细展示，如表6所示：

聚类次数	聚类中心	迭代次数	聚类时间(s)	正确率
1	[3,9,3,0,1,2,8,7,4,6]	6	0.052	67.00%
2	[6,4,3,0,3,8,9,0,1,1]	4	0.037	66.00%
3	[1,4,7,7,7,0,6,8,3,0]	5	0.039	65.00%
4	[7,1,3,3,0,0,8,6,9,4]	5	0.065	69.00%
5	[8,4,0,7,1,0,6,9,3,1]	7	0.066	66.00%
平均	-	5.4	0.052	66.33%

②num_sample = 1000

类似①，首先设置参数，num_sample=1000，k=10，time_while=100，将前1000张手写数字图像聚成10类，并且重复运行100次做统计分析，得到如图6所示的可视化图表。可以看到，100次聚类测试中，聚类的平均正确率为54.42%，最高达到62.81%，最低为46.11%，方差为0.002，每次聚类的平均时间为1.269s。

图6 num_sample=1000，k=10，time_while=100时的正确率

分析：通过对①与②的比较，可以看出随着样本数增大，聚类效果有降低或波动趋势，且时长增加，接下来将会对这一结论进行验证。

③对不同num_sample的情况进行对比分析

为验证上述结论，需要对更多不同num_sample的情况进行对比分析。所以在这里对num_sample=100，1000，3000，5000，7000，9000，11000的情况做了统计分析，结果如表7所示，正确率变化趋势如图7所示，运行时间变化趋势如图8所示。

表7 k=10的前提下，样本数不断增加的对比测试结果

聚类样本	聚类中心	平均正确率	最高正确率	最低正确率	方差	平均时间(s)
100	10	58.14%	68.00%	45.00%	0.0030	0.049
1000	10	54.42%	62.81%	46.11%	0.0020	1.269
3000	10	57.35%	62.57%	50.13%	0.0008	4.783
5000	10	56.72%	62.90%	50.38%	0.0009	8.316
7000	10	56.17%	62.57%	52.60%	0.0008	12.13
9000	10	56.55%	59.04%	54.77%	0.0007	15.981
11000	10	55.88%	58.69%	52.30%	0.0005	20.259

图7 K-means正确率随样本数变化的变化趋势

图8 K-means运行时间随样本数变化的变化趋势

分析：由表7、图7与图8统计分析，可清晰看出，在10个聚类中心的前提下，从正确率的角度来说，随着聚类的样本数的增加，K-means算法的平均正确率都集中在55%-60%，且有波动或下降的趋势。从运行时间的角度来说，随着样本数的增加，平均运行时间也不断增加。

④K-Means聚类数量上限及性能

为了探究本次设计的K-Means能对多少张手写图像进行聚类及其性能，在k=10的情况，我选取数据集中全部60000张图片进行聚类，聚类的正确率为58.47%，仍处于55%-60%的区间，运行时间为166.92s。所以本K-Means算法能完成对全部60000张手写图像进行聚类，性能正确率可以达到58.47%。

（3）可视化结果展示

当num_sample=100，k=10时，运行程序，正确率为58.14%，Python使用PCA降维得到如图9的聚类可视化结果，Matlab使用LDA降维得到的可视化如图10所示：

图9 num_sample=100，k=10的聚类前（左边）和聚类后（右边）的PCA可视化结果

图10 num_sample=100，k=10的聚类后的LDA可视化结果

当num_sample=1000，k=10时，运行程序，正确率为54.42%%，Python使用PCA降维得到如图11的聚类可视化结果：

图11 num_sample=1000，k=10的聚类前（左边）和聚类后（右边）的PCA可视化结果

分析：在经过降维算法的可视化后，可以轻易看出数据集使用K-Means进行聚类并不能有很好的效果。有一部分原因是K-means 是根据28*28来度量距离的，取前两维之后可视化的效果不会特别好。但本质上K-means作为一种无监督的基于距离的聚类算法，仍存在时间复杂度较高并且在实际问题中聚类中心的数量和选取在一开始难以精准确认等问题，这都使得K-Means算法的聚类结果并没有表现的很好。

（4）编程语言对于聚类效果的影响

为探究编程语言对聚类效果的影响，确定k=10，分别使用Matlab与Python实现手写数字聚类，探究过程与结果分析如下：

①编程语言对正确率的影响

首先设置参数，确定k = 10，令num_sample=100、1000、3000、5000、9000，time_while=100，分别使用Matlab与Python将前num_sample张手写数字图像聚成10类，并且重复运行100次做统计分析，结果如表8与图12所示：

表8 不同编程语言对聚类正确率的影响

图12 不同编程语言对聚类正确率的影响

分析：由表8与图12分析可知，在不同样本数下Python聚类正确率略高于Matlab但基本一致，且均有波动趋势，平均正确率仍处于55～60%区间。

②编程语言对聚类时间的影响

类似①，首先设置参数，确定k = 10，令num_sample=100、1000、3000、5000、9000，60000，time_while=100，分别使用Matlab与Python将前num_sample张手写数字图像聚成10类，并且重复运行100次做统计分析，结果如表9与图13所示：

表9 不同编程语言对聚类时间的影响

图13 不同编程语言对聚类时间的影响（除num_sample = 600000）

分析：由表9与图13分析可知，在不同样本数下Python聚类时间均高于Matlab，且随着样本数增加，运行效率差距变大。

（5）算法优化前后聚类效果对比

为验证创新聚类算法的优化效果，同时使用优化算法与经典K-means算法完成手写数字聚类任务，探究过程与结果分析如下：

首先设置参数，确定k = 10，令num_sample=100、1000、3000、5000、9000，time_while=100，分别使用K-means与优化算法将前num_sample张手写数字图像聚成10类，并且重复运行100次做统计分析，结果如表10与图14所示：

表10 算法优化前后聚类效果对比

图14 算法优化前后聚类效果对比

分析：由表9与图14分析可得，在不同样本数下，优化算法聚类效果均优于经典K-means算法，以此验证了优化的正确性。

（6）实验小结

（1）本次实验分为实验思路综述、K-means聚类算法的原理与算法过程、手写数字图像聚类、存在问题与优化及创新聚类算法设计、结果与分析五大部分，探究了K-means的原理与流程，并在实际问题中实践并对比分析。

（2）随着样本数量（num_sample）的增加，K-means对MNIST的聚类正确率有一定波动，但基本维持在55～60%，运行时间不断增加，在本次实验中聚类样本数对实验没有限制，K-means可以完成MNIST完整数据集（60000张图片）的聚类。

（3）经过PCA、LDA等降维算法的可视化后，可以较直观地看出聚类前后效果，并由此分析出数据集使用K-Means进行聚类并不能有很好的效果。

（4）不同编程语言对聚类效果有一定影响，在本次实验中，在不同样本数的情况下，Python的聚类正确率基本均略高于Matlab，但随着样本数增大，Python相对Matlab的聚类时间会大大增加。

（5）针对经典K-means的相关问题实验中做了分析与优化，并提出了创新聚类算法，并在不同样本数下与传统K-means进行了对比分析，优化算法的聚类正确率均高于经典算法，验证了优化算法的优越性。

七、其他

1. 数据集及资源

本实验所用数据集：MNIST

Python代码：深大计软_最优化方法_实验1：K-Means聚类之Python实现手写数字图像MNIST分类_聚类mnist-机器学习文档类资源-CSDN文库

2. 参考资料

1.【最优化方法】K-Means聚类实验：Python实现手写数字图像MNIST分类_Ferry_xie的博客

2.机器学习——K-means（聚类）与人脸识别_@李忆如的博客-CSDN博客_聚类识别

你可能感兴趣的:(最优化方法,python,kmeans,matlab)

如何修改Python安装路径壹只小小码农 python 学习开发语言
在安装软件时，很多人都会发现默认的安装路径不是他们想要的，于是就想要修改安装路径。那么如何修改安装路径呢？本文将从多个角度为大家进行分析。一、在安装向导中更改一般情况下，我们在安装软件时会看到安装向导，其中会有一个“安装路径”选项，我们可以在这里手动更改安装路径。不同软件的安装向导可能略有不同，但是一般都会有这个选项。二、使用修改器有些软件虽然没有提供修改安装路径的选项，但是我们可以使用一些修改器
Python中类基础知识详解和应用点云SLAM Python python 开发语言深度学习人工智能计算机视觉 python中的类学习
Python类知识详解类的定义语法class类名:#类体（属性、方法）示例：classPerson:pass创建类的实例（对象）p=Person()#创建一个类的对象（实例）类的构造方法（__init__）__init__是类的构造函数，在实例化对象时自动调用，用于初始化属性。classPerson:def__init__(self,name,age):self.name=nameself.age
python+requests+excel 接口测试鱼鱼说测试 postman python 开发语言
1、EXCEL文件接口保存方式，如图。2、然后就是读取EXCEL文件中的数据方法，如下：1importxlrd234classreadExcel(object):5def__init__(self,path):6self.path=path78@property9defgetSheet(self):10#获取索引11xl=xlrd.open_workbook(self.path)12sheet=x
Flask(二) 路由routes @昵称不存在 Flask flask
文章目录基本路由定义路由参数路由规则设置请求方法（GET/POST）路由函数返回静态文件和模板Blueprint（模块化路由）显示当前所有路由Flask路由是Web应用程序中将URL映射到Python函数的机制。定义路由：使用@app.route(‘/path’)装饰器定义URL和视图函数的映射。路由参数：通过动态部分在URL中传递参数。路由规则：使用类型转换器指定URL参数的类型。请求方法：指定
python中random中uniform怎么用_Python中的random.uniform()函数教程与实例解析 weixin_39763640
random.uniform()函数教程与实例解析1.uniform()函数说明random.uniform(x,y)方法将随机生成一个实数，它在[x,y]范围内。2.uniform()的语法与参数2.1语法#_*_coding:utf-8_*_importrandomrandom.uniform(x,y)或#_*_coding:utf-8_*_fromrandomimportuniformuni
Python实例题：基于 KNN 算法的手写数字识别
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于KNN算法的手写数字识别要求：实现一个基于K-NearestNeighbors(KNN)算法的手写数字识别系统。支持以下功能：使用MNIST数据集训练和测试模型实现KNN分类算法可视化手写数字样本评估模型性能（准确率、混淆矩阵等）添加用户交互界面，允许用户绘制数字并进行识别。解题思路：使用sklearn加载MNIST数据
Python实例题：基于遗传算法的旅行商问题求解狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于遗传算法的旅行商问题求解要求：使用遗传算法解决旅行商问题（TSP）。支持以下功能：随机生成城市坐标或导入预定义城市实现遗传算法的基本操作（选择、交叉、变异）可视化进化过程和最终路径统计进化过程中的适应度变化允许用户调整遗传算法参数（种群大小、迭代次数、交叉率、变异率等）。解题思路：用列表表示城市访问顺序作为染色体。使用欧
Python Flask Web教程004：Flask 变量规则若北辰 flask python 前端
FlaskWeb教程004：Flask变量规则1.Flask变量规则2.实例3.转换器构建规则4.规范的URL5.路由尾部有无斜杠的区别路由尾部斜杠的影响推荐使用带尾斜杠的路由结论1.Flask变量规则通过向规则参数添加变量部分，可以动态构建URL。此变量部分标记为。它作为关键字参数传递给与规则相关联的函数。2.实例在以下示例中，route()装饰器的规则参数包含附加到URL'/hello’的。因
Club_IntelliMatch_Development_Guide Joseit python python pygame django flask
ClubIntelliMatch系统-全栈开发流程文档概述ClubIntelliMatch系统是一个现代化的社团活动智能匹配平台，采用前后端分离架构。系统基于PythonFlask构建RESTfulAPI后端，Vue.js3+Vite构建现代化前端，MySQL作为持久化数据存储。本文档深入分析了整个开发流程的技术架构、设计原则和实现细节。系统架构流程图后端API架构前端组件架构app.pyFlas
Python实例题：基于 Flask 的博客系统狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：1.base.html2.index.html3.post.html4.create_post.html5.login.html6.register.htmlPython实例题题目基于Flask的博客系统要求：使用Flask框架构建一个简单的博客系统。实现用户认证（注册、登录、注销）。支持博客文章的创建、编辑、删除和查看。使用SQLite数据库存
Python助力自动驾驶：深度学习模型优化全攻略 Echo_Wish Python！实战！python 自动驾驶深度学习
Python助力自动驾驶：深度学习模型优化全攻略说起自动驾驶，大家第一反应往往是“高精地图”“传感器融合”“路径规划”等等，背后真正的“大脑”其实是各式各样的深度学习模型。它们负责感知环境、识别路况、预测行为，甚至实时做出决策。可是，跑在车上的这些模型不仅要精准，还得轻量、实时、稳定，这可不是简单的“丢GPU就能解决”的问题。今天，咱们就从Python开发者的视角，聊聊自动驾驶里深度学习模型的优化
Ansible部署MySQL实操码农运维知识运维 mysql ansible mysql
一、Ansible概述Ansible是一款开源的自动化运维工具，由MichaelDeHaan于2012年创建，2015年被红帽（RedHat）收购（收购金额超1亿美元）。它基于Python开发，通过SSH协议实现远程节点管理，无需在被控端安装任何客户端代理（Agentless）。这种设计使其成为轻量级、易部署的自动化解决方案，特别适合批量系统配置、应用程序部署和任务编排等场景。核心特点无代理架构：
AI绘画背后的技术：Stable Diffusion原理详解与实战 AI学长带你学AI ai
AI绘画背后的技术：StableDiffusion原理详解与实战关键词：StableDiffusion、扩散模型、AI绘画、潜在空间、文本生成图像摘要：本文将带你揭开AI绘画“魔法”背后的核心技术——StableDiffusion的神秘面纱。我们会用“给小学生讲故事”的方式，从生活中的例子出发，逐步解释扩散模型的底层逻辑、StableDiffusion的关键创新，并用Python代码实战演示如何生
matplotlib 绘制热力图扶子 python matplotlib绘图代码 matplotlib python 经验分享热力图
1、功能介绍：使用了matplotlib和seaborn两个python库来创建并显示一个热力图。热力图是一种通过颜色变化来表示二维表格数据集中值分布的图形，适合用于展示矩阵数据或数据分析结果中的模式和趋势。2、代码部分：importmatplotlib.pyplotaspltimportseabornassnsimportnumpyasnp#设置中文字体plt.rcParams['font.sa
open3d 使用 RANSAC 算法拟合平面扶子 python 点云处理平面 python open3d 经验分享点云拟合平面
1、功能介绍：一个python代码演示了如何使用open3d和numpy来完成一个完整的点云平面拟合任务。它包括以下几个主要部分：生成符合某一平面方程的随机点云数据、使用RANSAC算法对这些点云进行平面拟合、可视化原始点云和平面拟合结果2、代码部分：importnumpyasnpimportopen3daso3d#生成随机点云np.random.seed(42)n_points=100#假设这些
pycharm——djiango之数据迁移，终端操作 Pop– python
首先在pycharm中找到terminal(终端)，输入指令：pythonmanage.pymakemigrations之后你会看到如下图：这表示创建成功。接着输入指令：pythonmanage.pymigrate就能看到好多ok，你在数据库中也能看到很多表你可以在终端打开数据库查看表，也可以使用客户端的可视化界面查看，还可以在pycharm中右边的database里边打开查看，如下图：之后你就可
python 百度云api_Python使用百度API上传文件到百度网盘代码分享 weixin_39775577 python 百度云api
#coding:UTF-8importurllibimporturllib2__author__='Administrator'fromposter.encodeimportmultipart_encodefromposter.streaminghttpimportregister_openersregister_openers()defupload(fileName):"""通过百度开发者API
Flask入门基础1 浅清陌 Flask flask python 后端
1Flask简介Flask诞生于2010年，是Arminronacher（阿明·罗纳彻）用Python语言基于Werkzeug工具箱编写的轻量级Web开发框架。Flask本身相当于一个内核，其他几乎所有的功能都要用到扩展（邮件扩展Flask-Mail，用户认证Flask-Login，数据库Flask-SQLAlchemy），都需要用第三方的扩展来实现。比如可以用Flask扩展加入ORM、窗体验证工
C++封装python调用库技术大白 c++开发语言
传结构体中间用空字符串问题使用callback传输结构体，中间出现\0字符，使用std::vector类型voidPyProcessInterface::ProcessContent(constchar*buff,UINT32size,boolfromSelf){if(callback){std::vectordataVec(buff,buff+size);callback(std::move(d
量化价值投资入门：Fama-French三因子模型详解与实战应用量化价值投资入门到精通 ai
量化价值投资入门：Fama-French三因子模型详解与实战应用关键词：量化投资、Fama-French三因子模型、价值投资、因子投资、资产定价、Python实现、投资组合管理摘要：本文深入解析Fama-French三因子模型的理论基础、数学原理和实际应用。作为现代金融学最重要的资产定价模型之一，三因子模型通过市场因子、规模因子和价值因子解释股票收益差异。我们将从模型起源开始，详细讲解其数学表达和
Python操作百度网盘指南 weixin_47233946 编程 python 开发语言
##介绍百度网盘是中国流行的云存储服务，通过API可以实现自动化操作。本指南介绍如何使用Python操作百度网盘，包括上传、下载、管理文件等功能。##准备工作###1.获取百度网盘开发者权限1.访问[百度开发者中心](https://pan.baidu.com/union/home)2.注册开发者账号并创建应用3.获取API密钥（AppKey和SecretKey）###2.安装必要的Python库
python读取sas数据集_SASpy模块，利用Python操作SAS
SASpy模块打通了Python与SAS之间的连接。有了SASpy模块，我们就能够在Python中操控SAS。本文将首先介绍SASpy模块的一些基本方法，最后通过一个聚类分析的例子，来展示如何在Python中调用SAS的机器学习过程，以及对聚类结果的可视化。SASpy模块特点1、需要Python3.X及以上，SAS9.4及以上，需要Java环境；2、无论是本地SAS还是远程服务器上的SAS，都可以
从数据抓取到分析：用Python爬虫获取、清洗与可视化数据程序员威哥 python 爬虫 c++
在数据科学领域，数据的获取、清洗与分析是整个数据处理过程中的关键步骤。随着互联网上数据的不断增多，使用Python爬虫抓取网站数据并进行分析已成为数据科学家和分析师的常见任务。本篇文章将通过具体的实例，展示如何使用Python从零开始抓取数据，清洗数据，并进行数据分析和可视化。1.数据抓取：用Python爬虫获取网页数据1.1选择爬虫工具Python提供了多个强大的爬虫框架和库，常用的工具包括：r
Python基础（吃洋葱小游戏） aaiier python pygame 开发语言
下面我将为你设计一个"吃洋葱小游戏"的Python实现方案，使用Pygame库开发。这个游戏模拟吃洋葱的过程，玩家需要收集不同种类的洋葱以获得高分，同时避免吃到辣椒。吃洋葱小游戏-Python实现方案1.游戏设计概念游戏目标：玩家控制角色吃掉尽可能多的洋葱获得高分核心机制：洋葱从屏幕上方随机下落玩家左右移动角色接住洋葱不同洋葱有不同分值（普通洋葱+10，红洋葱+20，紫洋葱+50）辣椒会扣减生命值
模拟工作队列 - 华为OD机试真题(JavaScript卷) 什码情况算法面试 javascript 数据结构华为od
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述让我们来模拟一个工作队列的运作，有一个任务提交者和若干任务执行者，执行者从1开始编号。提交者会在给定的时
数据分类 - 华为OD机试真题(JavaScript 题解) 什码情况华为od javascript 开发语言数据结构算法机试
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述对一个数据a进行分类，分类方法为：此数据a（四个字节大小）的四个字节相加对一个给定的值b取模，如果得到的
odrive软件的版本 m0_55305757 stm32 电机嵌入式硬件 odrive
odrive软件的版本0.4.0通信方面引入一个fibre变复杂了（节点还是手工生成的），cpp程序开始变多了。（sensorless我看到变成独立文件了）pythontool开始使用pip安装形式。0.5.0开始支持spi的encoder，as5047之类0.5.1据说之后的版本controlloop开始变化0.5.2开始应该是大修改了//RequiredtouseOC4forADCtrigge
说说自己Python 代码优化实践 chilavert318 大数据 linux 运维 python
今年上半年在外省做一个大数据相关的项目，在review项目组成员的代码时，发现一段处理大数据集的模块存在明显性能瓶颈：10万条数据的清洗流程耗时近20分钟，CPU占用率却始终在30%以下。深入分析后发现，看似简洁的Python代码背后，隐藏着诸多可以优化的细节——这并非个例，我们的程序在追求代码可读性时，往往忽略了Python特有的性能陷阱。今天抽点时间，从我实践中的代码就python开发，从内存
ROS学习笔记5：常用API和模块导入
前言本人ROS小白，利用寒假时间学习ROS，在此以笔记的方式记录自己每天的学习过程。争取写满15篇(5/15)。环境：Ubuntu20.04、ROS1：noetic环境配置：严格按照下方学习链接的教程配置，基本一次成功。学习链接：【Autolabor初级教程】ROS机器人入门对应链接文档：ROS机器人入门课程《ROS理论与实践》笔记绝大部分代码使用Python语言编写。本期关键词：初始化，话题服务
一个简单测试Deepseek吞吐量的脚本,国内环境可跑谢平康深度学习 pytorch 人工智能
一个简单测试Deepseek吞吐量的脚本,这里用DeepSeek-R1-Distill-Qwen-32B,支持单卡409024G可跑,具体看你的硬件情况做调整,理论支持所有的模型,看你需要,可以修改模型名称,重点是pip使用国内的源,模型下载用阿里的ModelScope,无障碍下载,使用.最后可以生成一个txt与html报表.前提是你安装了python与python-venv,你可以不用venv来
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理