weixin_39849254

matlab实现kmeans聚类算法_kmeans聚类算法原理总结

k-means算法是非监督聚类最常用的一种方法，因其算法简单和很好的适用于大样本数据，广泛应用于不同领域，本文详细总结了k-means聚类算法原理。

1. k-means聚类算法原理

2. k-means聚类算法步骤

3. k-means++聚类优化算法

4. 小批量处理的k-means聚类算法

5. k值的选取

6. k-means聚类算法不适用的几个场景

7. k-means与knn区别

8. 小结

1. k-means聚类算法原理

聚类算法性能度量的文章提到若簇类相似度好簇间的相似度差，则聚类算法的性能较好。我们基于此定义k-means聚类算法的目标函数：

其中表示当样本划分为簇类k时为1，否则为0。

表示簇类k的均值向量。

目标函数(1.1)在一定程度上刻画了簇内样本围绕簇均值向量的紧密程度，J值越小则簇内样本相似度越高。最小化目标函数是一个NP难题，k-means聚类运用EM算法思想实现模型的最优化。

1)初始化K个簇的均值向量，即是常数，求J最小化时的。我们不难知道当数据点划分到离该数据点最近的簇类时，目标函数J取最小。

2)已知，求最小化J时相应的。令目标函数J对的偏导数等于0：

得：

表达式的含义是簇类中心等于所属簇类样本的均值。

本节用EM算法思想解释了k-means聚类算法的参数更新过程，相信大家对k-means聚类算法有一个更清晰的认识。

2. k-means聚类算法步骤

k-means聚类算法步骤实质是EM算法的模型优化过程，具体步骤如下：

1)随机选择k个样本作为初始簇类的均值向量；

2)将每个样本数据集划分离它距离最近的簇；

3)根据每个样本所属的簇，更新簇类的均值向量；

4)重复(2)(3)步，当达到设置的迭代次数或簇类的均值向量不再改变时，模型构建完成，输出聚类算法结果。

3. k-means++聚类优化算法

若给定足够的迭代次数，k-means算法就能收敛，但是有可能在局部最小值点收敛。k-means收敛局部极值的原因很可能是初始化簇类中心的距离很接近，而且算法的收敛时间也加长了，为了避免这一情况，多次运行k-means聚类算法，每次运行初始化不同的簇类中心。

另一种解决k-means收敛局部极值的方法是k++聚类算法，k-means++通过让簇间中心互相远离的方案来初始化簇类中心。

具体算法步骤：

1)随机选择一个样本数据作为第一个簇类中心；

2)计算每一个样本到簇类中心的最小距离；

3)选择最大距离的样本点作为簇类中心；

4)重复(2)(3)，直到达到簇类个数k；

5)利用这k个簇类中心作为初始化的簇类中心运行k-means算法；

4. 小批量处理的k-means聚类算法

k-means聚类算法的时间复杂度随着样本数的增加而增大，若样本量达到上万时，k-means聚类算法非常耗时，因此对该数据集进行无放回随机抽样得到合适的小批量样本数据集，sklearn.cluster包提供了相应的实现方法MiniBatchKMeans。

小批量处理的k-means聚类算法在减少了收敛时间的同时，算法结果相差不大。如下结果用inertia评价k-means和MiniBatchKmeans的算法结果。

import timeimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import MiniBatchKMeans, KMeansfrom sklearn.metrics.pairwise import pairwise_distances_argminfrom sklearn.datasets.samples_generator import make_blobs# Generate sample datanp.random.seed(0)# minibatch随机抽样100例样本进行训练batch_size = 100centers = [[1, 1], [-1, -1], [1, -1]]n_clusters = len(centers)# 产生3个簇类的30000个样本数据X, labels_true = make_blobs(n_samples=30000, centers=centers, cluster_std=0.7)# k-means++算法k_means = KMeans(init='k-means++', n_clusters=3, n_init=10)t0 = time.time()k_means.fit(X)

t_batch = time.time() - t0

# MiniBatchKMeans算法mbk = MiniBatchKMeans(init='k-means++', n_clusters=3, batch_size=batch_size,n_init=10, max_no_improvement=10, verbose=0)t0 = time.time()mbk.fit(X)t_mini_batch = time.time() - t0# 打印k-means++运行时间和性能度量print("k-means++_runtime= ",t_batch)print("k_means++_metics= ",k_means.inertia_)# 打印minibatch_k_means++运行时间和性能度量值print("MiniBatch_k_means++_runtime= ",t_mini_batch)print("k_means_metics= ",mbk.inertia_)#>k-means++_runtime= 0.36002039909362793k_means++_metics= 25164.97821695812MiniBatch_k_means++_runtime= 0.15800929069519043k_means_metics= 25178.611517320118

图形结果表示：

5. 簇类个数k的选取

我们运用Calinski-Harabasz分数作为评价聚类性能的标准，分数越大，聚类性能越好，Calinski-Harabasz的含义请参考该文，

我们首先构建四个不同标准差的二维样本数据：

from sklearn import metrics# 定义四个簇类中心centers1 = [[0,0],[1, 1],[1.9, 2],[3, 3]]# 定义每个簇类的标准差std1 = [0.19,0.2,0.3,0.4]# 算法可重复性seed1 =45# 产生4个簇类的30000个样本数据X, labels_true = make_blobs(n_samples=30000, centers=centers1, cluster_std=std1,random_state=seed1)plt.scatter(X[:,0],X[:,1],marker='o')plt.show()

数据散点图如下：

首先选择簇类个数为2，即K=2，查看聚类效果图和Calinski-Harabasz分数。

# 若我们选择k=2k_means = KMeans(init='k-means++', n_clusters=2, n_init=10,random_state=10)y_pred = k_means.fit_predict(X)plt.scatter(X[:, 0], X[:, 1], c=y_pred)plt.show()scores2 = metrics.calinski_harabaz_score(X,y_pred)print("the Calinski-Harabasz scores(k=2) is: ",scores2)

散点图效果：

Calinski-Harabasz分数：

#> the Calinski-Harabasz scores(k=2) is:  85059.39875951338

选择簇类个数为3，即K=3，查看聚类效果图和Calinski-Harabasz分数。

散点图效果：

Calinski-Harabasz分数：

#> the Calinski-Harabasz scores(k=3) is:  92778.08155077342

选择簇类个数为4，即K=4，查看聚类效果图和Calinski-Harabasz分数。

散点图效果：

Calinski-Harabasz分数：

#> the Calinski-Harabasz scores(k=4) is:  158961.98176157777

有结果可知：k=4时的Calinski-Harabasz分数最高，因此选择簇类个数为4 。

6. k-means聚类算法不适用的几个场景

k_means算法假设数据是各向同性的，即不同簇类的协方差是相等的，通俗讲就是样本数据落在各个方向的概率是相等的。

1)若样本数据是各向异性的，那么k-means算法的效果较差。

生成一组各向异性的样本数据：

import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfrom sklearn.datasets import make_blobsplt.figure(figsize=(6, 6))n_samples = 1500random_state = 170X, y = make_blobs(n_samples=n_samples, random_state=random_state)# 生成各项异性的数据transformation = [[0.60834549, -0.63667341], [-0.40887718, 0.85253229]]X_aniso = np.dot(X, transformation)plt.scatter(X_aniso[:, 0], X_aniso[:, 1], marker='.')plt.title("Anisotropicly Distributed Blobs")plt.show()

生成样本数据的散点图效果：

根据散点图分布，我们用簇类数k=3训练样本数据：

# k =3训练数据，输出散点效果图y_pred = KMeans(n_clusters=3, random_state=random_state).fit_predict(X_aniso)plt.scatter(X_aniso[:, 0], X_aniso[:, 1], marker='.',c=y_pred)plt.title("clustering scatter distributed k=3")plt.show()

聚类效果图：

由上图可知聚类效果很差。

2)当样本数据集是非凸数据集时，k-means聚类效果较差：

首先生成非凸数据集：

# 非凸数据集plt.figure(figsize=[6,6])from sklearn import cluster,datasetsn_samples = 1500noisy_circles = datasets.make_circles(n_samples=n_samples, factor=.5, noise=.05)plt.scatter(noisy_circles[0][:,0],noisy_circles[0][:,1],marker='.')plt.title("non-convex datasets")plt.show()

散点图效果：

根据散点图分布，我们用簇类数k=2训练样本数据：

# k=2训练数据y_pred = KMeans(n_clusters=2, random_state=random_state).fit_predict(noisy_circles[0])plt.scatter(noisy_circles[0][:, 0], noisy_circles[0][:, 1], marker='.',c=y_pred)plt.title("non-convex k-means clustering")plt.show()

散点图聚类效果：

由上图可知聚类效果很差。

3)当训练数据集各个簇类的标准差不相等时，k-means聚类效果不好。

# 构建不同方差的各簇类数据，标准差分别为1.0,2.5,0.5X_varied, y_varied = make_blobs(n_samples=n_samples,cluster_std=[1.0, 2.5, 0.5],random_state=random_state)y_pred = KMeans(n_clusters=3, random_state=random_state).fit_predict(X_varied)plt.scatter(X_varied[:, 0], X_varied[:, 1], c=y_pred)plt.title("Unequal Variance")plt.show()

由下图可知聚类效果不好：

4)若各簇类的样本数相差比较大，聚类性能较差。

产生三个样本数分别为500,10,10的簇类：

n_samples = 1500random_state = 170# 产生三个簇类，每个簇类样本数是500X, y = make_blobs(n_samples=n_samples, random_state=random_state)# 三个簇类的样本数分别为500,100,10，查看聚类效果X_filtered = np.vstack((X[y == 0][:500], X[y == 1][:100], X[y == 2][:5]))plt.scatter(X_filtered[:, 0], X_filtered[:, 1], marker='.')plt.title("Unequal Variance")plt.show()

散点图分布：

运用k-means对其聚类：

y_pred = KMeans(n_clusters=3,random_state=random_state).fit_predict(X_filtered)plt.scatter(X_filtered[:, 0], X_filtered[:, 1], c=y_pred,marker='.')plt.title("Unevenly Sized Blobs")plt.show()

效果图如下：

5) 若数据维度很大时，运行时间很长，可以考虑先用pca降维。

# 产生100维的15000个样本n_samples = 15000random_state = 170plt.figure(figsize=[10,6])t0=time.time()# 产生三个簇类，每个簇类样本数是500X, y = make_blobs(n_samples=n_samples, n_features=100,random_state=random_state)y_pred = KMeans(n_clusters=3,random_state=random_state).fit_predict(X)t1 =time.time()-t0scores1 = metrics.calinski_harabaz_score(X,y)print("no feature dimonsion reduction scores = ",scores1)print("no feature dimonsion reduction runtime = ",t1)

输出聚类效果和运行时间：

no feature dimonsion reduction scores =  164709.2183791984no feature dimonsion reduction runtime =  0.5700197219848633

数据先进行PCA降维再用k-means聚类，

# 数据先pca降维，再k-means聚类from sklearn.decomposition import PCApca = PCA(n_components=0.8)s=pca.fit_transform(X)t0=time.time()y_pred = KMeans(n_clusters=3,random_state=random_state).fit_predict(s)t1 =time.time()-t0print("feature dimonsion reduction scores = ",scores1)print("feature dimonsion reduction runtime = ",t1)

输出聚类效果和运行时间：

feature dimonsion reduction scores =  164709.2183791984feature dimonsion reduction runtime =  0.0630037784576416

由结果对比可知，聚类效果相差无几的情况下，运行时间大大降低了。

7. k-means与knn的区别

k-means是最简单的非监督分类算法，knn是最简单的监督分类算法，初学者学完监督学习章节再去学非监督章节会感觉似曾相识，原因可能都是用距离作为评价样本间的相似度。下面列举几个区别的地方：

1)knn是监督学习方法，k-means是非监督学习方法，因此knn需要样本的标记类，k-means不需要；

2)knn不需要训练，只要找到距离测试样本最近的k个样本，根据k个样本的类别给出分类结果；k-means需要训练，训练的目的是得到每个簇类的均值向量(质心)，根据质心给出测试数据的分类结果；

8. 小结

k-means算法简单且在一些大样本数据表现较好而得到广泛的应用，本文也列举了k-means不适用的几个场景，其他聚类算法可能很好的解决k-means所不能解决的场景，不同的聚类算法有不同的优缺点，后续文章会持续介绍聚类算法，希望这篇k-means总结文章能帮到您。

参考

https://scikit-learn.org/stable/modules/clustering.html#clustering

https://www.cnblogs.com/pinard/p/6169370.html

聚类 | 超详细的性能度量和相似度方法总结

ClaudeAPi接入 heikeb chatgpt java 人工智能
一，实现目标接入钉钉机器人支持群聊和私聊chatgpt体验：http://me.chat129.comchatgpt学习：http://www.chat129.com网上看了很多方案，因为Claude的api申请难度非常大，大部分都是说使用Slack，但是Slack只能免费使用一个月。作为一个完美主义怎么可能允许这样的事情发生。何如处理，抓网页。只能美，英，魔法这些都是入门小菜，这里不再赘述。自行
PCL 点云OBB包围盒（二）大鱼BIGFISH 点云进阶 C++PCL 点云OBB包围盒
文章目录一、简介二、实现步骤二、实现代码三、实现效果参考资料一、简介包围盒是一种求解离散点集最优包围空间的算法，基本思想是用体积稍大且特性简单的几何体（称为包围盒）来近似地代替复杂的几何对象。（来源于百度）常用的求解包围盒的算法主要有AABB和OOB算法，但AABB算法容易受到物体朝向的影响，产生较大的空隙，因此本文将以OOB算法思想实现最小包围盒的求取。包围盒的应用有很多，如机械上的碰撞测试、物
梯度下降法以及随机梯度下降法 HKkuaidou 人工智能深度学习 python pytorch
梯度下降法就是在更新weight的时候，向函数值下降的最快方向进行更新，具体的原理我就不再写了，就是一个求偏导的过程，有高数基础的都能够很快的理解过程。我在我的github里面会一直更新自己学习pytorch的过程，地址为：https://github.com/00paning/Pytorch_Learning这里我直接展示一个简易实现的python代码，我们还是先看一下运行的效果图：相关pyth
C++14--内存管理（new delete）大胆飞猪 c++
目录1.C++内存管理方式1.1new/delete操作内置类型1.2new和delete操作自定义类型2.operatornew与operatordelete函数3.new和delete的实现原理3.1内置类型3.2自定义类型4.定位new表达式(placement-new)5.malloc/free和new/delete的区别1.C++内存管理方式前言C语言内存管理在C++中可以继续使用，但是
Gone v2 中 Gone-Gin 性能测试报告 dapeng-大鹏 Gone框架介绍 gin gone 依赖注入请求参数依赖注入
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/goner/blob/main/gin/benchmark_test.mdGone-Gin性能测试报告文章目录Gone-Gin性能测试报告简介实现原理核心组件工作流程响应处理机制性能测试测试环境测试用例测试代码示例请求结构体定义Gone-Gin处理函数原生Gin处
MATLAB 操作指南（结尾附实操案例） vvvae1234 信息可视化
一、MATLAB简介MATLAB（矩阵实验室）是一个高级技术计算语言和交互环境，它主要用于数值计算、数据分析、算法开发和可视化。MATLAB的核心功能是矩阵运算，它能够处理向量和矩阵为中心的数学问题，方便用户进行算法的开发和数据可视化。主要特点高效的数值计算：MATLAB内置了许多用于数学和工程计算的函数，用户可以轻松地进行数值运算。可视化功能：MATLAB提供了丰富的工具，用于生成各种类型的图形
SpringBoot使用AspectJ实现AOP记录接口：请求日志、响应日志、异常日志 pan_junbiao Spring Spring Boot 我の原创 spring boot 后端 java
Spring面向切面编程（AOP），系列文章：《Spring面向切面编程（AOP）的简单实例》《Spring使用AspectJ的注解式实现AOP面向切面编程》《SpringBoot使用AspectJ实现AOP记录接口：请求日志、响应日志、异常日志》《SpringBoot使用AspectJ的@Around注解实现AOP全局记录接口：请求日志、响应日志、异常日志》1、AspectJ框架的简介Aspec
C++枚举算法详解卫青~护驾！算法数据结构 c++青少年编程枚举算法
一、枚举算法核心思想枚举算法是一种通过遍历所有可能情况来解决问题的暴力搜索方法，其核心特点是：全面性：不遗漏任何可能性简单性：逻辑直接易实现低效性：时间复杂度通常较高（O(n^k)）适用场景：问题规模有限且可穷举的情况（如数值范围小、维度低）二、经典案例：福尔摩斯密码破解问题描述ABCDE×?=EDCBA其中A,E,?∈[1,9]，B,C,D∈[0,9]所有字符互不相同算法实现（6层嵌套循环）fo
Python 实现的采集诸葛灵签老大白菜 python python 开发语言
Python实现的采集诸葛灵签项目介绍这是一个基于Python开发的诸葛灵签数据采集和展示项目。通过爬虫技术获取诸葛神签的签文和解签内容，并提供数据存储和查询功能。项目结构zhuge/├──zhuge_scraper.py#爬虫主程序├──zhuge_pages/#数据存储目录│├──all_signs.json#汇总数据│└──zhuge_sign_*.json#单个签文数据└──zhuge.m
数据输入输出的概念及在C语言中的实现小宋同学在不断学习旧版C语言学习 c语言开发语言
前言概括1所谓输入输出是以计算机为主体而言的2本章介绍的是向标准输出设备显示器输出数据的语句3在C语言中，所有的数据输入、输出都是由库函数完成的，因此都是函数语句4在使用C语言库函数时，要用编译命令#include将有关“头文件”包括到源文件中，使用标准输入输出库函数时要用到“stdio.h”文件，因此源文件开头由以下预编译指令#include或者#include"stdio.h"stdio是st
白话设计模式之（53）：迭代器模式——数据遍历的“百变魔方” 一杯年华@编程空间白话设计模式设计模式迭代器模式
白话设计模式之（53）：迭代器模式——数据遍历的“百变魔方”大家好！在软件开发的学习过程中，我们都在不断探索如何让代码更加高效、灵活且易于维护。设计模式作为编程领域的关键知识，为我们解决各种复杂问题提供了有力的工具。今天，咱们继续深入研究迭代器模式，它就像一个“百变魔方”，不仅能实现基本的数据遍历功能，还能通过各种扩展和变化，满足不同场景下的数据访问需求。希望通过这篇博客，能和大家一起更全面地理解
深入理解 Java 中 synchronized 的使用和锁升级谢家小布柔 java中的面试题 java 开发语言
目录一、synchronized的使用方式（一）修饰普通方法（二）修饰静态方法（三）修饰代码块二、synchronized的锁升级（一）无锁（二）偏向锁（三）轻量级锁（四）重量级锁在Java并发编程中，synchronized是一个非常重要的关键字，用于实现线程同步，保证在同一时刻只有一个线程可以访问被同步的代码块或方法，从而避免多线程带来的数据不一致等问题。同时，Java虚拟机（JVM）为了提高
C语言数据结构——变长数组（柔性数组） Iawfy22 数据结构 c语言柔性数组
前言这是一位即将大二的大学生（卷狗）在暑假预习数据结构时的一些学习笔记，供大家参考学习。水平有限，如有错误，还望多多指正。本文主要介绍了如何手动实现一个变长数组，以及实现其部分功能（如删除、查找、添加、排序等）变长数组介绍变长数组又可以叫柔性数组，与一般数组不同，它是一个动态的数组，具体表现为可以根据数组里面元素个数的多少而自动的进行扩容，以便达到变长（柔性）的特点。预备知识为了实现自动边长扩容这
pytorch实现cifar10多分类总结 L_pyu 人工智能 pytorch 分类
cifar-10简介：CIFAR-10是一个常用的图像分类数据集，每张图片都是3×32×32，3通道彩色图片，分辨率32×32。它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。CIFAR-10分类任务是将这些图像正确地分类到它们所属的类别中。对于这个任务，可以使用深度学习模型，如卷积
React 和 Vue _使用区别开心小老虎 react知识点+组件 vue3知识点+组件前端知识点 vue.js react.js 前端
目录一、框架介绍1.Vue2.React二、框架结构1.创建应用2.框架结构三、使用区别1.单页面组成2.样式3.显示响应式数据4.响应式html标签属性5.控制元素显隐6.条件渲染7.渲染列表react和vue是目前前端比较流行的两大框架，前端程序员应该将两种框架都掌握，本文总结一些基本知识点的使用区别。一、框架介绍1.VueVue是一个框架，也是一个生态。其功能覆盖了大部分前端开发常见的需求。
王道数据结构第三章（二）- 栈和队列的应用 int型码农数据结构算法
王道数据结构第三章（二）栈和队列的应用一、栈在括号匹配中的应用1.括号匹配2.实现2.前、中、后缀表达式二、栈在表达式求值中的应用1.后缀表达式（重要）1.1中缀转后缀1.2后缀表达式的计算1.2.1手算1.2.2机算2.前缀表达式2.1中缀转前缀2.2前缀表达式的计算3.中缀表达式3.1中缀转后缀的机算（用栈实现）3.2中缀表达式的计算三、栈在递归中的应用1.阶乘2.斐波那契数列四、队列的应用总
HTML网页中添加视频的代码冬瓜生鲜 JavaWeb
//非原创（当时忘记保存大佬连接了，不知道是谁的了，所以没有转载链接，见谅）只需要把名字改改就行如果要实现自动播放：改下这个：controlsautoplaymuted;
手动部署？NONONO，动态上传热部署才是王道！！架构文摘JGWZ 接口学习后端 spring
近期开发系统过程中遇到的一个需求，系统给定一个接口，用户可以自定义开发该接口的实现，并将实现打成jar包，上传到系统中。系统完成热部署，并切换该接口的实现。定义简单的接口这里以一个简单的计算器功能为例，接口定义比较简单，直接上代码。public interface Calculator { int calculate(int a, int b); int add(int a, int
Flutter从0到1：构建跨平台应用的新选择卓桢琳Blackbird
Flutter从0到1：构建跨平台应用的新选择去发现同类优质开源项目:https://gitcode.com/在移动开发领域，寻求一款既能提供高性能，又能实现跨平台的框架是开发者们永恒的话题。这就是我们要向您推荐的【Flutter从0到1】项目，它是一个详细、全面的Flutter学习资源库，旨在帮助初学者和有经验的开发者迅速掌握Flutter并构建出高质量的应用。项目简介Flutterfrom0t
react和vue 基础使用对比圣京都 react react.js javascript vue.js
1.实现功能（ts）0.基础属性使用1.组件直接的通信2.useState动态修改值3.循环遍历功能4.实现类型vue的watch，filter，computed属性功能5.实现类似vue2的生命周期5.类型vuev-if功能的实现2.文件结构图3.具体代码interface.tsimport"./index.less";import{message}from"antd";import{useSt
使用Python的 multiprocessing 模块实现多进程并行计算（上完整代码）小码小李开发语言 python 数据库
使用Python的multiprocessing模块实现多进程并行计算的较为详细复杂的示例代码，用于计算一个较大范围内数字的平方，并将结果汇总。以下是一个更具体、复杂且详尽的多进程并行计算代码示例，用于分析多个大型文本文件中单词出现的频率：importmultiprocessingimporttimeimportrefromcollectionsimportCounter#函数用于读取单个文件内容
nvm的使用汇总柒柒钏小知识点安装教程 NVM
nvm的使用汇总在Linux中安装nvm使用nvm安装Node.js一些特殊用法总结在Linux中安装nvm运行以下命令,用来下载并执行nvm的安装脚本：curl-o-https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.0/install.sh|bash注意：v0.40.0是截至2023年的最新稳定版本。如果需要其他版本，请替换为对应的版本号。安装
数据挖掘技术介绍柒柒钏数据挖掘数据挖掘人工智能
数据挖掘技术介绍分类聚类关联规则挖掘预测异常检测特征选择与降维文本挖掘序列模式挖掘深度学习集成学习数据挖掘（DataMining）是一种从大量数据中提取有用信息和模式的技术，旨在从数据中发现隐藏的规律、趋势或关系，从而为决策提供支持。分类定义：是一种监督学习方法，用于将数据分为不同的类别。功能：根据已标记的训练数据，学习一个模型，用于预测新数据的类别。方法：决策树、支持向量机、神经网络、逻辑回归、
【Python】全局解释器锁（Global Interpreter Lock，GIL）彬彬侠 Python基础全局解释器锁 GIL CPython 多进程 C 扩展 python
全局解释器锁（GlobalInterpreterLock，简称GIL）是CPython（Python的标准实现）中的一个机制，它确保同一时刻只有一个线程在执行Python字节码。GIL的主要作用是保护Python内部的数据结构，避免多线程访问共享数据时发生竞争条件，导致数据损坏。GIL的工作原理在Python的多线程环境中，GIL会限制多个线程同时执行Python字节码。尽管操作系统可以调度多个线
Spring Cloud 与微服务学习总结（14）—— 云原生时代，如何从 Java 开发者转型微服务？一杯甜酒 Spring Cloud与微服务 java 云原生 spring cloud 微服务微服务架构
前言根据维基百科定义，微服务不是整体应用程序中的一个层。相反，微服务是一个独立的业务功能，具有清晰的接口，并且可以通过内部组件实现分层架构。从战略角度来看，微服务架构基本上遵循“做一件事，就要做得好”的Unix哲学。为了应对传统单体架构的缺陷，微服务架构被企业广泛应用。然而，实践之前有很多问题都需要提前考虑清楚，比如Java背景的开发者是否更有优势？微服务、容器化、DevOps和CI/CD之间的关
《基于单片机的交通灯设计与实现（附论文+源代码）》 Blossom.118 单片机课程设计系列单片机嵌入式硬件单片机课程设计 51单片机工科软硬件技术 stm32 c++
1、项目背景交通灯控制系统是城市交通管理的重要组成部分，其作用是合理分配道路资源，缓解交通拥堵，保障行人和车辆的安全。传统的交通灯系统多为固定时长控制，而基于单片机的交通灯控制系统可以通过编程实现更灵活的控制逻辑，例如根据车流量调整信号时长，甚至实现智能交通管理。2、设计思想交通灯设计是以单片机AT89C51芯片作为核心原件，LED灯、八段数码管等构成交通灯显示系统，利用单片机的电源电路、时钟电路
深度学习在医疗影像诊断中的应用与实现 Evaporator Core #DeepSeek快速入门人工智能 #深度学习深度学习人工智能
引言随着人工智能技术的快速发展，深度学习在医疗领域的应用日益广泛，尤其是在医疗影像诊断方面。医疗影像数据量大、复杂度高，传统的诊断方法往往依赖于医生的经验，容易受到主观因素的影响。而深度学习通过自动学习特征，能够从海量数据中提取出有用的信息，辅助医生进行更精准的诊断。本文将探讨深度学习在医疗影像诊断中的应用，并通过代码示例展示如何实现一个简单的医疗影像分类模型。深度学习在医疗影像诊断中的应用1.图
C++调用Python程序方法超级大反派@_@ C++c++python 开发语言
前言：在之前做的一个项目中，要使用一段Python的代码。一般来讲可以将Python代码中的功能在C++项目中重构，但是如果Python项目太大，或者这部分是别人写的，自己不清楚整个项目的逻辑，这样重构起来就比较麻烦。这里给出了另外一种实现方法，即利用Python的API使得C++项目可以直接启动Python程序，快速在PC端验证代码功能。急性子可直接看：2.2C++调用python有参有返回值函
图神经网络学习笔记—高级小批量处理（专题十四） AI专题精讲图神经网络入门到精通人工智能
小批量（mini-batch）的创建对于让深度学习模型的训练扩展到海量数据至关重要。与逐条处理样本不同，小批量将一组样本组合成一个统一的表示形式，从而可以高效地并行处理。在图像或语言领域，这一过程通常通过将每个样本缩放或填充为相同大小的形状来实现，然后将样本在一个额外的维度中分组。该维度的长度等于小批量中分组的样本数量，通常称为batch_size。由于图是能够容纳任意数量节点或边的最通用的数据结
YOLOv8涨点大全总结（源码）清风AI 深度学习 YOLO 计算机视觉神经网络人工智能 python
（需要全部源码请私信或留言）性能指标在探讨YOLOv8的性能提升之前，我们需要明确评估其性能的主要指标。这些指标不仅是衡量模型优劣的标准，也是后续改进工作的出发点。常见的性能指标包括：指标名称含义mAP5050%交并比阈值下的平均精度mAP50-9550-95%交并比阈值范围内，步长为5%的平均精度Precision预测正确的正样本占总预测正样本的比例Recall预测正确的正样本占实际正样本总数的
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

matlab实现kmeans聚类算法_kmeans聚类算法原理总结

聚类 | 超详细的性能度量和相似度方法总结

你可能感兴趣的:(matlab实现kmeans聚类算法_kmeans聚类算法原理总结)