Python_YBYB

典型聚类——K-means算法原理及python实战

1 聚类算法简要介绍
1.1 聚类是什么
聚类是机器学习中的一种重要的无监督算法，可以将数据点归为一系列的特定组合。聚类算法可以将数据点聚成不同的类，揭示数据集中蕴含的不为人知的规律，从而指导我们的生产和生活。简单地说，聚类就是将对象进行分组，使得相似的对象归为一类。对于聚类其实我们并不陌生，我们常说的“物以类聚，人以群分”指的就是聚类。

1.2 聚类算法的应用场景
当聚类作为一个单独的过程时，用来寻找数据本身所蕴含的“分布结构”规律。例如，可以应用聚类结合已知的移动客户所在位置数据为连锁餐饮机新店选址提供参考。
聚类也可以为有监督学习做数据的前期准备，也可以用来为后期对数据做进一步细分。

2 通俗地讲聚类算法的过程
聚类算法是无监督学习的典型算法，其中K-means算法又是其中最经典的算法。K-means算法要求预先设定聚类的个数K，然后不断更新聚类中心，通过多次迭代直至算法收敛或者达到某一个预设的阀值。K-means算法的过程可以简单总结如下：
（1）从含有n个点的数据集中任意选择K个对象作为初始聚类中心。
（2）根据（1）中设置的K个聚类中心，计算每一数据点到这K个中心的距离。
（3）通过步骤（2）的距离计算了以后，每一个数据点与这K个聚类中心都有有一个距离值。这些距离有远的有近的，将数据点与距离它最近的聚类中心归为一类。
（4）通过（3）了以后，数据集被划分成了K个类簇。
（5）重复步骤（3）和步骤（4），不断迭代直至归类趋于稳定或者分类变化量较小时，停止迭代。

2.1 相似度通过距离来度量
聚类就是按照数据的相似度将其划分为多个类别，使得类别内部数据相似度较大而类别间相似度较小。这个“相似度”就是通过距离来进行表示。距离越大，相似度越小，距离越小，相似度越大。最常见的距离是“闵可夫斯基距离”：

$dist(x_{i},x_{j})=\left ( \sum_{u=1}^{n}\left | x_{iu}-x_{ju} \right |^{p} \right )^{\frac{1}{p}}$

(1)当时，闵可夫斯基不等式就是高中数学中的距离，即欧式距离。

（2）当时，闵可夫斯基不等式就是曼哈顿距离。

（3）当 $p\rightarrow \infty$ 时，闵可夫斯基不等式就是切比雪夫距离。

2.2 聚类的性能如何进行度量？

对于性能的评估，下面介绍两种方法：

（1）数据集含有标签信息。有时候虽然数据含有标签信息，也就是说原始数据含有正确的分类信息。但是仍然将数据聚类的时候，就可以考虑使用调整兰德系数（ARI）指标。ARI指标和有监督学习中的准确率比较类似，在sklearn模块中的metrics中就可以调用。

（2）数据不含有标签信息。如果数据集不含有所属类别信息，那么可以考虑使用轮廓系数来评估聚类效果，关于轮廓系数，在下文中会有进一步的介绍。一般来说，轮廓系数越大，聚类效果越好。轮廓系数可以在sklearn模块的metrics中调用silhouette_score来实现。

2.3 具体算法介绍：K-means算法

K-means算法是聚类算法中最简单、最常用的一种，其算法过程如下：

（1）随机选取数据集中的K个初始点作为聚类中心。

（2）为数据集中的每一个点寻找（1）中最近的聚类中心，数据集距离哪个中心最近就把数据集分配到该聚类中心对应的簇。

（3）通过过程（2）了以后，原始数据集被划分成了K个类簇。这个时候，计算每一个类簇的均值并将此均值作为新的聚类中心。

（4）转到步骤（2）和步骤（3）一直到聚类中心不变或者变化很小时停止。

K-means算法中的K个初始聚类中心是随机选取的，一个自然的问题是，不同的初始聚类中心会不会影响最终得到的聚类结果呢？答案是肯定的。在实际问题中，比较合理的是依据具体的实际问题选取合理的K值。

仔细想一想K-means算法过程，随机选取K个点作为初始聚类中心的确会对聚类结果产生影响，这也是K-means算法的缺陷。为此K-means++算法对此问题作了改进。

2.4 具体算法介绍：K-means++算法

针对K-means算法随机选取K个初始点的问题，戴维等人于2007年提出了K++算法。K-means++解决这一个问题的核心思想是，初始聚类中心并不是随机选取，而是希望这K个初始聚类中心分得越开越好。整个算法过程如下：

（1）随机选取一个初始点作为第一个聚类中心，为了叙述的方便，记为点A。

（2）首先计算除了A点以外的所有数据点与A点的距离，记为，如果数据集包含有n个点，那么得到的距离值就应该有n-1个。接下来，剩下的这n-1个点作为下一个聚类中心的概率 $P=\frac{D(x)^{2}}{\sum D(x)^{2}}$ 。

（2）' 计算每一个数据点与当下已有聚类中心中隔着自己最近的那个聚类中心的距离(在初始时候，聚类中心只有A点，做的是步骤（2）)。接着计算数据点被选用为下一个聚类中心的概率P（P的计算在（2）中已经给出）

（3）用轮盘法选出下一个聚类中心。（何为轮盘法，后面会说）

（4）重复步骤（2）'和（3）直至选出K个聚类中心。

（5）K个聚类中心选出来了以后，就可以用经典的K-means算法了。

下面，采用一个简单的例子来熟悉上述过程：

假设我们有一个数据集，为了方便采用二维的点集，数据集中共有8个样本，如下图所示：

首先是随机选取一个初始聚类中心，我们不妨选择1号点，那么选取第二个聚类中心的计算过程如下表所示：

K-means++示例数据
序号	1	2	3	4	5	6	7	8
	0		$2\sqrt{2}$		$\sqrt{5}$	$2\sqrt{5}$	$2\sqrt{10}$	$\sqrt{37}$
$D(x)^{2}$	0
	0							0.314
	0

其中，表示数据与初始选的第一个聚类中心1号点的距离，表示数据点被选为下一个聚类中心的概率，是概率的累计值。用轮盘法选出下一个聚类中心：

首先为每一个数据点确定一个其所在的区间，例如2号点所在的区间为[0.034,0.102)，3号点所在的区间为[0.102,0.136),4号点所在的区间为[0.136,0.178),这样确定下去。接下来产生一个0~1之间的一个随机数，随机数在哪个区间中，就选取对应的哪个数据点作为第二个聚类中心。

当完成K个聚类中心的选取了以后，就可以使用经典的K-means算法了。

3 机器学习库sklearn实战——K-means算法

为了方便，使用sklearn.datasets.make_blobs()生成聚类所需要的数据。make.blobs（）函数可以根据指定的特征变量数量类簇聚类中心数量等参数生成指定类别的数据，用于测试聚类算法的效果，make.blobs（）的参数声明可查询有关的资料。

首先导入所需要用到的包：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
from matplotlib.font_manager import FontProperties

使用make_blobs生成聚类所需要的样本数据：

#样本数据量为300，类簇数量为4，每一个簇内样本标准差为0.50,
X,y=make_blobs(n_samples=300,centers=4,cluster_std=0.50,random_state=0)  #X：300行2列的数据

根据生成的样本数据，开始进行聚类运算：

#将类簇数量遍历1~10，以便于后面找到合适的K值
list1=[]
for i in range(1,11):
    kmeans=KMeans(n_clusters=i,init='k-means++',max_iter=300,n_init=10,random_state=0)
    #初始化聚类中心的方式为K-means++,最大迭代次数为300，算法运行次数为10次，随机数种子为0
    kmeans.fit(X)   #训练数据
    list1.append(kmeans.inertia_)   #将每次循环训练数据时，聚类得到的每一个类簇的误差平方和添加到列表中

看看list1的结果：

print('十次结果的误差平方和:',list1)

#运行结果：十次结果的误差平方和: [2746.776260520676, 1121.4338468225149, 477.68455404063826, 147.2263862575243, 131.1318469883225, 119.16725404063813, 106.51193704849615, 96.12264557325749, 86.52582034564936, 78.70960563748244]

为了图形的可视化出现的有关标签以中文以及负号显示，需要设法使得pyplot支持中文和负号：

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

下面开始绘制误差随着K值（1~10）变化的图像：

plt.ylim(0,max(list1))  #设置y轴的范围
plt.xlim(0,11)     #设置x轴的范围
plt.plot(range(1,11),list1,c='r')
plt.title('误差随着K的变化曲线')
plt.show()

图像显示结果如下：

从图中可以看出，K取4的时上述曲线出现拐点同时曲线自此以后下降量都很小了。因此可以考虑以K=4进行聚类：

#以K=4进行聚类：
new_kmeans=KMeans(n_clusters=4,init='k-means++',max_iter=300,random_state=0)
result_y=new_kmeans.fit_predict(X)  #对特征数据的聚类结果储存在result_y中
print(result_y)   #打印测试

#结果：
[0 2 1 2 0 0 3 1 2 2 3 2 1 2 0 1 1 0 3 3 0 0 1 3 3 1 0 1 3 1 2 2 1 2 2 2 2
 2 3 0 1 3 1 1 3 3 2 3 2 0 3 0 2 0 0 3 2 3 2 0 2 1 2 3 3 3 2 0 2 3 1 3 2 3
 3 2 3 1 0 2 0 1 0 0 2 1 0 1 2 2 1 0 2 3 3 1 0 0 1 3 2 0 2 0 1 0 0 1 2 1 3
 3 0 2 0 1 2 0 0 1 3 0 3 0 0 0 0 3 0 3 2 3 3 0 2 3 3 2 1 2 2 3 1 3 1 3 2 1
 2 2 2 1 2 1 0 3 2 3 0 1 2 1 1 0 1 3 3 1 0 1 1 2 0 1 3 2 0 0 1 3 0 1 3 3 1
 1 1 1 0 2 1 3 1 1 3 3 3 1 3 2 1 3 0 3 1 2 3 2 1 2 1 3 1 1 2 3 3 0 0 1 2 0
 0 3 0 3 1 2 2 1 1 2 1 0 3 1 0 3 2 3 0 1 0 2 2 2 2 3 3 2 1 3 0 1 3 3 3 0 0
 2 1 1 3 0 2 3 1 2 1 0 0 3 3 1 0 0 0 1 2 2 0 0 1 0 0 0 2 3 2 1 0 0 2 2 2 0
 0 1 2 3]

聚类中心：

denters=new_kmeans.cluster_centers_  #聚类中心
print('聚类中心:',denters)   #打印测试


#运行结果：
聚类中心:
 [[ 1.99469693  0.8727049 ]
 [ 0.95415778  4.39985544]
 [-1.35241261  7.76731726]
 [-1.57480456  2.84532424]]

绘制K=4聚类的图像：

#绘制图形：
fig=plt.figure(figsize=(90,8))
ax1=plt.subplot(131)
ax1.scatter(X[:,0],X[:,1])
ax1.scatter(denters[:,0],denters[:,1],c='r',s=100)
plt.title('K=4的聚类结果')
plt.show()

运行结果如下图所示：

从图像中，可以看出，K=4时聚合效果较好。

当然，在选择K时，不局限于上述方法。还可以用sklearn模块的metrics中的函数adjusted_rand_score计算ARI找到合适的K进行聚类。不过需要注意的是该方法只适用于数据集含有正确分类标签的情形。当数据集不含分类标签时候，除了上述方法以外，还可以用轮廓系数与K的变化关系情况开选择合适的K值，当轮廓系数最大时，对应的就是最合适的K值。轮廓系数可以通过sklearn库的metrics中的silhouette_score函数进行计算。上述提到的sklearn.metrics中的两个函数可查阅有关资料了解参数声明，此处不再展开说明。

初学Python两个月，对python进行数据分析和机器学习等等方面比较感兴趣，借此机会想和大家一起分享所得和交流有关方面，文中肯定有许多不足之处，望各位大佬多多指教。

本文写作过程中主要参考了以下资料：

1.《Python 数学实验与建模》——司守奎、孙玺菁

2.《Python数据分析从入门代实践》——高春艳、刘志铭

3.《从0开始机器学习的数学原理和算法实践》——大威

4.《Scikit-learn机器学习详解》——潘风文、潘启儒

读书笔记06‖《时间管理，如何充分利用你的24小时》 Gemini_565d
54分钟，你没有听错，我读完了这本妙趣横生的书！总共128页，平均每分钟2页的阅读速度，我能行，你可以做到！作者用幽默诙谐的语言向我们讲述了时间管理的有效方法，字数不多，风格独特，没有废话！实际上并不单单指你24小时的内容！且来看看这本不占用你时间，但给你提出时间管理的技巧！01.主要结构与内容1.篇章结构上半部分:如何利用时间？下半部分:是否正在使用时间发挥最大效用？2.主要概念（1）意识是时间
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
2023-03-22 小郭不会打篮球
3.21笔记一、定位作用：显示定在所有其他元素之上、可以让元素在浏览器中任意位置。a标准流块级元素独占一行→垂直布局行内元素/行内块元素一行显示多个→水平布局b浮动可以让原本垂直布局的块级元素变成水平布局c定位可以让元素自由的摆放在网页的任意位置一般用于盒子之间的层叠情况1、属性名：position静态定位：static相对定位：relative绝对定位：absolute固定定位：fixed向下移
nextjs学习笔记 ainuo5213 web前端框架学习 next react react服务端渲染 next入门
由于本人最近在学习jocky老师的React16.8+Next.js+Koa2开发Github全栈项目关于react的服务端重构项目，然后跟着老师的视频做笔记，记录下自己的所学知识。目录结构pages(必需)：pages目录是nextjs中最终要的一个目录，这个目录的每一个文件都会对应到每一个页面，可以根据地址栏的路由进行跳转。若pages下的js文件在一个目录下，那么nextjs默认会将这个
计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW) Python毕设源码程序高学长 python 课程设计 uni-app
计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW)该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+uni+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+UNI等等组成，B/S模式+pychram管理
Python-Django毕业设计养老院老人日常生活管理系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
读书笔记：德鲁克《管理的实践》17 李唐星辰
1、【企业对员工的要求】这个版块中提到：企业期望员工不只是被动接受劳动力工作，而必须主动承担达成经营绩效的责任。……要求越高，表现越好，是人的特性，因此员工能发挥多大的生产力，很大部分取决于企业对他们的要求有多高。星辰感悟：人的潜力是无限的。说这句话的时候，不仅肯定了自己，也肯定了所有奋斗的人。很多时候，认知会限制我们的想法。这跟小马过河是一个道理。松鼠小觉得小溪就是一条河，但是对于马儿来说根本不
Java程序设计笔记是程序蜂啊 java 笔记开发语言
Java程序设计目录Java程序设计第一章java语言开发环境1.1工具篇1.2Eclipse调整字体第三章Java基础3.1java基本数据类型3.2关键字与标识符3.3常数3.4变量3.5.数据类型转换3.6由键盘输入数据4.1顺序结构4.2分支语句5.1什么是数组5.2数组赋值：5.3一维数组5.4二维数组6.1类的基本概念6.2定义类6.3对象的创建与使用6.4参数的传递第七章java语言
Supervisor 入门指南一篇就够 —— 安装、项目配置与常见报错速查逻极 python 开发工具笔记 python 运维工具开发 supervisor
Supervisor入门指南一篇就够——安装、项目配置与常见报错速查一、Supervisor是什么在服务器进程管理中，Supervisor是一款用Python编写的进程守护与管理工具。它的核心功能是将普通的命令行进程转变为后台daemon进程，并且在进程因意外情况退出时，能够自动将其重启，保证进程的持续运行。在实际应用中，它常出现在多层架构里。比如在Nginx→Gunicorn/Django→Su
Python基础（字符串的切片与断言）日暮凡尘 python 开发语言 pycharm
'''1.输入一个字符串，判断是否只包含英文字母（大写或小写）。输出True或False。2.输入一个字符串，统计里面数字字符（0-9）的数量。3.输入两个字符串，第一个是主串，第二个是要查找的字符，判断字符是否在主串中。4.输入一个字符串，将所有数字字符转换成整数后求和。5.统计字符串中空格的数量6.输入字符串和数字n，判断字符串是否只包含数字且长度等于n。7.验证用户输入的手机号格式（中国手机
《陪伴成长》读书笔记(一) 姬磨小学李会巧
今天，我读了《陪伴成长》中的“家庭教育不能盲从”这一章节，感受颇深。的确，在这个重视教育的年代，怎么样才能把自己的孩子教育成功呢？我们的孩子到底需要什么样的教育呢？当今社会，很多人都在渴望自己的孩子成为优秀，但他们很多人都忽视了优秀人才成长的基础；众多人都在关心孩子的教育，但他们很多人都把目光投向了分数；众多人都在以孩子成绩为荣，但他们很多人都淡忘了心理健康与道德修养；众多人都在给予爱，但他们很多
python 变量进阶（理解）程序员同行者
变量进阶（理解）目标变量的引用可变和不可变类型局部变量和全局变量01.变量的引用变量和数据都是保存在内存中的在Python中函数的参数传递以及返回值都是靠引用传递的1.1引用的概念在Python中变量和数据是分开存储的数据保存在内存中的一个位置变量中保存着数据在内存中的地址变量中记录数据的地址，就叫做引用使用id()函数可以查看变量中保存数据所在的内存地址注意：如果变量已经被定义，当给一个变量赋值
黑衣天使看见幸福开花
今日笔记：谁用脑谁受苦。半夜吃东西，因为我饿了，饿了就吃，困了就睡。不再带着担忧恐惧对孩子说：大半夜吃了东西，对肠胃不好啊。但我担忧恐惧半夜吃东西对孩子不好时，第一步要做的是格这个担忧恐惧，而不是欺骗自己说不担忧不恐惧，需要诚意的面对自己的情绪，再功课处理情绪。当我愤怒攻击对方，想让对方关注我，理解我的时候，我需要做的是看到自己的愤怒委屈，看着我的愤怒宝宝，委屈宝宝，而不是去想他为什么要如此针对我
python——for_in循环何处望天明CS python
#Nico#时间：2021/4/2021:09#for-in循环'''in表达式从（字符串、序列等）中依次取值，又称为遍历for-in遍历的对象必须是可迭代对象''''''for-in的语法结构for自定义变量in可迭代对象:循环体'''#字符串中取值foritemin'python':print(item)#range产生一个整数序列，也是一个可迭代对象foriinrange(10):print
一步一步学Python3(小学生也适用) 第十七篇:循环语句for in循环
一、Pythonforin循环Pythonforin循环，是用来遍历任何数据序列，如一个列表，一个字符串，一个字典，一个元组等。forin循环的一般语法如下：foritemin序列:语句块else:语句块forin字符串：把每个字符循环出来'''字符串：把每个字符循环出来'''str1='老树Python''''把字符串str1元素进行循环，每循环出一个元素，就把该元素赋值给item'''fori
OpenCV中常用特征提取算法（SURF、ORB、SIFT和AKAZE）用法示例（C++和Python）点云SLAM 图形图像处理 opencv 算法 ORB算法 SIFT算法 SURF算法 AKAZE算法计算机视觉
OpenCV中提供了多种常用的特征提取算法，广泛应用于图像匹配、拼接、SLAM、物体识别等任务。以下是OpenCV中几个主流特征提取算法的用法总结与代码示例，涵盖C++和Python两个版本。常用特征提取算法列表算法特点是否需额外模块SIFT（尺度不变特征）稳定性强、可旋转缩放xfeatures2d模块SURF（加速稳健特征）快速但专利保护xfeatures2d模块ORB（OrientedFAST
python 循环结构(for-in) 编程小僧 python基础
循环结构(for-in)说明：也是循环结构的一种，经常用于遍历字符串、列表，元组，字典等格式：forxiny:循环体执行流程：x依次表示y中的一个元素，遍历完所有元素循环结束示例1：遍历字符串s='Iloveyoumorethanicansay'foriins:print(i)示例2：遍历列表l=['鹅鹅鹅','曲项向天歌','锄禾日当午','春种一粒粟']foriinl:print(i)#可以
Python学习笔记 cherishSpring python python 学习笔记
目录一、名词解释二、数据类型（变量名无类型，变量值有类型）三、数据类型转换(万物皆可转字符串)四、标识符五、运算符六、字符串扩展七、数据输入八、if语句九、while语句十、for循环语句十一、函数十二、数据容器1、List列表2、tuple元组3、字符串4、序列的常用操作-切片5、set集合6、dict字典7、数据容器相互转换8、通用操作十三、文件编码一、名词解释1、字面量被写在代码中的固定的值
Python for循环 dengdieli5313 python
Pythonfor循环可以遍历任何序列的项目，如一个列表或者一个字符串。for循环的语法结构如下：foriterating_varinsequence:statements(s)最简单的形式如下，循环10次。1foriinrange(10):2print("loop:",i)输出为1loop:02loop:13loop:24loop:35loop:46loop:57loop:68loop:79lo
D065+8组煎果子+《高效能人士的7个习惯》读书笔记煎果子
习惯一：积极主动时下盛行的社会观点认为，环境与条件对我们起着决定性的作用。我们不否认条件作用的影响巨大，但并不等于承认它凌驾于一切之上，甚至可以决定我们的命运。在外界的刺激与最后的回应之间，人拥有选择的自由，这也是人与动物之间最大的不同。史蒂芬•柯维指出，看一个人的时间和精力集中于哪些事物，就可以大致判断出他是否积极主动。作者将我们关注的问题分成两类：关注圈和影响圈。关注圈，是指我们关注的问题，包
白帽必备技术栏目一（javascript基础）
直接进入主题正好也在带学生会把笔记同步发送到csdn上后期不管是去就业还是在家里挖洞都都行javascript基础注意事项局部作用域里面给到的变量不加var就会变成全局变量数据类型boolean布尔类型boolean除了0和空字符串以及nullundefined其他的都是truevarbool=true;varbool=false;number类型varnum=10;//10varnum=0x23
人的行为读书笔记，2-7 夕颜剑主
第二章人的行为科学在认识论层次的一些问题第七节历史的范畴和专门的研究方法1.历史的研究范畴与历史家如何进行真正的历史工作历史的范畴是研究所有关于人的行为的经验资料。历史学家收集、批判、筛选所有可以取得的文件，以这种证据为基础，着手进行真正的历史工作。2.错误的历史研究方法有人说，历史的任务是揭露一些事件实际上是如何发生的，不允许有所遐想，亦不许有价值判断（也即，对于一切价值判断保持中立）。他们认为
《我和你》读书笔记（六）相信，遇见心理咨询师卜彬
如何才能在一个生命的里面让早被掩埋的联系能量复活呢？如何才能让一个一直生活在任性之中的人觉到自由呢？自由同命运如影随形，任性与灾难也是如影随形。但自由同命运有誓约，任性与灾难、灵魂魔魅与世界鬼魇，则不过是一团和气地住在一起，而且很小心不想伤害和气，哪有什么结合可言，也谈不上有摩擦，完全无意义可言——直到在某一刻，眼神一不小心对上了，终于意识到原来并没有得到救赎！自由人是那种并非由于任性而有所想要的
python的for-in循环小白L. 入门 python numpy 开发语言
‘’‘for-in循环in表达从（字符串序列）中依次取值，又称为遍历for-in遍历的对象必须是可迭代对象for-in的语法结构for自定义的变量in可迭代对象:循环体循环体内不需要访问自定义变量，可以将自定义变量替代为下划线’‘’#第一次取出来的是P，将P赋值item，将item的值输出foritemin'python':print(item)#range（）产生一个整数序列，–》也是一个可迭代
Python-for-in循环難釋懷 python windows 服务器
一、前言在Python编程中，循环结构（LoopStructure）是程序控制流的重要组成部分。其中，for...in循环是Python中最常用、最简洁的迭代工具之一。与传统的C风格语言中的for不同，Python的for...in循环专门用于遍历可迭代对象（Iterable），如列表、元组、字符串、字典、集合，甚至是生成器等。本文将带你深入了解：for...in循环的基本语法；如何高效地遍历各种
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
脱岗离岗逃岗监测识别软件系统平台标检测算法#YOLO
值班脱岗智能监测识别系统是一种利用AI视频智能分析技术的智能化系统，能够对办公工作岗位区域、岗亭、值班室、生产线岗位等进行7*24小时不间断实时监测。该系统的出现，有助于提高工作效率，确保工作秩序的正常运行，同时也能有效避免值班人员脱岗、懈怠等现象的发生。该系统的工作原理是通过高清摄像头捕捉实时画面，然后利用AI视频智能分析技术对画面进行实时分析，识别出是否有人脱岗、懈怠或者有其他异常情况发生。当
Matlab 数字图像第二章矩阵及其运算肌肉猛1大序子 matlab 矩阵开发语言图像处理
目录2.1矩阵的创建2.1.1直接输入：2.1.2载入外部数据文件2.1.3利用内置函数创建2.2矩阵的寻访2.2.1下标元素访问2.2.2访问单元素2.3矩阵的拼接2.3.1矩阵拼接符[]2.3.2函数2.4矩阵的运算2.4.1加减2.4.2乘除2.4.3乘方2.4.4按位运算2.4.5行列式与秩2.4.6逆与迹2.4.7矩阵的范数（?)2.4.8特征值和特征向量PS纯纯用来记笔记，要是有错随时
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
Python设计模式：适配模式 niuguangshuo python基础 python 设计模式开发语言
1.适配模式（AdapterPattern）详解适配模式（AdapterPattern）是一种结构型设计模式，它允许将一个类的接口转换成客户端所期望的另一种接口。适配模式使得原本由于接口不兼容而无法一起工作的类可以协同工作。换句话说，适配模式充当了一个桥梁，允许不同接口的类之间进行交互。在软件开发中，常常会遇到需要使用现有类的情况，但这些类的接口与我们需要的接口不匹配。适配模式提供了一种解决方案，
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

典型聚类——K-means算法原理及python实战

你可能感兴趣的:(笔记,聚类,算法,机器学习,python,kmeans)