AmbiRF

K-均值聚类算法学习心得

一、分类与聚类

分类作为一种监督学习方法，要求必须事先明确知道各个类别的信息，并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足，尤其是在处理海量数据的时候，如果通过预处理使得数据满足分类算法的要求，则代价非常大，这时候可以考虑使用聚类算法。聚类属于无监督学习，相比于分类，聚类不依赖预定义的类和类标号的训练实例。由于具有出色的速度和良好的可扩展性，Kmeans聚类算法算得上是最著名的聚类方法。

二、K均值聚类算法

2.1算法原理

Kmeans算法是一个重复移动类中心点的过程，把簇的中心点，也称重心(centroids)，移动到其包含成员的平均位置，然后重新划分其内部成员。k是算法计算出的超参数，表示簇的数量；Kmeans可以自动分配样本到不同的簇，但是不能决定究竟要分几个簇。k必须是一个比训练集样本数小的正整数。如果用数据表达式表示，假设簇划分之间的随机数为k，则我们的目标是最小化平方误差E：

μi是第k个簇的重心位置。E是各个类畸变程度(distortions)之和。每个簇的畸变程度等于该簇重心与其内部成员位置距离的平方和。若簇内部的成员彼此间越紧凑则簇的畸变程度越小，反之，若簇内部的成员彼此间越分散则类的畸变程度越大。求解成本函数最小化的参数就是一个重复配置每个簇包含的观测值，并不断移动簇重心的过程。首先，簇的重心是随机确定的位置。实际上，重心位置等于随机选择的观测值的位置。每次迭代的时候，Kmeans会把观测值分配到离它们最近的簇，然后把重心移动到该簇全部成员位置的平均值那里。

简而言之，k均值聚类算法由以下四步组成：

首先,随机选定k个初始类簇中心(不同的类簇中心会导致收敛速度和聚类结果有差别,有可能会陷入局部最优.)

其次,计算每个点到每个类簇中心的距离,并将其分配到最近的类簇中

第三,重新计算每个类簇的中心

第四,重复第二步和第三步直到类簇中心不再发生变化,聚类停止

2.2代码实现

from numpy import *
import numpy as np  

#导入数据  
def loadDataSet(fileName):      #general function to parse tab -delimited floats  
    dataMat = []                #assume last column is target value  
    fr = open(fileName)  
    for line in fr.readlines():  
        curLine = line.strip().split('\t')   
        fltLine = list(map(float,curLine)) #map all elements to float()  
        #书上程序因为py2和3的的差别在这里没有对map进行一个定义，使用py3是需在map前加list
        dataMat.append(fltLine)  
    return dataMat  
  
def distEclud(vecA, vecB):  
    return sqrt(sum(power(vecA - vecB, 2))) #la.norm(vecA-vecB)  

#构建簇的质心  
def randCent(dataSet, k):  
    n = shape(dataSet)[1]  
    centroids = mat(zeros((k,n)))#create centroid mat  
    for j in range(n):#create random cluster centers, within bounds of each dimension  
        minJ = min(dataSet[:,j])   
        rangeJ = float(max(dataSet[:,j]) - minJ)  
        centroids[:,j] = mat(minJ + rangeJ * random.rand(k,1))  
    return centroids  
      
def kMeans(dataSet, k, distMeas=distEclud, createCent=randCent):  
    m = shape(dataSet)[0]  
    clusterAssment = mat(zeros((m,2)))#create mat to assign data points   
                                      #to a centroid, also holds SE of each point  
    centroids = createCent(dataSet, k)  
    clusterChanged = True  
    while clusterChanged:  
        clusterChanged = False  
        for i in range(m):#寻找最近的质心  
            minDist = inf; minIndex = -1  
            for j in range(k):  
                distJI = distMeas(centroids[j,:],dataSet[i,:])  
                if distJI < minDist:  
                    minDist = distJI; minIndex = j  
            if clusterAssment[i,0] != minIndex: clusterChanged = True  
            clusterAssment[i,:] = minIndex,minDist**2  
        print (centroids)  
        #更新质心的位置
        for cent in range(k):#recalculate centroids  
            ptsInClust = dataSet[nonzero(clusterAssment[:,0].A==cent)[0]]#get all the point in this cluster  
            centroids[cent,:] = mean(ptsInClust, axis=0) #assign centroid to mean   
    return centroids, clusterAssment  
  
#绘制图形程序  
import matplotlib.pyplot as plt  
def draw(dataMat,centroids,clusterAssment):  
    k=len(centroids)  
    fig = plt.figure()    
    ax = fig.add_subplot(111)    
    ax.scatter(centroids[:,0].tolist(),centroids[:,1].tolist(),marker='+',c='r')    
    markers=['o','s','v','*'];colors=['blue','green','yellow','red']    
    for i in range(k):    
        data_class=dataMat[nonzero(clusterAssment[:,0].A == i)[0]]    
        ax.scatter(data_class[:,0].tolist(),data_class[:,1].tolist(),marker=markers[i],c=colors[i])    
    plt.show()  
    
if __name__ =="__main__":    
    dataMat = mat(loadDataSet('testSet.txt'))        
    myCentroids, clustAssing = kMeans(dataMat,4)       
    draw(dataMat,myCentroids, clustAssing)

当选择簇的个数为4时绘制散点图图形如下：

当选择簇的个数为3时绘制散点图图形如下：

由此可以看出对此数据集而言，由四个质心所绘制的散点图更为合理，那么也就引出了接下来的问题，我们需要一种方法来确定我们的K值所选是正确的，才能生成最好的簇。

三、K值的确定方式

3.1肘部法则

如果问题中没有指定k的值，可以通过肘部法则这一技术来估计聚类数量。肘部法则会把不同k值的成本函数值画出来。随着kk值的增大，平均畸变程度会减小；每个类包含的样本数会减少，于是样本离其重心会更近。但是，随着kk值继续增大，平均畸变程度的改善效果会不断减低。kk值增大过程中，畸变程度的改善效果下降幅度最大的位置对应的kk值就是肘部。为了让读者看的更加明白，下面让我们通过一张图用肘部法则来确定最佳的k值。下图数据明显可分成两类：

从图中可以看出，k值从1到2时，平均畸变程度变化最大。超过2以后，平均畸变程度变化显著降低。因此最佳的k是2。

3.2与层次聚类结合

经常会产生较好的聚类结果的一个有趣策略是，首先采用层次凝聚算法决定结果粗的数目，并找到一个初始聚类，然后用迭代重定位来改进该聚类。

3.3 稳定性方法

稳定性方法对一个数据集进行2次重采样产生2个数据子集，再用相同的聚类算法对2个数据子集进行聚类，产生2个具有kk个聚类的聚类结果，计算2个聚类结果的相似度的分布情况。2个聚类结果具有高的相似度说明kk个聚类反映了稳定的聚类结构，其相似度可以用来估计聚类个数。采用次方法试探多个k，找到合适的k值。

四、二份K均值算法

4.1算法原理

为了克服k-均值算法的局部最小值问题,有人提出了二分k均值算法。该算法首先将所有点作为一个簇,然后讲该簇一分为二。之后选择其中一个簇继续划分，选择哪一个簇进行划分取决于对其划分是否可以最大程度降低SSE的值。上述基于SSE的划分过程不断重复,直到得到用户指定的簇数目为止。

4.2代码实现

def biKmeans(dataSet, k, distMeas=distEclud):
    m = shape(dataSet)[0]
    clusterAssment = mat(zeros((m,2)))
    centroid0 = mean(dataSet, axis=0).tolist()[0]
    centList =[centroid0] #create a list with one centroid #创建一个初始簇
    for j in range(m):#calc initial Error
        clusterAssment[j,1] = distMeas(mat(centroid0), dataSet[j,:])**2
    while (len(centList) < k):
        lowestSSE = inf
        for i in range(len(centList)):  #划分每一簇
            ptsInCurrCluster = dataSet[nonzero(clusterAssment[:,0].A==i)[0],:]#get the data points currently in cluster i
            centroidMat, splitClustAss = kMeans(ptsInCurrCluster, 2, distMeas)
            sseSplit = sum(splitClustAss[:,1])#compare the SSE to the currrent minimum
            sseNotSplit = sum(clusterAssment[nonzero(clusterAssment[:,0].A!=i)[0],1])
            print ("sseSplit, and notSplit: ",sseSplit,sseNotSplit)
            if (sseSplit + sseNotSplit) < lowestSSE:
                bestCentToSplit = i
                bestNewCents = centroidMat
                bestClustAss = splitClustAss.copy()
                lowestSSE = sseSplit + sseNotSplit
        bestClustAss[nonzero(bestClustAss[:,0].A == 1)[0],0] = len(centList) #更新簇的分配结果
        bestClustAss[nonzero(bestClustAss[:,0].A == 0)[0],0] = bestCentToSplit
        print ('the bestCentToSplit is: ',bestCentToSplit)
        print ('the len of bestClustAss is: ', len(bestClustAss))
        centList[bestCentToSplit] = bestNewCents[0,:].tolist()[0]#replace a centroid with two best centroids 
        centList.append(bestNewCents[1,:].tolist()[0])
        clusterAssment[nonzero(clusterAssment[:,0].A == bestCentToSplit)[0],:]= bestClustAss#reassign new clusters, and SSE
    return mat(centList), clusterAssment

仍然使用先前所使用的数据集，绘制散点图如下：

由此可见，相较于k均值算法而言，二份K均值算法在本数据集上的聚类更加成功。

五、算法总结

kmean算法的特点是不能保证该算法收敛域全局最优解，并且它常常终止于一个局部最优解。结果可能依赖于初始簇中心的随机选择，所以为了尽可能的得到好的结果，我们通常会选择不同的初始簇中心，来多疑运行K-均值算法。

算法优点：

1）原理比较简单，实现也是很容易，收敛速度快。

2）聚类效果较优。

3）算法的可解释度比较强。

4）主要需要调参的参数仅仅是簇数k。

算法缺点：

1）K值的选取不好把握

2）对于不是凸的数据集比较难收敛

3）如果各隐含类别的数据不平衡，比如各隐含类别的数据量严重失衡，或者各隐含类别的方差不同，则聚类效果不佳。

4）采用迭代方法，得到的结果只是局部最优。

参考资料：

《机器学习实战》 ——Peter Harrington著人民邮电出版社

从零开始实现Kmeans聚类算法——CSDN博客 https://blog.csdn.net/u013719780/article/details/78413770

《机器学习》—— 周志华著清华大学出版社

你可能感兴趣的:(K-均值聚类算法学习心得)

k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
如何在心上用功？余超林AIA财富管家
思考：如何在心上用功？学习心得：心-道-德-事的理解心-道-德-事这四部曲，本质上就是一个人的思维智慧的四个层面：事是最底层，这是所有人在这个社会谋求生存的基础，一个人能够把事情彻底做好，保质保量的完成，才会有真正的结果，但是这个层面要获得真正成功很困难，因为会做事的人很多，最终会出现恶性竞争；德是第三层，如果说整个社会做事的竞争激烈程度为100%，那么上升到德上的竞争激烈程度降低为80%，德是一
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
跟着黑马学mysql（5）小杜不吃糖 mysql 数据库
17.DQL-聚合函数DQL-聚合函数介绍将一列数据作为一个整体，进行纵向计算。常见聚合函数函数功能count统计数量max最大值min最小值avg平均值sum求和语法SELECT聚合函数(字段列表)FROM表名;注意：所有的null值不参与聚合函数的运算18.DQL-分组查询语法SELECT字段列表FROM表名[WHERE条件]GROUPBY分组字段名[HAVING分组后的过滤条件];where
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
息县一中第二期心理咨询培训第四组分享第五天 bcf0473e009c
今天在组长的带领下我们一组6人在五楼小会议室进行了一次复盘学习，大家都发表了自己的学习心得，令我感触良多。经过第一次的学习，初次了解聚焦正向的含义，朱老师说的两句话让我印象很深“不以改变为目的，才有改变的机会”“关系大于方式，方式大于内容”遇到学生的问题时，不要想着上来就去改变他，对他的说教只会让他更加封闭自己，更不要想着会去改变他，要换种思维方式，试着把关系搞好，可以从兴趣爱好入手，打开他的内心
《信号与线性系统分析》学习心得 GFeverything 个人学习感想信号与线性系统分析吴大正课本信号分析
《信号与线性系统分析》学习心得通过本学期上网课的学习，大致对信号有了一定的了解认知，下面对该课程的理解发表粗浅认知，说起信号，大家都不陌生，比如老师写的幻灯片，朋友的一个眼色，经常使用的WiFi信号......总之，信号就是信息的载体，它包含着信息！从数学的角度，信号可以说是一个时间函数/序列；从电路角度来说，信号就是各种激励与响应与系统的作用；从模电数电的角度来看，信号有连续时间信号与离散时间信
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
计算平均值python 暖风822 python
从键盘输入三个整数，分别存入x,y,z三个整型变量中，计算并输出三个数的和以及平均值。【输入形式】从键盘输入三个整数，整数之间以空格隔开。【输出形式】在屏幕上分两行显示结果：第一行为三个数的和，整数形式输出；第二行为三个数的平均值，浮点数形式输出，小数点后保留两位小数。【输入样例】3 2 3【输出样例】82.67【样例说明】3、2、3的和为8，所以第一行输出8；第二行输出3、2、3的平均值2.67
学习《菜根谭》（272）｜一身了一身，天下还天下快乐的子亿
【原文】就一身了[1]一身者，方能以万物付[2]万物；还[3]天下于天下者，方能出[4]世间于世间。[1]了：明白、觉悟。[2]付：托付，赋与。[3]还：归还。[4]出：超出，出越。【译文】能够通过自身了悟自我的人，才可根据自然规则，使万物按照本性去发展而各尽其用；能够把天下交还给天下万民所共有的人，才能身处尘世而心灵超越到尘世之外。【学习心得】要学会醒悟。
很感兴趣的行为金融学奔跑的阿牛
「思考，快与慢」读后感1⃣️均值回归是对于前后没有关联的事情，比如多次扔飞镖结果。而对于每一步的选择，后一步选择建立在前一步基础上，是相关的。只要想，是可以一步步向上走。2⃣️事前验尸比如马云召开员工大会，谈论阿里巴巴为什么倒闭。就是在事前，讨论失败的细分因素，做到事前预警。3⃣️人思考的系统一和系统二系统一：大脑的自动行驶，不需要细想就能运作（比如慢走散步，可以想起他简单事情系统二：需要集中注意
东3.6工作日报王少东0206
东3.6工作日报：1~今天我觉得最有意义的事就是：下午开小组会，大家对我们制定OKR进度评价达到54%，接下来就是大家的实操和进一步培训，可能时间有点赶，情况有点特殊，但是大家都在尽全力做好它吧。2~学习心得:今天分享新的书《复杂》，樊登总结非常好：“对于我们每个人个人的成长。就是你自己这一生事实上也是一个复杂的过程。你与其去做那么多的计算，算计，你不如把你能做的事尽量地做好，然后不断的自我更新迭
【Java】多态性-向下转型【主线学习笔记】虫本初阳新手java笔记 java 学习笔记
文章目录前言多态性中的向下转型1、代码示例2、注意事项前言Java是一门功能强大且广泛应用的编程语言，具有跨平台性和高效的执行速度，广受开发者喜爱。在接下来的学习过程中，我将记录学习过程中的基础语法、框架和实践技巧等，分享学习心得，对自己学习过程进行整理和总结，也希望能为其他学习Java的朋友提供一些帮助和参考。多态性中的向下转型在Java中，向下转型是指将父类对象类型转换为子类对象类型的过程。由
『 MySQL数据库』聚合统计 Dio夹心小面包数据库数据库 mysql
文章目录前言聚合函数COUNT()查询数据数量SUM()查询数据总和AVG()查询数据平均值MAX()查询数据最大值MIN()查询数据最小值数据分组GROUPBY子句GROUPBY示例HAVING语句前言在MySQL中存在一种查询方式叫做聚合查询;聚合查询顾名思义就是将一组数据的同种类型进行聚合,那么既然是一组同类型的数据那么即必须要对该数据进行分组同时再对这组数据进行聚合;所以对于聚合查询来说时
【Java】多态性【主线学习笔记】虫本初阳新手java笔记 java 学习笔记
文章目录前言多态性1、编译时多态性（静态多态性）：2、运行时多态性（动态多态性）3、多态性的实用性4、多态性的优点与弊端下一篇点击跳转《【Java】多态性-向下转型【主线学习笔记】》前言Java是一门功能强大且广泛应用的编程语言，具有跨平台性和高效的执行速度，广受开发者喜爱。在接下来的学习过程中，我将记录学习过程中的基础语法、框架和实践技巧等，分享学习心得，对自己学习过程进行整理和总结，也希望能为
第三期《论语》学习打卡25 暖暖1314
学习心得：1）脚踏实地，也需要不说大话，不去承诺做不到的事情。否则，说了做不到，实在是令人难堪。2）为人做事需要有自己的坚守，触碰到原则性的问题，即使明知道可能没有结果，也要去尝试去做，而不是完全放弃，不管不问。在其位谋其政，不在其位也要记得自己的操守和曾经坚守。3）对待君主或领导，我们不应当欺瞒，而是遇到问题就要积极地去直言谏语，让自己所处的位置的作用得到充分的发挥，也要有勇气去提出建设性的意见
K-means 算法的介绍与应用小魏冬琅 matlab 算法 kmeans 机器学习
目录引言K-means算法的基本原理表格总结：K-means算法的主要步骤K-means算法的MATLAB实现优化方法与改进K-means算法的应用领域表格总结：K-means算法的主要应用领域结论引言K-means算法是一种经典的基于距离的聚类算法，在数据挖掘、模式识别、图像处理等多个领域中得到了广泛应用。其核心思想是将相似的数据对象聚类到同一个簇中，而使得簇内对象的相似度最大、簇间的相似度最小
聚类分析 | Python密度聚类（DBSCAN）天天酷科研聚类分析算法（CLA）python 聚类机器学习 DBSCAN
密度聚类是一种无需预先指定聚类数量的聚类方法，它依赖于数据点之间的密度关系来自动识别聚类结构。本文中，演示如何使用密度聚类算法，具体是DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）来对一个实际的数据集进行聚类分析。一、基本介绍密度聚类的核心思想是将数据点分为高密度区域和低密度区域。高密度区域内的数据点被认为属于同一簇，而低
8.18下午学习心得（宋丽娟）无为_72a4
下午听了吴波老师《历史学科德育实践与案例分析》，收获如下：1.对于核心素养的理解更加透彻，唯物史观，时空定位，史料实证，历史解释，家国情怀它们个体以及整体之间的联系有一个深入了解！2.终于知道怎么完整做一份教学设计，包括教学分析（课标分析，内容分析（本课知识结构，本课单元地位，在知识体系中的地位，对于学生发展的作用））学情分析（分析学生的已学知识和基本状况）自我分析，资源分析，教学目标，教学重难点
牛客周赛 Round 58 Pown_ShanYu 算法 c++开发语言
D好好好数题目大意：定义k-好数为：可以表示为若干个不同的k的整次幂之和的数字例如30=3^3+3^1,30是一个3-好数给定一个数n，n最少可以表示成几个k-好数的和赛事错误思路：将n转化为k进制，然后将数位上的数字求和，当时想的是求n转换为n个k的整次幂的数正解：k进制数位上的最大值即为解，因为一个k-好数可以表示为多个k的整次幂的和，比如三进制下1010，可用（1000+10）两个k的整次幂
IDP-L17学习心得 swag_ae02
今天我们要谈的关键词是经验管理。你知道经验到底是什么吗？如何有效的积累经验呢？我来忙猜一下，经验应该就是沟通力等职场软实力吧，有效积累经验就需要我们经常性的复盘。接下来我们就带着这些问题一起来看看。已经在岗位上干了好些年的洪力，照道理来说应该是职场老手，但在他手下干活的人却都是怨声载道，要么吐槽他反馈意见不明确，要么感叹在他下面学不到什么东西。而在他自己看来，上次给他分配的人都是些菜鸟，他也没有耐
你会在原地等我吗（4）君子兰_fcb0
图片发自App岁月的墙角，总是堆积着诸多的回忆。五年前初秋的一个晚上，杨梓木那贤惠善良的妻子去接女儿下晚自习，路上不幸被一位酒驾司机撞倒，还没等到120救护车赶来时，她就停止了呼吸。在外地出差学习的杨梓木惊悉这一噩耗的瞬间，他的感官变得异常迟钝了，鼻子忘了怎么酸，连哭的力量都没有。他先是默不作声地望着刚和他一起交流学习心得的同事一眼，然后，视线就直直地停留在窗外。窗外如水的月光忽然暗了几分，渐渐地
Python 数学建模——方差分析 Desire.984 Python 数学建模数学建模 python 概率论
文章目录前言单因素方差分析原理核心代码双因素方差分析数学模型分析依据典型代码前言方差分析也是概率论中非常重要的内容，有时数学建模需要用到。方差分析是干什么的？如果说假设检验用于分析两个总体之间的均值μ1,μ2\mu_1,\mu_2μ1,μ2是否存在显著的差别，那么方差分析就是分析两个以上总体之间的均值是否存在显著的差别。单因素方差分析用途：已知一个量AAA可能会影响XXX，AAA的不同取值可能
2018.9.21感恩日记心无旁骛_3030
感恩清晨醒来外面阳光明媚，感恩太阳给予地球上的万物滋养和能量，阳光普照大地真的很美好。感恩这几天的感冒，提醒我要注意保护身体，尽量少熬夜，早睡早起，引起我对作息时间的思考。感恩药店姐姐给我拿的药很管用，吃了后咳嗽减轻很多。感恩能与她一起聊天，我把近期收获和学习心得与她分享，她也与我分享生活体验和感悟，感恩我有这么好的知心朋友，感恩我们都很上进，有一颗不断追求进步和提升自己的心，有这样的好朋友这的很
几何分布的期望和方差公式推导_算法数学基础-统计学最基础之均值、方差、协方差、矩... weixin_39848097 几何分布的期望和方差公式推导均值定理六个公式概率论方差公式
我们天天都可以接触很多随机现象，比如每天的天气不一样气温是我们最直接的感受，我们很难预测明天的精确问题，但是这些随机现象又体现出了一定的规律性。比如上海7月份平均35度左右，冬天的平均温度在5度左右。所以35、5这些数字体现了某种稳定性。所以除了前面几章中讲到的分布律和概率密度函数可以表征随机变量外，还可以用一组数字来表达随机变量的一般特性。这就是我们今天要讲到的随机变量的数字特征。通过对数字特征
数字图像处理（一系列对图像进行处理、分析和改进的技术）编程日记✧ 智能医疗计算机视觉图像处理人工智能
数字图像处理是指对图像进行一系列的数学和算法处理，以增强、分析或理解图像的内容。这些处理包括从基础的像素操作到复杂的高维变换和机器学习模型。1.图像降噪在图像获取和传输过程中，往往会引入噪声。降噪技术用于减少这些噪声，同时尽量保持图像的细节。常见方法有：均值滤波：将像素邻域内的像素值取平均值，从而平滑图像。这种方法简单但可能会模糊边缘。高斯滤波：使用高斯函数为权重对像素进行加权平均，可以更好地平滑
数模原理精解【8】叶绿先锋基础数学与应用数学人工智能统计分析概率论数学建模
文章目录协方差概述协方差的定义协方差的计算协方差的例子协方差矩阵协方差矩阵定义协方差矩阵的性质协方差矩阵的计算协方差矩阵的例子协方差矩阵的例题多元正态分布基础多元正态分布密度函数多元正态分布密度函数Julia实现详细解释定义计算例子例题参考文献协方差概述协方差是一种统计度量，用于描述两个变量之间的线性相关程度以及它们变化的趋势是否一致。具体来说，协方差计算的是两个变量同时偏离其均值的程度。如果两个
图像分割任务在设计模型损失函数时，高斯函数会被如何应用 Wils0nEdwards 计算机视觉人工智能深度学习
什么是高斯函数？Gaussianfunction，又称为高斯函数，是一种常见的数学函数，定义为一种特定形状的钟形曲线。其表达式通常为：f(x)=a⋅exp⁡(−(x−b)22c2)f(x)=a\cdot\exp\left(-\frac{(x-b)^2}{2c^2}\right)f(x)=a⋅exp(−2c2(x−b)2)其中：aaa决定了曲线的高度（峰值）。bbb是曲线中心位置的均值，决定曲线的对
前端基础知识点 der.. html css javascript
本人现在是一名准大二计算机系的学生，准备开始写博客，一方面是想在csdn留下自己的足迹，另一方面是想通过写博客来提高自己的能力。以后会分享一些学习心得，程序代码，以及我的一些学习计划，还有每天学习后的知识总结。如果你和我一样，不甘于平凡，那么，就请给我点一个关注，我们互相交流，共同进步。--------------------------------------------------------
《道德经》吟诵学习心得朱雀_1ff5
我是2020年5月17日开始接触《道德经》吟诵的。清楚地记得那天的情景，赵飞燕老师邀我进入“河南省《道德经》吟诵学习群”，开卷在即，学员们可以自己选报篇章在开卷礼上展示，不会吟诵的可以朗诵。作为灵宝人，家乡函谷关是老子注经地，读书时就知道老子。但令人汗颜的是我对《道德经》的解读却非常肤浅。不是不喜欢，是觉得这部巨著高深玄妙，读不懂，靠自学总是坚持不下来。现在有这么好的机会，可以和大家一起学习《道德
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他