Leo-Ma

SVM算法的python实现方法

前言
SMO算法的伪代码回顾
代码实现

完全按照Platt伪代码思路的实现
小小的改进
Coding Tips

运行结果

前言

光说不练花把势，在前面两篇文章SVM的数学原理和SMO（Sequential Minimal Optimization）算法的数学原理花了很多时间把数学问题搞清楚之后，时机已经非常成熟，参照SMO算法的伪代码，编写代码实现并检验一下效果将会是一件振奋又有趣的事情。

SMO算法的伪代码回顾

代码实现

完全按照Platt伪代码思路的实现

'''
#Implement svm algorithm only using basic python
#Author:Leo Ma
#For csmath2019 assignment5,ZheJiang University
#Date:2019.05.20
'''

import numpy as np
import random
import matplotlib.pyplot as plt
 

'''
类名称：dataStruct
功能：用于存储一些需要保存或者初始化的数据
作者：Leo Ma
时间：2019.05.20
'''
class dataStruct:
    def __init__(self,dataMatIn,labelMatIn,C,toler,eps):
        self.dataMat = dataMatIn                        #样本数据
        self.labelMat = labelMatIn                      #样本标签
        self.C = C                                      #参数C
        self.toler = toler                              #容错率
        self.eps = eps                                  #乘子更新最小比率
        self.m = np.shape(dataMatIn)[0]                 #样本数
        self.alphas = np.mat(np.zeros((self.m,1)))      #拉格朗日乘子alphas，shape(m,1),初始化全为0
        self.b = 0                                      #参数b，初始化为0
        self.eCache = np.mat(np.zeros((self.m,2)))      #误差缓存，

        
'''
函数名称：loadData
函数功能：读取文本文件中的数据，以样本数据和标签的形式返回
输入参数：filename       文本文件名
返回参数：dataMat        样本数据
         labelMat       样本标签
作者：Leo Ma
时间：2019.05.20
'''
def loadData(filename):
    dataMat = [];labelMat = []
    fr = open(filename)
    for line in fr.readlines():                 #逐行读取
        lineArr = line.strip().split('\t')      #滤除行首行尾空格，以\t作为分隔符，对这行进行分解
        num = np.shape(lineArr)[0]     
        dataMat.append(list(map(float,lineArr[0:num-1])))#这一行的除最后一个被添加为数据
        labelMat.append(float(lineArr[num-1]))#这一行的最后一个数据被添加为标签
    dataMat = np.mat(dataMat)
    labelMat = np.mat(labelMat).T
    return dataMat,labelMat

    


'''
函数名称：takeStep
函数功能：给定alpha1和alpha2，执行alpha1和alpha2的更新,执行b的更新
输入参数：i1            alpha1的标号
          i2            alpha2的标号
          dataMat       样本数据
          labelMat      样本标签
返回参数：如果i1==i2 or L==H or eta<=0 or alpha更新前后相差太小，返回0
         正常执行，返回1
作者：Leo Ma
时间：2019.05.20
'''   
def takeStep(i1,i2,dS):
    #如果选择了两个相同的乘子，不满足线性等式约束条件，因此不做更新
    if(i1 == i2):
        print("i1 == i2")
        return 0
    #从数据结构中取得需要用到的数据
    alpha1 = dS.alphas[i1,0]
    alpha2 = dS.alphas[i2,0]
    y1 = dS.labelMat[i1]
    y2 = dS.labelMat[i2]
    
    #如果E1以前被计算过，就直接从数据结构的cache中读取它，这样节省计算量,#如果没有历史记录，就计算E1
    if(dS.eCache[i1,0] == 1):
        E1 = dS.eCache[i1,1]
    else:
        u1 = (np.multiply(dS.alphas,dS.labelMat)).T * np.dot(dS.dataMat,dS.dataMat[i1,:].T) + dS.b     #计算SVM的输出值u1
        E1 = float(u1 - y1)    #误差E1
        #dS.eCache[i1] = [1,E1] #存到cache中

    #如果E2以前被计算过，就直接从数据结构的cache中读取它，这样节省计算量,#如果没有历史记录，就计算E2
    if(dS.eCache[i2,0] == 1):
        E2 = dS.eCache[i2,1]
    else:
        u2 = (np.multiply(dS.alphas,dS.labelMat)).T * np.dot(dS.dataMat,dS.dataMat[i2,:].T) + dS.b     #计算SVM的输出值u2
        E2 = float(u2 - y2)    #误差E2
        #dS.eCache[i2] = [1,E2] #存到cache中        

    s = y1*y2
    
    #计算alpha2的上界H和下界L
    if(s==1):       #如果y1==y2
        L = max(0,alpha1+alpha2-dS.C)
        H = min(dS.C,alpha1+alpha2)
    elif(s==-1):    #如果y1!=y2
        L = max(0,alpha2-alpha1)
        H = min(dS.C,dS.C+alpha2-alpha1)
    if(L==H):
        print("L==H")
        return 0
        
    #计算学习率eta
    k11 = np.dot(dS.dataMat[i1,::],dS.dataMat[i1,:].T)
    k12 = np.dot(dS.dataMat[i1,::],dS.dataMat[i2,:].T)
    k22 = np.dot(dS.dataMat[i2,::],dS.dataMat[i2,:].T)
    eta = k11 - 2*k12 +k22
    
    if(eta > 0):#正常情况下eta是大于0的，此时计算新的alpha2,新的alpha2标记为a2
        a2 = alpha2 + y2*(E1-E2)/eta#这个公式的推导，曾经花费了我很多精力，现在写出来却是如此简洁，数学真是个好东西
        #对a2进行上下界裁剪
        if(a2 < L):
            a2 = L
        elif(a2 > H):
            a2 = H
    else:#非正常情况下，也有可能出现eta《=0的情况
        print("eta<=0")
        return 0
        '''
        Lobj = 
        Hobj = 
        if(Lobj < Hobj-eps):
            a2 = L
        elif(Lobj > Hobj+eps):
            a2 = H
        else:
            a2 = alpha2
        '''
        
    #如果更新量太小，就不值浪费算力继续算a1和b，不值得对这三者进行更新
    if(abs(a2-alpha2) < dS.eps*(a2+alpha2+dS.eps)):
        print("so small update on alpha2!")
        return 0
        
    #计算新的alpha1，标记为a1
    a1 = alpha1 + s*(alpha2 - a2)
    
    #计算b1和b2,并且更新b
    b1 = -E1 + y1*(alpha1 - a1)*np.dot(dS.dataMat[i1,:],dS.dataMat[i1,:].T) + y2*(alpha2 - a2)*np.dot(dS.dataMat[i1,:],dS.dataMat[i2,:].T) + dS.b
    b2 = -E2 + y1*(alpha1 - a1)*np.dot(dS.dataMat[i1,:],dS.dataMat[i2,:].T) + y2*(alpha2 - a2)*np.dot(dS.dataMat[i2,:],dS.dataMat[i2,:].T) + dS.b
    if(a1>0 and a10 and a2dS.toler and alpha2>0)):
        '''
        #随机选择的方法确定另一个乘子alpha1，多执行几次可可以收敛到很好的结果，就是效率比较低
        i1 = random.randint(0, dS.m-1)
        if(takeStep(i1,i2,dS)):
            return 1
        '''
        #启发式的方法确定另一个乘子alpha1
        nonZeroAlphasList = np.nonzero(dS.alphas.A)[0].tolist()#找到所有的非0的alpha
        nonCAlphasList = np.nonzero((dS.alphas-dS.C).A)[0].tolist()#找到所有的非C的alpha
        nonBoundAlphasList = list(set(nonZeroAlphasList)&set(nonCAlphasList))#所有非边界（既不=0,也不=C）的alpha
        
        #如果非边界的alpha数量至少两个，则在所有的非边界alpha上找到能够使\E1-E2\最大的那个E1,对这一对乘子进行更新
        if(len(nonBoundAlphasList)  > 1):
            maxE = 0
            maxEindex = 0
            for k in nonBoundAlphasList:
                if(abs(dS.eCache[k,1]-E2)>maxE):
                    maxE = abs(dS.eCache[k,1]-E2)
                    maxEindex = k
            i1 = maxEindex
            if(takeStep(i1,i2,dS)):
                return 1
                
            #如果上面找到的那个i1没能使alpha和b得到有效更新，则从随机开始处遍历整个非边界alpha作为i1,逐个对每一对乘子尝试进行更新
            randomStart = random.randint(0,len(nonBoundAlphasList)-1)
            for i1 in range(randomStart,len(nonBoundAlphasList)):
                if(i1 == i2):continue
                if(takeStep(i1,i2,dS)):
                    return 1
            for i1 in range(0,randomStart):
                if(i1 == i2):continue
                if(takeStep(i1,i2,dS)):
                    return 1

                    
        #如果上面的更新仍然没有return 1跳出去或者非边界alpha数量少于两个，这种情况只好从随机开始的位置开始遍历整个可能的i1,对每一对尝试更新 
        randomStart = random.randint(0,dS.m-1)
        for i1 in range(randomStart,dS.m):
            if(i1 == i2):continue
            if(takeStep(i1,i2,dS)):
                return 1
        for i1 in range(0,randomStart):
            if(i1 == i2):continue
            if(takeStep(i1,i2,dS)):
                return 1   
        '''
        i1 = random.randint(0,dS.m-1)
        if(takeStep(i1,i2,dS)):
            return 1 
        '''
    #如果实在还更新不了，就回去重新选择一个alpha2吧，当前的alpha2肯定是有毒    
    return 0
    

'''
函数名称：SVM_with_SMO
函数功能：用SMO写的SVM的入口函数，里面采用了第一个启发式确定alpha2,即在全局遍历和非边界遍历之间来回repeat，直到不再有任何更新
输入参数：dS            dataStruct类的数据
返回参数：None
作者：Leo Ma
时间：2019.05.20
'''

def SVM_with_SMO(dS):
    #初始化控制变量，确保第一次要全局遍历
    numChanged = 0
    examineAll = 1

    #显然，如果全局遍历了一次，并且没有任何更新，此时examineAll和numChanged都会被置零，算法终止
    while(numChanged > 0 or examineAll):
        numChanged = 0
        if(examineAll):
            for i in range(dS.m):
                numChanged += examineExample(i,dS)
        else:
            for i in range(dS.m):
                if(dS.alphas[i] == 0 or dS.alphas[i] == dS.C):continue
                numChanged += examineExample(i,dS)
        if(examineAll == 1):
            examineAll = 0
        elif(numChanged == 0):
            examineAll = 1

'''
函数名称：cal_W
函数功能：根据alpha和y来计算W
输入参数：dS         dataStruct类的数据
返回参数：W          超平名的法向量W            
作者：Leo Ma
时间：2019.05.20
'''
def cal_W(dS):
    W = np.dot(dS.dataMat.T,np.multiply(dS.labelMat,dS.alphas))
    return W

'''
函数名称：showClassifer
函数功能：画出原始数据点、超平面，并标出支持向量
输入参数：dS         dataStruct类的数据
          W          超平名的法向量W    
返回参数：None
作者：机器学习实践SVM chapter 6
修改：Leo Ma
时间：2019.05.20
'''    
def showClassifer(dS,w):
	#绘制样本点
    dataMat = dS.dataMat.tolist()
    data_plus = []                                  #正样本
    data_minus = []                                 #负样本
    for i in range(len(dataMat)):
        if dS.labelMat[i,0] > 0:
            data_plus.append(dataMat[i])
        else:
            data_minus.append(dataMat[i])
    data_plus_np = np.array(data_plus)              #转换为numpy矩阵
    data_minus_np = np.array(data_minus)            #转换为numpy矩阵
    plt.scatter(np.transpose(data_plus_np)[0], np.transpose(data_plus_np)[1], s=30, alpha=0.7, c='r')   #正样本散点图
    plt.scatter(np.transpose(data_minus_np)[0], np.transpose(data_minus_np)[1], s=30, alpha=0.7,c='g') #负样本散点图
    #绘制直线
    x1 = max(dataMat)[0]
    x2 = min(dataMat)[0]
    a1, a2 = w
    b = float(dS.b)
    a1 = float(a1[0])
    a2 = float(a2[0])
    y1, y2 = (-b- a1*x1)/a2, (-b - a1*x2)/a2
    plt.plot([x1, x2], [y1, y2])
    #找出支持向量点
    for i, alpha in enumerate(dS.alphas):
        if abs(alpha) > 0.000000001:
            x, y = dataMat[i]
            plt.scatter([x], [y], s=150, c='none', alpha=0.7, linewidth=1.5, edgecolor='red')
    plt.xlabel("happy 520 day, 2018.06.13")
    plt.savefig("svm.png")
    plt.show()
          
    
    
if __name__ == '__main__':
    dataMat,labelMat = loadData("testSet.txt")
    dS = dataStruct(dataMat, labelMat, 0.6, 0.001, 0.01)#初始化数据结构 dataMatIn, labelMatIn,C,toler,eps
    for i in range(0,1):#只需要执行一次，效果就非常不错
        SVM_with_SMO(dS)
    W = cal_W(dS)
    showClassifer(dS,W.tolist())

小小的改进

在实际运行中，发现原文中第二个启发式，即确定拉格朗日乘子alpha1的过程中，存在一些cpu算力浪费的现象：

1.在函数examineExample()中，对于使|E1-E2|最大的alpha1不能有效更新的情况，原启发式将会从随机起点处遍历所有的非边界alpha，逐一对其进行可能的更新，由于非边界alpha数量很少(大部分alpha=0)，并且非边界alpha上更新更有效，原启发式对这一部分的处理合情合理完满

2.但是，在遍历所有非边界alpha后，仍然不能有效更新的情况，或者非边界alpha数量小于2，原启发式将会从随机起点处遍历所有可能的alpha，逐一对其进行可能的更新。这种策略实际运行中效率十分低下，主要原因是遍历所有的alpha使之与alpha2形成一对拉格朗日乘子，每次计算的alpha2的更新值a2，都会非常靠近alpha2，更新量太小根本不值得更新，但是这个过程却要花费算力去计算a2，因此效率很低

3.一个合理的想法是，将从随机起点处遍历所有可能的alpha变换为：
在所有可能的alpha中随机选择一个作为alpha1，对乘子对(alpha1,alpha2)尝试更新only once，若更新不成功，就直接跳出examineExample()，以期待一个更优秀的alpha2
这样就可以将大量的算力用在真正大步长更新的乘子对上，会显著加快收敛速度

改进的examineExample()：

'''
函数名称：examineExample
函数功能：给定alpha2，如果alpha2不满足KKT条件，则再找一个alpha1,对这两个乘子进行一次takeStep
输入参数：i2            alpha的标号
          dataMat       样本数据
          labelMat      样本标签
返回参数：如果成功对一对乘子alpha1和alpha2执行了一次takeStep，返回1;否则，返回0
作者：Leo Ma
时间：2019.05.20
'''
def examineExample(i2,dS):
    #从数据结构中取得需要用到的数据
    y2 = dS.labelMat[i2,0]
    alpha2 = dS.alphas[i2,0]

    #如果E2以前被计算过，就直接从数据结构的cache中读取它，这样节省计算量,#如果没有历史记录，就计算E2
    if(dS.eCache[i2,0] == 1):
        E2 = dS.eCache[i2,1]
    else:
        u2 = (np.multiply(dS.alphas,dS.labelMat)).T * np.dot(dS.dataMat,dS.dataMat[i2,:].T) + dS.b#计算SVM的输出值u2
        E2 = float(u2 - y2)#误差E2
        #dS.eCache[i2] = [1,E2]

    r2 = E2*y2
    #如果当前的alpha2在一定容忍误差内不满足KKT条件，则需要对其进行更新
    if((r2<-dS.toler and alpha2dS.toler and alpha2>0)):
        '''
        #随机选择的方法确定另一个乘子alpha1，多执行几次可可以收敛到很好的结果，就是效率比较低
        i1 = random.randint(0, dS.m-1)
        if(takeStep(i1,i2,dS)):
            return 1
        '''
        #启发式的方法确定另一个乘子alpha1
        nonZeroAlphasList = np.nonzero(dS.alphas.A)[0].tolist()#找到所有的非0的alpha
        nonCAlphasList = np.nonzero((dS.alphas-dS.C).A)[0].tolist()#找到所有的非C的alpha
        nonBoundAlphasList = list(set(nonZeroAlphasList)&set(nonCAlphasList))#所有非边界（既不=0,也不=C）的alpha
        
        #如果非边界的alpha数量至少两个，则在所有的非边界alpha上找到能够使\E1-E2\最大的那个E1,对这一对乘子进行更新
        if(len(nonBoundAlphasList)  > 1):
            maxE = 0
            maxEindex = 0
            for k in nonBoundAlphasList:
                if(abs(dS.eCache[k,1]-E2)>maxE):
                    maxE = abs(dS.eCache[k,1]-E2)
                    maxEindex = k
            i1 = maxEindex
            if(takeStep(i1,i2,dS)):
                return 1
                
            #如果上面找到的那个i1没能使alpha和b得到有效更新，则从随机开始处遍历整个非边界alpha作为i1,逐个对每一对乘子尝试进行更新
            randomStart = random.randint(0,len(nonBoundAlphasList)-1)
            for i1 in range(randomStart,len(nonBoundAlphasList)):
                if(i1 == i2):continue
                if(takeStep(i1,i2,dS)):
                    return 1
            for i1 in range(0,randomStart):
                if(i1 == i2):continue
                if(takeStep(i1,i2,dS)):
                    return 1

                    
        #如果上面的更新仍然没有return 1跳出去或者非边界alpha数量少于两个，在所有可能的alpha上随机挑一个alpha1,尝试更新一次，如果还不行就跳出本函数，及时止损 
        i1 = random.randint(0,dS.m-1)
        if(takeStep(i1,i2,dS)):
            return 1 
    #如果实在还更新不了，就回去重新选择一个alpha2吧，当前的alpha2肯定是有毒    
    return 0

Coding Tips

1.用非启发式的方法，多迭代几次也能跑出不错的结果
2.在用第二个启发式策略的时候，误差Ecache只要更新那些alpha非零的项。如果全部更新Ecache，则会造成算法陷入局部极值点，即用使最大化|E1-E2|的方式每次选出的alpha1都是基本相同的，此时陷入饱和。这将会是一件会让人心情很糟糕的事情。
3.只有每次在takeStep()中完成了alpha1、alpha2、b的更新之后，才需要重新计算Ecache
4.在非Ecache更新的所有其他地方，如果要用到E1和E2，应该先查询Ecache中是否已经计算得到，如果Ecache中已经保存有记录，则直接赋值。否则，新计算E1或者E2，这些新计算的结果一定不要存到Ecache中，这样可以保证Ecache的相对于alpha是干净的。

运行结果

数学与算法设计：从理论到实践的路径金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能数学建模数据库
随着科技的飞速发展，数学与算法设计在各个领域中的应用愈加广泛。从基础的计算机科学到复杂的人工智能系统，数学和算法无处不在，发挥着关键作用。本篇文章将深入探讨数学与算法设计的核心原理、发展趋势、经典案例以及从理论到实践的实现路径，帮助读者理解如何将理论知识转化为实际应用。一、数学与算法设计的核心原理在算法设计中，数学是其基础，而算法的优化则依赖于数学模型的精确表达。通常，我们通过以下几个方面进行优化
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
零基础学人工智能：TensorFlow 入门例子人工智能MOS 人工智能 tensorflow python
识别手写图片因为这个例子是TensorFlow官方的例子，不会说的太详细，会加入了一点个人的理解，因为TensorFlow提供了各种工具和库，帮助开发人员构建和训练基于神经网络的模型。TensorFlow中最重要的概念是张量（Tensor），它代表了多维数组或矩阵，因此TensorFlow支持各种不同类型的计算，如线性回归、逻辑回归、卷积神经网络、循环神经网络等。所以帮我们极大减少了对数学与算法基
C++ 数学与算法系列之高斯消元法求解线性方程组一枚大果壳 C++编程之美算法 c++线性代数
1.前言什么是消元法？消元法是指将多个方程式组成的方程组中的若干个变量通过有限次地变换，消去方程式中的变量，通过简化方程式，从而获取结果的一种解题方法。消元法主要有代入消元法、加减消元法、整体消元法、换元消元法、构造消元法、因式分解消元法、常数消元法、利用比例性质消元法等。对方程式消元时，是基于如下的初等行变换规则：改变方程组中方程式的顺序，或者说无论先求解方程组中哪一个方程式，不影响方程组的解。
C++ 数学与算法系列之牛顿、二分迭代法求解非线性方程一枚大果壳 C++编程之美算法 python
1.前言前文介绍了如何使用“高斯消元法”求解线性方程组。本文秉承有始有终的态度，继续介绍“非线性方程”的求解算法。本文将介绍2个非线性方程算法：牛顿迭代法。二分迭代法。牛顿迭代法（Newton'smethod）又称为牛顿-拉夫逊方法（Newton-Raphsonmethod），是拉夫逊和牛顿同时提出来的一种在实数域和复数域上近似求解方程的方法。为何说是近似求解方程？因为对于多数方程式，因不存在求根
【数学与算法】【分段三次Hermite插值】和【分段三次样条插值】 Mister Zhu 数学和算法插值
光滑曲线在数学上的定义是什么？？原文链接：光滑曲线在数学上的定义是什么?回答1：定义:切线随切点的移动而连续转动。若函数f(x)f(x)f(x)在区间(a,b)(a,b)(a,b)内具有一阶连续导数，则其图形为一条处处有切线的曲线。则为光滑曲线。简言之，若f′(x)f'(x)f′(x)连续，则曲线光滑。但反之，不成立。比如圆，圆在直角坐标系下，有两条竖直的切线，导数不存在（为∞大）。回答2：不敢保
【数学与算法】跟踪、预测、单目标、多目标、匈牙利匹配之间的关系 Mister Zhu 数学和算法自动驾驶算法
关于多目标跟踪的文章可以参考目标跟踪初探——SORT。多目标跟踪的步骤先后(简单记法)：先预测，再匈牙利匹配，最后再卡尔曼预测矫正，得到最优估计。【卡尔曼预测+匈牙利匹配】进行多目标跟踪的详细步骤：(1)根据预测方程，计算【状态预测值(先验值)】、【状态误差协方差先验估计】；(2)计算每个检测对象与每个状态跟踪器之间的【代价矩阵】；(3)匈牙利匹配(KM算法)求出【检测对象和跟踪器的匹配对】、【未
【数学与算法】PCA主成分分析与降维的通俗理解 Mister Zhu 数学和算法 pca降维
1.PCA与降维PCA主成分分析简单的理解，就是把某物的很多个能直接获取到的特征，经过变换得到很多个新特征，所有的新特征就是该物的成分。这些新特征对该物体来说，有的影响很大，有的影响很小，只需要使用这些影响大的新特征，舍弃很多影响小的新特征，就是使用主要的一些成分来分析，舍弃不重要的成分，这就是主成分分析的方法。相当于把特征维度给降低了，所以也叫降维。2.举例例如，假如我们想要用新方法衡量一个学生
【数学与算法】非线性最小二乘法的解法【最速梯度下降法】、【牛顿法】、【高斯牛顿法】、【LM算法】 Mister Zhu 数学和算法算法最小二乘法人工智能
关于非线性优化的问题，可以推荐观看视觉SLAM十四讲视频的第六讲非线性优化。如果不明白线性和非线性，可参考这篇博客：线性最小二乘和非线性最小二乘这篇博客的后面有讲到几种优化方法(最速梯度下降法、牛顿法、高斯牛顿法，LM算法)，很容易记住，不像其他的公式推导那么生硬：BundleAdjustment—即最小化重投影误差（高翔slam—第七讲）这篇博客也很棒非线性优化（高翔slam—第六讲）下图摘自非
【数学与算法】KMeans聚类代码 Mister Zhu 数学和算法聚类
KMeans聚类是根据各点距离聚类中心的距离来把所有点分类到不同类别的无监督算法。对于聚类，就是两点：1.分类所有样本点：遍历每个数据样本点，分别计算该样本点与K个聚类中心的距离，把该样本点的类别重新分类为距离最小的那一类。2.更新聚类中心：所有样本点都按第一步重新分类后，把各类别的点重新计算聚类中心(求平均值的方法)，更新K个类别的聚类中心值。3.重复前面两步，直到聚类中心点更新幅度小于阈值，或
欧拉计划(project euler)最详细中文题解 metaquant 技术世界数学算法编程语言 python
欧拉计划是一个在线解题网站，题目以各类数学问题为主，通常需要结合一定的数学与编程知识，写出适当的程序求解问题(详细介绍可以参见我的文章)。相比于力扣等刷题网站，欧拉计划上的题目有着更丰富的知识背景，在解答题目的过程中常能学习新的数学与算法知识，享受解题愉悦的同时也能颇有收获。在我的解题过程中，我尽量追求对每道题给出最优的解法，然后写文章把我的思路与代码记录下来。在每篇文章中，我首先将题目翻译成了中
编程新手导论 wangluozhangleilei 杂谈编程语言数据结构设计模式编译器算法
第二部分导论，这一部分主要是关于编程的导论，(要懂得一点思想具备一点常识)《设计，编码，，与软工》（编程与思想）这一章解释了三种思想，原语，抽象，组合，，和软件开发的二个重要过程，，软件工程的相关概念，是编程入门的关键(要懂得一点领域内的数学)《数学与算法》（编程与数学）计算机整个就是架构在数学上的，跟计算机平台实现，算法设计，，架构密切相关，，真正要深入编程，，，对数学的学习是必须的，，千万不要
有趣的算法(一)：如何让有情人终成眷属闻人翎悬 ***算法与编程艺术***Data Science：统计学习有趣的算法
我的机器学习教程「美团」算法工程师带你入门机器学习以及「三分钟系列」数据结构与算法已经开始更新了，欢迎大家订阅~这篇专栏整合了这几年的算法知识，简单易懂，也将是我实体书的BLOG版。欢迎大家扫码关注微信公众号「图灵的猫」，除了有更多AI、算法、Python相关文章分享，还有免费的SSR节点和外网学习资料。其他平台（微信/知乎/B站）也是同名「图灵的猫」，不要迷路哦~数学与算法告诉我们，有情人必将终
老猪带你玩转自定义控件三——sai大神带我实现ios 8 时间滚轮控件 weixin_34302561
ios8的时间滚轮控件实现了扁平化，带来很好用户体验，android没有现成控件，小弟不才，数学与算法知识不过关，顾十分苦恼，幸好在github上找到sai大神实现代码，甚为欣喜，顾把学习这个控件点滴记录下来，分享给大家。项目原地址https://github.com/saiwu-bigkoo/Android-PickerView。ios8滚轮的效果：而sai大神控件的效果：哎，妈呀是不是效果95
Android 实现 ios 滚轮效果 qq_26972449 Android基础学习——其它
转载自：博客园网址：http://www.cnblogs.com博客原文：http://www.cnblogs.com/manuosex/p/5032934.htmlios8的时间滚轮控件实现了扁平化，带来很好用户体验，android没有现成控件，小弟不才，数学与算法知识不过关，顾十分苦恼，幸好在github上找到sai大神实现代码，甚为欣喜，顾把学习这个控件点滴记录下来，分享给大家。项目原地址h
Python趣味编程：从入门到人工智能高清完整版免费下载Python基础教程免费电子书 Spade_King
点击获取书籍提取码：ija8内容简介本书是专门为青少年编写的零基础Python语言>编程人门教材,由浅人深、循序渐进地讲授Python语言编程知识,以解决问题为导向,培养青少年的编程思维。本书采用单元课程的形式编排内容,分为编程基础、数学与算法、游戏编程、人工智能四个单元,采用符合青少年认知水平的趣味案例进行教学，指导青少年使用编程的思维方式解决身边的问题,带领青少年迈进Python编程的奇妙世界
数学与算法的艺术 ACdreamers 基础数学
为了更好体现数学在计算机算法中的重要作用，我来介绍一些数学知识以及它们的应用。Contens1.秦九韶算法9.最小二乘法2.斯特林公式10.自守数3.外观数列4.整数拆分问题5.阿贝尔变换6.二项式反演7.马青公式8.艾森斯坦判别法1.秦九韶算法秦九韶算法是中国南宋时期数学家秦九韶提出的一种计算多项式的优化算法。在西方又被称为Horner算法。给定一个多项式，计算这个多项式的值。可以对这个多项式进
不明觉厉！Gitee大神们的算法/数学相关开源项目推荐 Gitee Gitee Gitee项目推荐算法数学开源项目
现在的大厂面试，算法似乎已经成为了必考项目。当大家的业务水平相近，谁的数学与算法基础更好，谁可能就会获得更好的机会。Gitee上也有一些数学算法的大牛，今天就为大家分享他们的开源项目，希望能给正在学习算法和数学的你有所帮助。1.mfcplot项目作者：rewine开源许可协议：MIT项目地址：https://gitee.com/rewine/mfcplotmfc数学函数曲线绘制程序。2.milvu
组合数学与算法题-排列组合篇 rosewind
前言之前刷过一些leetcode的题目，这学期修了组合数学这门课，让我感受颇多。课程上更关注的是数学上的解法，并没有讲到具体的用某种语言实现，并没有深入地讲为什么这样做就是对的。结合我的经验，想分享一下我的理解。leetcode31.下一个全排列31.下一个全排列2个关键点:下一个全排列比当前的大(字典序)增量要是最小的一些例子:1243->1324,要使1243更大，从右往左看，43已经是最大的
python实现决策树实例 Realmhang python机器学习
今天用python实现了一个决策树模型，python做机器学习有大量的库支持，简洁高效，没有深厚数学与算法基础的人也可以调用库来实现机器学习模型。当然大家想做好机器学习还是要好好积淀深厚的知识，只当调包侠能做的东西非常有限啊。本文是对经典的鸢尾花数据集做分类，大家需要下载sklearn、pandas、matplotlib、seaborn库，可以直接在pycharm中下载，另外鸢尾花数据集已经包含在
编程新手导论（转载）扇子
第二部分导论，这一部分主要是关于编程的导论，(要懂得一点思想具备一点常识)《设计，编码，，与软工》（编程与思想）这一章解释了三种思想，原语，抽象，组合，，和软件开发的二个重要过程，，软件工程的相关概念，是编程入门的关键(要懂得一点领域内的数学)《数学与算法》（编程与数学）计算机整个就是架构在数学上的，跟计算机平台实现，算法设计，，架构密切相关，，真正要深入编程，，，对数学的学习是必须的，，千万不要
编程新手导论（转载）叶广明_微信ye_guangming 面试编程语言数据结构设计模式编译器算法
第二部分导论，这一部分主要是关于编程的导论，(要懂得一点思想具备一点常识)《设计，编码，，与软工》（编程与思想）这一章解释了三种思想，原语，抽象，组合，，和软件开发的二个重要过程，，软件工程的相关概念，是编程入门的关键(要懂得一点领域内的数学)《数学与算法》（编程与数学）计算机整个就是架构在数学上的，跟计算机平台实现，算法设计，，架构密切相关，，真正要深入编程，，，对数学的学习是必须的，，千万不要
Java 技术书籍大全济南市民刘先生 java
前言本文档目前已收录277本Java相关领域经典技术书籍，从初级开发者到资深架构师，涵盖Java从业者的各个阶段。涵盖领域：Java入门书籍，Java基础及进阶书籍，框架与中间件，架构设计，设计模式，数学与算法，JVM周边语言，项目管理&领导力&流程，职业素养与个人成长，格局与视野，面试参考书等。入门书籍《明解Java》-豆瓣评分8.5《Java从入门到精通（第4版附光盘）》-豆瓣评分6《入门很简
"歌美"之游戏开发之数学与算法_中级篇小太阳会发光诺
ActionScript3.0是一种强大的面向对象编程语言，它还是一种适合快速构建效果丰富的互联网应用程序的语言，它所构建的应用程序已经成为Web体验的重要部分。本书以ActionScript为核心，辅以Photoshop等作为工具，深入剖析了图形图像算法及特性，介绍了游戏等特效的制作和实现，并且聚焦相关技术在交互程序各领域的应用。课程目录：课时1：概率问题与三角函数（1）课时2：概率问题与三角函
"歌美"之游戏开发之数学与算法_高级篇小太阳会发光诺
ActionScript3.0是一种强大的面向对象编程语言，它还是一种适合快速构建效果丰富的互联网应用程序的语言，它所构建的应用程序已经成为Web体验的重要部分。本书以ActionScript为核心，辅以Photoshop等作为工具，深入剖析了图形图像算法及特性，介绍了游戏等特效的制作和实现，并且聚焦相关技术在交互程序各领域的应用。课程目录：第1章：换元积分法和贝塞尔曲线积分的拟合课时1：换元积分
从入门到入坟：Java程序员一生要看多少书？Java技术书籍大全来啦 Java技术箭 Java 程序员 Spring Boot
本文档目前已收录277本Java相关领域经典技术书籍，从初级开发者到资深架构师，涵盖Java从业者的各个阶段，并持续更新。涵盖领域：Java入门书籍，Java基础及进阶书籍，框架与中间件，架构设计，设计模式，数学与算法，JVM周边语言，项目管理&领导力&流程，职业素养与个人成长，格局与视野，面试参考书等。注：本文只是推荐，只有一小部分的书籍有文档资料分享。包括：【Redis实战】【Kafka核心设
Java 技术书籍大全乐百氏vic
Java技术书籍大全本文档目前已收录277本Java相关领域经典技术书籍，从初级开发者到资深架构师，涵盖Java从业者的各个阶段。涵盖领域：Java入门书籍，Java基础及进阶书籍，框架与中间件，架构设计，设计模式，数学与算法，JVM周边语言，项目管理&领导力&流程，职业素养与个人成长，格局与视野，面试参考书等。入门书籍《明解Java》-豆瓣评分8.5《Java从入门到精通（第4版附光盘）》-豆瓣
80后博导拟任“211大学”副校长曾是人大最年轻教授机器学习算法与Python学习-公众号
本文转自“数学与算法之美”2012年，时年32岁的他成为中国人民大学最年轻的教授。6月20日，海南省委组织部发布干部任前公示，其中，现任中国人民大学汉青经济与金融高级研究院教授、反垄断与竞争政策研究所所长叶光亮拟任海南大学党委常委、副校长（试用期一年）。叶光亮温州新闻网图据公开简历，叶光亮是一名“80后”学者，生于1980年4月，研究生学历，经济学博士学位，教授，博士生导师，长江学者（青年）。叶光
数学与算法的艺术 K_ona 数学
为了更好体现数学在计算机算法中的重要作用，我来介绍一些数学知识以及它们的应用。转自：https://blog.csdn.net/acdreamersContens1.秦九韶算法9.最小二乘法2.斯特林公式10.自守数3.外观数列4.整数拆分问题5.阿贝尔变换6.二项式反演7.马青公式8.艾森斯坦判别法1.秦九韶算法秦九韶算法是中国南宋时期数学家秦九韶提出的一种计算多项式的优化算法。在西方又被称为H
老猪带你玩转自定义控件三——sai大神带我实现ios 8 时间滚轮控件 laozhu1124
ios8的时间滚轮控件实现了扁平化，带来很好用户体验，android没有现成控件，小弟不才，数学与算法知识不过关，顾十分苦恼，幸好在github上找到sai大神实现代码，甚为欣喜，顾把学习这个控件点滴记录下来，分享给大家。项目原地址https://github.com/saiwu-bigkoo/Android-PickerView。ios8滚轮的效果：而sai大神控件的效果：哎，妈呀是不是效果
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

SVM算法的python实现方法