gjy_hahaha

SVM支持向量机实验（基于SVM的手写体数字识别）

文章目录

最大间隔与分类
对偶问题
- 等式约束
- 不等式约束的KKT条件
- 二次规划
- SMO
核函数
软间隔与正则化
支持向量回归
实现SMO算法处理小规模数据集
- 简化版SMO算法
- 利用完整Platt SMO算法加速优化
- 在复杂数据上应用核函数
基于SVM的数字识别
实验总结

最大间隔与分类

线性模型：
在样本空间中寻找一个超平面，将不同类别样本分开。当数据点在二维平面上时，分隔超平面是一条直线。若数据集是三维的，分隔数据的即为一个平面。高维情况时分隔数据的是超平面，也就是分类的决策边界。分布在超平面一侧的所有数据都属于某个类别，而分布在另一侧的所有数据则属于另一个类别。

我们希望采用这种方式构建分类器，即如果数据点离决策边界越远，那么其最后的预测结果也就越可信。那么我们如何选择超平面？我们希望找到离分隔超平面最近的点（支持向量），确保它们离分隔面的距离尽可能远。这里点到分隔面的距离称为间隔，我们希望间隔尽可能的大，即最大化决策边界的边缘，这是因为若我们犯错或在有限数据上训练分类器的话，我们希望分类器尽可能健壮。
如图所示：

我们在选择超平面时应选择“正中间”的这条直线，容忍性好，鲁棒性高，泛化能力最强。

我们可将分隔超平面方程写为： $w^Tx+b=0$

如图所示：令 $x_+和x_-$ 位于决策边界上，标签为正负两个样本， $x_+$ 到分类线距离为： $d_+=\frac{|W^Tx_++b|}{||W||}$ .则分类间隔为： $width=\frac{2}{||W||}$ .

间隔最大化即要找到参数w和b，使得以下公式最大：

我们举一个间隔最大化的简单的例子：

根据已知条件，联立方程组并化简后可得到以下式子：

这样我们便得到了一个圆的方程 $\frac{1}{2}(w_1^2+w_2^2)$ 以及两条直线方程 $w_1+w_2>1$ 和 $\frac{3}{2}w_1+w_2>1$ ，用图表示如下：

我们要求的为 $\frac{1}{2}(w_1^2+w_2^2)$ 的最小值，显而易见该方程最小值即为0，但在求该方程最小值时同时要满足 $w_1+w_2>1$ 和 $\frac{3}{2}w_1+w_2>1$ 的约束条件，即图中两条直线的右边相交部分。因此以原点为中心，我们可以将圆不断放大直至与约束区域边界相切，这样便可以找到 $\frac{1}{2}(w_1^2+w_2^2)$ 的最小值。

如图所示：求得w和b后在代入便可得到分隔超平面方程及最大化间隔。

对偶问题

等式约束

给定目标函数f: $R^n->R$ ，希望找到x∈ $R^n$ ,在满足约束条件g(x)=0的前提下，使得f(x)有最小值。该约束优化问题记为：
min f(x) s.t. g(x)=0.
建立拉格朗日函数：
L(x,λ)=f(x)+λg(x)
λ为拉格朗日乘数，因此，将原本的约束优化问题转换为等价无约束优化问题：

分别对待求解参数求导，得：

一般联立方程组即可得到相应的解。

不等式约束的KKT条件

将约束条件g(x)=0推广为g(x)<=0，约束优化问题便改为：

拉格朗日函数为：
$L(x,\lambda)=f(x)+\lambda g(x)$
其约束范围为不等式，可等价转化为Karush-Kuhn-Tucker (KKT)条件：

在此基础上，通过优化方式（如二次规划或SMO）求解其最优解。

几何解释：

当解位于 $g_i(x)<0$ 范围时，那么 $g_i(x)=0$ 这一条件就未起到了约束作用，因此，当解满足 $g_i(x)=0$ 这一约束条件时，约束条件才有意义。

拉格朗日乘子法：

引入拉格朗日乘子 $\alpha_i>=0$ 得到拉格朗日函数： $L(w,b,\alpha)=\frac{1}{2}||w||^2-\sum_{i=1}^m\alpha_i(y_i(w^Tx_i+b)-1)$
令 $L(w,b,\alpha)$ 对w和b的偏导为0： $w=\sum_{i=1}^m\alpha_iy_ix_i,\sum_{i=1}^m\alpha_iy_i=0$
将w和b回代到第一步：
$L(w,b,\alpha)=\frac{1}{2}||w||^2-\sum_{i=1}^m\alpha_i(y_i(w^Tx_i+b)-1)$

= $\frac{1}{2}w^Tw-w^T\sum_{i=1}^m\alpha_iy_ix_i-b\sum_{i=1}^m\alpha_iy_i+\sum_{i=1}^m\alpha_i$

= $\frac{1}{2}w^T(\sum_{i=1}^m\alpha_iy_ix_i)-w^T\sum_{i=1}^m\alpha_iy_ix_i+\sum_{i=1}^m\alpha_i$

= $-\frac{1}{2}w^T\sum_{i=1}^m\alpha_iy_ix_i+\sum_{i=1}^m\alpha_i$

= $-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j+\sum_{i=1}^m\alpha_i$

即 $min_\alpha$ $\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j-\sum_{i=1}^m\alpha_i$
s.t. $\sum_{i=1}^m\alpha_iy_i=0,\alpha_i>=0,i=1,2,...,m.$

由于 $min_{w,b}\frac{1}{2}w^Tw=min_{w,b}max_\alpha L(w,b,\alpha)=max_\alpha min_{w,b}L(w,b,\alpha)$

则等价于 $max_\alpha\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j$
s.t. $\sum_{i=1}^m\alpha_iy_i=0,\alpha_i>=0,i=1,2,...,m.$

最终模型： $f(x)=w^Tx+b=\sum_{i=1}^m\alpha_Iy_ix_i^Tx+b$
此处 $\alpha_i$ 为未知数
据Karush-Kuhn-Tucker（KKT）条件，函数最优解满足以下条件：

对于不在最大边缘边界上的点，由于 $y_if(x_i)>1,因此$ $\alpha_i=0$

支持向量机解的稀疏性：
训练完成后，大部分训练样本都无需保留，最终模型只与支持向量有关。

二次规划

调用开源工具的二次规划程序求得 $\alpha_1,\alpha_2,\alpha_3,\alpha_4$ 的值，并代入求得w和b的值。

显然当数据集样本很大时，计算量也很大。

SMO

$max_\alpha\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j$
s.t. $\sum_{i=1}^m\alpha_iy_i=0.$
基本思路：不断重复执行以下两个步骤直至收敛。

选取一对需要更新的变量 $\alpha_i，\alpha_j$
固定 $\alpha_i，\alpha_j$ 以外的参数，求解对偶问题更新 $\alpha_i，\alpha_j$ 。

当仅考虑 $\alpha_i，\alpha_j$ 时，对偶问题的约束条件变为：
$\alpha_iy_i+\alpha_jy_j=-\sum_{k!=i,j}\alpha_ky_k,\alpha_i>=0,\alpha_j>=0$
偏移项b：通过支持向量确定。
算法流程：每次选取两个 $\alpha$ 进行更新


需要注意的是我们要同时改变两个 $\alpha$ ,若只选取一个，那么该变量可以通过其他变量和约束条件联合求得，可能会导致约束条件失效，因此我们需要同时改变两个 $\alpha$ 。

核函数

线性不可分->高维可分
当不存在一个能正确划分两类样本的超平面时，我们可以将样本从原始空间映射到一个更高维的特征空间，使得样本在该特征空间内线性可分。

设样本x映射后的向量为ϕ(x), 划分超平面为 $f(x)=w^Tϕ(x)+b$

基本想法：不显式的构造该映射，而是设计核函数。

Mercer定理（充分非必要）：只要对称函数值所对应的核矩阵半正定，则该函数可作为核函数。

常用核函数：仍然可用SMO算法求解

软间隔与正则化

在实际应用中，很难选择合适的核函数使样本在特征空间中线性可分，此外，线性可分的结果也很难断定是否是由过拟合造成的。因此，我们引入软间隔的概念，允许SVM在一些样本上不满足约束。

部分样本允许：
基本思想：最大化间隔的同时，让不满足约束的样本应尽可能的少。

C>0为惩罚参数， $l_{0/1}$ 是“0/1损失函数”

但是0/1损失函数非凸，非连续，不宜优化，因此我们选择替代损失函数，替代损失函数数学性质较好，一般是0/1损失函数的上界。

Hinge Loss：

据KKT条件推得最终模型只与支持向量有关，即hinge损失函数保留了支持向量机解的稀疏性。
支持向量机学习模型的更一般形式：

通过替换上图中的两个部分便可得到其他学习模型：对数几率回归（Logistic Regression）,最小绝对收缩选择算子（LASSO）。

支持向量回归

特点：允许模型输出和实际输出间存在2ε的偏差。

对于落入中间2ε间隔带的样本我们不计算损失，从而获得模型的稀疏性。

形式化：

训练策略：

实现SMO算法处理小规模数据集

简化版SMO算法

SMO算法中的辅助函数：

def loadDataSet(fileName):
    dataMat=[];
    labelMat=[];
    fr=open(fileName)
    for line in fr.readlines():#逐行解析
        lineArr=line.strip().split('\t')
        dataMat.append([float(lineArr[0]),float(lineArr[1])])#得到数据矩阵
        labelMat.append(float(lineArr[2]))#得到类标签
    return dataMat,labelMat
def selectJrand(i,m):#i为第一个alpha的下标，m为所有alpha的数目
    j=i
    while(j==i):
        j=int(random.uniform(0,m))#随机选择alpha
    return j
def clipAlpha(aj,H,L):#调整大于H或小于L的alpha值
    if aj>H:
        aj=H
    if L>aj:
        aj=L
    return aj

loadDataSet函数打开文件并对其逐行解析，得到每行的类标签和整个数据矩阵。selectJrand函数进行随机选择alpha。clipAlpha函数调整大于H或小于L的alpha值。
SMO函数伪代码如下所示：

创建一个alpha向量并将其初始化为0向量
当迭代次数小于最大迭代次数时（外循环）：
对数据集中的每个数据向量（内循环）：
如果该数据向量可以被优化：
随机选择另外一个数据向量
同时优化这两个向量
如果两个向量都不能被优化，退出内循环
如果所有向量都没被优化，增加迭代次数，继续下一次循环

简化版SMO算法如下所示：

def smoSimple(dataMatIn,classLabels,C,toler,maxIter):#数据集，类别标签，常数C，容错率，最大循环次数
    start=time.time()
    dataMatrix=mat(dataMatIn);
    labelMat=mat(classLabels).transpose()#转置类别标签
    b=0
    m,n=shape(dataMatrix)
    alphas=mat(zeros((m,1)))#初始化alpha列矩阵
    iter=0#存储在没有任何alpha改变情况下遍历数据集的次数
    while(iter<maxIter):
        alphaPairsChanged=0#记录alpha是否进行优化
        for i in range(m):
            fxi=float(multiply(alphas,labelMat).T*\
                      (dataMatrix*dataMatrix[i,:].T))+b #预测类别
            Ei=fxi-float(labelMat[i])#计算误差
            if((labelMat[i]*Ei<-toler)and(alphas[i]<C))or\
                    ((labelMat[i]*Ei>toler)and\
                     (alphas[i]>0)):
                j=selectJrand(i,m)#选择第二个alpha值
                fxj=float(multiply(alphas,labelMat).T*\
                          (dataMatrix*dataMatrix[j,:].T))+b
                Ej=fxj-float(labelMat[j])
                alphaIold=alphas[i].copy();
                alphaJold=alphas[j].copy();
                if(labelMat[i]!=labelMat[j]):
                    L=max(0,alphas[j]-alphas[i])
                    H=min(C,C+alphas[j]-alphas[i])
                else:
                    L=max(0,alphas[j]+alphas[i]-C)
                    H=min(C,alphas[j]+alphas[i])
                if L==H:
                    print('L==H')
                    continue
                eta=2.0*dataMatrix[i,:]*dataMatrix[j,:].T-\
                    dataMatrix[i,:]*dataMatrix[i,:].T-\
                    dataMatrix[j,:]*dataMatrix[j,:].T
                if eta>=0:
                    print('eta>=0')
                    continue
                alphas[j]-=labelMat[j]*(Ei-Ej)/eta
                alphas[j]=clipAlpha(alphas[j],H,L)
                if(abs(alphas[j]-alphaJold)<0.00001):
                    print('j not moving enough')
                    continue
                alphas[i]+=labelMat[j]*labelMat[i]*\
                           (alphaJold-alphas[j])#对i进行修改，修改量与j相同，但方向相反
                b1=b-Ei-labelMat[i]*(alphas[i]-alphaIold)*\
                    dataMatrix[i,:]*dataMatrix[i,:].T-\
                    labelMat[j]*(alphas[j]-alphaJold)*\
                    dataMatrix[i,:]*dataMatrix[j,:].T
                b2=b-Ej-labelMat[i]*(alphas[i]-alphaIold)*\
                    dataMatrix[i,:]*dataMatrix[j,:].T-\
                    labelMat[j]*(alphas[j]-alphaJold)*\
                    dataMatrix[j,:]*dataMatrix[j,:].T
                if(0<alphas[i])and(C>alphas[i]):
                    b=b1
                elif (0<alphas[j])and(C>alphas[j]):
                    b=b2
                else:
                    b=(b1+b2)/2.0
                alphaPairsChanged+=1
                print('iter:%d i:%d,pairs changed %d'%\
                      (iter,i,alphaPairsChanged))
        if(alphaPairsChanged==0):
            iter+=1
        else:
            iter=0
        print('iteration number: %d' %iter)
    end=time.time()
    rtime=end-start
    print("the running time is:%f"%(end-start))
    return b,alphas,rtime

	dataArr,labelArr=loadDataSet('D:/machinelearning/machinelearninginaction/Ch06/testSet.txt')
    # print(labelArr)
    b,alphas,rtime=smoSimple(dataArr,labelArr,0.6,0.001,40)

运行结果：

由运行结果可以看出简化版的SMO算法运行时间较久，并且随着迭代次数的增加，程序的运行时间也在增加，这里我运行了十次算法并计算出来程序的平均运行时间为4s左右，虽然不是太久，但该数据集规模较小，当数据集规模较大时，程序运行时间将会更长。
对支持向量用圆圈标记后的结果如图所示：

利用完整Platt SMO算法加速优化

在之前实现的简化版SMO算法中，对于小规模数据集运行时间并不会太久，但在更大规模数据集上时简化版SMO算法的运行时间就会变长。因此我们通过完整的Platt SMO算法进行加速优化。在简化版与完整版SMO算法中，实现alpha的更改和代数运算的优化环节一模一样，在优化过程中，唯一不同为选择alpha的方式。
Platt SMO算法是通过一个外循环来选择第一个alpha值的，并且其选择过程会在两种方式之间进行交替：一种方式为在所有数据集上进行单遍扫描，另一种方式是在非边界alpha中实现单遍扫描。非边界alpha指的是不等于边界0或C的alpha值，对整个数据集的扫描相当容易，而实现非边界alpha值的扫描时，首先需要建立这些alpha值的列表，然后再对这个表进行遍历，同时，该步骤会跳过已知的不会改变的alpha值。
在选择第一个alpha值后，算法会通过一个内循环来选择第二个alpha值，在优化过程中，会通过最大化步长的方式来获得第二个alpha值，在简化版SMO算法中，我们会在选择j之后计算错误率Ej，但在完整版SMO算法中，我们会建立一个全局的缓存用于保存误差值，并从中选择使得步长或者说Ei-Ej最大的alpha值。

完整版Platt SMO的支持函数：

class optStruct:
    def __init__(self,dataMatIn,classLabels,C,toler):
        self.X=dataMatIn
        self.labelMat=classLabels
        self.C=C
        self.tol=toler
        self.m=shape(dataMatIn)[0]
        self.alphas=mat(zeros((self.m,1)))
        self.b=0
        self.eCache=mat(zeros((self.m,2)))#误差缓存

def calcEk(oS,k):#计算E值并返回
    fXk=float(multiply(oS.alphas,oS.labelMat).T*(oS.X*oS.X[k,:].T))+oS.b
    Ek=fXk-float(oS.labelMat[k])
    return Ek

def selectJ(i,oS,Ei):#选择第二个alpha（内循环的alpha值）
    maxK=-1
    maxDeltaE=0
    Ej=0
    oS.eCache[i]=[1,Ei]#将输入值Ei在缓存中设置为有效的（已经计算好的）
    validEcacheList=nonzero(oS.eCache[:,0].A)[0]#构建出非零表
    if(len(validEcacheList))>1:
        for k in validEcacheList:
            if k==1:
                continue
            Ek=calcEk(oS,k)
            deltaE=abs(Ei-Ek)
            if(deltaE>maxDeltaE):#选择具有最大步长的j
                maxk=k;maxDeltaE=deltaE;Ej=Ek
        return maxK,Ej
    else:
        j=selectJrand(i,oS.m)
        Ej=calcEk(oS,j)
    return j,Ej

def updateEk(oS,k):#计算误差值并存入缓存当中
    Ek=calcEk(oS,k)
    oS.eCache[k]=[1,Ek]

首先建立一个数据结构保存所有重要值，这个过程可以通过一个对象来完成，这里使用对象的目的不是为了面向对象编程，而是作为一个数据结构来使用对象。构建一个仅包含init方法的optStruct类，该方法可以实现其成员变量的填充。calcEk函数用于计算E值并返回，在之前简化版SMO算法中，该过程是内嵌的，但由于该过程在完整版Platt SMO算法中出现频繁，因此将其单独拎出来。selectJ函数用于选择第二个alpha（内循环的alpha值）。updateEk函数计算误差值并存入缓存当中。

完整Platt SMO算法中的优化例程：

def innerL(i,oS):
    Ei=calcEk(oS,i)
    if((oS.labelMat[i]*Ei<-oS.tol)and(oS.alphas[i]<oS.C))or\
            ((oS.labelMat[i]*Ei>oS.tol)and(oS.alphas[i]>0)):
        j,Ej=selectJ(i,oS,Ei)#采用第二个alpha选择中的启发式方法
        alphaIold=oS.alphas[i].copy()
        alphaJold=oS.alphas[j].copy()
        if(oS.labelMat[i]!=oS.labelMat[j]):
            L=max(0,oS.alphas[j]-oS.labelMat[i])
            H=min(oS.C,oS.C+oS.alphas[j]-oS.alphas[i])
        else:
            L=max(0,oS.alphas[j]+oS.alphas[i]-oS.C)
            H=min(oS.C,oS.alphas[j]+oS.alphas[i])
        if L==H:
            print("L==H")
            return 0
        eta=2.0*oS.X[i,:]*oS.X[j,:].T-oS.X[i,:]*oS.X[i,:].T-\
            oS.X[j,:]*oS.X[j,:].T
        if eta>=0:
            print("eta>=0")
            return 0
        oS.alphas[j]-=oS.labelMat[j]*(Ei-Ej)/eta
        oS.alphas[j]=clipAlpha(oS.alphas[j],H,L)
        updateEk(oS,j)#更新误差缓存
        if(abs(oS.alphas[j]-alphaJold)<0.00001):
            print("j not moving enough")
            return 0
        oS.alphas[i]+=oS.labelMat[j]*oS.labelMat[i]*\
                      (alphaJold-oS.alphas[j])
        updateEk(oS,i)
        b1=oS.b-Ei-oS.labelMat[i]*(oS.alphas[i]-alphaIold)*\
            oS.X[i,:]*oS.X[i,:].T-oS.labelMat[j]*\
           (oS.alphas[j]-alphaJold)*oS.X[i,:]*oS.X[j,:].T
        b2=oS.b-Ej-oS.labelMat[i]*(oS.alphas[i]-alphaIold)*\
            oS.X[i,:]*oS.X[j,:].T-oS.labelMat[j]*\
           (oS.alphas[j]-alphaJold)*oS.X[j,:]*oS.X[j,:].T
        if(0<oS.alphas[i])and(oS.C>oS.alphas[i]):
            oS.b=b1
        elif(0<oS.alphas[j])and(oS.C>oS.alphas[j]):
            oS.b=b2
        else:
            oS.b=(b1+b2)/2.0
        return 1
    else:
        return 0

该部分代码与smoSimple函数几乎一样，但该部分代码使用了自己的数据结构，该结构在参数oS中传递，另外该部分代码使用了selectJ函数来选择第二个alpha值，最后在alpha值改变时更新Ecache。

完整版Platt SMO算法的外循环代码

def smoP(dataMatIn,classLabels,C,toler,maxIter,kTrup=('lin',0)):
    start=time.time()
    oS=optStruct(mat(dataMatIn),mat(classLabels).transpose(),C,toler)#构建数据结构容纳数据
    iter=0
    entireSet=True;alphaPairsChanged=0
    while(iter<maxIter)and((alphaPairsChanged>0)or(entireSet)):
        alphaPairsChanged=0
        if entireSet:#遍历所有的值
            for i in range(oS.m):
                alphaPairsChanged+=innerL(i,oS)
                print("fullSet,iter:%d i:%d,pairs changed %d"%(iter,i,alphaPairsChanged))
            iter+=1
        else:#遍历非边界值
            nonBoundIs=nonzero((oS.alphas.A>0) * (oS.alphas.A<C))[0]
            for i in nonBoundIs:
                alphaPairsChanged+=innerL(i,oS)
                print("non-bound,iter:%d i:%d,pairs changed %d"%(iter,i,alphaPairsChanged))
            iter+=1
        if entireSet:
            entireSet=False
        elif(alphaPairsChanged==0):
            entireSet=True
        print("iteration number:%d"%iter)
    end=time.time()
    rtime=end-start
    print("the running time is:%f"%(end-start))
    return oS.b,oS.alphas,rtime

该算法首先构建一个数据结构容纳所有数据，再对控制函数退出的一些变量进行初始化，代码主体为while循环，与smoSimple类似，但该算法的循环退出条件更多，当迭代次数超过指定最大值，或遍历整个集合都未对任意alpha值对进行修改时，就退出循环。while循环内部与smoSimple也不同，一开始for循环遍历数据集上任意可能的alpha，我们调用innerL函数选择第二个alpha，并在可能时对其进行优化处理，若任意一对alpha值发生改变，那么返回1，第二个for循环遍历所有非边界alpha值，即不在边界0或C上的值。

	dataArr,labelArr=loadDataSet('D:/machinelearning/machinelearninginaction/Ch06/testSet.txt')
    # print(labelArr)
    b,alphas,rtime=smoP(dataArr,labelArr,0.6,0.001,40)

运行结果：

由运行结果可以看出完整版的Platt SMO算法相比简化版SMO算法的运行时间快得多，运行10次的平均时间为0.5s左右，而简化版SMO算法则需要4s左右。

w的计算：

def calcWs(alphas,dataArr,classLabels):
    X=mat(dataArr)
    labelMat=mat(classLabels).transpose()
    m,n=shape(X)
    w=zeros((n,1))
    for i in range(m):
        w+=multiply(alphas[i]*labelMat[i],X[i,:].T)
    return w

    dataArr,labelArr=loadDataSet('D:/machinelearning/machinelearninginaction/Ch06/testSet.txt')
    b, alphas, rtime = smoP(dataArr, labelArr, 0.6, 0.001, 100)
ws=calcWs(alphas,dataArr,labelArr)
    print(ws)
    datMat=mat(dataArr)
    print(datMat[0]*mat(ws)+b)
    print(labelArr[0])
    datMat=mat(dataArr)
    print(datMat[1]*mat(ws)+b)
    print(labelArr[1])
    datMat=mat(dataArr)
    print(datMat[2]*mat(ws)+b)
    print(labelArr[2])

运行结果：

若值大于0则属于1类，若值小于0则属于-1类，对于数据点0，1，2，我们分别通过查看类别标签来验证分类的正确性，可以发现数据分类结果正确。

在复杂数据上应用核函数

核转换函数：

def kernelTrans(X,A,kTup):
    m,n=shape(X)
    K=mat(zeros((m,1)))
    if kTup[0]=='lin':
        K=X*A.T
    elif kTup[0]=='rbf':
        for j in range(m):
            deltaRow=X[j,:]-A
            K[j]=deltaRow*deltaRow.T
        K=exp(K/(-1*kTup[1]**2))#元素间的除法
    else:
        raise NameError('Houston We Have a Problem--That Kernel is not recognized')
    return K

class optStruct:
    def __init__(self,dataMatIn,classLabels,C,toler,kTup):
        self.X=dataMatIn
        self.labelMat=classLabels
        self.C=C
        self.tol=toler
        self.m=shape(dataMatIn)[0]
        self.alphas=mat(zeros((self.m,1)))
        self.b=0
        self.eCache=mat(zeros((self.m,2)))
        self.K=mat(zeros((self.m,self.m)))
        for i in range(self.m):
            self.K[:,i]=kernelTrans(self.X,self.X[i,:],kTup)

kernelTrans函数有三个输入参数：2个数据型变量，1个元组。元组kTup时核函数的信息，元组第一个参数是描述所用核函数类型的一个字符串，其他2个参数都是核函数可能需要的可选参数，该函数首先构建出一个列向量，然后检查元组以确定核函数的类型。

需要对innerL函数和calcEk函数做的修改：

def innerL(i,oS):
    Ei=calcEk(oS,i)
    if((oS.labelMat[i]*Ei<-oS.tol)and(oS.alphas[i]<oS.C))or\
            ((oS.labelMat[i]*Ei>oS.tol)and(oS.alphas[i]>0)):
        j,Ej=selectJ(i,oS,Ei)#采用第二个alpha选择中的启发式方法
        alphaIold=oS.alphas[i].copy()
        alphaJold=oS.alphas[j].copy()
        if(oS.labelMat[i]!=oS.labelMat[j]):
            L=max(0,oS.alphas[j]-oS.labelMat[i])
            H=min(oS.C,oS.C+oS.alphas[j]-oS.alphas[i])
        else:
            L=max(0,oS.alphas[j]+oS.alphas[i]-oS.C)
            H=min(oS.C,oS.alphas[j]+oS.alphas[i])
        if L==H:
            print("L==H")
            return 0
        # eta=2.0*oS.X[i,:]*oS.X[j,:].T-oS.X[i,:]*oS.X[i,:].T-\
        #     oS.X[j,:]*oS.X[j,:].T
        eta = 2.0 * oS.K[i, j] - oS.K[i, i] - oS.K[j, j]  # changed for kernel
        if eta>=0:
            print("eta>=0")
            return 0
        oS.alphas[j]-=oS.labelMat[j]*(Ei-Ej)/eta
        oS.alphas[j]=clipAlpha(oS.alphas[j],H,L)
        updateEk(oS,j)#更新误差缓存
        if(abs(oS.alphas[j]-alphaJold)<0.00001):
            print("j not moving enough")
            return 0
        oS.alphas[i]+=oS.labelMat[j]*oS.labelMat[i]*\
                      (alphaJold-oS.alphas[j])
        updateEk(oS,i)
        # b1=oS.b-Ei-oS.labelMat[i]*(oS.alphas[i]-alphaIold)*\
        #     oS.X[i,:]*oS.X[i,:].T-oS.labelMat[j]*\
        #    (oS.alphas[j]-alphaJold)*oS.X[i,:]*oS.X[j,:].T
        # b2=oS.b-Ej-oS.labelMat[i]*(oS.alphas[i]-alphaIold)*\
        #     oS.X[i,:]*oS.X[j,:].T-oS.labelMat[j]*\
        #    (oS.alphas[j]-alphaJold)*oS.X[j,:]*oS.X[j,:].T
        b1 = oS.b - Ei - oS.labelMat[i] * (oS.alphas[i] - alphaIold) * oS.K[i, i] - oS.labelMat[j] * (
                    oS.alphas[j] - alphaJold) * oS.K[i, j]
        b2 = oS.b - Ej - oS.labelMat[i] * (oS.alphas[i] - alphaIold) * oS.K[i, j] - oS.labelMat[j] * (
                    oS.alphas[j] - alphaJold) * oS.K[j, j]
        if(0<oS.alphas[i])and(oS.C>oS.alphas[i]):
            oS.b=b1
        elif(0<oS.alphas[j])and(oS.C>oS.alphas[j]):
            oS.b=b2
        else:
            oS.b=(b1+b2)/2.0
        return 1
    else:
        return 0
def calcEk(oS, k):
    fXk = float(multiply(oS.alphas,oS.labelMat).T*oS.K[:,k] + oS.b)
    Ek = fXk - float(oS.labelMat[k])
    return Ek

利用核函数进行分类的径向基测试函数：

def testRbf(k1=1.3):
    dataArr,labelArr=loadDataSet('D:/machinelearning/machinelearninginaction/Ch06/testSetRBF.txt')
    b,alphas = smoP(dataArr, labelArr, 200, 0.0001, 10000, ('rbf', k1)) #C=200 important
    datMat=mat(dataArr)
    labelMat=mat(labelArr).transpose()
    svInd=nonzero(alphas.A>0)[0]
    sVs=datMat[svInd]#构建支持向量矩阵
    labelSV=labelMat[svInd]
    print("there are %d support vectors"%shape(sVs)[0])
    m,n=shape(datMat)
    errorCount=0
    for i in range(m):
        kernelEval=kernelTrans(sVs,datMat[i,:],('rbf',k1))
        predict=kernelEval.T*multiply(labelSV,alphas[svInd])+b
        if sign(predict)!=sign(labelArr[i]):
            errorCount+=1
    print("the training error rate is:%f"%(float(errorCount)/m))
    dataArr,labelArr=loadDataSet('D:/machinelearning/machinelearninginaction/Ch06/testSetRBF2.txt')
    errorCount=0
    datMat=mat(dataArr)
    labelMat=mat(labelArr).transpose()
    m,n=shape(datMat)
    for i in range(m):
        kernelEval=kernelTrans(sVs,datMat[i,:],('rbf',k1))
        predict=kernelEval.T*multiply(labelSV,alphas[svInd])+b
        if sign(predict)!=sign(labelArr[i]):
            errorCount+=1
    print("the test error rate is:%f"%(float(errorCount)/m))

    testRbf()

运行结果：

如图所示：当k1参数为1.3时，支持向量个数为5，训练错误率为0.46，测试错误率为0.43，当我们改变k1参数为0.3或2.3时，支持向量个数发生改变，同时训练错误率及测试错误率也发生了改变。支持向量数目存在一个最优值，SVM优点在于能对数据进行高效分类，若支持向量太少，可能会得到一个很差的决策边界，若支持向量太多，相当于每次都利用整个数据集进行分类，这种分类方法称为k近邻。

基于SVM的数字识别

def img2vector(filename):
    returnVect = zeros((1,1024))
    fr = open(filename)
    for i in range(32):
        lineStr = fr.readline()
        for j in range(32):
            returnVect[0,32*i+j] = int(lineStr[j])
    return returnVect

def loadImages(dirName):
    from os import listdir
    hwLabels=[]
    trainingFileList=listdir(dirName)
    m=len(trainingFileList)
    trainingMat=zeros((m,1024))
    for i in range(m):
        fileNameStr=trainingFileList[i]
        fileStr=fileNameStr.split('.')[0]
        classNumStr=int(fileStr.split('_')[0])
        if classNumStr==9:
            hwLabels.append(-1)
        else:
            hwLabels.append(1)
        trainingMat[i,:]=img2vector('%s/%s'%(dirName,fileNameStr))
    return trainingMat,hwLabels
def testDigits(kTup=('rbf',10)):
    dataArr,labelArr=loadImages('D:/machinelearning/machinelearninginaction/Ch06/digits/trainingDigits')
    b,alphas=smoP(dataArr,labelArr,200,0.0001,10000,kTup)
    datMat=mat(dataArr)
    labelMat=mat(labelArr).transpose()
    svInd=nonzero(alphas.A>0)[0]
    sVs=datMat[svInd]
    labelSV=labelMat[svInd]
    print("there are %d support vectors"%shape(sVs))[0]
    m,n=shape(datMat)
    errorCount=0
    for i in range(m):
        kernelEval=kernelTrans(sVs,datMat[i,:],kTup)
        predict=kernelEval.T*multiply(labelSV,alphas[svInd])+b
        if sign(predict)!=sign(labelArr[i]):
            errorCount+=1
    print("the training error rate is:%f"%(float(errorCount)/m))
    dataArr,labelArr=loadImages('D:/machinelearning/machinelearninginaction/Ch06/digits/testDigits')
    errorCount=0
    datMat=mat(dataArr)
    labelMat=mat(labelArr).transpose()
    m,n=shape(datMat)
    for i in range(m):
        kernelEval=kernelTrans(sVs,datMat[i,:],kTup)
        predict=kernelEval.T*multiply(labelSV,alphas[svInd])+b
        if sign(predict)!=sign(labelArr[i]):
            errorCount+=1
    print("the test error rate is:%f"%(float(errorCount)/m))

支持向量机是一个二类分类器，因此我们对手写体识别的数据集进行处理，只保留1和9的数据样本，当碰到数字9输出类别标签-1，否则输出+1.
运行结果：

结果表明：当改变参数分别为0.1，10，100时，支持向量个数及错误率也发生了变化。

实验总结

在SVM支持向量机的实验当中，首先要对实验原理足够熟悉以及掌握对数据集的处理才能方便实验进行。

你可能感兴趣的:(支持向量机,机器学习,算法)

Spring Boot 集成高德地图电子围栏 Cloud_. spring boot 后端 java
摘要：本文手把手教你通过SpringBoot调用高德地图API实现电子围栏功能，涵盖云端围栏创建、设备位置监控与本地算法校验，附带完整代码和避坑经验！一、电子围栏核心原理1.1什么是电子围栏？虚拟地理边界：在地图上划定区域（圆形/多边形），触发进出事件应用场景：员工考勤、物流围栏、儿童安全区域监控技术核心：基于GPS/北斗坐标的位置判断（射线法或API调用）1.2高德地图API能力云端围栏管理：创
数据结构与算法——二叉搜索树，使用TreeMap将键值对存储在一棵二叉搜索树的节点 Book_熬夜！数据结构与算法算法 javascript 数据结构
二叉搜索树【二叉搜索树（BST）】：对于树中的每个节点，其左子树的每个节点的值都要小于这个节点的值，右子树的每个节点的值都要大于这个节点的值。左小右大。中序遍历结果是有序的，会从小到大排序。7/\49/\\1810（不符合）可以使用TreeMap把键值对存储在一棵二叉搜索树的节点里通过遍历这棵二叉搜索树，比遍历普通的二叉树能更快实现增删查改classTreeNode{constructor(key
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
请编写一个Python程序，实现WOA-CNN-BiLSTM鲸鱼算法优化卷积双向长短期记忆神经网络多输入单输出回归预测功能。 2301_81121233 算法神经网络 python mongodb storm zookeeper spark
实现一个基于鲸鱼优化算法（WOA）优化的卷积双向长短期记忆神经网络（CNN-BiLSTM）的多输入单输出回归预测功能是一个复杂的任务，涉及到多个步骤和组件。由于完整的实现会非常冗长，我将提供一个简化的框架和关键部分的代码示例，帮助你理解如何实现这个功能。请注意，这个示例不会包含所有细节，比如数据集的准备、鲸鱼优化算法的具体实现（WOA是一个元启发式算法，需要单独实现或引用现有库），以及CNN-Bi
Dijkstra算法例题及解析 _gxd_ 算法
最短路算法（2）——Dijkstra算法本章一共有三道例题。1.最短路2.TiltheCowsComeHome3.成语接龙1.最短路Description在每年的校赛里，所有进入决赛的同学都会获得一件很漂亮的t-shirt。但是每当我们的工作人员把上百件的衣服从商店运回到赛场的时候，却是非常累的！所以现在他们想要寻找最短的从商店到赛场的路线，你可以帮助他们吗？FormatInput输入包括多组数据
AI人工智能中的概率论与统计学原理与Python实战：Python实现概率模型 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的不断发展，概率论与统计学在人工智能领域的应用越来越广泛。概率论与统计学是人工智能中的基础知识之一，它们在机器学习、深度学习、自然语言处理等领域都有着重要的作用。本文将介绍概率论与统计学的核心概念、算法原理、具体操作步骤以及Python实现方法，并通过具体代码实例进行详细解释。2.核心概念与联系2.1概率论与统计学的区别概率论是一门数学学科，它研究随机事件发生的可能性。
技术解析麦萌短剧《月光下的你》：从「时间序列的对抗扰动」到「加密身份的收敛证明」萌萌短剧重构
《月光下的你》以十六年的时间跨度展开一场关于「数据污染」与「身份验证」的深度博弈，本文将用机器学习视角拆解这场跨越时空的模型纠偏实验。1.数据污染事件：十六年前的对抗攻击许芳菲（Agent_Xu）的遭遇可视为时间序列上的对抗样本注入：标签篡改攻击：许清清（Adversary_XuQing）通过伪造标签（Label_Tampering）将Agent_Xu与傅临州（Node_Fu）强行关联，触发道德约
蓝桥杯网络安全春秋赛 Crypto RSA 叁Three 蓝桥杯密码学
蓝桥杯网络安全春秋赛CryptoRSA题目某公司为了保护其重要数据，使用了RSA加密算法。该公司以同一个N为模数，为Alice和Bob分别生成了不同的公钥和与之相应的私钥。Alice和Bob都使用自己的公钥对同一条明文m进行加密，分别得到密文c1和c2。假设你是一名密码安全研究者，你已获取了N值、两个密文和公钥，能否使用RSA的相关知识还原出明文m呢？#!python3.9fromCrypto.U
机器学习 [白板推导]（三）[线性分类] 神齐的小马机器学习分类人工智能
4.线性分类4.1.线性分类的典型模型硬分类：输出结果只有0或1这种离散结果；感知机线性判别分析Fisher软分类：会输出0-1之间的值作为各个类别的概率；概率生成模型：高斯判别分析GDA、朴素贝叶斯，主要建模的是p(x⃗,y)p(\vec{x},y)p(x,y)概率判别模型：逻辑回归，主要建模的是p(y∣x⃗)p(y|\vec{x})p(y∣x)4.2.感知机4.2.1.基本模型模型：f(x
基于内容分块（CDC）的重删算法详解：原理、实现与优化这个懒人算法
引言在数据爆炸式增长的时代，存储资源优化成为技术领域的重要课题。重复数据删除（Deduplication）技术通过消除冗余数据副本，可将存储需求降低90%以上。其中基于内容分块（Content-DefinedChunking,CDC）算法凭借其对数据局部修改的强适应性，成为企业级备份系统、云存储服务的核心技术。一、CDC算法核心原理1.1动态分块vs静态分块传统固定分块算法将数据按固定大小（如4K
算法-找到字符串中所有字母异位词程序员南飞算法数据结构开发语言 java
力扣题目：438.找到字符串中所有字母异位词-力扣（LeetCode）题目描述:给定两个字符串s和p，找到s中所有p的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。示例1:输入:s="cbaebabacd",p="abc"输出:[0,6]解释:起始索引等于0的子串是"cba",它是"abc"的异位词。起始索引等于6的子串是"bac",它是"abc"的异位词。示例2:输入:s="aba
【面试经验】华为 AI软开计算产品线（面经+时间线） litterfinger 面试华为人工智能
一.岗位：AI软开二.时间线：投递08.09，机试08.28，测评08.29；面试均线上，一面09.12，二面09.27，三面09.29（本来是09.19线下二三面，但由于本人有事推迟）三.一面（50min）自我介绍简单介绍一下传统知识图谱建设和大模型对于知识的构建的差异和整体的趋势聊聊实习经历中的提示工程和sft具体的工作AI的一个发展历史流程和相关算法的引进知识图谱建设的总体流程回顾机试：老鼠
【北上广深杭大厂AI算法面试题】计算机视觉篇...详解目标检测中的多尺度训练和测试? 努力毕业的小土博^_^ AI算法题库人工智能计算机视觉算法深度学习神经网络目标检测
【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度训练和测试?【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度训练和测试?文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...详解目标检测中的多尺度训练和测试?前言多尺度训练核心思想：优点与注意点：多尺度测试核心思想：优点与注意点：综合作用参考示例总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上
MVC/MVP/MVVM框架学习总结（二）每次的天空 mvc 学习 java
上次已经了解到MVC的知识，现在是扩展实现MVP/MVVM的框架改进本身项目MVVM框架即Model-View-ViewModel框架，是一种软件架构设计模式，以下是具体介绍：核心组件Model（模型）：代表应用程序的数据结构和业务逻辑，负责数据的存储、检索、验证和处理，定义业务规则和算法，是应用程序的数据核心。比如在一个电商应用中，商品数据、用户订单数据等的存储和相关逻辑处理都属于Model层。
【时间复杂度常见的计算】 xihongshi547 算法 leetcode 数据结构
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档时间复杂度的简单介绍前言一、时间复杂度是什么？二、时间复杂度的计算1.基本步骤2.常见的时间复杂度总结前言对于判断一段代码的好坏，取决于该代码运行的时间与占用的空间，也就是时间复杂度与空间复杂度，本章就先讲一下时间复杂度，主要包含常见的时间复杂度的计算。一、时间复杂度是什么？时间复杂度是衡量算法运行效率的一个重要指标，它表示随着输入规
Ollama 基本概念 Mr_One_Zhang 学习Ollama ai
Ollama是一个本地化的、支持多种自然语言处理（NLP）任务的机器学习框架，专注于模型加载、推理和生成任务。通过Ollama，用户能够方便地与本地部署的大型预训练模型进行交互。1.模型（Model）在Ollama中，模型是核心组成部分。它们是经过预训练的机器学习模型，能够执行不同的任务，例如文本生成、文本摘要、情感分析、对话生成等。Ollama支持多种流行的预训练模型，常见的模型有：deepse
为什么转行大模型行业？深度解析职业变革与技术红利大模型入门教程大模型学习语言模型人工智能 AI 大模型程序员大模型入门
引言2023年ChatGPT的爆发式发展，标志着AI大模型技术正式进入大众视野。这一技术不仅重塑了人工智能的边界，更催生了全新的职业赛道。从传统算法工程师到互联网从业者，越来越多的人开始将目光投向大模型领域。本文将深入探讨这一现象背后的核心动因，并结合行业现状、技术趋势与职业发展路径，为从业者提供系统性分析。一、行业变革：传统岗位萎缩与大模型崛起传统技术岗位的困境以推荐算法为例，随着移动互联网流量
算法学习之路——贪心算法蒋楠鑫算法算法贪心算法
文章目录一、前言二、什么是算法三、什么是贪心算法1.含义2.基本思路3.适用场景四、代码实现五、经典例题分析六、总结一、前言先来看一道简单的数学问题：小明有30元钱，每瓶酒要5元钱，每3个空瓶子可以换1瓶酒，请问小明最多可以喝到多少瓶酒？这道题目显然是一道求最优解的问题，由于数据量小我们可以用最简单最直接的枚举法来解决，但是如果将题目泛化一下呢：小明现在购买了m瓶酒，每n个空瓶子可以换1瓶酒，请问
人工智能直通车系列24【机器学习基础】（机器学习模型评估指标（回归））浪九天人工智能直通车开发语言 python 机器学习深度学习神经网络人工智能
目录机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）2.均方根误差（RootMeanSquaredError,RMSE）3.平均绝对误差（MeanAbsoluteError,MAE）4.决定系数（CoefficientofDetermination,R2）机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）详细解释均方误差是回归问
五大基础算法——模拟算法六七_Shmily 数据结构与算法分析算法
模拟算法是一种通过直接模拟问题描述的过程或规则来解决问题的算法思想。它通常用于解决那些问题描述清晰、步骤明确、可以直接按照规则逐步实现的问题。以下是模拟算法的核心概念、适用场景、实现方法及经典例题：一、核心概念问题描述清晰问题的规则和步骤明确，可以直接按照描述实现。逐步模拟按照问题的规则，一步一步模拟过程，直到得到最终结果。无复杂优化模拟算法通常不涉及复杂的优化技巧，重点是准确实现问题描述。二、适
C++闪电侠：快速幂算法终极指南三流搬砖艺术家算法算法深度优先 c++
目录快速幂核心思想快速幂模板代码快速幂取模模板（大数必备）实战演练（LeetCode真题）快速幂核心思想二进制分解+分治思想：a^13=a^(8+4+1)=a^8*a^4*a^1通过不断平方分解指数：a→a²→a⁴→a⁸→...动态演示：指数b=13的二进制：1101计算路径：a^1→(a^1)²→a^2→(a^2)²→a^4→(a^4)²→a^8最终结果=a^8*a^4*a^1快速幂模板代码ll
从零开始学机器学习——构建一个推荐web应用努力的小雨机器学习机器学习前端人工智能
首先给大家介绍一个很好用的学习地址：https://cloudstudio.net/columns今天，我们终于将分类器这一章节学习完活了，和回归一样，最后一章节用来构建web应用程序，我们会回顾之前所学的知识点，并新增一个web应用用来让模型和用户交互。所以今天的主题是美食推荐。美食推荐Web应用程序首先，请不要担心，本章节并不会涉及过多的前端知识点。我们此次的学习重点在于机器学习本身，因此我们
云原生：K8s（Kubernetes）高频典型面试题汇总老舅的火箭爱扫地云原生 kubernetes 容器
1.简述etcd及其特点？答：etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点：l简单：支持REST风格的HTTP+JSONAPIl安全：支持HTTPS方式的访问l快速：支持并发1k/s的写操作l可靠：支持分布式结构，基于Raft的一致性算法，R
【第14届蓝桥杯】软件赛CB组省赛 Guiat 算法竞赛真题题解蓝桥杯
个人主页：Guiat归属专栏：算法竞赛真题题解文章目录A.日期统计B.01串的熵C.冶炼金属D.飞机降落E.接龙数列F.岛屿个数G.子串简写H.整数删除I.景区导游J.砍树正文总共10道题。A.日期统计【题目】日期统计【分析】【答案】235【AC_Code】#include#defineIOSios::sync_with_stdio(0);cin.tie(0);cout.tie(0);usingn
Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例云策量化 Python自动化炒股量化投资量化软件 python 量化交易 QMT PTrade 量化炒股量化投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例在当今快节奏的金融市场中，自动化交易和预测模型成为了投资者和交易者的重要工具。Python以其强大的数据处理能力和丰富的机器学习库，成为了实现这些模型的首选语言。本文将带你了解如何使用XGBoost和LightGBM这两个流行的机器学习算法来
企业级通配符 SSL 证书：企业网络安全的坚实护盾 ssl证书
一、什么是企业级通配符SSL证书企业级通配符SSL证书，是一种数字证书，它就像是企业在网络世界的“身份证”。与普通证书不同，其最大亮点在于一个证书能保护一个主域名及其下所有的子域名。这极大地简化了证书管理流程，企业无需为每个子域名单独申请和配置证书，一站式搞定网络加密需求。二、强大的加密保障在网络数据传输如水流般穿梭的时代，信息安全至关重要。企业级通配符SSL证书采用先进加密算法，将数据加密打包后
深度合成算法备案十大雷区拆解 AI产品备案人工智能算法语言模型 ai
最近后台收到了很多小伙伴的私信，基本上都是在问算法备案被打回了；哪部分的材料有什么问题；不清楚驳回原因等等。今天结合大家最关心的问题，为大家详细剖析一下备案过程中常见的十大难题及解决方法。一、备案主体性质界定不明不少企业在备案过程中往往难以明确自身是否属于备案主体范围，尤其是涉及技术提供与应用服务的交叉领域，无法判断自身是否属于“具有舆论属性或者社会动员能力”主体。解决方案：仔细研读相关政策法规，
【sklearn 04】DNN、CNN、RNN @金色海岸 sklearn dnn cnn
DNNDNN（DeepNeuralNetworks，深度神经网络）是一种相对浅层机器学习模型具有更多参数，需要更多数据进行训练的机器学习算法CNNCNN（convolutionalNeuralNetworks，卷积神经网络）是一种从局部特征开始学习并逐渐整合的神经网络。卷积神经网络通过卷积层来进行特征提取，通过池化层进行降维，相比较全连接的神经网络，卷积神经网络降低了模型复杂度，减少了模型的参数，
【sklearn 02】监督学习、非监督下学习、强化学习 @金色海岸 sklearn 学习人工智能
监督学习、非监督学习、强化学习**机器学习通常分为无监督学习、监督学习和强化学习三类。-第一类：无监督学习（unsupervisedlearning），指的是从信息出发自动寻找规律，分析数据的结构，常见的无监督学习任务有聚类、降维、密度估计、关联分析等。-第二类：监督学习（supervisedlearning），监督学习指的是使用带标签的数据去训练模型，并预测未知数据的标签。监督学习有两种，当预测
从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）码事漫谈 AI 人工智能
文章目录第一部分：AI开发的背景与历史1.1人工智能的起源与发展1.2神经网络与深度学习的崛起1.3Transformer架构与LLM的兴起1.4当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1机器学习：AI的基础2.1.1机器学习的类型2.1.2机器学习的流程2.2深度学习：机器学习的进阶2.2.1神经网络基础2.2.2深度学习的关键架构2.3Transformer架构：现代LLM的核
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s