徐佳浩

基于SVM的手写数字识别

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

前言

本文采用SVM进行手写数字识别；

主要使用MATLAB进行代码编写，处理MNIST数据集利用PYTHON；

数据集为MNIST手写数字，训练集大致有60000张图片，测试集有20000张图片；

文章目录

SVM原理简介
实验步骤
实验分析
完整代码

SVM原理简介

支持向量机大致包含以下三个方面内容：1、线性可分支持向量机；2、线性支持向量机；3、线性不可分支持向量机；其中线性可分支持向量机是其余两个支持向量机的基础，其针对的是线性可分的数据集；线性支持向量机则是针对近似线性可分的数据集；非线性支持向量机则是针对非线性可分的数据集。

支持向量机的基本思想就是求解能够正确划分训练数据集并且几何间隔最大的分离超平面；所谓几何间隔用于表示分类正确度以及确信度的一个概念。

线性可分支持向量机

以下先进行线性可分支持向量机介绍：

假设给定特征空间上线性可分的训练数据集

$T = \left\{ {\left( {{x_1},{y_1}} \right),\left( {{x_2},{y_2}} \right),...,\left( {{x_N},{y_N}} \right)} \right\}$

其中 ${x_i} \in \aleph = {^n}$ ， ${y_i} \in \gamma = \left\{ { + 1, - 1} \right\}$ ，

1.1、函数间隔与几何间隔定义

下面给出函数间隔与几何间隔的定义：

给定训练数据集和超平面 $\omega {x_{}} + b = 0$ ，定义超平面 $\left( {\omega ,b} \right)$ 关于样本点 $\left( {{x_i},{y_i}} \right)$ 的函数间隔：

${\hat \nu _i} = {y_i}\left( {\omega {x_i} + b} \right)$

函数间隔能够表示样本点分类正确性与离超平面远近；

定义在训练集中，所有样本点函数间隔最小值：

$\hat \nu = \mathop {\min }\limits_{i = 1,...,N} {\hat \nu _i}$

由于 ${\hat \nu _i}$ 会随着 $\omega$ 的变化而进行改变，因此我们定义几何间隔来更好地表示样本点被分类的正确性与确信度：

${\nu _i} = \frac{{{{\hat \nu }_i}}}{{\left\| \omega \right\|}}$

同样的可以定义训练集中，所有样本点几何间隔最小值：

$\nu = \mathop {\min }\limits_{i = 1,...,N} {\nu _i}$

支持向量机的任务就是寻找一个超平面能够正确划分数据集并且几何间隔最大，也就是最小间隔最大化；上述问题可以描述为：

$\begin{array}{l} \mathop {\max }\limits_{\omega ,b} \nu \\ s.t.{\rm{ }}{y_i}(\frac{\omega }{{\left\| \omega \right\|}}{x_i} + \frac{b}{{\left\| \omega \right\|}}) \ge \nu ,{\rm{ }}i = 1,2,...,N \end{array}$

将其改写为函数间隔形式：

$\begin{array}{l} \mathop {\max }\limits_{\omega ,b} \frac{{\hat \nu }}{{\left\| \omega \right\|}}\\ s.t.{\rm{ }}{y_i}(\omega {x_i} + b) \ge \hat \nu ,{\rm{ }}i = 1,2,...,N \end{array}$

由于几何间隔只与超平面方向有关，与其大小无关，因此可以通过变化大小，将固定为1，因此上述可以转化为：

$\begin{array}{l} \mathop {\max }\limits_{\omega ,b} \frac{1}{{\left\| \omega \right\|}}\\ s.t.{\rm{ }}{y_i}(\omega {x_i} + b) \ge 1,{\rm{ }}i = 1,2,...,N \end{array}$

进而转化为以下等价形式：

$\begin{array}{l} \mathop {\max }\limits_{\omega ,b} \frac{1}{2}{\left\| \omega \right\|^2}\\ s.t.{\rm{ }}{y_i}(\omega {x_i} + b) \ge 1,{\rm{ }}i = 1,2,...,N \end{array}$

1.2、对偶算法

对于以上问题，主要通过利用拉格朗日对偶性，通过求解对偶问题来求得原问题的解；

先进行拉格朗日函数的构建：

$L(\omega ,b,\alpha ) = \frac{1}{2}{\left\| \omega \right\|^2} - \sum\limits_{i = 1}^N {{\alpha _i}{y_i}(\omega {x_i} + b) + \sum\limits_{i = 1}^N {{\alpha _i}} }$

原始问题为：

$\begin{array}{l} \mathop {\max }\limits_{\omega ,b} \frac{1}{2}{\left\| \omega \right\|^2}\\ s.t.{\rm{ }}{y_i}(\omega {x_i} + b) \ge 1,{\rm{ }}i = 1,2,...,N \end{array}$

该问题等价于以下问题：

$\mathop {\min }\limits_{\omega ,b} \mathop {\max }\limits_{\alpha \ge 0} L(\omega ,b,\alpha )$

根据拉格朗日对偶性，原问题的对偶问题为：

$\mathop {\max }\limits_{\alpha \ge 0} \mathop {\min }\limits_{\omega ,b} L(\omega ,b,\alpha )$

通过对求导数，并令其为0：

${\nabla _{\omega ,b}}L(\omega ,b,\alpha ) = 0$

求解该对偶问题，得到以下与之等价的最优化问题：

$\begin{array}{l} \mathop {\min }\limits_\alpha \frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _i}{\alpha _j}{y_i}{y_j}({x_i}{x_j})} } - \sum\limits_{i = 1}^N {{\alpha _i}} \\ s.t.{\rm{ }}\sum\limits_{i = 1}^N {{\alpha _i}{y_i} = 0} \end{array}$

对偶问题最优解与原始问题最优解存在着一定联系，该联系表述为：

满足一定条件，原始问题最优解与对偶问题最优解满足KKT条件；

设 ${\alpha ^*}$ 是对偶问题最优解，存在下标使得，原始问题最优解为：

$\begin{array}{l} {\omega ^*} = \sum\limits_{i = 1}^N {\alpha _i^*{y_i}{x_i}} \\ {b^*} = {y_j} - \sum\limits_{i = 1}^N {\alpha _i^*{y_i}({x_i}{x_j})} \end{array}$

最后，运用得到的最优超平面 $({\omega ^*},{b^*})$ 通过 $f(x) = sign({\omega ^*}x + {b^*})$ 对样本点进行分类。

二．线性支持向量机

给定近似线性可分的训练数据集，这意味着不存在一个超平面能够将两类数据完美分开，为了解决这个问题，通过引入松弛变量，将原先约束条件变得宽松：

${y_i}(\omega {x_i} + b) \ge 1 - {\xi _i}$

对于原先问题转化为如下问题：

$\begin{array}{l} \mathop {\max }\limits_{\omega ,b} \frac{1}{2}{\left\| \omega \right\|^2} + C\sum\limits_{i = 1}^N {{\xi _i}} \\ s.t.{\rm{ }}{y_i}(\omega {x_i} + b) \ge 1 - {\xi _i},{\rm{ }}i = 1,2,...,N\\ {\rm{ }}{\xi _i} \ge 0,{\rm{ }}i = 1,2,...,N \end{array}$

同理，利用线性可分支持向量机中对偶问题转化，该问题对偶问题为：

同理，存在下标使得 $0 < \alpha _j^* < C$ ，计算原始问题最优解：

$\begin{array}{l} {\omega ^*} = \sum\limits_{i = 1}^N {\alpha _i^*{y_i}{x_i}} \\ {b^*} = {y_j} - \sum\limits_{i = 1}^N {\alpha _i^*{y_i}({x_i}{x_j})} \end{array}$

三、非线性可分支持向量机

给定一线性不可分数据集，我们可以利用函数映射技巧，将原始数据点映射到更高维的特征空间中，这样在更高维空间中，数据集就是线性可分或者近似线性可分的，就可以利用之前得到的结果进行计算。

3.1、核函数技巧

设 $\aleph$ 是输入特征空间，为另外一个特征空间，如果存在一个从 $\aleph$ 到的一个映射 $\phi (x)$ ： $\aleph \to {\rm H}$ ， $K(x,z) = \phi (x) \bullet \phi (z)$ ，我们称为核函数。

借助核函数技巧，可以不用给出具体的映射 $\phi (x)$ ，只需计算即可；

3.2、核函数技巧在支持向量机中应用

利用核函数技巧将原先的问题中所有涉及内积 $({x_i}{x_j})$ 替换为 $K({x_i},{x_j})$ ，转换为以下问题：

$\begin{array}{l} \mathop {\min }\limits_\alpha \frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _i}{\alpha _j}{y_i}{y_j}K({x_i},{x_j})} } - \sum\limits_{i = 1}^N {{\alpha _i}} \\ s.t.{\rm{ }}\sum\limits_{i = 1}^N {{\alpha _i}{y_i} = 0} \end{array}$

原先的决策函数式改写为 $f(x) = sign(\sum\limits_{i = 1}^N {\alpha _i^*{y_i}K({x_i},{x_j})} + {b^*})$

SMO算法

通过先前讨论我们清楚，凸优化问题可以转化为其对偶形式问题的最优化：

该问题是一个凸二次规划问题，SMO算法是一种启发式算法，基本思路是如果所有变量满足KKT条件，那么该问题的最优解也就得到了；选择两个变量，固定其他变量，更新这两个变量的值进行优化，直到没有变量违反条件为止。

4.1、变量选择

我们通过以下方式进行样本点 $({x_i},{y_i})$ 是否满足KKT条件的检验：

$\begin{array}{l} {\alpha _i} = 0 \Leftrightarrow {y_i}g({x_i}) \ge 1\\ 0 < {\alpha _i} < C \Leftrightarrow {y_i}g({x_i}) = 1\\ {\alpha _i} = C \Leftrightarrow {y_i}g({x_i}) \le 1 \end{array}$

其中 $g(x) = \sum\limits_{i = 1}^N {\alpha _i^{}{y_i}K({x_i},x)} + {b^{}}$

外层循环遍历数据集寻找不满足KKT条件的数据点，作为第一个变量的选择；

为了加速运算，我们希望更新幅度越大越好，因此我们通过寻找 $\left| {{E_1} - {E_2}} \right|$ 最大的作为第二个变量的选择。

4.2、变量更新

现在已经选择两个变量 ${\alpha _1},{\alpha _2}$ ，固定其余变量，原问题可以转化为关于 ${\alpha _1},{\alpha _2}$ 的最优化问题，考虑到约束条件 ${\alpha _1}{y_1} + {\alpha _2}{y_2} = - \sum\limits_{i = 3}^N {{y_i}{\alpha _i}}$ ，因此 ${\alpha _1}$ 与 ${\alpha _2}$ 是在一条直线上的，将 ${\alpha _1}$ 转化为 ${\alpha _2}$ 的变量进行运算；

$\alpha _2^{new}$ 需要满足一定的条件：

$L \le \alpha _2^{new} \le H$

其中和分别为对角线两端的端点的解；

若 ${y_1} \ne {y_2}$ ， $L = \max (0,\alpha _2^{old} - \alpha _1^{olld})$ ， $H = \min (C,C + \alpha _2^{old} - \alpha _1^{old})$

若 ${y_1} = {y_2}$ ， $L = \max (0,\alpha _2^{old} + \alpha _1^{olld} - C)$ ， $H = \min (C,\alpha _2^{old} + \alpha _1^{old})$

记 ${E_i}$ 为对 ${x_i}$ 的预测值与真实输出 ${y_i}$ 之差；

${E_i} = g({x_i}) - {y_i},{\rm{ }}i = 1,2$

为经过裁剪的 $\alpha _2^{unc} = \alpha _2^{old} + \frac{{{y_2}({E_1} - {E_2})}}{\eta }$ ，

其中 $\eta = K({x_1},{x_1}) + K({x_2},{x_2}) - 2K({x_1},{x_2}) = {\left\| {\phi ({x_1}) - \phi ({x_2})} \right\|^2}$

经过裁剪得到解为：

$\alpha _2^{new} = \left\{ {\begin{array}{*{20}{c}} {H,{\rm{ }}\alpha _2^{unc} > H}\\ {\alpha _2^{unc},{\rm{ }}L \le \alpha _2^{unc} \le H}\\ {L,{\rm{ }}\alpha _2^{unc} < L} \end{array}} \right.$

计算的到 $\alpha _1^{new} = \alpha _1^{old} + {y_1}{y_2}(\alpha _2^{old} - \alpha _2^{new})$

4.3、SMO算法概述

（1）取初始值 ${\alpha ^{(0)}} = 0$ ；

（2）选取优化变量 $\alpha _1^{(k)},\alpha _2^{(k)}$ ，进行更新为 $\alpha _1^{(k + 1)},\alpha _2^{(k + 1)}$ ；

（3）在精度范围内，如果每个都满足KKT条件，则停机；

（4）否则转（2）

（5） $\alpha = {\alpha ^{(k + 1)}}$

实验步骤

一、算法设计

网上下载MNIST的手写数字数据集，并将其解析为CSV格式文件，其中每一行为一个样本，第一列为标签值，剩余列为特征值；
划分训练集以及测试集，训练集有60000张图片，测试集有20000张图片；
在训练集中，对于第类样本，将其标签值设为1，将其余别的类别样本设为-1，利用SMO算法进行训练，训练得到该类的SVM模型，模型参数包含： $MODEL(i).\ker nelFunction$ ：所使用的核函数形式、： $\alpha$ 的值、：的值、 $MODEL(i).\omega$ ： $\omega$ 的值；
对于每一个样本 ${x_j}$ ，利用 $svm\Pr ediction(MODEL,x)$ 函数，输出样本 ${x_j}$ 在上得分，得分最高的类别为 ${x_j}$ 样本被分到的类别，即 $kind({x_j}) = \mathop {\arg }\limits_{} \mathop {\max }\limits_{i = 1,2,...} \{ svm\Pr ediction(MODEL(i),{x_j})\}$ ；
分别输出训练集正确率与测试集正确率；
人为调整参数使得和取得好的效果；

二、程序结构：

2.1、解析文件：

由于从网上下载下来的文件格式为idx3-ubyte、idx1-ubyte格式，因此先要进行对这两个文件进行解析，得到csv格式文件，为训练集与测试集，分别为mnist_train.csv、mnist_test.csv，其中每一行表示一个样本的特征与标签，第一列是标签，剩余列为特征；此处代码为PYTHON代码；

1.#将IDX数据转化为CSV数据
2.#每一行为一张图片， 第一列为标签值， 往后为图片信息
3.def convert(imgf, labelf, outf, n):
4.    f = open(imgf, "rb")
5.    o = open(outf, "w")
6.    l = open(labelf, "rb")
7.    f.read(16)
8.    l.read(8)
9.    images = []
10.    for i in range(n):
11.        image = [ord(l.read(1))]
12.        for j in range(28 * 28):
13.            image.append(ord(f.read(1)))
14.        images.append(image)
15.    for image in images:
16.        o.write(",".join(str(pix) for pix in image) + "\n")
17.    f.close()
18.    o.close()
19.    l.close()
20.
21.
22.convert("C:/Users/Administrator/Desktop/模式识别实验/MINIST/train-images.idx3-ubyte", "C:/Users/Administrator/Desktop/模式识别实验/MINIST/train-labels.idx1-ubyte",
23.        "C:/Users/Administrator/Desktop/模式识别实验/MINIST/mnist_train.csv", 60000)
24.convert("C:/Users/Administrator/Desktop/模式识别实验/MINIST/t10k-images.idx3-ubyte", "C:/Users/Administrator/Desktop/模式识别实验/MINIST/t10k-labels.idx1-ubyte",
25.        "C:/Users/Administrator/Desktop/模式识别实验/MINIST/mnist_test.csv", 10000)
26.
27.print("Convert Finished!")

2.2、SMO算法实现

按照SMO算法进行代码编写，

输入：训练集样本特征集X、训练集样本标签集Y、惩罚系数C、采用的核函数形式kernelFunction、最大精度范围tol、最大迭代次数max_passes；

输出：训练好的模型MODEL；此处代码为MATLAB代码；

1.function [model] = smo_quick2(X, Y, C, kernelFunction, tol, max_passes)
2.%smo_quick:加速版smo算法
3.%X:样本特征集，每一行代表一个样本
4.%Y：二分类标签集，正类为1，负类为0
5.%C：惩罚系数
6.%kernelFunction：所选核函数
7.%tol：判断相等的最大容忍值
8.%max_passes：没有alphas改变的最大迭代数
9.
10.%缺省处理方式
11.if ~exist('tol', 'var') || isempty(tol)
12.    tol = 1e-3;
13.end
14.if ~exist('max_passes', 'var') || isempty(max_passes)
15.    max_passes = 5;
16.end
17.
18.% 一些关于数据集的参数
19.m = size(X, 1);
20.n = size(X, 2);
21.
22.
23.Y(Y==0) = -1;
24.
25.% smo算法需要用的变量
26.alphas = zeros(m, 1);
27.b = 0;
28.E = zeros(m, 1);
29.passes = 0;
30.eta = 0;
31.L = 0;
32.H = 0;
33.
34.%根据所选核函数，计算Kernel矩阵
35.fprintf('******Begin to calculate Kernel mat******\n');
36.if strcmp(func2str(kernelFunction), 'linearKernel')
37.    %线性核
38.    K = X*X';
39.elseif strfind(func2str(kernelFunction), 'gaussianKernel')
40.   %RBF核
41.    X2 = sum(X.^2, 2);
42.    K = bsxfun(@plus, X2, bsxfun(@plus, X2', - 2 * (X * X')));
43.    K = kernelFunction(1, 0) .^ K;
44.else
45.    %高斯核
46.    K = zeros(m);
47.    for i = 1:m
48.        for j = i:m
49.             K(i,j) = kernelFunction(X(i,:)', X(j,:)');
50.             K(j,i) = K(i,j); %the matrix is symmetric
51.        end
52.    end
53.end
54.fprintf('******End of Kernel mat******\n');
55.% Train
56.fprintf('******Training******\n');
57.while passes < max_passes
58.    fprintf('******running now******\n');
59.    num_changed_alphas = 0;
60.    for i = 1:m
61.        E(i) = b + sum (alphas.*Y.*K(:,i)) - Y(i);
62.        %选择不满足KKT条件的alpha
63.        if ((Y(i)*E(i) < -tol && alphas(i) < C) || (Y(i)*E(i) > tol && alphas(i) > 0))
64.            %选择Ei-Ej绝对值最大的j
65.            non_zero_index = find(E ~= 0);
66.            num_E_nozero = length(non_zero_index);
67.            j = -1; max_E = 0;
68.            if num_E_nozero > 1
69.                for k = (non_zero_index)'
70.                    if k == i
71.                        continue;
72.                    end
73.                    Ek = b + sum (alphas.*Y.*K(:,k)) - Y(k);
74.                    deltaE = abs(Ek-E(i));
75.                    if deltaE >= max_E
76.                        max_E = deltaE;
77.                        j = k;
78.                    end
79.                end
80.            else
81.                j = ceil(m * rand());
82.                while j == i  
83.                    j = ceil(m * rand());
84.                end
85.            end                       
86.            E(j) = b + sum (alphas.*Y.*K(:,j)) - Y(j);            
87.            % Save old alphas
88.            alpha_i_old = alphas(i);
89.            alpha_j_old = alphas(j);            
90.            % Compute L and H by (10) or (11). 
91.            if (Y(i) == Y(j))
92.                L = max(0, alphas(j) + alphas(i) - C);
93.                H = min(C, alphas(j) + alphas(i));
94.            else
95.                L = max(0, alphas(j) - alphas(i));
96.                H = min(C, C + alphas(j) - alphas(i));
97.            end         
98.            if (L == H)
99.                % continue to next i. 
100.                %fprintf('******L=H******\n');
101.                continue;
102.            end
103.            % Compute eta by (14).
104.            eta = 2 * K(i,j) - K(i,i) - K(j,j);
105.            if (eta >= 0)
106.                % continue to next i. 
107.                fprintf('******eta>=0******\n');
108.                continue;
109.            end            
110.            % Compute and clip new value for alpha j using (12) and (15).
111.            alphas(j) = alphas(j) - (Y(j) * (E(i) - E(j))) / eta;
112.            fprintf('******New the alphas******\n');
113.            % Clip
114.            alphas(j) = min (H, alphas(j));
115.            alphas(j) = max (L, alphas(j));  
116.            E(j) = b + sum (alphas.*Y.*K(:,j)) - Y(j);
117.            % Check if change in alpha is significant
118.            if (abs(alphas(j) - alpha_j_old) < tol)
119.                fprintf('******old_alphaj=new_alphaj******\n');
120.                alphas(j) = alpha_j_old;
121.                continue;
122.            end
123.            % Determine value for alpha i using (16). 
124.            alphas(i) = alphas(i) + Y(i)*Y(j)*(alpha_j_old - alphas(j));
125.            E(i) = b + sum (alphas.*Y.*K(:,i)) - Y(i);
126.            % Compute b1 and b2 using (17) and (18) respectively. 
127.            b1 = b - E(i) ...
128.                 - Y(i) * (alphas(i) - alpha_i_old) *  K(i,j)' ...
129.                 - Y(j) * (alphas(j) - alpha_j_old) *  K(i,j)';
130.            b2 = b - E(j) ...
131.                 - Y(i) * (alphas(i) - alpha_i_old) *  K(i,j)' ...
132.                 - Y(j) * (alphas(j) - alpha_j_old) *  K(j,j)';
133.            if (0 < alphas(i) && alphas(i) < C)
134.                b = b1;
135.            elseif (0 < alphas(j) && alphas(j) < C)
136.                b = b2;
137.            else
138.                b = (b1+b2)/2;
139.            end
140.            num_changed_alphas = num_changed_alphas + 1;
141.        end        
142.    end    
143.    if (num_changed_alphas == 0)
144.        passes = passes + 1;
145.    else
146.        passes = 0;
147.    end
148.end
149.fprintf(' Done! \n\n');
150.% Save the model
151.idx = alphas > 0;
152.model.X= X(idx,:);
153.model.y= Y(idx);
154.model.kernelFunction = kernelFunction;
155.model.b= b;
156.model.alphas= alphas(idx);
157.model.w = ((alphas.*Y)'*X)';
158.End

2.3、预测样本集在模型上的得分

输入：训练得到的模型MODEL、待预测的样本集X；

输出：样本集在该MODEL上的得分p；

1.function p = svmPredict(model, X)
2.%SVMPREDICT returns a vector of predictions using a trained SVM model
3.%(svmTrain). 
4.%   pred = SVMPREDICT(model, X) returns a vector of predictions using a 
5.%   trained SVM model (svmTrain). X is a mxn matrix where there each 
6.%   example is a row. model is a svm model returned from svmTrain.
7.%   predictions pred is a m x 1 column of predictions of {0, 1} values.
8.%
9.
10.% Check if we are getting a column vector, if so, then assume that we only
11.% need to do prediction for a single example
12.if (size(X, 2) == 1)
13.    % Examples should be in rows
14.    X = X';
15.end
16.
17.% Dataset 
18.m = size(X, 1);
19.p = zeros(m, 1);
20.pred = zeros(m, 1);
21.
22.if strcmp(func2str(model.kernelFunction), 'linearKernel')
23.    % We can use the weights and bias directly if working with the 
24.    % linear kernel
25.    p = X * model.w + model.b;
26.elseif strfind(func2str(model.kernelFunction), 'gaussianKernel')
27.    % Vectorized RBF Kernel
28.    % This is equivalent to computing the kernel on every pair of examples
29.    X1 = sum(X.^2, 2);
30.    X2 = sum(model.X.^2, 2)';
31.    K = bsxfun(@plus, X1, bsxfun(@plus, X2, - 2 * X * model.X'));
32.    K = model.kernelFunction(1, 0) .^ K;
33.    K = bsxfun(@times, model.y', K);
34.    K = bsxfun(@times, model.alphas', K);
35.    p = sum(K, 2);
36.else
37.    % Other Non-linear kernel
38.    for i = 1:m
39.        prediction = 0;
40.        for j = 1:size(model.X, 1)
41.            prediction = prediction + ...
42.                model.alphas(j) * model.y(j) * ...
43.                model.kernelFunction(X(i,:)', model.X(j,:)');
44.        end
45.        p(i) = prediction + model.b;
46.    end
47.end

2.4、定义高斯核函数

高斯核函数表达式：

输入：向量

输出：

1.function sim = gaussianKernel(x1, x2, sigma)
2.%RBFKERNEL returns a radial basis function kernel between x1 and x2
3.%   sim = gaussianKernel(x1, x2) returns a gaussian kernel between x1 and x2
4.%   and returns the value in sim
5.
6.% Ensure that x1 and x2 are column vectors
7.x1 = x1(:); x2 = x2(:);
8.
9.% You need to return the following variables correctly.
10.sim = 0;
11.
12.% ====================== YOUR CODE HERE ======================
13.% Instructions: Fill in this function to return the similarity between x1
14.%               and x2 computed using a Gaussian kernel with bandwidth
15.%               sigma
16.%
17.%
18.
19.sim=(x1-x2)'*(x1-x2);
20.sim=exp(-sim/(2*sigma^2));
21.% =============================================================
22.    
23.end

2.5、随机采样函数

对数据集进行随机采样，每次生成随机随机数，采取该随机数对应的下标的样本收入集合中；

输入：数据集X，采样容量num；

输出：随机采样形成的集合sample；

1.function sample = sampling(S, num)
2.%sampling：在S中随机选择num个样本
3.fprintf('******Begin to sampling******\n');
4.m = size(S, 1);
5.sample = [];
6.for i = 1:num
7.    x = ceil(rand()*m+1);
8.    sample = [sample; S(x, :)];
9.end
10.fprintf('******End of sampling******\n');
11.end

实验分析

由于图片数据量过大，且随着训练集规模增大，SMO算法训练时间成几何级数增长，（本人亲自测试：100个训练样本需要12.804秒，200个训练样本需要18.629秒，500个训练样本需要63.768秒，700个训练样本需要114.106秒，1000个训练样本需要248.256秒，1500个训练样本需要），绘制成以下曲线，可以看出训练时间随着训练样本大致呈现指数分布，因此用SMO算法跑60000张图片是不现实的；

考虑到，SVM最终超平面其实是由支持向量进行决定的，因此我采取对训练集进行随机采样的方式，从60000随机抽取6000张图片进行训练，这样有效降低了训练规模大小，且最终训练结果也相当可靠，因为6000张将会有很大概率包含多个支持向量；

2.SVM主要核心为，SMO算法，该算法包含以下超参数：核函数类型（线性核函数，RBF核函数，高斯核函数，其中高斯核函数）、高斯核函数方差、惩罚系数C 、最大精度tol 、最大迭代次数 max_passes；我们通过调整上述参数使得SMO算法在训练集正确率与测试集正确率上取得好的效果；通过本人一遍遍探索，最终确定：核函数选取高斯核函数，高斯核函数方差=900 ，惩罚系数 C=1，最大精度tol=0.001 ，最大迭代次数max_passes=5 时在训练集与测试集均能取得良好效果：训练集正确率为98.65%，测试集正确率为93.00%；因为该方法每次使用的训练集均为随机采样的，选取优化变量具有一定随机性，因此每次结果都会有一定波动，但是总体而言还是比较稳定的，基本稳定在90%左右；

3.其中对于高斯核函数方差，该值的取值与样本在特征空间分布有一定关系，一开始我是将方差=0.01 ，但是其测试集准确率始终在10%左右，查看相关变量发现，每个样本在不同分类模型中得分都相等，这可能是因为取值过小导致了值太大导致溢出，因此我将方差值增大，随着方差值增大，测试集准确率也随之上升，方差取到900以上测试集正确率达到90%以上；为了探究取值到底与什么因素相关，我用IRIS数据集测试，发现方差=1是最佳的，通过分析样本在特征空间中的取值大小，MNIST数据集特征的值分布大致为200左右，IRIS特征的值分布大致为0.1左右，因此可以断言将会与数据集特征的值的分布相关，当样本在特征空间取值越大时，方差的取值也应当越大，数量级应当是相等的；

完整代码

test.m（训练与测试代码）

1.clc, clear
2.%导入训练集测试集
3.%每一行代表一个样本，第一列是标签值，剩余列是图片数据
4.train_filename = 'mnist_train.csv';
5.test_filename = 'mnist_test.csv';
6.train_set = csvread(train_filename);
7.test_set = csvread(test_filename);
8.
9.%train_set = train_set(1:6000, :);
10.N = 1500; %样本大小
11.train_set = sampling(train_set, N);
12.%将训练集分为标签与特征
13.y_train = train_set(:, 1);
14.x_train = train_set(:, 2:end);
15.
16.%训练集大小
17.m = size(x_train, 1);
18.n = size(x_train, 2);
19.
20.x_set = x_train;
21.y_set = zeros(m ,1);
22.C = 1;
23.tol = 1e-3;
24.sigmod = 1000;
25.max_itera = 10;
26.model_sum = [];
27.fprintf('******Begin to train******\n\n');
28.for i = 1:10
29.    fprintf('the %d kind train\n', i);
30.    for j = 1:m
31.        if y_train(j, 1) == i-1
32.            y_set(j, 1) = 1;
33.        else
34.            y_set(j, 1) = 0;
35.        end
36.    end
37.    %[w(:, i), b(:, i)] = smo_std(x_set, y_set, C, @gussian, tol, max_itera);    
38.    model = smo_quick2(x_set, y_set, C, @(x1, x2)gussianKernel(x1, x2, sigmod));
39.    %model = smo_quick2(x_set, y_set, C, @linearKernel);
40.    model_sum = [model_sum; model];
41.end
42.fprintf('******Finished training******\n');
43.
44.true = 0;
45.label_train = [];
46.score_sum = [];
47.for i = 1:10
48.    score = svmPredict(model_sum(i), x_set);
49.    score_sum = [score_sum, score];
50.end
51.[max_s, index] = max(score_sum, [], 2);
52.index = index-1;
53.for i = 1:m
54.    if index(i) == y_train(i)
55.        true = true+1;
56.    end
57.end
58.train_true_rate = true/m*100
59.
60.
61.%测试集上
62.%test_set = test_set(1:300, :);
63.test_set = sampling(test_set, ceil(N/10));
64.test_label = test_set(:, 1);
65.test_feature = test_set(:, 2:end);
66.label_test = [];
67.true = 0;
68.score_sum = [];
69.for i = 1:10
70.    score = svmPredict(model_sum(i), test_feature);
71.    score_sum = [score_sum, score];
72.end
73.[max_s, index] = max(score_sum, [], 2);
74.index = index-1;
75.for i = 1:size(test_feature, 1)
76.    if index(i) == test_label(i)
77.        true = true+1;
78.    end
79.end
80.test_true_rate = true/size(test_feature, 1)*100

smo_quick2.m（SMO算法实现）

159.function [model] = smo_quick2(X, Y, C, kernelFunction, tol, max_passes)
160.%smo_quick:加速版smo算法
161.%X:样本特征集，每一行代表一个样本
162.%Y：二分类标签集，正类为1，负类为0
163.%C：惩罚系数
164.%kernelFunction：所选核函数
165.%tol：判断相等的最大容忍值
166.%max_passes：没有alphas改变的最大迭代数
167.
168.%缺省处理方式
169.if ~exist('tol', 'var') || isempty(tol)
170.    tol = 1e-3;
171.end
172.if ~exist('max_passes', 'var') || isempty(max_passes)
173.    max_passes = 5;
174.end
175.
176.% 一些关于数据集的参数
177.m = size(X, 1);
178.n = size(X, 2);
179.
180.
181.Y(Y==0) = -1;
182.
183.% smo算法需要用的变量
184.alphas = zeros(m, 1);
185.b = 0;
186.E = zeros(m, 1);
187.passes = 0;
188.eta = 0;
189.L = 0;
190.H = 0;
191.
192.%根据所选核函数，计算Kernel矩阵
193.fprintf('******Begin to calculate Kernel mat******\n');
194.if strcmp(func2str(kernelFunction), 'linearKernel')
195.    %线性核
196.    K = X*X';
197.elseif strfind(func2str(kernelFunction), 'gaussianKernel')
198.   %RBF核
199.    X2 = sum(X.^2, 2);
200.    K = bsxfun(@plus, X2, bsxfun(@plus, X2', - 2 * (X * X')));
201.    K = kernelFunction(1, 0) .^ K;
202.else
203.    %高斯核
204.    K = zeros(m);
205.    for i = 1:m
206.        for j = i:m
207.             K(i,j) = kernelFunction(X(i,:)', X(j,:)');
208.             K(j,i) = K(i,j); %the matrix is symmetric
209.        end
210.    end
211.end
212.fprintf('******End of Kernel mat******\n');
213.% Train
214.fprintf('******Training******\n');
215.while passes < max_passes
216.    fprintf('******running now******\n');
217.    num_changed_alphas = 0;
218.    for i = 1:m
219.        E(i) = b + sum (alphas.*Y.*K(:,i)) - Y(i);
220.        %选择不满足KKT条件的alpha
221.        if ((Y(i)*E(i) < -tol && alphas(i) < C) || (Y(i)*E(i) > tol && alphas(i) > 0))
222.            %选择Ei-Ej绝对值最大的j
223.            non_zero_index = find(E ~= 0);
224.            num_E_nozero = length(non_zero_index);
225.            j = -1; max_E = 0;
226.            if num_E_nozero > 1
227.                for k = (non_zero_index)'
228.                    if k == i
229.                        continue;
230.                    end
231.                    Ek = b + sum (alphas.*Y.*K(:,k)) - Y(k);
232.                    deltaE = abs(Ek-E(i));
233.                    if deltaE >= max_E
234.                        max_E = deltaE;
235.                        j = k;
236.                    end
237.                end
238.            else
239.                j = ceil(m * rand());
240.                while j == i  
241.                    j = ceil(m * rand());
242.                end
243.            end                       
244.            E(j) = b + sum (alphas.*Y.*K(:,j)) - Y(j);            
245.            % Save old alphas
246.            alpha_i_old = alphas(i);
247.            alpha_j_old = alphas(j);            
248.            % Compute L and H by (10) or (11). 
249.            if (Y(i) == Y(j))
250.                L = max(0, alphas(j) + alphas(i) - C);
251.                H = min(C, alphas(j) + alphas(i));
252.            else
253.                L = max(0, alphas(j) - alphas(i));
254.                H = min(C, C + alphas(j) - alphas(i));
255.            end         
256.            if (L == H)
257.                % continue to next i. 
258.                %fprintf('******L=H******\n');
259.                continue;
260.            end
261.            % Compute eta by (14).
262.            eta = 2 * K(i,j) - K(i,i) - K(j,j);
263.            if (eta >= 0)
264.                % continue to next i. 
265.                fprintf('******eta>=0******\n');
266.                continue;
267.            end            
268.            % Compute and clip new value for alpha j using (12) and (15).
269.            alphas(j) = alphas(j) - (Y(j) * (E(i) - E(j))) / eta;
270.            fprintf('******New the alphas******\n');
271.            % Clip
272.            alphas(j) = min (H, alphas(j));
273.            alphas(j) = max (L, alphas(j));  
274.            E(j) = b + sum (alphas.*Y.*K(:,j)) - Y(j);
275.            % Check if change in alpha is significant
276.            if (abs(alphas(j) - alpha_j_old) < tol)
277.                fprintf('******old_alphaj=new_alphaj******\n');
278.                alphas(j) = alpha_j_old;
279.                continue;
280.            end
281.            % Determine value for alpha i using (16). 
282.            alphas(i) = alphas(i) + Y(i)*Y(j)*(alpha_j_old - alphas(j));
283.            E(i) = b + sum (alphas.*Y.*K(:,i)) - Y(i);
284.            % Compute b1 and b2 using (17) and (18) respectively. 
285.            b1 = b - E(i) ...
286.                 - Y(i) * (alphas(i) - alpha_i_old) *  K(i,j)' ...
287.                 - Y(j) * (alphas(j) - alpha_j_old) *  K(i,j)';
288.            b2 = b - E(j) ...
289.                 - Y(i) * (alphas(i) - alpha_i_old) *  K(i,j)' ...
290.                 - Y(j) * (alphas(j) - alpha_j_old) *  K(j,j)';
291.            if (0 < alphas(i) && alphas(i) < C)
292.                b = b1;
293.            elseif (0 < alphas(j) && alphas(j) < C)
294.                b = b2;
295.            else
296.                b = (b1+b2)/2;
297.            end
298.            num_changed_alphas = num_changed_alphas + 1;
299.        end        
300.    end    
301.    if (num_changed_alphas == 0)
302.        passes = passes + 1;
303.    else
304.        passes = 0;
305.    end
306.end
307.fprintf(' Done! \n\n');
308.% Save the model
309.idx = alphas > 0;
310.model.X= X(idx,:);
311.model.y= Y(idx);
312.model.kernelFunction = kernelFunction;
313.model.b= b;
314.model.alphas= alphas(idx);
315.model.w = ((alphas.*Y)'*X)';
316.End

svmPredict.m（输出预测值的函数）

48.function p = svmPredict(model, X)
49.%SVMPREDICT returns a vector of predictions using a trained SVM model
50.%(svmTrain). 
51.%   pred = SVMPREDICT(model, X) returns a vector of predictions using a 
52.%   trained SVM model (svmTrain). X is a mxn matrix where there each 
53.%   example is a row. model is a svm model returned from svmTrain.
54.%   predictions pred is a m x 1 column of predictions of {0, 1} values.
55.%
56.
57.% Check if we are getting a column vector, if so, then assume that we only
58.% need to do prediction for a single example
59.if (size(X, 2) == 1)
60.    % Examples should be in rows
61.    X = X';
62.end
63.
64.% Dataset 
65.m = size(X, 1);
66.p = zeros(m, 1);
67.pred = zeros(m, 1);
68.
69.if strcmp(func2str(model.kernelFunction), 'linearKernel')
70.    % We can use the weights and bias directly if working with the 
71.    % linear kernel
72.    p = X * model.w + model.b;
73.elseif strfind(func2str(model.kernelFunction), 'gaussianKernel')
74.    % Vectorized RBF Kernel
75.    % This is equivalent to computing the kernel on every pair of examples
76.    X1 = sum(X.^2, 2);
77.    X2 = sum(model.X.^2, 2)';
78.    K = bsxfun(@plus, X1, bsxfun(@plus, X2, - 2 * X * model.X'));
79.    K = model.kernelFunction(1, 0) .^ K;
80.    K = bsxfun(@times, model.y', K);
81.    K = bsxfun(@times, model.alphas', K);
82.    p = sum(K, 2);
83.else
84.    % Other Non-linear kernel
85.    for i = 1:m
86.        prediction = 0;
87.        for j = 1:size(model.X, 1)
88.            prediction = prediction + ...
89.                model.alphas(j) * model.y(j) * ...
90.                model.kernelFunction(X(i,:)', model.X(j,:)');
91.        end
92.        p(i) = prediction + model.b;
93.    end
94.end
95.
96.% Convert predictions into 0 / 1
97.pred(p >= 0) =  1;
98.pred(p <  0) =  0;
99.
100.end

gussianFunction.m（高斯核函数）

24.function sim = gaussianKernel(x1, x2, sigma)
25.%RBFKERNEL returns a radial basis function kernel between x1 and x2
26.%   sim = gaussianKernel(x1, x2) returns a gaussian kernel between x1 and x2
27.%   and returns the value in sim
28.
29.% Ensure that x1 and x2 are column vectors
30.x1 = x1(:); x2 = x2(:);
31.
32.% You need to return the following variables correctly.
33.sim = 0;
34.
35.% ====================== YOUR CODE HERE ======================
36.% Instructions: Fill in this function to return the similarity between x1
37.%               and x2 computed using a Gaussian kernel with bandwidth
38.%               sigma
39.%
40.%
41.
42.sim=(x1-x2)'*(x1-x2);
43.sim=exp(-sim/(2*sigma^2));
44.% =============================================================
45.    
46.end

sampling.m（随机采样）

12.function sample = sampling(S, num)
13.%sampling：在S中随机选择num个样本
14.fprintf('******Begin to sampling******\n');
15.m = size(S, 1);
16.sample = [];
17.for i = 1:num
18.    x = ceil(rand()*m+1);
19.    sample = [sample; S(x, :)];
20.end
21.fprintf('******End of sampling******\n');
22.end

总结

本文借鉴《统计学习基础》以及《机器学习实战》

通过此次学习，有以下几点收获：

（1）编写代码前先得写伪代码，并根据伪代码进行算法编写，这样能使得编代码时思路清晰明了；

（2）编写代码前得对其总体结构有清楚认识，可以列个大纲之类的，将任务模块化；

（3）函数传入参数尽量要少，将尽可能多的工作放在函数内部去做；

（4）将参数写在一块，方便之后调试；

（5）吸纳别人经验，可以有效拓宽视野，更快找到问题所在；

你可能感兴趣的:(支持向量机,python)

Python 基础（三）：入门必备知识的思考与对之前内容的总结 AI自学kuke-v Python教学 python 开发语言
1思考前两节我们讲了input,print()还有变量与数据类型的用法，但是我发现可学习性还是比较低。无法让大家系统的掌握Python这门语言的入门语法。那么为什么要系统的掌握语法呢？因为系统的掌握语法后，当我们想要用到这一知识点的时候，我们就可以迅速的找到相应的处理方法，从而更加方便与快捷的解决我们遇到的问题，不至于我们到用到的时候再去寻找相关的处理方法，所以我讲的内容要尽可能的高度地相关性、全
【网络安全 | 扫描子域+发现真实IP】CloakQuest3r安装使用详细教程秋说网安渗透工具使用教程(全)web安全子域名扫描渗透工具
原创文章，禁止转载。本文仅作学习交流使用，不得用于非法渗透，笔者不承担任何责任。文章目录简介功能介绍执行流程限制安装步骤可选功能：SecurityTrailsAPI使用示例简介CloakQuest3r是一款强大的Python工具，专为揭示受Cloudflare及类似服务保护的网站真实IP地址而设计。Cloudflare作为广泛应用的Web安全与性能优化服务，其防护机制可隐藏网站的实际IP，而Clo
Python进程知多少我的身前一尺是我的世界 Python python进程 python多进程 python进程共享内存 python服务器进程 python进程通信
目录目标Python版本官方文档概述进程（Process）的基本概念进程之间的通信方法进程同步进程间共享状态实战创建进程的基本语法创建进程并传递复杂的参数进程同步&进程通信共享内存基于服务器进程实现共享基于队列实现进程安全生产者&消费者模型（基于队列）生产者&消费者模型（基于管道）目标掌握进程的基本概念和使用方法，包括：创建进程、进程同步、进程间共享状态、进程通信。Python版本Python3.
python 开启https服务魔兽-SS python python https 开发语言
importjsonfromflaskimportFlask,Response,requestimportosapp=Flask(__name__)#设置SSL证书路径ssl_cert_path=os.path.join(os.path.dirname(__file__),'certs','self.crt')ssl_key_path=os.path.join(os.path.dirname(__
自动化办公|xlwings与pandas交互游客520 自动化 python从入门到出家实用代码 pandas excel python 自动化
1.介绍在数据分析和Excel自动化中，pandas作为Python处理数据的强大库，而xlwings则可以高效操作Excel。将pandas与xlwings结合使用，可以实现从Excel读取数据到DataFrame、将DataFrame写入Excel以及Excel的自动化处理。2.从Excel读取数据到PandasDataFrame2.1读取整个表格importxlwingsasxwimport
使用Semantic Kernel：对DeepSeek添加自定义插件归-途机器学习 oneapi 机器学习
SemanticKernel介绍SemanticKernel是一个SDK，它将OpenAI、AzureOpenAI等大型语言模型与C#、Python和Java等传统编程语言集成在一起。SemanticKernel通过允许您定义插件来实现这一点。为什么需要添加插件？大语言模型虽然具有强大的自然语言理解和生成能力，但它们通常是基于预训练的模型，其功能受限于训练时所接触的数据和任务。为大语言模型添加插件
关于openAI接口的使用(个人学习总结) 暗雾飘扬 python机器学习_实验项目学习人工智能
文章目录背景OpenAIOpenAI的三种使用方法模型python的openai库根据文档自定义request函数http请求构成接口的响应构成自定义请求和接收函数背景在使用OpenAIAPI接口时遇到了许多问题，在此总结个人的问题（不代表大众），如要深究请看官方OpenAI-API接口文档（中文版）。OpenAIOpenAI的三种使用方法1、使用OpenAIAPI2、使用第三方库3、自己训练模型
pip指令及其用法大侠升指令大全 pip
pip是Python的包管理工具，用于安装、升级和管理Python包。下面是一些常用的pip指令及其用法：1.安装包安装一个包，默认从PyPI安装：pipinstall例如：pipinstallnumpy2.安装指定版本的包安装指定版本的包：pipinstall==例如：pipinstallnumpy==1.19.33.升级包升级已安装的包到最新版本：pipinstall--upgrade例如：p
Python和curl 如何使用OpenAI 接口访问LLM SmallerFL Python相关 python openai llm gpt
文章目录1.安装所需的库2.设置API密钥（可选）3.编写代码4.curl命令1.安装所需的库首先，你需要确保你的环境中安装了openai库。你可以通过pip来安装它：pipinstallopenai2.设置API密钥（可选）如果访问ChatGPT需要设置密钥，如果访问本地模型不需要设置密钥！对于ChatGPT密钥要从OpenAI的官方网站获取，要按token收费。一旦你有了API密钥，可以通过环
爬虫必备数据存储 ylfhpy 爬虫项目入门爬虫 python 开发语言去重数据持久化
一、引言在当今信息爆炸的时代，网络数据的获取与处理变得至关重要。Python凭借其简洁的语法和丰富的库，成为了爬虫开发的首选语言。当爬虫成功获取数据后，如何高效、可靠地存储这些数据，并避免重复数据的干扰，是需要解决的关键问题。不同类型的数据和应用场景需要不同的存储方式，而数据去重则有助于提高数据质量和存储效率。本文将系统地介绍Python爬虫中常见的数据存储方式和数据去重方法。二、文本数据存储方式
多个python打包成exe_多个py文件生成一个可运行exe文件演绎完美身材多个python打包成exe
一、概述目前有一个python脚本，需要在别的电脑中运行，安装python环境太麻烦，封装成exe文件，运行比较方便。二、演示环境说明python版本：3.7.9操作系统：windows10安装模块pip3installerpyinstaller封装新建目录test，目录结构如下：./├──conf.py└──test.pyconf.py#！/usr/bin/python3#-*-coding:u
Slurm作业调度系统常见操作（使用超算运行深度学习）坐在云朵上的kiwi 工程项目 #deep learning 深度学习服务器
1.传输下载文件sftp远程命令cd,pwd等，本地命令lcd,lpwdget远程地址本地地址put本地地址远程地址上传文件夹1.在远程建立和本地一样名称的文件夹如data/2.put-rdata/2.建立虚拟环境moduleloadpython/3.8#加载modulevirtualenv--no-downloadENV#建立一个叫ENV的虚拟环境激活虚拟环境sourceENV/bin/acti
《ROS2 机器人开发从入门道实践》鱼香ROS2——第5章内容儒雅芝士机器人
目录第5章ROS常用开发工具5.1坐标变换工具介绍5.1.1通过命令行使用TF5.1.2对TF原理的简单探究5.2Python中的手眼坐标变换5.2.1通过Python发布静态TF5.2.2通过Python发布动态TF5.2.3通过Python查询TF关系5.3C++中的地图坐标系变化5.3.1通过C++发布静态TF5.3.2通过C++发布动态TF5.3.3通过C++查询TF关系5.4常用可视化工
pyQT学习笔记-----pushbutton控制Graphics view内对象移动汉东省长达康 pyQT pyQT Graphics view pushbutton控制移动
pyQT学习笔记-----pushbutton控制Graphicsview内对象移动引言项目需要制作一个美观，大气，高逼格的控制界面，出于项目的需要，以及本人对于python语言的掌握程度远高于C，所以果断采用了python+pyQT这个框架，今天本人终于完成了这个控制系统二维操作的动态显示，历时三个周，前前后后试过很多的方法。第一种尝试：从lable显示图片开始，接着使用openCV，用labl
服务器ubuntu常见命令 can903154417 服务器 linux 深度学习 tensorflow
新建/删除文件：mkdirA.txt/rmA.txt新建/删除文件夹:mkdirA/rm-dA移动文件或文件夹A到BmvAB打开并编辑并退出文本：via.txtiEsc保存并退出：shift加:然后！wq或者wq查询目前进行任务：top或者ps-auxtop程序停止运行：ctrl+C!!!保持程序后台运行：nohup和&一起使用，nohuppythontest.py>test.log2>&1&杀死
2024年Python最新PyQt5 小工具：Excel数据分组汇总器 2401_84556783 程序员 python qt excel
importpandasaspd编写UI界面组件布局，UI布局函数init_ui()。init_ui()的函数整体内容都贴在下面这里，大佬们可以根据自己的需要随意发挥。definit_ui(self):标题、图标设置self.setWindowTitle(‘Excel数据汇总工具公众号：[Python集中营]’)self.setWindowIcon(QIcon(‘:/data_sum.ico’))
常见自动化测试工具集合 2401_85613856 自动化测试工具运维
1、Appium------->AppUI自动化测试官网：http://appium.ioAppium是一个移动端自动化测试开源工具，支持iOS和Android平台，支持Python、Java等语言，即同一套Java或Python脚本可以同时运行在iOS和Android平台，Appium是一个C/S架构，核心是一个Web服务器，它提供了一套REST的接口。当收到客户端的连接后，就会监听到命令，然后
【详解】PythonUnicodeDecodeError:‘ascii‘codeccan‘tdecodebyte0xe9inposition0解决办法牛肉胡辣汤 java linux 前端
目录PythonUnicodeDecodeError:'ascii'codeccan'tdecodebyte0xe9inposition0解决办法方法一：使用bytes类型方法二：使用unicode_escape编码方法三：确保使用正确的编码方式方法四：使用six库PythonUnicodeDecodeError:'ascii'codeccan'tdecodebyte0xe9inposition0
【从入门到精通】Python必会的基础知识和基本语法,看这一篇就够了天若有情673
Python是一种高级、解释型、面向对象的编程语言，具有简洁易读的语法特点。以下是Python的一些基本语法：1.注释注释用于解释代码的功能和用途，Python中有单行注释和多行注释。#这是单行注释"""这是多行注释可以写很多内容"""2.变量和数据类型变量变量用于存储数据，在Python中不需要声明变量类型，解释器会根据赋值自动推断。#定义一个整数变量num=10#定义一个字符串变量name="
Python办公自动化案例：批量修改Word文件中的段落格式衍生星球 python word c#
案例：Python实现批量修改Word文件中的段落格式。在处理大量Word文档时，经常需要批量修改这些文档的格式，比如统一段落格式，以提升文档的一致性和专业性。使用Python来实现这一任务可以极大地提高工作效率，特别是当涉及到数百或数千个文档时。Python通过第三方库如python-docx可以方便地操作Word文档。准备工作：准备两份没有设置段落格式的Word文件。如下图所示：编写代码：#定
常见的Python框架--matplotlib 我有颗小粒的痣 Python python matplotlib
matplotlib获取方法：https://matplotlib.org/users/installing.html#building-on-linuxsudoapt-getinstallpython-matplotlib#python2.sudoapt-getinstallpython3-matplotlib#python3.简介用于数据可视化#easyexampleimportmatplot
python docx document 输出word 设置字体南阳范宏云 python word 开发语言
python相关学习资料：一张图生成指定动作的动态视频,MagicAnimate本地部署搭建私人助理大模型需要什么环境？GitLabCI/CD-pending的原因使用Python-docx库设置Word文档字体Python-docx是一个用于创建和更新MicrosoftWord文档的Python库。它允许我们以编程方式操作Word文档，包括设置字体样式。本文将介绍如何使用Python-docx库
用Python复制Word内容并使用格式设字体与大小 txlgl
网上流传的部分可以百度关键词“Python”和“word”后查看文章学习，以下内容为个人实践，修正了不能运行出错的情况。importwin32comfromwin32com.clientimportDispatch,constantsw=win32com.client.Dispatch('Word.Application')#或者使用下面的方法，使用启动独立的进程：#w=win32com.clie
Python--面向对象基础（上）索然无味io Python全栈开发 python 开发语言 windows 网络安全 web安全笔记
初识面向对象类与对象定义classMessage:defsend_email(self,email,content):print(f"给{email}发邮件，内容：{content}")#实例化对象并调用方法msg=Message()msg.send_email("[email protected]","HelloWorld")语法规范类名采用大驼峰命名法（如ClassName）类默认继承objec
【Pytorch】基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN(各种KAN修改一行代码搞定)的共享单车租赁预测研究(数据可换)Python 冒泡芳 python pytorch lstm
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、研究背景与意义二、TCN与KAN简介三、基于TCN-KAN的共享单车租赁预测模型四、研究挑战与展望基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN的共享单车租赁预测研究1.引言2.模型介绍
Python GUI开发：PyQt5 vs. PySide6 Sherry Wangs GUI开发 python qt 开发语言
文章目录项目应用许可证适用场景PyQt5和PySide6之间区别导入语句信号与槽工具和命令事件循环项目应用许可证PyQt5：采用GPL或商业许可证。如果开发闭源商业应用，必须购买商业许可证。PySide6：采用LGPLv3许可证，允许在闭源项目中使用，且无需公开整个项目的源代码。如果使用PyQt5开发项目，需要购买商业许可证，而PySide可以免费使用。适用场景PyQt5：需要长期稳定性的项目。有
API开发：Flask VS FastAPI Sherry Wangs Python开发实践 python fastapi 后端
在当今的Web开发领域，选择合适的框架对于构建高效、稳定且易于维护的API至关重要。Flask和FastAPI是两个备受关注的PythonWeb框架，它们各自具有独特的特点和优势，适用于不同的开发场景。文章目录一、简介二、性能表现三、开发效率（中文语音识别为例）四、代码可读性和维护性五、生态系统和社区支持六、总结一、简介Flask：Flask是一个轻量级的PythonWeb框架，它基于Werkze
深入了解阿里云 OSS：强大的云存储解决方案 Sherry Wangs Python开发实践阿里云云计算
在现代互联网应用中，数据存储是一个不可忽视的环节。随着数据量的不断增长，传统的存储方式已经无法满足高速、低成本、大容量的需求。阿里云OSS（对象存储服务）作为一种高性能、低成本且具备高度扩展性的云存储服务，已经成为许多企业和开发者的首选存储方案。文章目录阿里云OSS概述核心特性：阿里云OSS基础概念阿里云OSS使用的典型场景静态文件存储数据备份与归档静态网站托管Python使用阿里云OSS实践阿里
Python基础教程之Matplotlib-基础绘图粒子jiang Python教程 python matplotlib
最近想自学一些数据可视化相关的工具，首先想到了Python，于是自己写一些文章，把学习成果和问题贴出来，方便自己后续查询。之前有断断续续学习过一些Python的基础语法，所以直接从Matplotlib开始，后续应该会继续更新其他相关信息。目前用的开发工具是jupyternotebook，对Python感兴趣的小伙伴也可以在评论区交流起来。>>>Matplotlibbasicusage>>>导入模块
Python：将CURL并一键转为python爬虫代码 luoluosheng07 python python
Python：在线转Curl转其他语言：https://curlconverter.com/爬虫获取当前ip请求：https://www.httpbin.org/ip爬虫获取当前所用的user-agent请求：https://www.httpbin.org/user-agent
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb