SVM支持向量机原理详解

SVM

考虑一个二分类问题。假设输入空间与特征空间为两个不同的空间。输入空间为欧式空间或离散集合，特征空间为欧式空间或希尔伯特空间。线性可分支持向量机、线性支持向量机假设这两个空间的元素一一对应，并将输入空间中的输入映射为特征空间中的特征向量。非线性支持向量机利用一个从输入空间到特征空间的非线性映射将输入映射为特征向量。所以，输入都由输入空间转换到特征空间，支持向量机的学习是在特征空间进行的。

希尔伯特空间：一个完备的内积空间。 $R^n$ 就是一个完备的内积空间，即Hilbert空间。大部分时候我们的输入 $x$ 都在 $R^n$ 中，因此即使不懂什么叫完备也没关系。

线性可分支持向量机

线性可分即存在一个超平面可以将数据点分为两类，分离超平面为:
$\begin{aligned} w^*x+b^*=0 \tag{1} \end{aligned}$

决策函数为：

$sign(w^*x+b^*) \tag{2}$

SVM最大的特点就是使分离超平面与样本点的最小距离最大，即“最小间隔最大化”。因为距离分离平面越远的点，模型在预测其类别时的置信度就越高。距离最大就引出了SVM的优化目标函数,在这之前首先要介绍函数间隔和几何间隔。

函数间隔

$\hat{\mathop{r}} = y(wx+b) \tag{3}$

上式中 $y$ 为样本的类别标签。可以看出，当点 $x_i$ 被正确分类，则其函数间隔大于0，而与其类别无关；反之则一定小于0.对于给定的一组 $w, b$ ，函数间隔的大小也可以代表模型对于分类结果的确信程度。

几何间隔

当 $w, b$ 成比例变化时，函数间隔亦成比例变化，但是分隔超平面没有变化。比如在二维坐标系下 $2x_1+4x_2+3=0$ 与 $4x_1+8x_2+6=0$ 显然为同一条直线，只是系数成比例的变化。这就启发我们可以对每个分离超平面除以它的 $∣ ∣ w ∣ ∣$ , 由此得到几何间隔：
$r=y\frac{wx+b}{||w||} \tag{4}$

事实上，当分类正确时等号右边就是点到直线的距离公式。这样我们就能将SVM公式化为下面的优化问题：

$\max_{w, b} \qquad r \\ \tag{5} s.t.\qquad \frac{y_i}{||w||}(wx_i+b)\ge{r}, i=1, 2, \dots, N$

其中，限制条件体现了“最小间隔”，目标函数保证了“间隔最大化”。 但是这个最优化问题不好求解，我们需要想办法让问题的形式更简单一点。考虑函数间隔和几何间隔之间的关系，可以将上面的优化问题改写为：

$\max_{w, b} \qquad \frac{\hat{r}}{\lVert w\rVert}\\ \tag{6} s.t.\qquad {y_i}(wx_i+b)\ge{\hat{r}}, i=1, 2, \dots, N$
根据我们之前的讨论，函数间隔可以任意变化，我们总是可以通过成比例的改变 $w, b$ 来保证得到相同的分离超平面。

证明：假设 $r_1=kr_2$ ，当 $\hat{r}=r_2$ 时解为 $w^*, b^*$ ,则对于任意的输入 $x_i$
$\begin{aligned} &k{y_i}(w^*x_i+b^*)\ge kr_2=r_1, \qquad &满足限制条件\\ &\frac{r_1}{k||w^*||}=\frac{r_2}{||w^*||}\ge\frac{r_2}{||w||}=\frac{r_1}{k||w||}，\qquad &满足最优的要求 \end{aligned}$
故 $kw^*, kb^*$ 是 $\hat{r}=r_1$ 的解,显然它与 $w^*, b^*$ 是同一个解。又因为在线性可分的情形下分离超平面存在且唯一，所以 $\hat{r}=r_1$ 和 $\hat{r}=r_2$ 同解。又因为任意两个实数 $a, b$ 都可以表示成 $a = k b$ 的形式，因此 $\hat{r}$ 的取值不影响最优化问题的解。

简便起见，我们可令 $\hat{r}=1$ ，然后做一些便于求导和表示的等价处理，可以得到下面的优化问题:
$\begin{aligned} &\min_{w, b} \qquad \frac{1}{2}\lVert w\rVert ^ 2 \\ \tag{7} &s.t.\qquad {y_i}(wx_i+b) - 1\ge0, i=1, 2, \dots, N \end{aligned}$

事实上，这是一个凸二次优化问题，也就是说它的限制条件和目标函数都是连续可微的凸函数。

最大分离超平面的存在性和唯一性

证明：

存在性：由线性可分的假设，知优化问题一定存在可行解（也就是有解），又因为优化目标有下界（范数的平方一定是非负的有最小值0），故存在最优解。但是如果 $\frac{1}{2}||w^{*}||^2=0$ ，即取到下界0就有 $w = 0$ 此时分离超平面是不存在的。又因为输入数据中有正类和负类，所以 $(0, b)$ 不是最优化问题的解，否则的话分类决策函数 $f(x)=sign(b^*)$ 输出恒为1或-1。由此可知分离超平面的存在性。

唯一性：假设存在 $w_1^*, b_1^*$ , $w_2^*, b_2^*$ 都是最优化问题的解。则 $w=\frac{w_1^*+w_2^*}{2}$ , $b=\frac{b_1^*+b_2^*}{2}$ 也是最优化问题的可行解（即满足限制条件，但不一定满足最优化目标）。设 $w_1^*||=||w_2^*||=c$ :
$\begin{aligned} c \le ||w|| \le \frac{1}{2}||w_1^*||+\frac{1}{2}||w_2^*||=c \tag{8} \end{aligned}$
上式中的不等号来自三角不等式。由此可以推出 $∣ ∣ w ∣ ∣ = c$ ,根据三角不等式等号成立的条件可知 $w_1^*$ 与 $w_2^*$ 共线，又因为二者范数相等，则 $w_1^*= w_2^*$ 或 $w_1^*= -w_2^*$ 。当 $w_1^*= -w_2^*$ 时， $w = 0$ ，所以 $w_1^*= w_2^*$

由上述结论可知，两个分离超平面是平行的，所以 $x_i$ 中使得不等式约束等号成立的点对于两个分离超平面是相同的（因为使得等号成立的点是到分隔超平面几何距离最小的点，而每个点到两个分离超平面的几何距离相差一个常数 $b_1^* - b_2^*|$ ）。又因为两个解都是最优解，所以最小的几何距离相等，故 $b_1^* - b_2^*|=0$ ，推出 $b_1^* = b_2^*$ 。由此可知唯一性。

最优化问题的求解

在高等数学中我们求解带限制条件的极值问题时通常会使用拉格朗日极值法。考虑下面的拉格朗日函数：

$\max_{\alpha：\alpha \ge 0} \qquad L(w, b, \alpha)=\frac{1}{2}\lVert w \rVert ^ 2 - \sum_{i=1}^N \tag{9}\alpha_iy_i(wx_i+b)+\sum_{i=1}^N\alpha_i$

结合限制条件：
$\max_{\alpha：\alpha \ge 0} \qquad L(w, b, \alpha)=\left\{ \begin{aligned} &\frac{1}{2}\lVert w \rVert ^ 2, \qquad&{y_i}(wx_i+b) - 1\ge0, i=1, 2, \dots, N\\ \tag{10} &+\infty , \qquad &{y_i}(wx_i+b) - 1<0, i=1, 2, \dots, N \end{aligned} \right.$

所以当 $x$ 满足限制条件时，下述最优化问题与原始问题等价：
$\begin{aligned} \min_{w,b}\max_{\alpha:\alpha \ge 0}L(w, b, \alpha) \tag{11} \end{aligned}$

这个问题不便于求解，因为根据拉格朗日极值法，我们首先需要求 $\alpha)$ 对 $\alpha$ 的导数，并令其为0：
$\frac{\partial L}{\partial \alpha_i} = 1 - y_i(wx_i+b)=0 \rightarrow y_i(wx_i+b) = 1 \tag{12}$
将其代回(n)中有
$\min_{w,b}=\frac{1}{2}\lVert w \rVert ^ 2 \tag{13}$
这就回到了我们的原始问题。我们可以将上述问题转化为其对偶问题进行求解，又因为这个优化问题满足KKT条件（对偶问题和KKT条件），所以原问题和对偶问题有相同的解 $w^*, b^*$ （拉格朗日对偶性):

$\max_{\alpha:\alpha \ge 0}\min_{w,b}L(w, b, \alpha) \tag{14}$
类似于之前的求解方法：
$\begin{aligned} \frac{\partial L}{\partial w} &= w - \sum_{i=1}^{N}\alpha_iy_ix_i&=0 \\ \frac{\partial L}{\partial b} &= -\sum_{i=1}^{N}\alpha_iy_i&=0 \tag{15} \end{aligned}$
将式(15)带回式(14)中可以得到：
$\begin{aligned} &\min_{\alpha} \qquad\frac{1}{2} \sum_{i=1}^N \sum_{j=1}^N \alpha_i \alpha_j y_i y_j (x_i.x_j)-\sum_{i=1}^N\alpha_i \\ \tag{16} &s.t. \qquad \sum_{i=1}^N \alpha_iy_i=0 \\ &\qquad\qquad\alpha_i\ge{0} \end{aligned}$

由式（15）有
$w^*=\sum_{i=1}^N \alpha_i^*y_ix_i \tag{17}$
其中 $\{\alpha_i^*\}$ 为对偶问题的最优解。若要求 $b^*$ 需要用到KKT条件：
$\begin{aligned} &\nabla_wL(w^*,b^*,\alpha^*)=w^*-\sum_{i=1}^{N}\alpha_i^*y_ix_i \\ &\nabla_bL(w^*,b^*,\alpha^*)=-\sum_{i=1}^{N}\alpha_i^*y_i=0 \\ &\alpha_i^*(y_i(w_*x_i+b^*)-1)=0, \qquad i=1,2,\dots,N \\ &y_i(w_*x_i+b^*)-1 \ge 0, \qquad i=1,2,\dots,N \\ &\alpha_i^* \ge 0, \qquad i=1,2,\dots,N \tag{18} \end{aligned}$
$\{\alpha_i^*\}$ 中必有大于0的项，否则的话 $w^*=0$ ,而0不是最优化问题的解。假设 $\alpha_j^* > 0$ ,将 $\alpha_j^*$ 代入(18-3)，可求得
$b^*=y_j-\sum_{i=1}^{N}\alpha_i^*y_i(x_i .x_j) \tag{19}$

大于0的 $\alpha_i$ 对应的点 $x_i$ 即为特征向量由KKT条件， $\alpha_i^*(y_i(w^*x_i+b^*)-1)=0$ ,易知后面的括号内为0，则 $x_i$ 位于距离分离超平面函数距离为1的直线上。

线性支持向量机

现实中线性可分的情况比较少见，大部分情况下我们无法找到这样的分隔超平面。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yE5a8hoQ-1627808631140)(https://raw.githubusercontent.com/LinRds/image_bed/main/myplot.png)]

比如这张图片就展示了线性不可分的情况。对于实际问题中的数据，我们通常可以通过删除一些离群点使得原始数据变得线性可分(但是这样模型就失去了泛化性)。比如我们可以把上图中的 $(0, 1), (1, 1)$ 两个点删去，则数据变得线性可分。线性不可分意味着存在部分点无法满足函数间隔大于等于1的条件。为此我们只能够减弱最大间隔限制的条件，添加一个松弛变量 $\xi_i$ ,则限制条件变为：
$\begin{aligned} y_i(wx_i+b) \ge 1-\xi_i \qquad \xi_i \ge 0 \end{aligned}$
$\xi_i$ 的引入的代价会体现在目标函数中：
$\min_{w, b}\frac{1}{2} \lVert w \rVert ^2 + C\sum_{i=1}^N \xi_i$
其中 $C > 0$ 是惩罚系数， $C$ 越大误分类的惩罚就越大（当 $\xi_i>1$ 时SVM会出现分类错误）。所以添加正则项的目的就是为了让函数间隔可以比1小一点，但是又不希望太小，这个力度由 $C$ 来调节。

类似于线性可分支持向量机中的情况，将原始优化问题转化为拉格朗日对偶问题后求解，可以推导出 $w^*, b^*$ 的推导公式：
$w^*=\sum_{i=1}^N \alpha_i^*y_ix_i$

$b^*=y_j - \sum_{i=1}^N y_i \alpha_i^*(x_i.x_j) \qquad0 < \alpha_j^* < C$

选择的 $j$ 不同则计算出的 $b^*$ 通常也是不同的。

支持向量

$\alpha_i^* < C$ ,则 $\xi_i=0$ （通过KKT条件可以推出），则 $x_i$ 正好位于间隔边界上；
$\alpha_i^*=C,0<\xi_i<1$ 此时 $x_i$ 位于间隔边界与分隔超平面之间，分类正确；
$\alpha_i^*=C,\xi_i>1$ ,此时 $x_i$ 位于误分类的一侧。

合页损失函数（hinge logg）

合页损失函数的定义如下：
$\sum_{i=1}^N\max(0, 1-y_i(wx_i+b))+\lambda \lVert w \rVert ^2$
下面证明最小化 $(20)$ 与最小化 $(17)$ 是等价的。设：
$\max(0, 1-y_i(wx_i+b))=\xi_i$
则当 $1-y_i(wx_i+b) > 0$ 时， $\xi_i=1-y_i(wx_i+b)>0$ ；当 $1-yi(wx_i+b) \le 0$ 时， $\xi_i=0$ 。综上， $\xi_i \ge 0$ $(16)$ 中的限制条件成立。因此可以将 $(20)$ 写成与 $(17)$ 相同的形式，只需要令 $\lambda=\frac{1}{2}$ 。合页损失函数可以让我们用梯度下降来求解，而不用解析的方式。

核函数

如果不存在一个很好的分离超平面，那么这个时候分类问题就变成非线性的了。此时我们希望找到一个分离超曲面来解决这个问题。而核技巧（kernel trick）则另辟蹊径，他将输入数据通过一个非线性变换映射到特征空间中，而在特征空间中，我们可以找到一个合适的分离超平面。

核函数可以表示成两个向量的内积，而核技巧的巧妙之处局在于我们不需要显示的求出非线性变换。事实上，非线性变换的求解是困难的，而且同一个核函数可以对应不同的特征空间和映射函数的取法。核函数帮我们回避了这个问题，这就是所谓的“技巧”（trick）。

我们所说的核函数通常都是正定核函数。正定是线性代数中的一个概念，英文中写作positive definite,翻译过来是“一定为正”,也就是对于任意非零向量 $x$ 有 $x^TAx > 0$ .如果半正定，则大于号变为大于等于号。关于正定矩阵有一种几何角度的理解方式，我们将 $x^TAx$ 看做向量 $x$ 和 $A x$ 的内积，这个值始终大于0，也就是说这两个向量的夹角一定在0和 $\frac{\pi}{2}$ 之间，所以两个向量方向一致。

spark应用程序转换_4.Spark特征提取、转换和选择 - 简书 weixin_39956182 spark应用程序转换
在实际机器学习项目中，我们获取的数据往往是不规范、不一致、有很多缺失数据，甚至不少错误数据，这些数据有时又称为脏数据或噪音，在模型训练前，务必对这些脏数据进行处理，否则，再好的模型，也只能脏数据进，脏数据出。这章我们主要介绍对数据处理涉及的一些操作，主要包括：特征提取特征转换特征选择4.1特征提取特征提取一般指从原始数据中抽取特征。4.1.1词频－逆向文件频率(TF-IDF)词频－逆向文件频率(T
深度学习：探索人工智能的无限可能木小梦(๑• . •๑) 人工智能深度学习
引言：在当今这个数字化时代，人工智能（AI）已经成为了一个热门话题。从自动驾驶汽车到智能助手，AI正在逐渐改变我们的生活方式。而在AI领域，深度学习是近年来发展最为迅速的一个分支。本文将深入探讨深度学习及其相关领域，包括计算机视觉、自然语言处理、神经网络和强化学习。1.深度学习深度学习是一种基于人工神经网络的机器学习方法，它试图模拟人脑的工作方式，通过训练大量数据来自动学习数据的内在规律和表示层次
计算机视觉概念科普极客代码玩转AI 人工智能图像处理计算机视觉深度学习
计算机视觉（ComputerVision,CV）是一门多学科交叉的科学，旨在让计算机具备“看”的能力，即通过图像或视频数据来理解世界。它结合了信号处理、图像处理、模式识别、机器学习等多个领域的技术，让计算机能够执行诸如识别、分类、追踪等复杂的视觉任务。本文将深入探讨计算机视觉的核心概念和技术。一、计算机视觉概述计算机视觉是一门研究如何让计算机“看”世界并从中获取信息的科学。它主要关注如何处理、分析
机器学习和深度学习中常见损失函数，包括损失函数的数学公式、推导及其在不同场景中的应用早起星人机器学习深度学习人工智能
目录引言什么是损失函数？常见损失函数介绍3.1均方误差（MeanSquaredError,MSE）3.2交叉熵损失（Cross-EntropyLoss）3.3平滑L1损失（SmoothL1Loss）3.4HingeLoss（合页损失）3.5二进制交叉熵损失（BinaryCross-EntropyLoss）3.6KL散度（KLDivergence）3.7Huber损失（HuberLoss）3.8对比
AI学习记录 - 对抗性神经网络 victor-AI最好的学习方式是画图人工智能学习神经网络
有用点赞哦学习机器学习到一定程度之后，一般会先看他的损失函数是什么，看他的训练集是什么，训练集是什么，代表我使用模型的时候，输入是什么类型的数据。对抗神经网络其实可以这样子理解，网上一直说生成器和判别器的概念，没有触及到本质。我有一种看法：假如当前场景是输入模糊图片，然后输出高质量图片。当判别器和生成器本来就是一个模型，在不把判别器生成器拆开的时候，我输入一张图片，这个模型输出的是0和1，那这个整
【ShuQiHere】《机器学习的进化史『上』：从数学模型到智能算法的百年征程》 ShuQiHere 机器学习人工智能
【ShuQiHere】引言：概述机器学习的演进机器学习的发展史是一段从数学基础到智能算法的演进历程。从19世纪的数学探索，到20世纪的计算革命，再到21世纪的智能算法应用，机器学习模型的演化贯穿了科学进步的每个重要阶段。这篇博客将系统回顾这些模型的历史演进，展示它们之间的联系，并探讨其在现代应用中的重要性。线性回归：机器学习的起点背景故事：1805年的法国，年轻的数学家Adrien-MarieLe
TensorFlow和它的弟弟们活蹦乱跳酸菜鱼 tensorflow 人工智能 python
TensorFlow、TensorFlowLite、TensorFlowLiteMicro是Google在深度学习领域推出的三个不同产品，它们各自有着不同的设计目标和适用场景。以下是它们之间的主要区别：1.TensorFlow(PC\GPU)设计目标：TensorFlow是一个开源的机器学习框架，由GoogleBrain团队开发，旨在帮助开发者构建和训练深度学习模型。它支持多种编程语言（如Pyth
机器学习（ML）算法分类活蹦乱跳酸菜鱼机器学习
机器学习（ML）算法是一个广泛而多样的领域，涵盖了多种用于数据分析和模式识别的技术。以下是一些常见的机器学习算法分类及其具体算法：一、监督学习算法监督学习算法使用标记（即已知结果）的训练数据来训练模型，以便对新数据进行预测。线性回归：用于建立连续变量之间的关系，通过拟合一条直线或超平面来预测新数据的输出值。逻辑回归：虽然名称中包含“回归”，但实际上是用于分类问题，特别是二分类问题。通过将线性回归模
Datawhale AI夏令营-task03 ghost_him 人工智能
DatawhaleAI夏令营-task03笔记来源：DatawhaleAI夏令营数据增强基础数据增强是一种在机器学习和深度学习领域常用的技术，尤其是在处理图像和视频数据时。**数据增强的目的是通过人工方式增加训练数据的多样性，从而提高模型的泛化能力，使其能够在未见过的数据上表现得更好。**数据增强涉及对原始数据进行一系列的变换操作，生成新的训练样本。这些变换模拟了真实世界中的变化，对于图像而言，数
K-means聚类算法：从原理到实践的全面解读一休哥助手人工智能算法 kmeans 聚类
引言在当今数据驱动的时代，机器学习技术的发展已经成为各行各业的重要驱动力。在机器学习中，聚类算法是一类被广泛应用的技术之一。聚类旨在将数据集中的样本划分为不同的组，使得组内的样本相似度高，组间的相似度低。K-means聚类算法作为聚类算法中的一种经典方法，因其简单、高效的特性被广泛应用于各个领域。在本文中，我们将深入探讨K-means聚类算法，从基本原理到实际应用，以及算法的优化和实现方法。首先，
机器学习——支持向量机酱香编程，风雨兼程机器学习支持向量机机器学习算法
一、间隔与支持向量给定训练样本集D={(x1,y1),(x2,y2),⋯ ,(xm,ym)},yi∈{−1,+1}D=\{(\bmx_1,y_1),(\bmx_2,y_2),\cdots,(\bmx_m,y_m)\},y_i\in\{-1,+1\}D={(x1,y1),(x2,y2),⋯,(xm,ym)},yi∈{−1,+1}，分类学习最基本的想法就是基于训练集DDD在样本空间中找到一个划分超
【机器学习-随记】使用 Slack 和 Facebook Messenger 的消息机器人实现虚拟客服人员听忆. 机器学习 facebook 机器人
使用Slack和FacebookMessenger的消息机器人实现虚拟客服人员1.平台选择与集成2.消息机器人开发3.自然语言处理(NLP)4.虚拟助手功能实现5.语音助手集成6.安全与用户隐私7.测试与部署边走、边悟迟早会好实现一个虚拟客服人员，能够通过Slack和FacebookMessenger进行交互，并执行虚拟助手和语音助手通常完成的任务，涉及多个技术组件和步骤。以下是实现这一系统的详细
每天一个数据分析题（五百零五）- 提升方法跟着紫枫学姐学CDA 数据分析题库数据分析
提升方法（Boosting），是一种可以用来减小监督式学习中偏差的机器学习算法。基于Boosting的集成学习，其代表算法不包括？A.AdaboostB.GBDTC.XGBOOSTD.随机森林数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库，数据
每天一个数据分析题（五百零六）- 装袋方法跟着紫枫学姐学CDA 数据分析数据挖掘
装袋方法(bagging)也叫做bootstrapaggregating,是在原始数据集有放回地重采样S次后得到新数据集的一种技术，其代表算法有？A.AdaboostB.GBDTC.XGBOOSTD.随机森林数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专
7+非肿瘤纯生信，内容不多但思路值得借鉴！生信小课堂
关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，铁死亡，自噬等基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，有需要的朋友患者添加小编咨询生信分析咨询请关注生信小课堂研究背景：扩张型心
亦菲喊你来学机器学习（14） --贝叶斯算法方世恩机器学习算法人工智能 python scikit-learn
文章目录贝叶斯一、贝叶斯定理二、贝叶斯算法的核心概念三、贝叶斯算法的优点与局限优点：局限：四、构建模型训练模型测试模型总结贝叶斯贝叶斯算法（Bayesianalgorithm）是一种基于贝叶斯定理的机器学习方法，主要用于估计模型参数和进行概率推断。以下是对贝叶斯算法的详细解析：一、贝叶斯定理贝叶斯定理是概率论中的一个基本定理，它描述了条件概率之间的关系。该定理的数学表达式为：P(A∣B)=P(B)
探索数据世界的钥匙：机器学习中的线性回归程序员-李旭亮机器学习
在浩瀚的数据海洋中，寻找隐藏的模式与规律，一直是科学家、工程师乃至各行各业决策者们的共同追求。而机器学习，作为这一领域的璀璨明珠，以其强大的数据分析与预测能力，正逐步改变着我们的世界。在众多机器学习算法中，线性回归以其简洁、直观、易于理解的特点，成为了入门机器学习的首选，更是解决回归问题的一把金钥匙。一、线性回归：定义与原理线性回归，顾名思义，是一种通过线性模型来预测一个或多个自变量（X）与因变量
深度学习与OpenCV：解锁计算机视觉的无限可能程序员-李旭亮深度学习
在科技日新月异的今天，计算机视觉作为人工智能领域的一颗璀璨明珠，正以前所未有的速度改变着我们的生活与工作方式。而《深度学习》与OpenCV，作为这一领域的两大重要工具，更是为计算机视觉的入门与深入探索铺设了坚实的基石。本文将带您一窥这两者的魅力，探索它们如何携手开启计算机视觉的无限可能。深度学习：智能的催化剂深度学习，作为机器学习的一个分支，其核心在于通过构建深层次的神经网络模型，模拟人脑的学习过
PyTorch库学习之torch.mean函数 Midsummer-逐梦 #torch pytorch 学习人工智能
PyTorch库学习之torch.mean函数一、简介torch.mean是PyTorch库中的一个函数，用于计算张量的均值。它可以沿着指定的维度或者整个张量计算均值，是数据分析和机器学习中常用的操作之一。二、语法和参数语法:torch.mean(input,dim=None,keepdim=False,*,out=None)参数:input(torch.Tensor):输入张量。dim(int,
AI大模型副业变现之路，有技术就有收入！ AI大模型-王哥人工智能 AI大模型大模型大模型学习大模型教程大模型入门
在当今时代，AI大模型的应用越来越广泛，利用这些技术开展副业赚钱已成为可能。以下是一份详细的指南，帮助你了解需要学习的内容以及如何操作。一、需要学习的内容基础知识储备（1）数学知识：线性代数、概率论与数理统计、微积分等，这些是理解AI算法的基础。（2）编程技能：掌握Python编程语言，因为Python在AI领域有丰富的库和框架支持。（3）机器学习原理：了解常见的机器学习算法，如线性回归、决策树、
c++调用python和numpy混合编程 AIVoyager c++python c++python numpy
目录1.cmake配置2.python脚本3.c++头文件初始化4.c++调用python中的函数，实现功能参考在现代软件开发中，跨语言编程和混合编程的需求日益增长。C++作为一种高效、强大的编程语言，广泛应用于底层开发、游戏引擎、高性能计算等领域。而Python则因其简洁的语法、丰富的库和易于学习的特性，在数据科学、机器学习、Web开发等领域占据重要地位。NumPy是Python中一个用于数值计
springboot集成 AI 实现图片辅助设计功能 cesske spring boot 人工智能后端
springboot集成AI实现图片辅助设计功能在SpringBoot中实现一个图片辅助设计功能，通常会涉及到图像处理、计算机视觉以及机器学习（AI）技术的应用。这样的系统可以帮助用户进行图像编辑、风格转换、自动设计布局等。以下是一个基本步骤和技术栈建议，用于在SpringBoot中构建图片辅助设计功能的系统。1.技术栈选择SpringBoot：作为后端框架，提供RESTfulAPI。图像处理库：
【ShuQiHere】SGD vs BGD：搞清楚它们的区别和适用场景 ShuQiHere 机器学习 python 人工智能
【ShuQiHere】在机器学习中，优化模型是构建准确预测模型的关键步骤。优化算法帮助我们调整模型的参数，使其更好地拟合训练数据，减少预测误差。在众多优化算法中，梯度下降法是一种最为常见且有效的手段。梯度下降法主要有两种变体：批量梯度下降（BatchGradientDescent,BGD）和随机梯度下降（StochasticGradientDescent,SGD）。这两者在如何计算梯度并更新模型参
每天一个数据分析题（五百零二）- 分割式聚类算法跟着紫枫学姐学CDA 数据分析题库算法数据分析聚类
以下哪个选项是分割式聚类算法?A.K-Means。B.CentroidMethodC.Ward’sMethodD.以上皆非数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库，数据分析从业者刷题必备神器！
【机器学习基础】Anaconda与Pycharm使用叫我东方小巴黎机器学习基础人工智能
这里写目录标题指定py版本安装包指定py版本安装包condaenvlistactivatexxxcondalistpipinstallxxx
【机器学习】初学者经典案例（随记）听忆. 机器学习人工智能数据挖掘深度学习语言模型
边走、边悟迟早会好一、概念机器学习是一种利用数据来改进模型性能的计算方法，属于人工智能的一个分支。它旨在让计算机系统通过经验自动改进，而不需要明确编程。类型监督学习：使用带标签的数据进行训练，包括分类（如垃圾邮件检测）和回归（如房价预测）。无监督学习：使用不带标签的数据进行训练，包括聚类（如客户细分）和降维（如主成分分析）。强化学习：通过与环境的交互学习策略，以最大化累积奖励（如AlphaGo）。
机器学习概述与应用：深度学习、人工智能与经典学习方法刷刷刷粉刷匠人工智能机器学习深度学习
引言机器学习（MachineLearning）是人工智能（AI）领域中最为核心的分支之一，其主要目的是通过数据学习和构建模型，帮助计算机系统自动完成特定任务。随着深度学习（DeepLearning）的崛起，机器学习技术在各行各业中的应用变得越来越广泛。在本文中，我们将详细介绍机器学习的基础概念，包括无监督学习、有监督学习、增量学习，以及常见的回归和分类问题，并结合实际代码示例来加深理解。1.机器学
《陈天奇：机器学习科研的十年》阅读笔记 Bunny_Ben 科研方法&心得笔记
0、作者介绍陈天奇是机器学习领域著名的青年华人学者之一，本科毕业于上海交通大学ACM班，博士毕业于华盛顿大学计算机系，研究方向为大规模机器学习。2019年，陈天奇在Twitter上宣布自己将于2020年秋季加入CMU任助理教授，成为加入CMU的年轻华人学者之一。在本文中，陈天奇回顾了自己做机器学习科研的十年。 1、原文十年前，MSRA的夏天，刚开始尝试机器学习研究的我面对科研巨大的不确定性，感到最
Datawhale X 李宏毅苹果书 AI夏令营｜机器学习基础之案例学习 Monyan 人工智能机器学习学习李宏毅深度学习
机器学习（MachineLearning,ML）：机器具有学习的能力，即让机器具备找一个函数的能力函数不同，机器学习的类别不同：回归（regression）：找到的函数的输出是一个数值或标量（scalar）。例如：机器学习预测某一个时间段内的PM2.5，机器要找到一个函数f，输入是跟PM2.5有关的的指数，输出是明天中午的PM2.5的值。分类（classification）：让机器做选择题，先准备
聚星文社——绘唐科技Ai推文软件绘唐AIGCAI工具科技
聚星文社——绘唐科技Ai推文软件聚星文社--绘唐科技Ai推文软件https://iimenvrieak.feishu.cn/docx/ZhRNdEWT6oGdCwxdhOPcdds7nofAI推文软件是一种利用人工智能技术帮助用户自动生成推文内容的工具。该软件会分析用户提供的相关信息和目标群体，然后使用机器学习算法和自然语言处理技术来生成具有吸引力和关联性的推文内容。通过使用AI推文软件，用户可以
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts