Air浩瀚

统计学习方法支持向量机（上）

文章目录

统计学习方法支持向量机（上）
- 线性可分支持向量机与硬间隔最大化
- - 定义
  - 硬间隔最大化
  - 对偶算法
- 线性支持向量机与软间隔最大化
- - 定义
  - 软间隔最大化
  - 对偶算法
  - 合页损失函数

统计学习方法支持向量机（上）

读李航的《统计学习方法》中，关于支持向量机的相关笔记。

支持向量机（SVM）是一种二分类模型。其学习策略为间隔最大化，可形式化为一个求解凸二次规划的问题，同时也等价于正则化荷叶损失函数最小化的问题。间隔最大使它有别于感知机。

线性可分支持向量机与硬间隔最大化

线性可分支持向量机使用硬间隔最大化的算法，因此要求线性可分的训练数据集。

定义

线性可分支持向量机：给定线性可分数据集，通过硬间隔最大化或等价求解相应的凸二次规划问题学习到的分离超平面：
$w^\ast \cdot x+b^\ast=0$
以及相应的分类决策函数：
$f(x)=\text{sign}(w^\ast \cdot x+b^\ast)$
称为线性可分支持向量机。

函数间隔：给定训练数据 $T$ 与超平面 $(w,\,b)$ ，超平面关于样本点 $x_1,\,y_i)$ 的函数间隔为：
$\hat{\gamma}_i=y_i(w \cdot x_i+b)$

超平面参数确定的情况下，函数间隔可以反映样本点距离超平面的远近和分类的正确性与可信度；

几何间隔：给定训练数据 $T$ 与超平面 $(w,\,b)$ ，超平面关于样本点 $x_1,\,y_i)$ 的几何间隔为：
$\hat{\gamma}_i=\frac{1}{||w||}y_i(w \cdot x_i+b)$

几何间隔表示样本点到超平面的距离带上是否分类正确的符号，即带符号的距离；
函数间隔的大小受到 $w$ 和 $b$ 的 scale 的影响，但几何间隔反映了实际距离，二者的关系为：

$\gamma=\frac{\hat{\gamma}}{||w||}$

其中：
$\gamma=\min\limits_{i=1,\cdots,N}\gamma_i ,\quad\quad \hat\gamma=\min\limits_{i=1,\cdots,N}\hat\gamma_i$

硬间隔最大化

硬间隔最大化：SVM 学习的基本想法是，求解能够正确划分数据集、并且几何间隔最大的分离超平面。对于线性可分的数据集，可正确划分的超平面可能有无穷多个，但几何间隔最大的分离超平面是唯一的。

也就是说，我们要找到的分离超平面，不仅可以正确划分数据，同时还能与数据保持尽量远的距离，这样灵活性更高，加入新的未知的实例时能有更好的分类预测能力。

该问题可以表示为下面的约束最优化问题：
$\begin{array}{l} \max\limits_{w,\,b} \gamma \\ \text{s.t. } \frac{1}{||w||}y_i(w \cdot x_i+b) \geq \gamma,\quad i=1,2,\cdots,N \end{array}$
使用函数间隔的话，可以表示为：
$\begin{array}{l} \max\limits_{w,\,b} \frac{\hat{\gamma}}{||w||} \\ \text{s.t. } y_i(w \cdot x_i+b) \geq \hat\gamma,\quad i=1,2,\cdots,N \end{array}$
函数间隔的取值并不影响最优化问题的解，因为比如将 $w$ 和 $b$ 等比例放大为 $\lambda w$ 和 $\lambda b$ ，此时函数间隔也变为 $\lambda\hat\gamma$ 。所以可以取 $\hat\gamma=1$ ，这样问题转化为：
$\begin{array}{l} \min\limits_{w,\,b} \frac{1}{2}||w||^2 \\ \text{s.t. } y_i(w \cdot x_i+b) -1 \geq 0,\quad i=1,2,\cdots,N \end{array}$
这样就变成了一个凸二次规划的问题。

凸二次规划问题：约束最优化问题，形如：
$\begin{aligned} \min\limits_w &\, f(w) \\ \text{s.t. } &\, g_i(w)\leq 0,\quad i=1,2,\cdots,k \\ &\, h_i(w)= 0,\quad i=1,2,\cdots,l \\ \end{aligned}$
目标函数 $f (w)$ 和约束函数 $g_i(w)$ 都是 $R^n$ 上连续可微的凸函数（convex function），而约束函数 $h_i(w)$ 是 $R^n$ 上的仿射函数（即线性变换函数， $f(x)=a\cdot x+b$ ）；

算法：线性可分支持向量机学习算法 - 最大间隔法

输入：线性可分训练数据集 $T=\set{(x_1,t_1),(x_2,y_2),\cdots,(x_N,y_N)}$ ，其中 $x_i\in\mathcal{X}\subseteq \R^n$ ， $y_i\in\mathcal{Y}=\set{1,\,-1}$
输出：最大间隔分离超平面和分类决策函数

构造并求解约束最优化问题：

$\begin{array}{l} \min\limits_{w,\,b} \frac{1}{2}||w||^2 \\ \text{s.t. } y_i(w \cdot x_i+b) -1 \geq 0,\quad i=1,2,\cdots,N \end{array}$

求得最优解 $w^\ast$ ， $b^\ast$ ；

由此得到分离超平面：

$w^\ast \cdot x+b^\ast = 0$

分类决策函数：
$f(x)=\text{sign}(w^\ast \cdot x+b^\ast)$

最大间隔分离超平面的存在唯一性：如果训练数据 $T$ 线性可分，则可以将所有样本点正确分开并且最大间隔的分离超平面存在且唯一。

（存在性很明显，唯一性由凸最优问题的解的唯一性可以得到）

支持向量：所谓的支持向量，就是处在离超平面最近的间隔上的点，即：
$y_i(w \cdot x_i+b) -1 = 0$
$y_i=+1$ 的支持向量在超平面：
$H_1:\, w\cdot x+b=1$
$y_i=-1$ 的支持向量在超平面：
$H_2:\, w\cdot x+b=-1$
间隔： $H_1$ 和 $H_2$ 之间的距离称为间隔，为 $\frac{2}{||w||}$ ； $H_1$ 和 $H_2$ 称为间隔边界。

所以说 SVM 具有稀疏性，因为只有少数几个样本点（支持向量）在起作用。

对偶算法

对偶算法的推导：硬间隔最大化问题的 Lagrangian 为：
$\begin{aligned} L(w,b,\alpha)=&\, \frac{1}{2}||w||^2+ \sum\limits_{i=1}^N \alpha_i(1-y_i(w\cdot x_i+b)) \\ =&\, \frac{1}{2}||w||^2-\sum\limits_{i=1}^N \alpha_iy_i(w\cdot x_i+b))+\sum\limits_{i=1}^N \alpha_i \end{aligned}$
等价为极小极大问题：（参考拉格朗日对偶性的笔记）
$\min_{w,b}\max_{\alpha}L(w,b,\alpha)$
等价为对应的对偶问题，即极大极小问题：
$\max_{\alpha}\min_{w,b}L(w,b,\alpha)$
为了求解对偶问题，我们要先求解极小问题，再求解极大问题：

求 $\min\limits_{w,b}L(w,b,\alpha)$ ：由 FOC 得：

$\begin{aligned} \frac{\partial L}{\partial w}= &\, w-\sum_{i=1}^{N}\alpha_iy_ix_i=0 \quad\Rightarrow\quad w =\sum_{i=1}^{N}\alpha_iy_ix_i\\ \frac{\partial L}{\partial b}= &\, -\sum_{i=1}^{N}\alpha_iy_i=0 \quad\Rightarrow \quad \sum_{i=1}^{N}\alpha_iy_i=0 \end{aligned}$

代回原来的 Lagrangian ，得到：
$L(w,b,\alpha)=-\frac{1}{2}\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}\alpha_i\alpha_jy_iy_j(x_i\cdot x_j)+\sum\limits_{i=1}^{N}\alpha_i$

求 $\max\limits_{\alpha}\left(\min\limits_{w,b}L(w,b,\alpha)\right)$ ：我们取个负号，得到对应的对偶优化问题：

$\begin{aligned} \min_{\alpha}&\, \frac{1}{2}\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}\alpha_i\alpha_jy_iy_j(x_i\cdot x_j)-\sum\limits_{i=1}^{N}\alpha_i \\ \text{s.t.}&\,\, \sum_{i=1}^{N}\alpha_iy_i=0 \\ &\,\, \alpha_i\geq 0,\quad i=1,2,\cdots,N \end{aligned}$

因此，我们先解决对应的对偶优化问题，得到 $\alpha^\ast$ ，再带入得到 $w^\ast$ 和 $b^\ast$ 。其中 $b^\ast$ 的计算为：由于对偶优化问题满足 KKT 条件（参考拉格朗日对偶性的笔记），因此有：
$\alpha_i^\ast (y_i(w^\ast \cdot x_i+b^\ast)-1)=0,\quad i=1,2,\cdots,N$
要么 $\alpha_i^\ast=0$ ，说明 $x_i$ 没有起到约束作用；要么 $\alpha_i^\ast\gt 0$ ，即 $x_i$ 是支持向量。至少存在一个 $a_j^\ast\gt 0$ ，此时有：
$y_j(w^\ast \cdot x_j +b^\ast)-1=0$
代入 $=\sum\limits_{i=1}^{N}\alpha_iy_ix_i$ ，而且 $\frac{1}{y_j}=y_j$ ，所以有：
$b^\ast=y_j-\sum\limits_{i=1}^N \alpha_i^\ast y_i$
算法：线性可分支持向量机学习算法 - 最大间隔法的对偶算法

输入：线性可分训练数据集 $T=\set{(x_1,t_1),(x_2,y_2),\cdots,(x_N,y_N)}$ ，其中 $x_i\in\mathcal{X}\subseteq \R^n$ ， $y_i\in\mathcal{Y}=\set{1,\,-1}$
输出：最大间隔分离超平面和分类决策函数

构造并求解约束最优化问题：

得到最优解 $\alpha^\ast$ ；

计算：

$w^\ast = \sum\limits_{i=1}^{N}\alpha_i^\ast y_ix_i$

并选择 $\alpha^\ast$ 的一个正分量 $\alpha_j^\ast$ ，计算：
$b^\ast=y_j-\sum\limits_{i=1}^{N}\alpha_i^\ast y_i(x_i\cdot x_j)$

由此得到分离超平面：

$w^\ast \cdot x+b^\ast = 0$

分类决策函数：
$f(x)=\text{sign}(w^\ast \cdot x+b^\ast)$

线性支持向量机与软间隔最大化

线性支持向量机不要求数据集线性可分，仅仅是支持向量机的数学形式是线性的。

定义

线性支持向量机：对于给定的线性不可分的训练数据集，通过软间隔最大化问题或对应的凸二次规划问题，得到的分离超平面为：
$w^\ast \cdot x+b^\ast=0$
以及相应的分类决策函数：
$f(x)=\text{sign}(w^\ast \cdot x+b^\ast)$
称为线性支持向量机。

软间隔最大化

软间隔最大化：软间隔的思想是，对于非线性可分的数据集，只是存在一些特异点（outlier），将这些特异点去除后数据集就变得线性可分了。那么，特异点不能满足函数间隔大于等于 1 的约束条件，我们需要引入新的变量：

松弛变量：每个样本引入一个松弛变量 $\xi_i \geq 0$ ，使得约束条件变为：
$y_i(w\cdot x_i + b) \geq 1-\xi_i$
惩罚参数：对于分类问题，我们是想让尽量多的样本点处于间隔之外，所以松弛变量应当尽可能小，需要对松弛变量支付代价，目标函数变为：
$\frac{1}{2}||w||^2+C\sum\limits_{i=1}^{N}\xi_i$
其中惩罚参数 $C\gt 0$ ，是 SVM 的超参数之一。

算法：线性支持向量机学习算法 - 最大间隔法

输入：非线性可分训练数据集 $T=\set{(x_1,t_1),(x_2,y_2),\cdots,(x_N,y_N)}$ ，其中 $x_i\in\mathcal{X}\subseteq \R^n$ ， $y_i\in\mathcal{Y}=\set{1,\,-1}$
输出：最大间隔分离超平面和分类决策函数

构造并求解约束最优化问题：

$\begin{aligned} \min\limits_{w,\,b}&\, \frac{1}{2}||w||^2+C\sum\limits_{i=1}^{N}\xi_i \\ \text{s.t.}&\,\, y_i(w \cdot x_i+b) \geq 1-\xi_i,\quad i=1,2,\cdots,N \\ &\,\,\xi_i \geq 0 ,\quad i=1,2,\cdots,N \\ \end{aligned}$

求得最优解 $w^\ast$ ， $b^\ast$ ；

由此得到分离超平面：

$w^\ast \cdot x+b^\ast = 0$

分类决策函数：
$f(x)=\text{sign}(w^\ast \cdot x+b^\ast)$

对偶算法

对偶算法的推导：软间隔最大化问题的 Lagrangian 为：
$\begin{aligned} L(w,b,\xi,\alpha,\mu)=&\, \frac{1}{2}||w||^2+C\sum\limits_{i=1}^{N}\xi_i+ \sum\limits_{i=1}^N \alpha_i(1-\xi_i-y_i(w\cdot x_i+b))-\sum\limits_{i=1}^{N}\mu_i\xi_i \\ =&\, \frac{1}{2}||w||^2+C\sum\limits_{i=1}^{N}\xi_i-\sum\limits_{i=1}^N \alpha_iy_i(w\cdot x_i+b))+\sum\limits_{i=1}^N \alpha_i-\sum\limits_{i=1}^{N}(\alpha_i+\mu_i)\xi_i \end{aligned}$
等价为极小极大问题：（参考拉格朗日对偶性的笔记）
$\min_{w,b,\xi}\max_{\alpha,\mu}L(w,b,\xi,\alpha,\mu)$
等价为对应的对偶问题，即极大极小问题：
$\max_{\alpha,\mu}\min_{w,b,\xi}L(w,b,\xi,\alpha,\mu)$
为了求解对偶问题，我们要先求解极小问题，再求解极大问题：

求 $\min\limits_{w,b,\xi}L(w,b,\xi,\alpha,\mu)$ ：由 FOC 得：

代回原来的 Lagrangian ，得到（这个结果和前面的硬间隔最大化的结果是一样的，已经没有 $\mu$ 了）：
$L(w,b,\alpha)=-\frac{1}{2}\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}\alpha_i\alpha_jy_iy_j(x_i\cdot x_j)+\sum\limits_{i=1}^{N}\alpha_i$

求 $\max\limits_{\alpha,\mu}\left(\min\limits_{w,b,\xi}L(w,b,\xi,\alpha,\mu)\right)$ ：我们取个负号，得到对应的对偶优化问题：

$w^\ast$ 和 $b^\ast$ 的计算跟前面硬间隔最大化是一样的。既然这里已经没有 $\mu_i$ 了，因此 $\alpha_i$ 的取值范围实际上可以写成：
$\leq \alpha_i \leq C$
也就是说，软间隔最大化的对偶算法相比于硬间隔最大化中的对偶算法，只多了一个 $\alpha_i$ 的约束条件：不大于 C。

支持向量：同样地：

若 $\alpha_i=0$ ，则样本点 $x_i$ 落在间隔外；
若 $0\lt \alpha_i \lt C$ ，则样本点 $x_i$ 为支持向量；
若 $\alpha_i=C$ ，则样本点 $x_i$ 落在间隔内（也可以称为支持向量），此时：
- 若 $\xi_i =0$ ，则样本点 $x_i$ 落在正确的间隔边界上；
- 若 $0\lt \xi_i \lt 1$ ，则样本点 $x_i$ 落在分离超平面与正确的间隔边界之间；
- 若 $\xi_i =0$ ，则样本点 $x_i$ 落在分离超平面上；
- 若 $\xi_i\gt 1$ ，则样本点 $x_i$ 落在分离超平面与错误的间隔边界之间；

样本 $x_i$ 到间隔边界的距离为 $\frac{\xi_i}{||w||}$ ：

算法：线性支持向量机学习算法 - 最大间隔法的对偶算法

输入：线性可分训练数据集 $T=\set{(x_1,t_1),(x_2,y_2),\cdots,(x_N,y_N)}$ ，其中 $x_i\in\mathcal{X}\subseteq \R^n$ ， $y_i\in\mathcal{Y}=\set{1,\,-1}$
输出：最大间隔分离超平面和分类决策函数

确定超参数：惩罚参数 $C\gt 0$ ；构造并求解约束最优化问题：

得到最优解 $\alpha^\ast$ ；

计算：

$w^\ast = \sum\limits_{i=1}^{N}\alpha_i^\ast y_ix_i$

并选择 $\alpha^\ast$ 的一个分量 $0\lt \alpha_j^\ast\lt C$ ，计算：
$b^\ast=y_j-\sum\limits_{i=1}^{N}\alpha_i^\ast y_i(x_i\cdot x_j)$

由此得到分离超平面：

$w^\ast \cdot x+b^\ast = 0$

分类决策函数：
$f(x)=\text{sign}(w^\ast \cdot x+b^\ast)$

合页损失函数

线性支持向量机学习还可以解释为：最小化以下目标函数：
$\sum\limits_{i=1}^{N}\left[1-y_i(w\cdot x_i+b)\right]_++\lambda ||w||^2$

第一项是经验损失或经验风险函数，称为合页损失函数 （下标 $+$ 代表 ReLU）：

$L(y(w\cdot x+b))=\left[1-y(w\cdot x+b)\right]_+$

第二项则是 L2 正则化项；

Th 7.4：线性支持向量机原始最优化问题：
$\begin{aligned} \min\limits_{w,\,b}&\, \frac{1}{2}||w||^2+C\sum\limits_{i=1}^{N}\xi_i \\ \text{s.t.}&\,\, y_i(w \cdot x_i+b) \geq 1-\xi_i,\quad i=1,2,\cdots,N \\ &\,\,\xi_i \geq 0 ,\quad i=1,2,\cdots,N \\ \end{aligned}$
等价于最优化问题：
$\min\limits_{w,b}\sum\limits_{i=1}^{N}\left[1-y_i(w\cdot x_i+b)\right]_++\lambda ||w||^2$
证明：令 $\xi_i=\left[1-y_i(w\cdot x_i+b)\right]_+$ ，则 $\xi_i \geq 0$ 成立，且 $y_i(w \cdot x_i+b) \geq 1-\xi_i$ 成立。所以新的优化问题可以写成：
$\min\limits_{w,b}\sum\limits_{i=1}^{N}\xi_i+\lambda ||w||^2$
取 $\lambda=\frac{1}{2C}$ ，则变为：
$\min\limits_{w,\,b}\, \frac{1}{C}\left(\frac{1}{2}||w||^2+C\sum\limits_{i=1}^{N}\xi_i\right)$
和原始最优化问题等价。

代理损失函数：图中展示了 0-1 损失函数和合页损失函数。可以认为为 0-1 损失函数是二分类问题真正的损失函数，而合页损失函数是 0-1 损失函数的一个上界，称为代理损失函数。

虚线是感知机的损失函数，可以看出在 $[0,\,1)$ 区间内，合页损失函数仍有损失，而感知机的损失函数已经是 0 了，说明感知机只要要求分类正确即可，而合页损失函数需要在分类正确的前提下，确信度足够高（即样本位于间隔之外），才能没有损失。

poi html转换成word文档,poi将html转换为word文档天猪飞翔 poi html转换成word文档
如何使用apachepoi将word转化为htmlJava可以使用这个开源框架，对word进行读取合并等操作，ApachePOI是一个开源的利用Java读写Excel、WORD等微软OLE2组件文档的项目。最新的3.5版本有很多改进，加入了对采用OOXML格式的Office2007支持，如xlsx、docx、pptx文档。示例如下：importorg.apache.poi.POITextExtra
Java poi导出word文件辉_哥 Java poi word java word 开发语言
Java在导出word文件时主要对表格中内容垂直居中处理做以记录方便后续碰到类似问题解决。mavenpom.xml中添加poi依赖org.apache.poipoi-ooxml4.1.2下载后查看依赖是否成功此时当在wordutil.java类中CTPageSz报红是因为ooxml-shemas版本不对需要另外下载1.3版本然后添加到本项目依赖中即可下载ooxml-shemas1.4版本的依赖po
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
交错并联Buck+LLC变换器的建模与控制优化研究
交错并联Buck+LLC变换器的建模与控制优化研究前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。摘要本文针对宽输入电压范围(200-450V)、多电压输出(12-48V)的高效DC-DC变换系统，提出了一种基于交错并联Buck预调节器和LLC谐振变换器的两级式拓扑结构。中间母线电压设定为200V，系统输出功率为1500W，要求电压和
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
JAVA 使用Apache POI合并Word文档并保留批注的实现
一、需求背景在实际工作中，我们经常需要将多个Word文档合并成一个文件。但当文档中包含批注（Comments）时，传统的复制粘贴会导致批注丢失或引用错乱。本文将介绍如何通过Java和ApachePOI库实现保留批注及引用关系的文档合并功能。二、技术选型核心依赖：org.apache.poipoi-ooxml5.3.0org.apache.poipoi-ooxml-full5.3.0三、实现原理详解
长篇科幻小说《黄茧》第33章发现 3 橙黄茧香
如果……如果那样下沉……那样穿越，就……就算最终能够完成，只怕……只怕我……我也会被这透明凝胶给窒息而亡。提取转化后的个体意识量子态信息数据，全需接受蜜云虚拟世界数理逻辑算法制约，必须在M蜜巢系统模式构架下运行，故环境数据对个体意识数据形成制约，如两者间发生数理冲突，个体意识信息数据必会被M蜜巢系统算法清除，个体意识也就将会在蜜云虚拟世界内消亡，窒息本质上对信息数据不构成损伤，但它执行是蜜云虚拟世
ROS和autosar区别和联系，以及AP/CP对比ROS Jaliang_ 汽车
ROS和autosar区别和联系ROS(RobotOperatingSystem)和AUTOSAR(AutomotiveOpenSystemArchitecture)是两个不同领域的开源软件框架。应用领域的不同:ROS主要面向机器人技术和相关的智能系统，它为机器人研发提供了一套完整的软件解决方案，包括通信、驱动、算法、模拟等各方面的支持。ROS适合用于机器人的控制、感知、规划、模拟等方面的开发，也
机器学习初学者理论初解 Mikhail_G 机器学习人工智能
大家好!为什么手机相册能自动识别人脸？为什么购物网站总能推荐你喜欢的商品？这些“智能”背后，都藏着一位隐形高手——机器学习（MachineLearning）。一、什么是机器学习？简单说，机器学习是教计算机从数据中自己找规律的技术。就像教孩子认猫：不是直接告诉他“猫有尖耳朵和胡须”，而是给他看100张猫狗照片，让他自己总结出猫的特征。传统程序vs机器学习传统程序：输入规则+数据→输出结果（例：按“温
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
C#实现24种数据校验算法的综合指南及工具包.zip 语嫣凝冰
本文还有配套的精品资源，点击获取简介：在数据通信和网络编程中，数据的完整性和准确性是至关重要的。C#作为一种流行的开发语言，提供了强大的工具来实现各类数据校验算法。本压缩包包含了一个名为“WindowsFormsApp”的C#应用程序，用于展示和实验24种数据校验方法，涵盖从简单到复杂的各种算法。这包括CRC校验、MD5、SHA系列、Adler32、Checksum、ParityBit、LRC、H
广州区域热门无创孕期亲子鉴定机构地址一览（附2024最新鉴定中心整理）中量国鉴
广州无创孕期亲子鉴定在哪里可以做？怀孕多久能够做亲子鉴定？首先呢，我们要到医疗机构要确定你是怀孕了，那么在怀孕五周以后就可以做孕期的无创亲子鉴定，鉴定的方法呢，操作也非常简单，只要抽取孕妇10ml的一个静脉血，分离出胎儿的游离DNA与疑似父亲的样本呢，做对比来确定是不是生父，那么操作过程呢，也非常的呃便捷安全，那么到正规的鉴定机构进行一个咨询，确认以后采集样本，然后将样本送到鉴定机构，一般在5~7
《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
Apache POI 依赖版本冲突导致 NoSuchFieldError: Factory 报错
>mvndependency:tree-Dincludes=org.apache.poi.....[INFO]+-org.apache.poi:poi:jar:4.1.2:compile[INFO]+-org.apache.poi:poi-ooxml:jar:4.1.2:compile[INFO]+-org.apache.poi:poi-scratchpad:jar:4.1.2:compile[I
大语言模型：人像摄影的“达芬奇转世”？——从算法解析到光影重塑的智能摄影革命黑巧克力可减脂 AIGC 语言模型人工智能自然语言处理
导言在摄影术诞生之初，达芬奇或许无法想象，他对于光影、比例和解剖的严谨研究，会在数百年后以另一种形式重生。今天，当摄影师面对复杂的光线环境或苦苦寻找最佳构图时，一位由代码构筑的“光影军师”正悄然降临——大语言模型（LLM）正以前所未有的方式，重塑人像摄影的创作边界。解构经典：大语言模型如何“消化”百年摄影智慧大语言模型并非凭空创造建议，其根基在于对海量摄影知识体系的深度理解与结构化重组。理论内化：
集群技术笔记-HAProxy 与 Keepalived 高可用负载均衡实战
目录前言HAProxy一、HAProxy介绍（一）定义（二）核心优势（三）调度算法速查表（四）工作模式（五）配置文件结构（六）健康检查字段二、搭建负载均衡集群（一）准备基本环境（二）配置流程配置真实服务器配置代理服务器（三）客户端验证三、配置健康检查页面（一）修改配置文件追加配置内容（二）重启服务（三）浏览器访问验证Keepalived一、Keepalived介绍（一）定义（二）功能（三）工作原理
LVS调度算法等风来也chen 随笔 lvs lvs调度算法
LVS的十种调度算法一）静态调度：①RR（RoundRobin）:轮询调度轮询调度算法的原理是每一次把来自用户的请求轮流分配给内部中的服务器，从1开始，直到N(内部服务器个数)，然后重新开始循环。算法的优点是其简洁性，它无需记录当前所有连接的状态，所以它是一种无状态调度。【提示：这里是不考虑每台服务器的处理能力】②WRR：weight,加权轮询（以权重之间的比例实现在各主机之间进行调度）由于每台服
LVS调度算法+防火墙解决轮询调度问题+会话解决甜辣小悦羊 lvs 服务器运维
lvs的调度算法类型分配：依据负载状态静态方法：仅根据算法本身进行调度，不考虑RS的负载情况动态方法：主要根据每RS当前的负载状态及调度算法进行调度Overhead=value较小的RS将被调度静态调度方法：RR（roundrobin）：轮询RS分别被调度，当RS配置有差别时不推荐WRR（WeightedRR）：加权轮询根据RS的配置进行加权调度，性能差的RS被调度的次数少SH（SourceHas
LVS的10种调度算法蜡笔晓心其他
1.1静态算法:1.1.1rr(roundrobin):轮询调度算法:轮询调度算法的原理就是依次将用户的访问请求,平均的分配到每一台web服务节点上,从1开始,到最后一台服务器节点结束,然后在开始新一轮的循环,这种算法简单,但是没有考虑到每台节点服务器的具体性能1.1.2wrr(weight):权重调度算法由于每台服务器的性能会高低不同,wrr将会根据管理员设定的权重值来分配访问请求,权重值越大的
算法工程师必备：数据结构10大经典算法详解数据结构与算法学习数据结构与算法宝典算法数据结构 ai
算法工程师必备：数据结构10大经典算法详解关键词：数据结构、经典算法、时间复杂度、应用场景、代码实现摘要：本文是算法工程师的“算法工具箱”指南，系统讲解数据结构领域最核心的10大经典算法（快速排序、归并排序、二分查找、深度优先搜索DFS、广度优先搜索BFS、动态规划、贪心算法、KMP字符串匹配、哈希算法、并查集）。通过生活案例、代码示例、复杂度分析和实战场景，帮你彻底掌握这些算法的原理与应用，真正
lvs调度算法（10种） beyoundout lvs 算法
一、静态算法（不考虑后端真实服务器的负载情况，按算法该谁就分配给谁）1.rr（RoundRobin）轮询算法算法原理：将外部请求按顺序轮流分配到集群中的真实服务器上，它均等地对待每一台服务器，而不管服务器上实际的连接数和系统负载举例：就像在食堂打饭，有三个打饭窗口。学生们排成一队从餐厅门口进入食堂，依次到第一个窗口、第二个窗口、第三个窗口打饭，后面的学生再从第一个窗口循环，每个窗口平等地接待学生，
全球软件技术峰会 2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴向日葵也有悲伤运维架构推荐算法数据结构大数据数据库架构
全球软件技术峰会2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴在软件定义未来的时代，人工智能与数字化技术正以颠覆性力量重塑全球产业格局。2025年8月15-16日，以"全球专家、卓越智慧"为宗旨的全球软件技术峰会将盛大启幕，特邀全球近50位来自微软、谷歌、亚马逊、字节跳动等企业的技术领袖及一线实战专家，围绕大模型智能应用开发、AI与ML智能运维、软件开发智能化、架构设计与演进四大核
AI产品经理面试宝典第42天：学习方法与产品流程解析 TGITCIC AI产品经理一线大厂面试题产品经理 AI面试大模型面试 AI产品经理面试大模型产品经理面试 AI产品大模型产品
具体问答：学习产品及AI知识的方法问：请谈谈您是如何学习产品及AI知识的，以及您认为哪些资源对您帮助最大答：我的学习体系包含三个维度：分层知识架构、实践验证闭环、资源筛选机制。在知识获取阶段，采用「理论-案例-工具」三级学习法：通过《人工智能：一种现代的方法》构建AI基础框架，用TensorFlow官方文档掌握工程实现，结合《启示录》《俞军产品方法论》理解产品逻辑。实践环节采用「项目反哺」模式，例
Spring Boot+Redis+Caffeine 二级缓存架构的终极实现方案、包含万级QPS下的黄金配置参数、全文超过2500字（博君一赞）夜雨hiyeyu.com java spring boot redis 架构后端 java spring cloud spring
SpringBoot+Redis+Caffeine二级缓存架构的终极实现方案、包含万级QPS下的黄金配置参数、全文超过2500字（博君一赞）一、架构设计原理（10万QPS基石）设计优势：二、Caffeine本地缓存原子级配置1.高性能缓存构造器2.容量智能计算算法3.动态TTL策略三、Redis集群极致优化（支撑百万OPS）1.Lettuce连接池配置2.Redis服务端关键配置3.Pipelin
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
python 密码学模块_Python加密与解密 No module named 'Crypto' weixin_39827304 python 密码学模块
DES加密全称为DataEncryptionStandard，即数据加密标准，是一种使用密钥加密的块算法入口参数有三个：Key、Data、ModeKey为7个字节共56位，是DES算法的工作密钥；Data为8个字节64位，是要被加密或被解密的数据；Mode为DES的工作方式,有两种:加密或解密3DES(即TripleDES)是DES向AES过渡的加密算法使用两个密钥，执行三次DES算法加密的过程是
从PRISM开始学WPF（九）交互Interaction？ weixin_34204057 测试 shell
原文:从PRISM开始学WPF（九）交互Interaction？0x07交互这是这个系列的最后一篇了，主要介绍了Prism中为我们提供几种弹窗交互的方式。Notification通知式Prism通过InteractionRequest来实现弹窗交互，它是一个泛型接口，不同的类型对应不同类型的弹窗方式。在使用InteractionRequest的时候需要在，xaml中需要注册一个Trigger：In
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

统计学习方法 支持向量机（上）

文章目录

统计学习方法 支持向量机（上）

线性可分支持向量机与硬间隔最大化

定义

硬间隔最大化

对偶算法

线性支持向量机与软间隔最大化

定义

软间隔最大化

对偶算法

合页损失函数

你可能感兴趣的:(#,ML,1024程序员节,机器学习,人工智能,算法,支持向量机)

统计学习方法支持向量机（上）

统计学习方法支持向量机（上）