一碗姜汤

机器学习——支持向量机

首先区分一对概念：

线性可分：存在一条直线或一个平面或超平面，可以将样本集分开。

非线性可分：不存在......

这里我们假设中间那条直线的方程为： $\omega_1x_1+\omega_2x_2+b=0$

权重（weight）： $\omega_1, \omega_2$

偏置（bias）：

值得注意的是：在直线的两侧，直线方程分别 大于零 和 小于零 ，这个规定可以是人为的。

接着用数学严格定义训练样本以及他们的标签：

假设：有个样本和他们的标签。 $\{(X_1,y_1),(X_2,y_2),...,(X_N,y_N)\}$

其中 $X_i=[x_{i1},x_{i2}]^T\ ,y_i=\{+1,-1\}$

规定：如果 $X_i\in c_1$ ，则反之，

线性可分的严格定义：

一个训练样本集 $\{(X_1,y_1),(X_2,y_2),...,(X_N,y_N)\}$ 在 $i=1\sim N$ 线性可分，是指存在 $(\omega_1,\omega_2,b)$ ，使得对 $i=1\sim N$ ，有：

（1）若，则 $\omega_1x_1+\omega_2x_2+b>0$

（2）若，则 $\omega_1x_1+\omega_2x_2+b<0$

我们也可以用向量的方式定义线性可分：

假设： $X_i=\begin{bmatrix} x_{i1}\\x_{i2} \end{bmatrix}^T \omega=\begin{bmatrix} \omega_1\\\omega_2 \end{bmatrix}^T$ 则：

（1）若，则 $\omega^TX_i+b>0$

（2）若，则 $\omega^TX_i+b<0$

进一步我们可以化简为如下形式：

如果就取 $\pm1$ 那么一个训练样本集 $\{(X_i,y_i)\}$ ，在 $i=1\sim N$ 线性可分，是指：

存在 $(\omega,b)$ ，使得对 $i=1\sim N$ ，有： $y_i(\omega^TX_i+b)>0$

思考题：

（1）能否给出实际生活中，训练样本集是线性可分和不可分的例子？大多数实际生活中的例子是线性可分还是线性不可分？

（2）请对类别数大于2的情况，给出线性可分与线性不可分的严格数学定义。

（3）请通过数学定义严格证明：在二分类情况下，如果一个数据集是线性可分的，那么一定存在无数多个超平面将这两个类别完全分开。

Vladimir Vapnik提出的支持向量机算法分成如下两个步骤：

一、解决线性可分问题；

二、再将线性可分问题中，获得的结论推广到线性不可分的情况

首先解决线性可分问题，对于那无数多个分开各个类别的超平面中，到底哪一个是最好的呢？

结合没有免费午餐定理，我们需要对为什么2号线是最好的做出一定的假设（这种假设可以有很多种）：假设训练样本的位置在特征空间上有测量误差，如图：

如果为1号线，则会导致分类错误。而二号线依旧能分类正确。换言之，二号线更能抵御训练样本位置的误差。接下来是个关键的问题，二号线是怎么画出来的？

基于最优化理论，对于任何一条分开圆圈和叉的直线，把这条直线朝一侧平行地移动，直到插到一个或几个训练样本为止，同时也朝另外一侧相同做法，如图所示：

定义那两条直线为数据集的支持向量（support vector）,而在其余样本上的平行直线称为：非支持向量把平行线之间地距离称为间隔（margin）。而我们想要求得的二号线是使间隔最大的线。为了使找到的线唯一，还需让这条线在上下两个平行线的中间。

总而言之，支持向量机寻找最优分类直线应满足：

（1）该直线分开了两类。

（2）该直线最大化间隔。

（3）该支线处于间隔的中间，到所有支持向量的距离相等。

思考题：证明：在线性可分的条件下，有且只有唯一一条直线满足上面三个条件。

以下用严格的数学，把支持向量机，寻找最优分类超平面的问题写成一个最优化问题：

目标：最小化（Minimize）： $\frac{1}{2}\|\omega\|^2$

限制条件： $y_i(\omega^Tx_i+b)\geq1$ ， $(i=1\sim N)$

可以看出来是个凸优化问题（ Convex Optimization ）中的二次规划问题

二次规划的定义：

（1）目标函数（Objective Function）是二次项。

（2）限制条件是一次项。

凸优化问题要么无解，要么只有唯一的最小值。

——在实际当中，如果一个问题是凸优化问题，那么我们会把它当成一个已经解决的问题，

因为凸优化问题只有唯一的一个全局极值。我们可以应用梯度下降的算法，可以很方便求得它的解。

求解凸优化问题是一门专门的课程。

这里需要注意的是，已知：训练样本集 $\{(X_i,y_i)\}$ ， $i=1\sim N$ 待求： $(\omega,b)$

想要推出以上式子，需要知道以下事实：

事实1： $\omega^Tx+b=0$ 与 $(a\omega^T)x+(ab)=0$ 是同一个超平面 $(a\neq0)$

事实2：一个点到超平面 $\omega^Tx+b=0$ 的距离 $d=\frac{|\omega^T x_0+b|}{\|\omega\|}$

基于事实1，我们可以用  去缩放 $\omega b$ ： $(\omega,b)\to(a\omega,ab)$

最终使在支持向量  上有： $|\omega^Tx_0+b|=1$

而在支持向量外侧，非支持向量上有： $|\omega^Tx_0+b|>1$

从而有了限制条件： $y_i(\omega^Tx_i+b)\geq1,\ i=1\sim N$ （其中：是为了协调超平面的左右。）

值得注意的是如果把上式的  改成，那么 $(\omega,b)$ 会比原来相差一个  ，仍代表同一个平面。

根据事实2，支持向量  到超平面的距离将会变为 $d=\frac{|\omega^T x_0+b|}{\|\omega\|}=\frac{1}{\|\omega\|}$

最大化支持向量到超平面的距离 等价于 最小化 $\|\omega\|$ ，为了后续求导会更加方便，

把优化问题定为：最小化 $\frac{1}{2}\|\omega\|^2$

思考题：支持向量机的限制条件如果从大于1变成大于等于2，则（w,b）会变成（aw,ab），如果Xi和w都是M维的向量，那么算出a是多少？——我猜是2.

如果训练样本集是线性不可分的，那么以上优化问题的解是什么呢？

显然无解，这时需要适当地放松限制条件，使上面的最优化问题变得有解。

思路：设置松弛变量 $\delta_i$ （slack variable）

限制条件改写为： $y_i(\omega^TX_i+b)\geq1-\delta_i,(i=1\sim N)$

当然我们还应该加入新的限制使每一个 $\delta_i$ 能够尽量小。

改造后的支持向量机优化版本：

目标：最小化（Minimize）： $\frac{1}{2}\|\omega\|^2+C\sum^N_{i=1}\delta_i$ 或者 $\frac{1}{2}\|\omega\|^2+C\sum^N_{i=1}\delta_i^2$

限制条件： $\begin{array}{lcl} (1)\delta_i\geq0,(i=1\sim N)\\ (2)y_i(\omega^TX_i+b)\geq 1-\delta_i,(i=1\sim N) \end{}$

——比例因子C起到了平衡两项的关键作用，是人为设定的，我们把认为事先设定的参数叫做算法的超参数（Hyper Parameter）

一般在实际应用中，会不断变化C的值，同时测试算法的识别率，再选取合适的超参数C。

支持向量机是超参数很少的算法模型。

以下是求得的结果，显然未达到求解的目的。那么问题出在哪里呢？

问题在于：我们的算法模型是线性的，即我们假设分开两类的函数是线性的，但是线性模型的表现力是不够的。因此我们只有扩大可选的函数范围，使它超越线性，才有可能应对各种复杂的线性不可分场景。

思考题：对于上图，需要有一个椭圆，来分开圆圈和叉，另一个方面，我们也可以对特征空间的两个维度x1和x2做某种非线性变换从而把本来线性不可分的线性样本集变为线性可分。这个变换如何设计？

支持向量机在扩大函数可选范围方面可谓独树一帜：

神经网络采取的是多层的非线性函数的组合的方式，而支持向量机的做法则是通过特征空间由低维映射到高维，然后在高位的特征空间当中仍然用线性超平面对数据进行分类。

映射函数： $\varphi(x):$

例如：

原本线性不可分的数据集变成了线性可分。

一般结论：

假设在一个M维空间上随机取N个训练样本，随机的对每一个训练样本赋予标签+1或-1，同时假设这些训练样本线性可分的概率为P(M)则有当M趋于无穷大时，P(M)=1.

将训练数据从低维映射到高维，会增大线性可分的概率。

其实很好理解，当我们增加特征空间的维度时，待估参数（w,b）的维度也增加。即整个算法模型的自由度增加。当然就更有可能分开低维时候无法分开的数据集。

如何构造 $\varphi(x)$ 就成了一个关键性的问题。这里先假设 $\varphi(x)$ 已经确定，那么原先的优化问题只需改变一点点：

目标：最小化（Minimize）： $\frac{1}{2}\|\omega\|^2+C\sum^N_{i=1}\delta_i$ 或者 $\frac{1}{2}\|\omega\|^2+C\sum^N_{i=1}\delta_i^2$

限制条件： $\begin{array}{lcl} (1)\delta_i\geq0,(i=1\sim N)\\ (2)y_i(\omega^T\varphi(X_i)+b)\geq 1-\delta_i,(i=1\sim N) \end{}$ （ $\omega$ 的维度与 $\varphi(X_i)$ 相同）

我们仍然可用凸优化理论求解。

为了具体研究 $\varphi(x_i)$ 的形式，我们引入核函数：

理念是这样的：我们可以不用知道 $\varphi(x)$ 的具体形式，取而代之，如果对任意两个向量X1和X2.

我们知道 $K(X_1,X_2)=\varphi(X_1)^T\varphi(X_2)$ 那么我们仍然能够通过一些技巧获得一个测试样本的类别信息，从而完成对测试样本类别的预测。在这里我们定义为核函数（Kernel Function

并且结果是一个实数。核函数和映射 $\varphi$ 是一一对应的关系。

——需要指出的是核函数的形式不能随意的取。需要满足一定的条件才能分解为两个 $\varphi$ 内积的形式。

能写成 $\varphi(X_1)^T\varphi(X_2)$ 的充要条件:

（1）（交换性）

（2） $\forall C_i(i=1\sim N),\forall N$ 有 $\Sigma^N_{i=1}\Sigma^N_{j=1}C_iC_jK(X_iX_j)\geq0$ （半正定性）

虽然无法知道 $\varphi(x)$ 的值，但却可以通过核函数有办法知道 $\omega^T\varphi(x)+b$ 的值。

引入原问题和对偶问题：

原问题（Prime problem）:

最小化： $f(\omega)$ 自变量为： $\omega$ 多维向量

限制条件（Subject to）： $\begin{array}{clc} g_i(\omega)\leq0\quad i=1\sim K\\ h_i(w)=0\quad i=1\sim m \end{array}$

定义该原问题的对偶问题过程如下：

首先定义一个函数： $\begin{array} {lcr} L(\omega,\alpha,\beta)=f(\omega)+\Sigma^K_{i=1}\alpha_i g_i(\omega)+ \Sigma^K_{i=1}\beta_ih_i(\omega)=f(\omega)+\alpha^T g(\omega)+ \beta^T h(\omega) \end{array}$

其中： $\begin{array}{lcl} \alpha=[\alpha_1,\alpha_2,...,\alpha_K]^T\\ \beta=[\beta_1,\beta_2,...,\beta_M]^T\\ g(\omega)=[g_1(\omega),g_2(\omega),...,g_K(\omega)]^T\\ h(\omega)=[h_1(\omega),h_2(\omega),...,h_M(\omega)]^T \end{array}$

对偶问题如下：

最大化： $\theta(\alpha,\beta)=inf\ L(\omega,\alpha,\beta)$ ：

（意思是：遍历所有定义域内的 $\omega$ ，找到使最小的 $\omega$ ,并把这个值赋给 $\theta(\alpha,\beta)$ ）

限制条件： $\alpha_i\geq0, i=1\sim K$

综合员问题和对偶问题定义得到：

定理一：

如果 $\omega^*$ 是原问题的解， $(\alpha^*,\beta^*)$ 是对偶问题的解，则有 $f(\omega^*)\geq\theta(\alpha^*,\beta^*)$

其中： $g(\omega^*)\leq0$ ， $h(\omega^*)=0$ ， $\alpha(\omega^*)\geq0$

我们把 $f(\omega^*)-\theta(\alpha^*,\beta^*)$ 定义为对偶差距（Duality Gap）

强对偶定理：

如果 $g(\omega)=A\omega+b,h(\omega)=C\omega+d$ ， $f(\omega)$ 为凸函数，则有 $f(\omega^*)=\theta(\alpha^*,\beta^*)$ ,即对偶差距为0.

换言之，如果原问题的目标函数是凸函数，而限制条件是线性函数，那么原问题的解和对偶问题的解就会相等

KKT条件：

若 $f(\omega^*)=\theta(\alpha^*,\beta^*)$ ，则定理一中必然能够推出，对于所有的 $i=1\sim K$ ，

要么 $\alpha_i=0$ ，要么 $g_i(\omega^*)=0$

将支持向量机的原问题转化为对偶问题：

1. 首先证明支持向量机的原问题满足强对偶定理：

为了将限制条件全部写成小于等于0的形式，先将 $\delta_i$ 变号，整理一下得到：

最小化： $\frac{1}{2}\|\omega\|^2-C\sum^N_{i=1}\delta_i$ 或者 $\frac{1}{2}\|\omega\|^2-C\sum^N_{i=1}\delta_i^2$

限制条件： $\begin{array}{lcl} (1)\delta_i\leq0,\quad (i=1\sim N)\\ (2)1+\delta_i- y_i \omega^T\varphi(X_i)- y_ib \leq 0, (i=1\sim N) \end{}$

可以看到这两个限制条件都是线性的，而目标函数是凸的。所以满足强对偶定理。

值得注意的是这里的 $\omega$ 自变量指的是 $(\omega,b,\delta_i)$ 的组合。

在这个问题当中没有等式约束条件，不存在 $h_i(\omega)$

对偶问题如下：

最大化： $\theta(\alpha,\beta)=\inf_{\omega,\delta_i,b}\{ \frac{1}{2}\|\omega\|^2-C\Sigma^N_{i=1}\beta_i\delta_i+\Sigma^N_{i=1}\alpha_i[1+\delta_i-y_i \omega^T\varphi(X_i)- y_ib ]\}$

限制条件： $\begin{array}{lcl} (1)\alpha_i\geq0\\ (2)\beta_i \geq 0\end{}$

因为是遍历每一个 $(\omega,b,\delta_i)$ 的组合，我们可以分别对三个变量求导，并令导数为0。可以得到：

将获得的三个式子代入表达式中，进一步转化对偶问题为：

最大化： $\theta(\alpha,\beta)=\Sigma^N_{i=1}\alpha_i-\frac{1}{2}\Sigma^N_{i=1} \Sigma^N_{j=1}y_iy_j\alpha_i\alpha_j\varphi(X_i)^T\varphi(X_j)$

限制条件： $\begin{array}{lcl} (1)0\leq\alpha_i\leq C ,(i=1\sim N)\\ (2)\Sigma^N_{i=1}\alpha_iy_i=0 ,(i=1\sim N)\end{}$

基于此对偶问题给出支持向量机算法的统一流程：

首先把对偶式子中的 $\varphi(X_i)^T\varphi(X_j)$ 用代替。解出所有的 $\alpha_i ,(i=1\sim N)$ ，

可以根据第一个求导的式子： $\omega=\Sigma^N_{j=1}\alpha_jy_j\varphi(X_j)$ 得到：

$\omega^T\varphi(X_i)=\Sigma^N_{j=1}\alpha_jy_j\varphi(X_j)^T\varphi(X_i) =\Sigma^N_{j=1}\alpha_jy_jK(X_i,X_j)$

再由第一个对偶问题根据KKT定理得到：

而如果对某个， $\alpha_i\neq 0$ 且 $\alpha_i\neq c$ ，则根据KKT条件，必有 $\delta_i=0$ ；且：

所以只需要找一个 $0<\alpha_i<c$ ，就能得到：

算出了b，那么测试样本的类别信息也就知道了 $\omega^T\varphi(X)+b$

根据之前的式子展开得到： $\omega^T\varphi(X)+b= \Sigma_{i=1}^N\alpha_iy_iK(X_i,X)+b$

这一结论被称为核函数戏法（Kernel Trick）

最后得到如下判别标准：

我们一旦知道了所有的 $\alpha_i$ 和，我们就完成了支持向量机的训练过程。

思考题：推到目标函数中 $\delta_i^2$ 的支持向量机训练和测试流程。

我们在应用SVM工具包的时候需要对两个超参进行人为设置：

-c 、-g:

这里gama就是 $\frac{1}{\sigma^2}$

基于人工的经验我们用网格搜索，搜索参数的最佳取值：

暂时先想写这么多了。。。

LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
智能产品经理的核心能力 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
智能产品经理的核心能力1.背景介绍在当今快节奏的数字时代,产品经理扮演着至关重要的角色,他们负责确保产品满足用户需求,实现商业目标,并保持竞争优势。随着人工智能(AI)和机器学习(ML)技术的不断发展,智能产品经理的概念应运而生。智能产品经理需要将传统的产品管理技能与新兴技术相结合,以创建具有创新性和智能化的产品体验。智能产品不仅需要满足功能需求,还需要提供个性化、智能化和无缝的用户体验。这对产品
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
堡垒机操作行为异常检测的机器学习算法应用
一、传统检测模式的困境与机器学习的破局价值在数字化转型浪潮中，堡垒机作为运维安全的核心防线，面临着操作行为复杂度激增与检测能力滞后的双重挑战。传统检测手段主要依赖静态规则库与统计模型，存在三大致命缺陷：规则固化与误报泛滥：某金融机构曾因规则库未及时更新，导致运维人员正常批量操作被误判为“暴力破解”，单日误报量超2000次，消耗安全团队60%的精力。动态行为适应性弱：微服务架构下，运维人员访问路径呈
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
机器学习与光子学的融合正重塑光学器件设计范式 m0_75133639 光电智能电视二维材料电子半导体人工智能顶刊 nature
Nature/Science最新研究表明，该交叉领域聚焦六大前沿方向：光子器件逆向设计、超构材料智能优化、光子神经网络加速器、非线性光学芯片开发、多任务协同优化及光谱智能预测。系统掌握该领域需构建四维知识体系：1、基础融合——从空间/集成光学系统切入，解析机器学习赋能光学的理论必然性，涵盖光学神经网络构建原理2、逆向设计革命——通过AnsysOptics实战，掌握FDTD算法与粒子群/拓扑优化技术
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
全球人工智能与机器学习大会PPT a flying bird 论文解读和大咖技术号记录人工智能
大会演讲PPT合集https://ppt.infoq.cn/list/93PPT分享|ppt|人工智能|aicon|infoq|机器学习PPT分享,前段时间的AICon北京站2021全球人工智能与机器学习大会（https://aicon.infoq.cn/2021/beijing），汇集了很多业界大佬，工业界多个方向的从业人员分享了他们在实际业……https://xw.qq.com/cmsid/2
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
数据挖掘：从理论到实践的深度探索代码老y 数据挖掘人工智能
在当今数字化时代，数据已经成为企业决策的重要依据。数据挖掘作为一门从大量数据中提取有价值信息的技术，已经广泛应用于各个领域，如金融、医疗、零售、互联网等。本文将深入探讨数据挖掘的基本概念、主要技术和实际应用案例，帮助读者更好地理解数据挖掘的价值和应用。一、数据挖掘的基本概念（一）数据挖掘的定义数据挖掘（DataMining）是从大量数据中提取有用信息的过程。它结合了统计学、机器学习、数据库技术和人
开发智能化的企业并购风险评估模型
开发智能化的企业并购风险评估模型关键词：企业并购、风险评估、人工智能、机器学习、深度学习、数学建模摘要：本文详细探讨了开发智能化企业并购风险评估模型的背景、核心概念、算法原理、系统架构设计以及项目实战。通过结合机器学习和深度学习技术，提出了一种基于数据驱动的智能化风险评估方法，旨在帮助企业更准确地识别和预测并购过程中的潜在风险，提升决策的科学性和有效性。第1章:企业并购风险评估模型的背景与问题描述
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
机器学习算法：核心原理与前沿发展综述 fmvrj34202 机器学习算法人工智能
机器学习算法作为人工智能的核心驱动力，正在重塑我们解决问题的范式。本文将系统性地探讨机器学习算法的分类体系、数学基础、优化方法以及最新发展趋势，为从业者提供技术参考。一、算法分类体系根据学习范式，机器学习算法可分为三大类：监督学习：基于标注数据的建模方法线性回归：最小化平方误差的闭式解θ=(XᵀX)⁻¹Xᵀy支持向量机：通过核技巧实现非线性分类，优化目标为max(0,1-yᵢ(w·xᵢ+b))决策
「日拱一码」020 机器学习——数据处理胖达不服输「日拱一码」机器学习人工智能数据处理 python
目录数据清洗缺失值处理删除缺失值：填充缺失值：重复值处理检测重复值处理重复值异常值处理Z-score方法IQR方法（四分位距）数据一致性检查数据转换规范化（归一化）Min-Max归一化MaxAbsScaler标准化离散化等宽离散化等频离散化数据清洗数据清洗是数据处理的第一步，目的是去除噪声数据、处理缺失值和异常值，使数据更加干净、可用缺失值处理删除缺失值：如果数据集中缺失值较少，可以直接删除包含缺
机器学习每周挑战——二手车车辆信息&交易售价数据梦想成为一名机器学习高手机器学习 python 人工智能
这是数据集的截图目录背景描述数据说明车型对照：燃料类型对照：老规矩，第一步先导入用到的库第二步，读入数据：第三步，数据预处理第四步：对数据的分析第五步：模型建立前的准备工作第六步：多元线性回归模型的建立第七步：随机森林模型的建立问题：背景描述本数据爬取自印度最大的二手车交易平台CARS24，包含8000+该平台上交易车辆的关键评估信息。CARS24成立于2015年，总部位于印度古尔冈，是一个在印度
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

机器学习——支持向量机

首先区分一对概念：

接着用数学严格定义训练样本以及他们的标签：

线性可分的严格定义：

进一步我们可以化简为如下形式：

Vladimir Vapnik提出的支持向量机算法分成如下两个步骤：

以下用严格的数学，把支持向量机，寻找最优分类超平面的问题写成一个最优化问题：

如果训练样本集是线性不可分的，那么以上优化问题的解是什么呢？

以下是求得的结果，显然未达到求解的目的。那么问题出在哪里呢？

支持向量机在扩大函数可选范围方面可谓独树一帜：

映射函数：

例如：

为了具体研究的形式，我们引入核函数：

引入原问题和对偶问题：

综合员问题和对偶问题定义得到：

强对偶定理：

KKT条件：