sunMoonStar_c

机器学习西瓜书笔记：支持向量机SVM（support vector machines）

一、概念

支持向量机

分类学习的基本思想：基于训练样本集 $D = \{(x_1,y_1),(x_2,y_2),....,(x_m,y_m)\}, yi∈\{-1,+1\}$ ，在样本空间找到一个划分超平面，将不同类别样本分开

支持向量机：分类问题，对于线性可分的数据集，找距离正负样本都最远的超平面模型。（感知机的超平面解可能不唯一，但是SVM解是唯一的）

位于两类样本正中间的，对训练样本局部扰动的容忍性最好，产生的分类结果最健壮（robust），对未见示例的泛化能力最强。

对于泛化能力最强的解释：

如图，如果我们选择的超平面是红色，他距离正负样本的距离不是都是最远，则对于新的正样本（紫色），会把它划分到负样本中，即泛化能力不强。

而SVM找到的超平面是绿色，明显泛化能力更好，分类错误情况更少。

支持向量support vector

距离超平面最近的训练样本点

超平面 $\vec{w}^T\vec{x} + b= 0$

超平面方程和性质

1、超平面方程： $\vec{w}^T\vec{x} + b= 0$ （回忆神经网络时b是 $-\theta$ 阈值）

n=1，超平面是一个点
n=2，超平面是一条直线
n=3，超平面是一个面
…

超平面可记为 $(\vec{w}, b)$

2、超平面性质：以n=2时， $w_1 = w_2 = 1, b= -1$ 超平面为例

超平面方程不唯一，每一项添加一个系数，结果还是一样
法向量 $\vec{w}$ 垂直于超平面：如图法向量 $\vec{w} = (w_1,w_2) = (1,1)$ ，决定超平面的方向
法向量 $\vec{w}$ ，和位移项 $b$ ，确定一个唯一的超平面
法向量 $\vec{w}$ 指向的一半为正空间，另一半为负空间。
- 正空间内的点，带入 $\vec{w}^T\vec{x} +b > 0$
- 负空间内的点，带入 $\vec{w}^T\vec{x} +b < 0$
- 超平面上的点，带入 $\vec{w}^T\vec{x} +b = 0$

样本点到超平面的距离：几何间隔的一部分

样本空间中任意点 $\vec{x}$ 到超平面 $(\vec{w}, b)$ 的距离 $r$

该公式其实想一下对于直线 $A x + B y + C = 0$ ,平面上任意一点 $x_0, y_0)$ 到直线的距离公式是： ${|Ax_0 + Bx_0+C|}\over {\sqrt{A^2+B^2}}$ 即可对应 $n 维$ 空间公式。

具体推导过程：

几何间隔margin：不按照西瓜书

西瓜书对于间隔的定义：

间隔margin：两个异类支持向量 到超平面的距离之和

该公式跳了很多步骤，西瓜书会对正确分类的SVM超平面模型假设为6.3，这里的+1，-1其实可以是任意常数，对结果w，b不影响，因为系数可以缩放。

这里规定是+1，-1，也就决定了支持向量到超平面距离=1，则异类支持向量到超平面距离之和就如6.4所示。

后面的推导，没有先假设是+1，-1，而是到了最后一步，令分子=1，反正就是这些系数全都可以为了计算随意设置，不影响求w和b

非西瓜书

1、数据集中的样例点 $(\vec{x_i}, y_i), y_i \in \{-1,1\},i=1,2,..,m$ 关于超平面 $\vec{w}^T\vec{x} + b= 0$ 几何间隔 $\gamma_i$ ：

几何间隔不仅能体现真实间隔大小，即样本点到超平面的距离r，还能体现分类是否正确

分类正确时，几何间隔 $\gamma_i > 0$
分类错误时，几何间隔 $\gamma_i <0$

证明：

正空间内的点，带入 $\vec{w}^T\vec{x} +b > 0$
- 分类错误：真实标记 $y_i=-1$ ，则 $\gamma_i$ <0
- 分类正确：真实标记 $y_i=1$ ，则 $\gamma_i$ >0
负空间内的点，带入 $\vec{w}^T\vec{x} +b < 0$
- 分类错误：真实标记 $y_i=1$ ，则 $\gamma_i$ <0
- 分类正确：真实标记 $y_i=-1$ ，则 $\gamma_i$ >0
超平面上的点，带入 $\vec{w}^T\vec{x} +b = 0$

2、数据集 $X$ 到超平面的几何间隔：定义为 $X$ 中所有样本点的几何间隔的最小值

二、SVM

1、模型：实现分类的最大间隔超平面

我们直接规定该超平面是正确分类的，分类功能套个sign函数，把实值变为分类值1，-1.

当前数据集线性可分，代表我们必然能找到能正确划分的超平面，也就是我们最优化间隔过程结束后，找到的最大的 $\gamma$ 必然是>0的。
因此一开始我们应当规定超平面模型就是正确分类的模型，没必要考虑无法正确分类，因为对于线性可分数据集不可能。

接下来就是对这个能正确分类的超平面，使其损失函数最小化，也就是间隔最大化。

2、策略：推导损失函数

最终目的：SVM要求一个超平面 $\gamma$ ，该超平面的几何间隔是所有超平面中最大的。

同时几何间隔自身要满足约束条件： $\gamma = \min \gamma_i$ ，即是数据集中样本点到超平面距离的最小值。

首先回忆样本点到超平面的间隔公式：

SVM问题转化为：

这里的(xmin,ymin)就是西瓜书定义的支持向量

分母相同，去掉，问题变为：

求最优解需要限制 $(\vec{w}^*, b)$

在求解之前还要继续变化问题形式，直到是一个可以求出固定最优解的最小化问题

求能得到最大几何间隔的最优解 $(\vec{w}^*, b)$ 。

但是此条件极值问题，和LDA中一样，无法直接求解。

因为假设最优解为 $(\vec{w}^*, b)$ ，则 $(\alpha\vec{w}^*,\alpha b)$ 必然也是最优解，会上下约分掉。

因此必须对 $(\vec{w}^*, b)$ 做出限制：通常是固定分子或者分母为一个固定常数值。不固定的话，系数 $\alpha$ 随便取了，无法求解；固定的话，就必须存在唯一一个 $\alpha$ 满足此等式。

SVM固定分子：相当于规定支持向量距离超平面1

问题转化为：

最大化问题转最小化问题

通常把最大化问题转化为最小化问题，毕竟是叫损失函数，则把max的变成其倒数，约束写成<=0的形式。

而为了后面计算，如求导方面，写成 ${1\over 2}$ 模长的平方。

最优化主问题为：

3、求解：转化为拉格朗日对偶问题

3.1、主问题：其实本身已经是凸优化问题

该主问题满足：

是凸优化问题
具有强对偶性：则对偶问题的最优解就是主问题的最优解。证明见后面

因此虽然主问题本身已经是凸优化问题，有现成优化计算包求解，但是转化为对偶问题求解更加高效。

3.2、拉格朗日函数：

对m条不等式约束添加拉格朗日乘子 $\alpha_i$ ，对偶问题要求 $\alpha_i \ge 0$

3.3、求解对偶函数 $\Gamma(\vec{\alpha})$ = $\inf L(\vec{w}, b,\vec{\alpha)}$

也就是求L的最小值，求L最小值为啥我们求偏导=0呢？有如下几种理解：

凸函数的性质：该拉格朗日函数把w,b变成 $\hat{\vec{w}}$ ，是关于 $\hat{\vec{w}}$ 的凸函数，则对其求偏导=0，解出来的一定是最优解。
该SVM问题强对偶性成立，则主问题的最优解必然满足5个KKT条件，条件一就是拉格朗日函数的最优解带入偏导数=0

矩阵，向量求偏导常用公式：

带入偏导=0，得到对偶函数 $\Gamma(\vec{\alpha})$ = $\inf L(\vec{w}, b,\vec{\alpha)}$ 为：

3.4 对偶问题

对偶问题的定义

这里给出简单定义，后面有详细讲解

SVM的对偶问题：6.11

有了对偶函数，根据对偶问题需要的约束条件 $\alpha_i \ge 0$ ，以及题目本身需要的约束，得到对偶问题

强对偶性成立还需要满足KKT条件

KKT条件见后面讲解

3.5 求解6.11对偶问题

后面再讲

将样本从低维映射到高维。
则高维的划分超平面模型为：

对偶问题变为：

问题：原始样本映射到的高维特征空间，可能维数特别大，甚至是无穷维，则计算6.21 $\phi(\vec{x}_i)^Tphi(\vec{x}_i)$ 会很困难。

解决：引入核函数 $\kappa(·,·)$

该核函数，把原本高维内积问题变成：在原始样本维度上做内积

6.21对偶问题重写为：求出使得对偶问题最大化的核函数值

需要求解的超平面模型为：

根据6.9： $\vec{w} = \sum_{i=1}^m\alpha_i y_i \phi(\vec{x}_i)$

支持向量展式（support vector expansion）

6.24表示：超平面模型的最优解，可以通过训练样本 $\vec{x}$ 的核函数展开

则只要知道了核函数，就能求出超平面模型。

核函数的选取需要满足两个条件，见附录。

常用核函数如下：都满足核函数定理

选取一个合适的核函数，映射到合适的特征空间，求出性能佳的划分超平面模型。

公式推导过程：

附录1：凸优化问题

凸函数：海塞矩阵是正定或者半正定

凸优化问题：

目标函数是凸函数
约束集合是凸集

特别地：如下情况也是凸优化问题
1、目标函数是凸函数
2、约束集合是凸集
3、不等式约束函数是凸函数
4、等式约束函数是线性函数

显然SVM是个凸优化问题。

附录2：针对任意优化问题：转化为对偶问题dual problem

不管你主问题是不是凸优化问题，其对偶问题必然是凸优化问题

1、一般的优化问题：即不一定是凸优化问题

1、形式

2、该优化问题的定义域 $D$ 为是每个函数定义域的交集：

3、可行集 $\tilde{D}$ ：即定义域中能满足约束条件的

4、最优值 $p^* = \min\{f(\vec{\tilde{x}})\}$ , $\vec{\tilde{x}} \in \tilde{D}$ ，即被优化函数 符合约束条件时（可行集上） 的最小值

2、一般优化问题的拉格朗日函数

3、拉格朗日对偶函数 $\Gamma(\vec{\mu}, \vec{\lambda})$

下确界：简单理解为下界。记为 $i n f (f (x))$

如 $f(x) = e^x$ ， $i n f (f (x)) = 0$
f无下界， $-\infin$

定义优化问题的 拉格朗日对偶函数 $\Gamma(\vec{\mu}, \vec{\lambda})$ 为：拉格朗日函数 $L(\vec{x}, \vec{\mu}, \vec{\lambda})$ 在 $D$ 上的下确界：

对偶函数的2个性质：

性质2证明：

最优值 $p^* = \min\{f(\vec{\tilde{x}})\}$ , $\vec{\tilde{x}} \in \tilde{D}$ ，即被优化函数 符合约束条件时（可行集上） 的最小值
可行集 $\tilde{D}$ ：即定义域中能满足约束条件的

1、证明 $\Gamma(\vec{\mu}, \vec{\lambda}) \leq p^*$ ，即证： $\Gamma(\vec{\mu}, \vec{\lambda}) \leq \min\{f(\vec{\tilde{x}}\})$ ；即证： $\Gamma(\vec{\mu}, \vec{\lambda}) \leq f(\vec{\tilde{x}})$

2、即证: $\inf_{\vec{x} \in D} L(\vec{x}, \vec{\mu}, \vec{\lambda}) \leq f(\vec{\tilde{x}})$ 。

左边是拉格朗日函数全局定义域上符合约束条件的下界，肯定比更小定义域范围的可行集上的函数值更小，则 $\inf_{\vec{x} \in D} L(\vec{x}, \vec{\mu}, \vec{\lambda}) \leq L(\tilde{\vec{x}}, \vec{\mu}, \vec{\lambda})$

3、即证 $L(\tilde{\vec{x}}, \vec{\mu}, \vec{\lambda}) \leq f(\vec{\tilde{x}})$ :

根据可行集上的点符合约束条件的而行之，很容易就能证明
证明过程倒推即可。

4、拉格朗日对偶问题：恒为凸优化问题；求对偶函数最大值

原优化问题称为：主问题

拉格朗日对偶问题：注意拉格朗日参数要求都>=0

定义就是求对偶函数最大值的优化问题！！

对偶问题恒为凸优化问题

5、强对偶性：解释为啥SVM是凸优化问题还用对偶问题求解

首先SVM问题强对偶性成立，因此对偶问题的最优解（求最大值）就是原问题（求最小值）的最优解。也就是说是可以求解
对偶问题的参数是拉格朗日乘数，和样本量m成正比。而原问题和特征向量的维数n成正比。一般维数n远大于样本量m，此时用对偶问题求解更高效。

之前证明了对偶函数的性质2：
$\vec{\mu} \succcurlyeq 0时，\Gamma(\vec{\mu}, \vec{\lambda}) \leq p^* = \min\{f(\tilde{\vec{x}})\}$

把对偶问题的最优值记为： $d^* = \max\{\Gamma(\vec{\mu}, \vec{\lambda})\} \leq p^*$ 。此时称为弱对偶性成立

当 $d^* = p^*$ 时，称为强对偶性成立

何时强对偶性成立？显然SVM成立

SVM的主问题是凸优化问题
且可行集中存在一点能使得 所有不等式约束的不等号成立

附录3：KKT条件：5个（强对偶性成立时需要满足）

SVM强对偶性成立，则必然满足入五个条件：

$\vec{x}^*$ ：主问题的最优解
$(\vec{\mu}^*, \vec{\lambda}^*)$ ：对偶问题的最优解

最优解必须满足：

对参数求偏导=0：拉格朗日乘数法就满足了
等式约束成立
不等式约束成立
不等式约束的m个拉格朗日乘数必须>=0
不等式约束的拉格朗日乘数*不等式约束 = 0

附录4：核函数

问题：原始维度的样本空间内，不存在一个能正确划分两类样本的超平面

如：异或问题

解决：把样本 $\vec{x}$ 映射到更高维的特征空间，映射后的样本为 $\phi(\vec{x})$ 。样本在此高维特征空间内线性可分。（原始空间时有限维，即属性有限，则必然存在一个高位特征空间使得样本线性可分）

二维特征空间，映射到三维特征空间。找到划分超平面

核函数 $\kappa$ 和映射 $\phi$ 是一一对应的，已知一个，就能求出另一个。

核函数的形式不能随意取，需要满足一定条件

高斯核函数

我们知道了若满足上述两个条件，核函数则能写成向量内积形式。
虽然依然不知道如何求出 $\phi$ 映射函数的形式。但是可以求出 $\vec{w}^T\phi(\vec{x})+b$ ，则模型有了，样本也可以划分类别了

使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
深入探索 PyTorch 在语音识别中的应用 Zoro｜ PyTorch Deep Learning 机器学习 pytorch 语音识别人工智能
深入探索PyTorch在语音识别中的应用在本篇博客中，我将分享如何使用PyTorch进行语音识别任务，重点围绕环境配置、数据预处理、特征提取、模型设计以及模型比较展开。本文基于最近一次机器学习作业（HW2）的任务内容，任务目标是对语音信号进行逐帧音素预测，从而完成多类别分类任务。一、介绍任务背景任务目标：利用深度神经网络对语音信号进行逐帧音素预测。音素定义：音素是语音中能够区分单词的最小语音单位。
MNIST数据集&手写数字识别 Zoro｜ keras tensorflow 人工智能机器学习
TensorFlow是一个开源的机器学习框架，由Google开发并发布。它提供了一种基于数据流图的编程模型，用于构建和训练机器学习模型。TensorFlow的核心概念是张量（Tensor）和流图（Graph）。张量是TensorFlow中的基本数据单位，可以理解为多维数组，可以是标量、向量、矩阵或更高维度的数组。流图是由一系列操作（Operation）和张量组成的。操作定义了计算和转换张量的方式。
OpenLSD是一个自适应开源数据集，旨在支持逻辑综合中的多种机器学习任务。数据集
2024-11-14，由中国科学院计算技术研究所、鹏城实验室和北京大学等联合创建OpenLSD数据集，目的为逻辑综合过程中的机器学习任务提供一个自适应的数据集生成框架。该数据集的核心研究问题是如何在逻辑综合的三个基本步骤——布尔表示、逻辑优化和技术映射中，通过机器学习方法提升效率和质量。一、研究背景：逻辑综合是电子设计自动化（EDA）流程中的关键环节，它负责将高级设计规范转化为门级网络列表。近年来
【Python】测试数据生成工具 --- Faker pythonfaker数据分析
Faker库介绍Faker是一个强大的库，能够帮助开发者和测试人员生成大量的假数据，但这些数据看起来却非常真实。它支持生成多种类型的数据，如姓名、地址、公司名称、电子邮件等，甚至能够根据不同国家的特定文化生成相应的数据。Faker的应用不仅限于测试，它还广泛应用于数据分析、机器学习训练集的准备以及任何需要大量样本数据的场景。Faker安装前提：已安装python、pip安装命令如下：pipinst
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
机器学习线性回归学习心得_线性回归为机器学习的初学者解释 weixin_26750481 机器学习 python 人工智能逻辑回归深度学习
机器学习线性回归学习心得Datasciencewiththekindofpoweritgivesyoutoanalyzeeachandeverybitofdatayouhaveatyourdisposal,tomakesmart&intelligentbusinessdecisions,isbecomingamust-havetooltounderstandandimplementinyouror
统计机器学习 (Statistical Machine Learning) 原理与代码实例讲解 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
统计机器学习(StatisticalMachineLearning)原理与代码实例讲解1.背景介绍统计机器学习是现代人工智能和数据科学的核心领域之一。它结合了统计学和计算机科学的理论与方法，通过数据驱动的方式来构建预测模型和决策系统。统计机器学习不仅在学术研究中占据重要地位，还在工业界有广泛应用，如推荐系统、图像识别、自然语言处理等。2.核心概念与联系2.1统计学与机器学习的关系统计学关注数据的收
【python 机器学习】sklearn数据集的使用人才程序员 python 机器学习 sklearn 人工智能深度学习神经网络目标检测
文章目录sklearn数据集的使用1.`sklearn`内置数据集2.导入`sklearn`数据集3.加载和使用Iris数据集3.1加载数据3.2查看数据3.3使用数据集进行分类任务4.加载和使用Digits数据集4.1加载数据4.2查看数据4.3使用数据集进行分类任务5.加载和使用BreastCancer数据集5.1加载数据5.2查看数据5.3使用数据集进行分类任务6.总结sklearn数据集的
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南 2401_85702623 conda pip python
标题：【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南Conda是一个强大的包管理器和环境管理器，广泛用于Python社区，尤其是在数据科学和机器学习领域。尽管Conda本身可以处理大多数包的安装和管理，但有时我们可能仍需使用pip来安装特定的Python包。本文将详细解释如何在Conda环境中使用pip，包括配置、安装包、环境管理等，确保您可以充分利用这两个工具的优势。1.C
量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
运维Tips | Ubuntu 24.04 安装配置 samba 文件共享全栈工程师修炼指南企业IT运维实践运维 ubuntu linux 服务器
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]Ubuntu24.04安装配置samba文件共享描述：我们将Ubuntu24.04作为机器学习的工作站，往往需要将Ubuntu24.04中的数据或者代码共享给我们其他使用Windows系统的小伙伴，此时我们可以使用SAMBA，开辟出一个文件共享目录供大家进行数据交换使用。SAMBA是什么?在Linux中，SAMBA是一个开源的软件套件，它提供了
人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）基尼系数基于熵机器学习入门
在决策树应用一文中，在构建决策分类树应用决策算法时，介绍了基尼系数（GiniIndex）和基于熵（Entropy）两种算法。本文通过实例来更加深入的介绍一下这两个算法。仍然以简单的数据为例：id喜欢颜色是否有喉结身高性别1绿否165女2蓝是170男3粉否172女4绿是175男基尼系数分别对喜欢颜色是否有喉结求基尼系数如下：喜欢的颜色id喜欢颜色性别1绿女2蓝男3粉女4绿男对于姓别女分类而言，数据如
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR