u010366427

coursera机器学习技法笔记(1-4)——Support Vector Machine

1 Linear Support Vector Machine

1.1 Coursera Introduction

　　本门课程主要内容是围绕特征转换进行的，并包括三种主要的思想：
　　(1)怎样使用数字的特征并控制其复杂度：该角度启发了SVM模型。
　　(2)怎样构建并混合使用具有预测能力的特征：启发了adaboost模型。
　　(3)发现并利用潜在的特征：启发了Deep Learning模型。

1.2 Large Margin Separating Hyperplane

　　最大间隔的目标是，使得最靠近划分数据集的超平面的点到超平面的距离最大，同时保证超平面能正确划分所有点。即：

m a x (m i n 1 \dots n d i s t a n c e (x n, w))

s . t . e v e r y y n (w T x n + b) \geq 0

1.3 Standard Large-Margin Problem

　　首先计算 distance(xn,w) ，套用几何公式， xn 到以 w 为法向量的超平面的距离是：

d i s t a n c e (x n, w) = | | w T x n - b | | | | w | |

同时，根据条件限制，我们有

yn(wTxn+b)≥0 ，故上式可写为：

d i s t a n c e (x n, w) = 1 | | w | | y n (w T x n - b)

同时我们可以注意到，对

w 进行放缩(即每个分量同时乘以或除以一个常数)是对

distance(xn,w) 没有影响的，所以我们对

w 进行缩放，令

min　yn(wTxn−b)=1 ，则整个问题变成了：

m a x 1 | | w | |

s . t . m i n y n (w T x n + b) = 1

鉴于约束条件难解，我们在不改变最优解的条件下放宽约束：

m a x 1 | | w | |

s . t . \forall y n (w T x n + b) \geq 1

这样做不改变最优解的原因是，当存在

w 使得

∀yn(wTxn+b)=c≥1 ，我们可以通过不等号两边同时除以

c ，使得

w:=wc,b:=bc 在满足约束的时候获得更大的

1||w|| ，因此最优解一定符合约束条件。
　　最后，我们将优化目标去绝对值，转换为对偶问题，并加上常数方便以后的运算：

m a x 1 2 w T w

s . t . \forall y n (w T x n + b) \geq 1

1.4 Support Vector Machine

　　以上的优化目标可以用二次规划 QP(Q,p,A,c) 解决，二次规划的目标是：

m a x w T Q w + p T w

s . t . A w \geq c

在此将b作为w_0加入 w后对照使用即可。

1.5 Reason behind Large-Margin Hyperplane

　　本节叙述了SVM能工作的理论基础。可以从优化目标内看出，SVM的目标是在限制 yn(wTxn+b)≥1 的条件下对 wTw 取最小，而regularize是在 wTw<c 的前提下使得 yn(wTxn+b) 。
　　从VC维的角度来看，由于限制了最大边际至少大于1，因此使得一些能被PLA打散的数据不能被SVM打散，导致其VC维降低。

2 Dual Support Vector Machine

2.1 Motivation of Dual SVM

　　由于我们希望SVM能进行非线性划分，而通过多项式特征转换进行非线性划分会导致大量的VC维，因此我们希望找到一种方法使得其复杂度能与多项式特征个数无关。
　　本节后半部分介绍了用拉格朗日乘子来解带约束的优化问题，并解释了拉格朗日乘子的工作原理。

2.2 Largrange Dual SVM

　　我们希望将原问题转化为对偶问题：

m i n b, w (m a x a l l α n \geq 0 L (b, w, α)) \geq m a x a l l α n \geq 0 (m i n b, w L (b, w, α))

当满足KKT条件时不等号可以化为等号，推导过程如下：

m a x a l l α n \geq 0 (m i n b, w 1 2 w T w + \sum M n = 1 α n (1 - y n (w T x n + b)))

对上式中最小化部分的

b 求导，并使结果等于0，得到结果：

\sum M n = 1 α n y n = 0

对上式中最小化部分的w求导，并使结果等于0得到结果：

w = - \sum M n = 1 α n y n x n

将这两者分别带入优化目标公式中可以得到对偶问题的优化目标公式：

m a x a l l α n \geq 0, \sum α n y n = 0, w = \sum α n y n x n (- 1 2 | | \sum M n = 1 α n y n x n | | 2 + \sum M n = 1 α n)

　　另外，KKT的条件是：
　　(1)满足原问题的约束；
　　(2)拉格朗日乘子不小于0(在上式中写为

α )；
　　(3)对偶问题的各变量(即

w 和

b )求导结果为0；
　　(4)拉格朗日项(即拉格朗日乘子乘以约束)均为0(要么拉格朗日乘子为0，要么约束项等于0)；
　　可以看出，在以上的推导、转换的过程中已经满足了KKT的全部条件，因此可以判定能转化为对偶问题。

2.3 Solving Dual SVM

　　我们可以将上节的最优化目标增加符号后转换为最小化优化问题，并利用二次规划解 α 。这里需要注意的是，由于在对应的二次优化问题中会出现一个极大密集矩阵 Qp,q=ypyqxpxq ，因此建议使用对SVM特别优化的二次规划计算包。
　　当解得 α 后，我们可以通过

w = - \sum M n = 1 α n y n x n

来解得

w ，并通过

α n (1 - y n (w T x n + b)) = 0

b = y n - w T x n

来解得

b 。以上公式由KKT条件得出。另外我们可以注意到一个有意思的现象是，当

αn 不等于0时，

yn(wTxn+b)=1 ，说明该样本是支持向量。

2.4 Message behind Dual SVM

2.4.1 SVM与PLA的比较
　　可以发现，SVM与PLA在对 w 的求解上都是类似的，即 w 是样本点 xy 的线性组合。其区别在于，SVM采用了支持向量的样本点来求解 w ，而PLA用“犯错”的样本点来进行线性组合求解 w 。
2.4.2 原始SVM与对偶SVM的比较
　　原始SVM是通过拉伸 w 和 b 来找到合适的 w 和 b ，其与 w 的复杂度(特征向量的长度)有密切关系。而对偶问题通过找支持向量(判断 αn 是否为0)来求解 w 。其中，原始问题由于与复杂度关系很大，因此适用于特征不多的情况下，而对偶问题由于表面上与特征数量无关，因此使用在数据量少而特征较多的情况下。
　　但需要注意的是，对偶问题并没有使得计算复杂度与特征数量完全独立，因为在求对偶问题的矩阵时， Qp,q=ypyqxpxq 很明显和特征数量有关系。
另外注意到的一点是，在边界上的点未必是支撑向量，因为它的 αn 也同样可能是0.

3 Kernel Support Vector Machine

3.1 Kernel Trick

　　在SVM的对偶问题中，计算 Qp,q=ypyqxpxq 时依旧会与特征数量相关，因此有一个trick可以简化多次特征的计算，在这里设 z 是 x 的多次特征转换之后的特征：

K (x, x') = z T z' = 1 + \sum n i = 1 x i x' i + \sum n i = 1 \sum n j = 1 x i x j x' i x' j = 1 + x T x + (x T x) 2

　　因此，只要有关

zTz′ 的特征计算，都可以通过计算

xTx 来实现。这个函数叫核函数(kernel function)。同时，我们还可以通过该方法来计算

wTz′ ：

w T z' = (\sum M n = 1 α n y n z n 〗) z' = \sum M n = 1 α n y n z T n z' = \sum M n = 1 α n y n K (x T n x')

其中

M 是支持向量集。通过这种方法，我们能极大缩减高次特征转换所需要的计算资源。

3.2 Polynomial Kernel

　　对核函数的计算进行进一步简化，以二次核函数为例，我们设中间一次项系数为2，代表着我们对高次空间 z 中一次项的系数做了伸缩：

K 2 (x, x') = 1 + 2 x T x + (x T x) 2 = (1 + x T x) 2

可以看到，我们再一次简化了计算。将该方法扩展至高次，并添加系数以控制伸缩程度：

K 2 (x, x') = (δ + γ x T x) Q

　　这样，计算资源再一次得到了缩减，并且可以通过系数来控制伸缩程度。这种放缩的方法本质上对应着距离定义的变化。

3.3 Gaussian Kernel

　　我们可以利用高斯函数作为核函数，即：

K (x, x') = e x p (- γ | | x - x' | | 2)

由于高斯函数可以通过泰勒展开成为无限高次的多项式组合，因此高斯核代表了无限高次的特征转化。
　　但需要注意的是，

γ 过高时依旧会发生过拟合的现象。

3.4 Comparison of Kernels

　　本节对几个kernel做了对比。
　　(1)线性SVM的好处是用原始问题求解速度快，并且不用担心过拟合问题，缺点是不能解决非线性数据分类。
　　(2)多次核的好处是可以解决非线性分类问题，但参数多难以选择，并且在次数高的时候得到的核的值要么很大，要么逼近0，因此在低阶的时候可以考虑使用多次核。同时，当次数很低，例如是2或是3的时候，或许直接构造出多次特征空间然后用线性SVM的原始问题求解可能会更快。
　　(3)高斯核的好处在于非常强大，并且参数少。缺点在于计算复杂，容易过拟合。
　　另外，可以将核函数看成是两个向量的相似度，但是由于核的出处是内积，因此如果要构造新的核，需要在一定程度上满足内积的特点：
　　(1)对称性，所定义的核必须满足两个向量交换位置值不变。
　　(2)所有样本两两之间相互使用核函数进行计算所得到的矩阵是半正定的。

4 Soft-Margin Support Vector Machine

4.1 Motivation and Primal Problem

　　我们在原优化目标的基础上加入容忍错误的条目并使错误更轻成为优化目标之一：

m i n w, b, ε 1 2 w T w + C \sum N n = 1 ε

s . t . \forall y n w T x n + b \leq 1 - ε n

\forall ε n \geq 0

其中，

C 代表了margin的大小与容忍样本错误度的相对比例，

C 越大，代表我们希望错误程度越低，即SVM更严格，margin越低，反之亦然。

εn 代表了第

n 个节点偏离超平面的程度。

4.2 Dual Problem

　　我们按照原来的hard-SVM的方法同样来推导soft-SVM。首先通过拉格朗日乘子将问题转化为min-max问题，然后利用KKT条件转化为max-min问题，在这里注意到的是，设条件 ∀ynwTxn+b≤1−εn 的拉格朗日乘子为 αn ， ∀εn≥0 的拉格朗日乘子为 βn ，则先对 εn 求导，我们可以得到 βn=C−αn ，代入式子后发现和原来hard-SVM的形式相同，因此soft-SVM的对偶形式为：

m a x α (- 1 2 | | \sum M n = 1 α n y n x n | | 2 + \sum M n = 1 α n)

C \geq α n \geq 0

\sum α n y n = 0

其中仅第二行的条件有所区别，原因是新加入条件

βn=C−αn≥0 。

4.3 Message behind Soft-Margin SVM

　　注意到在最后求解 b 的时候Soft-SVM会与hard-SVM有所区别，通过KKT条件我们可以知道：

α n (1 - ε n - y n (w T x n + b)) = 0

(C - α n) ε n = 0

可以看到，我们必须令

0<αn<C 才能使得

εn=0 并且通过

1 - y n (w T x n + b) = 0

解出

b ，这部分的样本叫free-support vector。当

αn=C 时，

εn>0 ，代表这部分样本到超平面的距离小于最小边界，或者分类错误了。当

αn=0 时

εn=0 ，因此代表这些样本非常安全，离边界很远。

4.4 Model Selection

　　选择最好模型参数的方法是利用验证集，同时，SVM还有一个非常有意思的理论可以在某种程度上减少我们验证的次数。
　　在交叉测试的留一法中，如果被选中作为测试点的样本是非支持向量，则该点的测试结果一定是正确，同时如果把它放进训练集再换另一个非支持向量出来测试，结果同样是正确。而如果把支持向量作为测试样本，结果未必正确。因此，SVM的误差上限是支持向量数量除以样本总量。
　　需要注意的是，由于仅仅是误差上限，因此常常用来排除“错误答案”。

你可能感兴趣的:(机器学习,SVM,Coursera)

Python深度学习033：Python、PyTorch、CUDA和显卡驱动之间的关系若北辰 Python深度学习 python 深度学习 pytorch
Python、PyTorch、CUDA和显卡驱动之间的关系相当紧密，它们共同构成了一个能够执行深度学习模型的高效计算环境。下面是它们之间关系的简要概述：PythonPython是一种编程语言，广泛用于科学计算、数据分析和机器学习。它是开发和运行PyTorch代码的基础环境。PyTorchPyTorch是一个开源的机器学习库，用于应用如自然语言处理和计算机视觉的深度学习模型。它提供了丰富的API，使
机器学习算法在司法预测中的应用【附保姆级代码】一键难忘机器学习算法人工智能
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中~机器学习算法在司法预测中的应用司法预测作为法律领域的前沿研究
PyTorch深度学习框架60天进阶学习计划 - 第19天：时间序列预测凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程迁移学习 python
PyTorch深度学习框架60天进阶学习计划-第19天：时间序列预测目录时间序列预测概述滑动窗口数据构造方法归一化策略对比：MinMaxvsZ-ScoreLSTM基础原理Attention机制与LSTM结合LSTM-Attention模型实现TeacherForcing技术与应用Prophet基准模型对比多步预测的滚动验证方法综合实战：股票价格预测1.时间序列预测概述时间序列预测是机器学习中的一个
Python爬虫学习笔记_DAY_26_Python爬虫之requests库的安装与基本使用【Python爬虫】_requests库ip 苹果Android开发组程序员 python 爬虫学习
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
大模型相关知识学习随记 m0_65156252 语言模型人工智能自然语言处理
2024/3/151，概念解释：通义千问，是阿里云推出的一个超大规模的语言模型，功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互，也融入了多模态的知识理解，且有文案创作能力，能够续写小说，编写邮件等。2，多模态大模型：多模态大模型是一种基于深度学习的机器学习技术，其核心思想是将不同媒体数据（如文本、图像、音频和视频等）进行融合，通过学习不同模态之间的关联，实现
DeepSeek在供热行业中的应用杨航 AI 人工智能深度学习 python 机器学习算法
目录引言1.1DeepSeek技术概述1.2供暖行业业务挑战1.3DeepSeek在供暖行业的应用前景DeepSeek技术基础2.1深度学习与机器学习2.2自然语言处理（NLP）2.3图像识别与处理2.4数据挖掘与分析供暖行业应用场景3.1设备监控与维护3.1.1设备状态监控3.1.2故障预测与诊断3.1.3维护计划优化3.2能源管理与优化3.2.1能耗数据分析3.2.2热负荷预测3.2.3节能优
Anaconda与VS Code wei099
最近在学习机器学习和计算机视觉，使用GoogleColab来运行网上的示例代码。考虑到网页上写代码效率太低，没有代码补全功能，没有函数提示，不利于对代码的了解，于是还是决定折腾一下在自己的Windows本上安装工作环境。想要学习机器学习的技能，不可避免要具备熟练使用Python编程的能力。Anaconda是Python软件包管理器，可以大大减少使用者安装各种包的麻烦，提高工作效率。我先后安装了An
适合机器学习的Linux系统推荐及基本配置指南金外飞176 信息分享机器学习 linux 人工智能
适合机器学习的Linux系统推荐及基本配置指南在机器学习领域，选择一个合适的Linux发行版至关重要。它不仅影响开发效率，还可能影响模型训练的性能。经过广泛调研和用户反馈，Ubuntu脱颖而出，成为众多机器学习爱好者的首选。下面将详细介绍为何推荐Ubuntu以及其基本配置需求。一、推荐Ubuntu的理由1.用户友好的界面和强大的社区支持Ubuntu提供了直观的图形用户界面，对于初次接触Linux的
使用Python进行火焰检测与识别：从基础理论到高级实现的全面指南快撑死的鱼 python算法解析 python 开发语言
使用Python进行火焰检测与识别：从基础理论到高级实现的全面指南火灾是一种常见而危险的自然灾害，在工业、家庭和公共场所中，实时检测火焰并做出响应是保障安全的重要手段。随着计算机视觉技术的发展，使用图像处理和机器学习的方法进行火焰检测已经成为可能。Python作为一种功能强大且广泛使用的编程语言，提供了丰富的库和工具，能够有效地实现火焰检测和识别。在本文中，我们将深入探讨如何使用Python进行火
[每日一学]数据分析与可视化：anaconda与pythoncharm使用上的区别之处及优越点，使用哪款比较好用拼命绽放 python 开发语言
anaconda、.jupyter·jupyter的基本使用，开发环境与pythoncharm有什么区别？在数据分析和可视化使用中有什么区别？哪个在数据分析和可视化上更占优势？如果用pythoncharm如何去实现数据分析与可视化有影响吗？一、Anaconda是一个开源的Python发行版本，集成了多个常用的数据科学、机器学习、深度学习等相关工具，例如JupyterNotebook、Spyder、
差分革命：清华微软携手，用物理智慧重塑Transformer“慧眼” YINWA AI 人工智能科技 AI 人工智能科技 ai
当物理学遇上AI，一场精准捕捉的变革悄然上演想象一下，在信息的汪洋大海中，寻找一根至关重要的“针”，难度无异于“大海捞针”。然而，随着诺贝尔物理学奖的光芒照耀到“机器学习之父”GeoffreyHinton的肩头，另一场跨界融合也在悄然进行——微软与清华大学的科研团队携手，将物理学的智慧融入AI，推出DifferentialTransformer（DIFFTransformer），让Transfor
深度学习核心技术深度解析月落星还在深度学习深度学习人工智能
一、深度学习的本质与核心思想定义：通过多层非线性变换，自动学习数据层次化表征的机器学习方法核心突破：表征学习：自动发现数据的内在规律，无需人工设计特征端到端学习：直接从原始输入到最终输出，消除中间环节的信息损失分布式表示：通过神经元激活模式的组合，指数级提升表达能力数学本质：f(x)=WLσ(WL−1σ(...σ(W1x+b1)...)+bL−1)+bLf(x)=W_{L}σ(W_{L-1}σ(.
AI 界的包青天：GaussianNB 智断分类难题星际编程喵人工智能分类数据挖掘
前言在机器学习的江湖中，分类算法纷繁复杂，各具特色。有的深不可测，犹如隐世高人的内功心法，让人望而却步；有的则像街头小贩，简单直接却也能精准解决问题。江湖中高手云集，其中有一位侠客，宛如包青天，正气凛然，以公正无私和高效迅捷著称，擅长快速解决分类难题。此侠客正是GaussianNaïveBayes（高斯朴素贝叶斯，简称GaussianNB）。凭借朴素的假设与强大的数学支撑，GaussianNB在分
深度学习/机器学习入门基础数学知识整理（一）：线性代数基础，矩阵，范数等 chljerry_mouse 线性代数深度学习机器学习
前面大概有2年时间，利用业余时间断断续续写了一个机器学习方法系列，和深度学习方法系列，还有一个三十分钟理解系列（一些趣味知识）；新的一年开始了，今年给自己定的学习目标——以补齐基础理论为重点，研究一些基础课题；同时逐步继续写上述三个系列的文章。最近越来越多的研究工作聚焦研究多层神经网络的原理，本质，我相信深度学习并不是无法掌控的“炼金术”，而是真真实实有理论保证的理论体系；本篇打算摘录整理一些最最
图像识别技术与应用超帅的好吧笔记
第一节课这节课了解了这门专业的就业职位：工资是怎么样的岗位职责和任职要求看到了人类工业文明的演变了解了人工智能的研究、开发、模拟、延伸、理论、方法和技术看到了生活方式的转变比如智能语音闹钟控制系统、自动驾驶和人脸识别考勤智能购物、医疗日常生活的智能比如指纹、淘宝、抖音还能用软件看到天气的好坏了解了典型训练和机器学习中的关键组件机器学习中的关键组件包含：数据模型目标函数优化算法这节课学习了第一节剩下
AI概率学预测足球大小球让球数据分析 sanx18 人工智能数据分析数据挖掘
在足球数据分析中，AI概率学预测主要涉及大小球和让球盘口的分析。以下是关键点：1.大小球分析大小球指机构设定的进球数预期，投注者预测实际进球数是否超过或低于该值。AI应用：历史数据：AI通过分析球队的历史进球、失球等数据，预测未来比赛进球数。机器学习：使用回归模型、神经网络等预测进球数，考虑球队实力、比赛风格、天气等因素。实时数据：结合实时比赛数据动态调整预测。2.让球分析让球是机构为平衡双方实力
【梯度下降算法】蝉叫醒了夏天机器学习算法
梯度下降算法：第一章梯度下降的历史沿革1.1优化方法的演进脉络从17世纪牛顿时代的数值解法，到20世纪最优控制理论的发展，直至现代机器学习对优化算法的特殊需求，梯度下降算法在数学优化史上占据重要地位。1947年FrankRosenblatt在感知机研究中首次系统应用梯度下降思想1.2机器学习时代的复兴21世纪深度学习革命使梯度下降算法获得新生：2006年Hinton团队在深度信念网络中的突破应用2
sparkML入门，通俗解释机器学习的框架和算法 Tometor spark-ml 机器学习算法回归数据挖掘人工智能 scala
一、机器学习的整体框架（类比烹饪）假设你要做一道菜，机器学习的过程可以类比为：步骤-->烹饪类比-->机器学习对应1.确定目标|想做什么菜（红烧肉/沙拉）|明确任务(分类/回归/聚类)2.准备食材|买菜、洗菜、切菜|数据收集与预处理3.设计食谱|决定烹饪步骤和调料|选择算法和模型设计4.试做并尝味道|调整火候和调味|模型训练与调参5.最终成品|端上桌的菜|模型部署与应用二、机器学习的核心流程1.数
神经网络机器学习中说的过拟合是什么意思 yuanpan 机器学习神经网络人工智能
在神经网络和机器学习中，过拟合（Overfitting）是指模型在训练数据上表现非常好，但在未见过的测试数据上表现较差的现象。换句话说，模型过度学习了训练数据中的细节和噪声，导致其泛化能力（Generalization）下降，无法很好地适应新数据。过拟合的表现训练误差很低，但测试误差很高：模型在训练集上的准确率非常高，但在测试集上的准确率却显著下降。模型过于复杂：模型学习了训练数据中的噪声或不相关
造价算量审图多元化融合软件开发实战：技术架构与核心代码解析夏末之花架构
——从BIM模型解析到AI智能审图的完整实现路径1.技术架构设计该软件需融合以下模块：BIM/CAD模型解析引擎（支持Revit/DWG文件一键导入）智能算量核心算法（基于规则引擎与机器学习）协同审图平台（多人实时标注与版本控制）AI辅助决策系统（材料价格预测、工程量误差检测）技术栈推荐：前端：Three.js（3D模型渲染）+React（协同界面）后端：Python（算量算法）+Java（业务逻
基于大模型的Text2SQL微调的实战教程(二) herosunly AIGC Text2SQL 微调实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了基于大模型的Text2SQL微调的实战教程(二)，希望对学习大语言模型的
基于支持向量机SVM的电网负荷预测，libsvm工具箱详解，SVM详细原理神经网络机器学习智能算法画图绘图支持向量机SVM 支持向量机算法机器学习 SVM电网负荷预测 svr
目录支持向量机SVM的详细原理SVM的定义SVM理论Libsvm工具箱详解简介参数说明易错及常见问题SVM应用实例，基于支持向量机SVM的电网负荷预测代码结果分析展望摘要基于支持向量机SVM的电网负荷预测，SVM原理，SVM工具箱详解，SVM常见改进方法支持向量机SVM的详细原理SVM的定义支持向量机（supportvectormachines,SVM）是一种二分类模型，它的基本模型是定义在特征空
论文学习：基于机器学习的光声图像分析1 superace7911 基于机器学习的光声图像处理机器学习人工智能图像处理
3/25——3/31期间论文学习笔记，关于基于机器学习的光声图像分析的6篇1区论文血管结构模拟&分割：Quantificationofvascularnetworksinphotoacousticmesoscopy链接数据集链接摘要这篇论文提出了一种新的方法，利用中观光声成像（MesoscopicPhotoacousticImaging,PAI）技术和高级图像分析技术，来非侵入性地定量化和分析活体
详细解释交叉熵损失函数（面试题200合集）快撑死的鱼人工智能机器学习
非常抱歉，我在之前的回答中确实没有严格遵循您指定的公式格式要求。感谢您的提醒！以下是修正后的版本，我将确保：内联公式使用$...$表示，例如a+b=ca+b=ca+b=c，嵌入在文本中。块级公式使用$$...$$表示，例如：E=mc2E=mc^2E=mc2我将重新整理并严格按照要求格式化之前的回答，同时保持内容清晰简洁。交叉熵损失函数的详细解释交叉熵（Cross-Entropy）损失函数是机器学习
NLP常见任务专题介绍（3）-垂直领域的聊天机器人搭建详细教程 AI专题精讲大模型专题系列自然语言处理机器人人工智能
一、整体流程构建垂直领域的聊天机器人需要结合特定行业的需求，采用自然语言处理和机器学习等技术。以下是一个典型的构建流程及相关技术实现：需求分析：明确机器人需要解决的问题范围和功能，例如客户服务、信息查询等。数据收集与预处理：数据收集：从行业相关的网站、论坛、数据库等渠道获取大量专业领域的文本数据。数据清洗：去除广告、无意义回复等噪声数据，确保数据质量。数据标注：对文本进行意图识别和实体识别的标注，
iOS 18 系统功能解析目录蓝鲸忘了海 IOS 1-18系统功能解析 ios cocoa macos
iOS18系统功能解析目录iOS18系统功能解析引言第一部分：iOS18系统架构全解析1.1全新系统设计理念1.2核心架构与硬件协同1.3安全架构与隐私保护1.4跨平台生态协同第二部分：用户界面与交互体验的革新2.1全新视觉设计2.2自定义UI与多任务切换2.3通知中心与交互体验2.4动态交互动画与手势识别第三部分：人工智能与机器学习的深度整合3.1新一代智能助手3.2CoreML与机器学习框架进
Chebykan wx 文章阅读やっはろ深度学习
文献筛选[1]神经网络：全面基础[2]通过sigmoid函数的超层叠近似[3]多层前馈网络是通用近似器[5]注意力是你所需要的[6]深度残差学习用于图像识别[7]视觉化神经网络的损失景观[8]牙齿模具点云补全通过数据增强和混合RL-GAN[9]强化学习：一项调查[10]使用PySR和SymbolicRegression.jl的科学可解释机器学习[11]Z.Liu,Y.Wang,S.Vaidya,F
机器学习专栏博文汇总 python游乐园机器学习机器学习人工智能合集
本篇汇集了Python游乐园中机器学习专栏博文，会持续更新，需要的小伙伴可以收藏一下Python机器学习实战：基于不同机器学习算法的鸢尾花数据集分析机器学习常见问题：过拟合及其处理方式结构化数据和非结构化数据的区别是什么如何选择合适的机器学习算法来处理非结构化数据可用于文本分析的机器学习算法都有哪些Python机器学习实战：遗传算法机器学习基础：什么是启发式算法机器学习中常用的调节参数的方法（附P
KMeans实战——聚类和轮廓系数评估啤酒数据集巷955 机器学习人工智能
原理：在数据分析和机器学习中，聚类是一种常用的无监督学习方法，用于将数据集中的样本划分为若干个簇，使得同一簇内的样本相似度较高，而不同簇之间的样本相似度较低。KMeans算法是其中最常用的聚类算法之一。本文将介绍如何使用KMeans算法对啤酒数据集进行聚类，并使用轮廓系数（SilhouetteScore）来评估聚类结果的质量。1.数据准备首先，我们需要导入必要的库并加载数据集。本文使用的数据集是一
如何增强机器学习基础，提升大模型面试通过概率 weixin_40941102 机器学习面试人工智能
我的好朋友没有通过面试所以我给我的好朋友准备了这一篇学习路线随着大模型（如Transformer、GPT-4、LLaMA等）在自然语言处理（NLP）、计算机视觉（CV）和多模态任务中的广泛应用，AI行业的招聘竞争愈发激烈。面试官不仅要求候选人熟练使用深度学习框架（如PyTorch、TensorFlow），还希望他们具备扎实的机器学习理论基础、算法实现能力和实际问题解决经验。本文将从机器学习基础入手
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他