不二txz

核函数背后隐藏着怎样的映射

核函数（kernel functions）是机器学习里的一个常用技巧。它接收两个样本的特征向量，给出一个标量；这个标量可以理解成把两个特征向量通过一个「隐藏的映射」变换到一个高维空间之后，再做内积的结果。用 x1,x2 表示两个特征向量，K 表示核函数，ϕ 表示从特征空间到高维空间的隐藏映射，则有：

K(x1,x2)=⟨ϕ(x1),ϕ(x2)⟩

映射 ϕ 往往不容易写出显式的表达式，它的像空间也往往不只是「高维」，而是「无穷维」。

　　径向基函数（radial basis functions, RBF）是一类常用的核函数，其特点是函数值只与两个特征向量的距离 ||x1−x2|| 有关：

K(x1,x2)=k(||x1−x2||)

RBF 核函数中最常用的是高斯核函数，其形式为：

K(x1,x2)=exp⁡(−γ||x1−x2||22)

其中 γ>0 是一个可调的参数。

　　我是在 2011 年的机器学习课上接触到 RBF 核函数的。从此以后，我一直有一个疑问：RBF 核函数只与距离有关，看起来并不像一个内积呀！它背后到底隐藏着一个怎样的映射，能使映射后向量的内积只与它们在特征空间的距离有关呢？

　　这个疑问直到我前两天看到下面这个讲解 maximum mean discrepancy 的视频时，才从 22:35 处的配图中寻到了一丝端倪：

Two-Sample Tests, Integral Probability Metrics, and GAN Objective - Dougal J. Sutherlandwww.youtube.com/watch?v=Xpd6DL02C7Q

　　这篇文章就来讲解一下 RBF 核函数背后的映射到底是什么样的，并为设计这种形式的映射寻找一种动机。我会介绍两种映射，第一种映射（波包映射）非常直观，第二种映射（复螺旋映射）方便通过采样用有限维映射来近似。第二种映射的近似形式，是我在 2014 年见到的，但由于没有第一种映射作铺垫，感觉颇似「神来之笔」，而现在终于理解了它的来龙去脉。

　　第一种映射其实非常浅显，但我在网上居然没有找到与它有关的讲解。许多资料给出了另一种形如泰勒展开的映射形式（如维基百科），但它远不如本文介绍的波包映射直观。

一、RBF 核函数背后的波包映射

　　核函数的目的是模仿内积，而内积的一个作用是衡量样本之间的相似度。把两个样本看作空间中的两个点，怎么衡量它们的相似度呢？

图 1：两个样本点

一种合理的动机是，两个点靠得越近，它们的相似度就应该越大。为此，我们用一个（旋转对称的）波包来代表一个点；两个点靠得越近，它们对应的波包重合得就越多。

图 2：用波包代表样本

　　把波包看成一个函数，其定义域是样本的特征空间 Rn，值域为实数域 R 。两个波包的重合程度，就正好可以用函数的「内积」来刻画，即两个波包相乘后积分。不难看出，这个积分的值只与两个样本点的距离有关，所以它就是一种 RBF 核函数 K，而从样本点到波包的映射，就是核函数背后隐藏的映射 ϕ 。映射 ϕ 的像空间是从 Rn 到 R 的函数空间，所以是无穷维的，而且是不可数无穷维。

　　这个不可数无穷维空间应该怎么形象地理解呢？有两个方面比较重要：

　　1. 在样本空间中相近的两个点，经过 ϕ 映射后内积比较大，在重合时达到最大值；在样本空间中相距较远的两个点，经过 ϕ 映射后内积趋于零。这可以理解成，所有的样本点都被映射成无穷维空间中同一个超球面上的点，相近的点映射到了夹角较小的方向，而相距较远的点则被映射到了几乎正交的方向。这符合高维空间的特性——在高维空间中随机取两个方向，它们一般都是接近正交的。

　　2. 在样本的特征空间中，内积与原点的位置是有关的。把一个样本 x1 与原点的距离扩大一倍，即移动至 2x1，则它与另一个样本 x2 的内积也会扩大一倍。在很多时候，这并不是我们想要的性质，因为 2x1 与 x2 并不见得就比 x1 与 x2 更相似。而经过 ϕ 映射后，两个样本的内积就只取决于它们在原特征空间中的距离，特征空间变成了平移不变的，其中的原点就不再具有特殊性了。这其实正是我们想要的性质，但正因为它与原特征空间中的内积性质截然不同，所以才让我怀疑 RBF 核函数怎么能理解成内积。

　　下面来看一下高斯核函数的实例。为方便起见，样本的特征空间就设为一维，样本的坐标 x1,x2 不再使用粗体书写。把样本 x1,x2 映射为均值在 x1,x2、标准差为 σ 的高斯波包：

f1(x)=exp⁡[−(x−x1)22σ2],f2(x)=exp⁡[−(x−x2)22σ2]

则两个样本的核函数值，即两个波包相乘后再积分，就等于：

K(x1,x2)=⟨ϕ(x1),ϕ(x2)⟩=⟨f1,f2⟩=∫−∞+∞f1(x)f2(x)dx=∫−∞+∞exp⁡[−(x−x1)22σ2]⋅exp⁡[−(x−x2)22σ2]dx=∫−∞+∞exp⁡[−2x2−2(x1+x2)x+(x12+x22)2σ2]dx=∫−∞+∞exp⁡{−1σ2[(x−x1+x22)2+(x1−x22)2]}dx=∫−∞+∞exp⁡(−x2σ2)dx⋅exp⁡[−(x1−x2)24σ2]=πσ⋅exp⁡[−(x1−x2)24σ2]

忽略系数 πσ，我们发现这就是 γ=14σ2 的高斯核函数。

　　在上面的例子中，波包和核函数都是高斯形式（但方差差了一倍）。在一般情况下，波包和核函数的形式不一定相同。比如，如果把波包取成矩形的，则核函数就会是三角形的。一般地，核函数是波包的自相关函数。高斯函数的自相关函数，恰好仍是高斯形式。

图 3：矩形波包及其自相关函数

二、RBF 核函数背后的复螺旋映射

　　在机器学习中，有时候我们会想要把样本特征经过核函数中隐藏映射处理后的结果显式地表示出来。比如，可以用这些结果做为新的特征，送到神经网络里去做分类，如[1]。映射的结果往往是无穷维的，这就需要用有限维映射去近似。

　　上一节揭示了 RBF 核函数背后的映射，是把样本特征映射成一个波包函数。要用有限维映射去近似这个波包函数，可以在它上面取有限个采样点。但这个采样比较困难：要让近似足够精确，就要在波包的峰值附近多采一些样，但每个样本对应的波包都处于不同的位置，很难让每个波包都获得足够多的采样点。于是我们就有了设计第二种映射的动机：能不能把波包都弄到同一个位置呢？我们有大杀器——傅里叶变换！

　　傅里叶变换有「保内积」性：两个函数经过傅里叶变换后再求内积，跟它们直接求内积的结果相等。仍以一维情况为例，设 f1(x),f2(x) 是两个函数，它们的傅里叶变换分别为 F1(ω),F2(ω)，则有：

⟨f1,f2⟩=⟨F1,F2⟩

这里有两点需要注意：

傅里叶变换要选取幺正的形式。若以角频率为频域的自变量，则正、逆变换都要带有系数 12π，即：F(ω)=12π∫−∞+∞f(x)e−iωxdx，f(x)=12π∫−∞+∞F(ω)eiωxdω。

傅里叶变换往往涉及复数，所以求内积时别忘了在某一个函数（不妨取第二个函数）上加共轭：

∫−∞+∞f1(x)f2(x)¯dx=∫−∞+∞F1(ω)F2(ω)¯dω

　　由傅里叶变换的保内积性可知，核函数 K(x1,x2) 也等于 ⟨F1,F2⟩ ，所以「波包的傅里叶变换」也可以作为 RBF 核函数背后的隐藏映射。

　　波包的傅里叶变换长什么样呢？这又需要用到傅里叶变换的另一条性质：在一个域中的位移，对应于另一个域中的相移。设位于原点处的波包 f(x) 的傅里叶变换为 F(ω)，则平移后的波包 f(x−a) 的傅里叶变换就是 e−iaωF(ω) 。注意，不管波包 f(x−a) 处于什么位置，它的傅里叶变换 e−iaωF(ω) 都是一个位于频域原点处的波包，只是相移因子不同！

　　仍以高斯核函数为例。在第一节中，我们用高斯波包 f(x)=exp⁡(−x22σ2) 作为隐藏映射。高斯波包的傅里叶变换还是一个高斯波包（一般函数的傅里叶变换则不一定保持相同的形式）：

F(ω)=σ⋅exp⁡(−12σ2ω2)

平移后的高斯波包 f(x−a) 的傅里叶变换则是：

e−iaωF(ω)=e−iaω⋅σ⋅exp⁡(−12σ2ω2)

　　取 σ=1,a=5，画出 e−iaωF(ω) 的图像如下。注意这是一个复值函数，所以图中有一个坐标轴表示自变量、两个坐标轴分别表示函数值的实部与虚部。图像呈螺旋状，所以我把「波包的傅里叶变换」这个映射称为「复螺旋映射」。螺旋的旋向及密度由平移量 a 决定，a 的绝对值越大，螺旋越密；螺旋粗细的变化（即包络，图中彩色轮廓）遵循 F(ω) 本身的形状。

图 4：复螺旋 1

　　若取 σ=1,a=−10，则复螺旋 e−iaωF(ω) 的图像如下。螺旋的方向反了过来，并且密度加倍了。

图 5：复螺旋 2

　　两个复螺旋的内积怎么直观地理解呢？如果两个复螺旋的 a 比较接近，比如旋向相同、密度相近，则它们在原点附近会有较长的一段区间基本同相，在这段区间上共轭相乘再积分会对内积做出较大的贡献。在离原点较远的区域，两个复螺旋的相位基本是乱的，并且螺旋也变得比较细了，对内积就没有什么贡献了。如果两个复螺旋的 a 差距较大，则它们在原点附近基本同相的区间就会很短，也就只能得到较小的内积。

三、复螺旋映射的有限维近似

　　设有两个样本 x1,x2，它们经复螺旋映射后的结果分别为 F1(ω)=e−ix1ωF(ω)、F2(ω)=e−ix2ωF(ω)。我们要用采样的方法，把这两个复螺旋近似成两个有限维向量，以近似计算如下内积：

∫−∞+∞F1(ω)F2(ω)¯dω=∫−∞+∞e−ix1ωF(ω)e−ix2ωF(ω)¯dω

　　两个复螺旋都在频域的原点附近值比较大，一种容易想到的采样方法是，在原点附近的一个有限区间内均匀采样。但这个区间的长度并不好取：取短了，则区间外的遗漏就比较多；取长了，则区间内靠近边缘的部分对内积的贡献又不大，显得浪费。

　　文献[2]提出了一种聪明的办法。它把内积化成了如下的形式：

∫−∞+∞F1(ω)F2(ω)¯dω=∫−∞+∞|F(ω)|2e−ix1ωe−ix2ω¯dω

并把右边看成是在 |F(ω)|2 这个概率密度下，对 e−ix1ωe−ix2ω¯ 求期望。|F(ω)|2 本身并不一定是归一化的，不过把它归一化只相当于给内积乘上一个系数，无伤大雅。在这种理解下，我们就可以按 |F(ω)|2 这个概率密度函数去采样 ω，并用这些 ω 处 e−ix1ω 和 e−ix2ω 的值组成向量，作为 F1、F2 的有限维近似。换句话说，对于一个样本 x，我们可以设计如下一个有限维的近似隐藏映射：

ϕ(x)=[e−ixω1,…,e−ixωm]

其中 ω1,…,ωm 是从概率密度 |F(ω)|2 中随机采样得到的，采样越多，近似越精确。注意这些采样点自然会在原点附近聚集得更密！

　　用上述方法得到的 ϕ(x) 是一个复值向量，使用起来仍嫌不便。注意到由于波包本身是个实值函数，波包的内积也是实的，所以复螺旋的内积其实也是实的。于是我们可以对复螺旋的内积取实部：

∫−∞+∞F1(ω)F2(ω)¯dω=∫−∞+∞|F(ω)|2Re[e−ix1ωe−ix2ω¯]dω=∫−∞+∞|F(ω)|2Re[e−i(x1−x2)ω]dω=∫−∞+∞|F(ω)|2cos⁡[(x1−x2)ω]dω=∫−∞+∞|F(ω)|2[cos⁡(x1ω)cos⁡(x2ω)+sin⁡(x1ω)sin⁡(x2ω)]dω

由此可以得到一个实的、有限维的近似隐藏映射：

ϕ(x)=[cos⁡(xω1),sin⁡(xω1),…,cos⁡(xωm),sin⁡(xωm)]

　　上面的讨论都默认了 x 和 ω 是一维的。在多维情况下它们都是向量，隐藏映射为：

ϕ(x)=[cos⁡(x⋅ω1),sin⁡(x⋅ω1),…,cos⁡(x⋅ωm),sin⁡(x⋅ωm)]

其中 ω1,…,ωm 是从多维概率密度 |F(ω)|2 中采样得到的随机向量。

　　这个隐藏映射用神经网络实现起来特别方便。只需要把原本的特征 x 送进一个全连接层（其权重由 ω1,…,ωm 排成），再分别经过 cos、sin 两个激活函数即可。

　　最后说一下，计算概率密度 |F(ω)|2，并不需要知道波包的表达式。这是因为，傅里叶变换的模方就等于自相关函数的傅里叶变换，即：概率密度 |F(ω)|2 就是核函数本身（把 x1−x2 看作自变量）的傅里叶变换。

参考

^Yun Wang and Florian Metze, "Recurrent support vector machines for audio-based multimedia event detection", ICMR 2016. https://maigoakisame.github.io/papers/icmr16.pdf

^Ali Rahimi and Benjamin Recht, "Random features for large-scale kernel machines", NIPS 2007. https://people.eecs.berkeley.edu/~brecht/papers/07.rah.rec.nips.pdf

四、SVM中，高斯核为什么会把原始维度映射到无穷多维？

斯核函数背后隐藏的映射 ϕ\phi ，是把每个样本点映射成一个高斯波包，就像这样：

波包本身是一个函数，是从样本本来的特征空间（图中画的是一维，实际上可以是 Rn\mathbb{R}^n）到实数 R\mathbb{R} 的映射，它们构成一个（不可数）无穷维的函数空间。ϕ\phi 是把样本对应成波包的映射，所以也是无穷维的。

使用numpy或pytorch校验两个张量是否相等
文章目录1、numpy2、pytorch做算法过程中，如果涉及到模型落地，那必然会将原始的深度学习的框架训练好的模型转换成目标硬件模型的格式，如onnx,tensorrt,openvino,tflite;那么就有对比不同格式模型输出的一致性，从而判断模型转换是否成功。1、numpy用到的核心代码就一行，就是：importnumpyasnpnp.testing.assert_allclose(act
机器学习笔记：MATLAB实践 techDM 机器学习笔记 matlab Matlab
在机器学习领域，MATLAB是一种功能强大且广泛使用的工具，它提供了许多内置函数和工具箱，方便开发者进行各种机器学习任务。本文将介绍一些常见的机器学习任务，并提供相应的MATLAB源代码示例。数据预处理在进行机器学习之前，通常需要对原始数据进行预处理。这包括数据清洗、特征选择、特征缩放和数据划分等步骤。%导入数据data=readmatrix('data.csv');%数据清洗cleaned_da
【深度学习pytorch-6】张量与numpy相互转换超华东算法王 DL-pytorch 深度学习 pytorch numpy
张量与Numpy数组之间的互相转换在深度学习中，张量（tensor）和Numpy数组（numpyarray）是两种常见的数据结构。张量通常用于深度学习框架（如PyTorch、TensorFlow等），而Numpy数组在科学计算中被广泛使用。为了便于数据处理和计算，常常需要在它们之间进行转换。下面介绍张量和Numpy数组之间的互相转换。1.PyTorch张量与Numpy数组的互相转换PyTorch提
LoRA微调详解：如何为AIGC模型节省90%显存 SuperAGI2025 AI大模型应用开发宝典 AIGC ai
LoRA微调详解：如何为AIGC模型节省90%显存关键词：LoRA、低秩适应、AIGC模型、参数高效微调、显存优化摘要：在AIGC（人工智能生成内容）领域，大模型（如GPT-3、LLaMA、StableDiffusion）的微调需要消耗海量显存，普通用户或企业难以负担。本文将深入解析LoRA（Low-RankAdaptation，低秩适应）这一参数高效微调技术，通过生活类比、数学原理、代码实战和应
探索《非官方知乎 API》：解锁知乎数据潜能指南
探索《非官方知乎API》：解锁知乎数据潜能指南Unofficial-Zhihu-API深度学习模型自动识别验证码，python爬虫库自动管理会话，通过简单易用的API，实现知乎数据的爬取项目地址:https://gitcode.com/gh_mirrors/un/Unofficial-Zhihu-API项目介绍非官方知乎API是一个由社区贡献的开源工具，位于https://github.com/l
西南交通大学【机器学习实验1】
实验目的理解和掌握回归问题和分类问题模型评估方法，学会使用均方误差、最大绝对误差、均方根误差指标评估回归模型，学会使用错误率、精度、查全率、查准率、F1指标评价分类模型。实验内容给定回归问题的真实标签和多个算法的预测结果，编程实现MSE、MAE、RMSE三种评测指标，对模型进行对比分析。给定二分类问题真实标签和多个算法的预测结果，编程实现混淆矩阵评测，采用错误率、精度、查全率、查准率、F1指标对结
结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践大模型之路 RAG rag
一、引言：混合RAG技术的发展与挑战在人工智能领域，检索增强生成（RAG）技术正成为构建智能问答系统的核心方案。传统RAG通过向量数据库存储文档嵌入并检索相关内容，结合大语言模型（LLM）生成回答，有效缓解了LLM的“幻觉”问题。然而，单一的稠密向量检索（如基于Transformer的嵌入模型）在处理关键词匹配和多义词歧义时存在局限性，而稀疏向量检索（如BM25）虽擅长精确关键词匹配，却缺乏语义理
学习笔记(28):随机噪声的原理、作用及代码实现详解宁儿数据安全 #机器学习学习笔记 python
学习笔记(28):随机噪声的原理、作用及代码实现详解一、什么是随机噪声？为什么需要添加？在机器学习中，随机噪声是指数据中无法用特征解释的随机波动，通常符合某种概率分布（如正态分布）。在房价模拟中添加噪声的核心原因如下：1.模拟真实世界的不确定性真实房价除了受面积、房龄影响，还受装修情况、学区、交通、政策等未被建模的特征影响，这些因素的综合效应可抽象为“噪声”。示例：两套面积和房龄相同的房子，房价可
学习笔记(29):训练集与测试集划分详解：train_test_split 函数深度解析宁儿数据安全 #机器学习学习笔记深度学习
学习笔记(29):训练集与测试集划分详解：train_test_split函数深度解析一、为什么需要划分训练集和测试集？在机器学习中，模型需要经历两个核心阶段：训练阶段：用训练集数据学习特征与目标值的映射关系（如线性回归的权重）。测试阶段：用测试集评估模型在未见过的数据上的表现，避免“过拟合”（模型只记住训练数据的噪声，无法泛化到新数据）。类比场景：学生通过“练习题”（训练集）学习知识，再通过“考
军事，本身就是智能人机与认知实验室人工智能大数据
军事智能后面两个字不重要，军事本身就是智能。军事活动中的许多决策和操作本质上都离不开“智能”，不论是指人类的智慧，还是现代技术和人工智能的应用。军事行动本质上是一种复杂的决策过程，涉及到战略、战术、资源配置、情报分析等多个方面。每一个决策都需要充分的智慧和智能的支持，考虑的因素包括敌我态势、地理环境、气候、技术优势等。人类指挥官的战略智慧和经验在军事行动中至关重要，但随着现代技术的发展，智能化技术
图像分类：从基础原理到前沿技术随机森林404 计算机视觉分类数据挖掘人工智能
引言在当今数字化时代，图像数据正以惊人的速度增长。从社交媒体上的照片分享到医疗影像诊断，从自动驾驶到工业质检，图像分类技术已经成为人工智能领域最基础也最重要的应用之一。本文将全面介绍图像分类的基础概念、发展历程、关键技术、应用场景以及未来趋势，帮助读者系统性地理解这一领域。第一章图像分类概述1.1什么是图像分类图像分类（ImageClassification）是计算机视觉中的一项核心任务，其目标是
《dlib库中的聚类》算法详解：从原理到实践 A小庞算法算法聚类数据挖掘机器学习 c++
一、dlib库与聚类算法的关联1.1dlib库的核心功能dlib是一个基于C++的机器学习和计算机视觉工具库，其聚类算法模块提供了多种高效的无监督学习工具。聚类算法在dlib中主要用于：数据分组：将相似的数据点划分为同一簇。特征分析：通过聚类结果发现数据潜在的结构。降维辅助：结合聚类结果进行特征选择或数据压缩。dlib支持的经典聚类算法包括K-Means和ChineseWhispers，适用于图像
通义灵码+DeepSeek：国产代码生成王炸组合，带你飞！
引言在人工智能飞速发展的当下，AI代码生成工具如雨后春笋般涌现，为开发者们带来了前所未有的编程体验。其中，国产的通义灵码结合DeepSeek模型异军突起，成为众多开发者关注的焦点。它们凭借强大的功能和出色的表现，在代码生成领域崭露头角，不仅提升了开发效率，还为编程工作流注入了新的活力。然而，如同任何新兴技术一样，在使用过程中也会遇到各种问题和挑战。本文将通过实测，深入剖析通义灵码与DeepSeek
机器学习：集成算法的装袋法（Bagging）：随机森林（Random Forest） rubyw #概念及理论机器学习算法随机森林
随机森林（RandomForest）是一种集成学习方法，通过构建多个决策树并结合其预测结果来提升模型的性能和稳定性。它由LeoBreiman于2001年提出，广泛应用于分类和回归任务。以下是随机森林的详细介绍，包括其基本概念、构建过程、优缺点及应用场景。基本概念随机森林是一种基于决策树的集成算法，通过生成多棵决策树，并将这些树的预测结果结合起来，以提高整体模型的预测准确性和稳定性。每棵决策树都是在
uni-app 多端开发中 AI 的集成与适配：一次开发，智能多端运行欧阳天羲大前端与 AI 的深度融合 #AI 与大前端框架结合篇 uni-app 人工智能前端
一、引言：uni-app与AI多端集成的背景在当今跨平台开发趋势下，uni-app凭借"一次编写，多端运行"的特性成为企业级应用开发的首选框架之一。随着人工智能技术的普及，将AI能力集成到多端应用中已成为提升用户体验的关键需求。然而，小程序、APP、Web等不同端的运行环境差异显著，如何实现AI功能的统一集成与高效适配成为开发难点。本文将系统讲解在uni-app框架中集成AI能力的完整方案，涵盖跨
大语言模型技术系列讲解：大模型应用了哪些技术知世不是芝士语言模型人工智能自然语言处理 chatgpt 大模型
为了弄懂大语言模型原理和技术细节，笔者计划展开系列学习，并将所学内容从简单到复杂的过程给大家做分享，希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲，先列出大模型使用到了哪些技术，目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
森林的智慧：随机森林与集成学习的民主之道田园Coder 人工智能科普人工智能科普
当约阿夫·弗罗因德和罗伯特·沙皮尔提出的AdaBoost算法在90年代末期以其强大的预测精度震惊机器学习界，展示了“团结弱者为强者”的集成魅力时，另一种集成思想也在悄然孕育。这种思想同样信奉“众人拾柴火焰高”，但走的是一条与AdaBoost截然不同的路径：它不执着于反复调整数据权重去“关注”被前序模型分错的困难样本，而是致力于创造尽可能多样化的模型，然后让这些模型平等地投票。它的核心哲学是：如果每
机器学习：集成学习方法之随机森林(Random Forest) 慕婉0307 机器学习集成学习机器学习随机森林
一、集成学习与随机森林概述1.1什么是集成学习集成学习(EnsembleLearning)是机器学习中一种强大的范式，它通过构建并结合多个基学习器(baselearner)来完成学习任务。集成学习的主要思想是"三个臭皮匠，顶个诸葛亮"，即通过组合多个弱学习器来获得一个强学习器。集成学习方法主要分为两大类：Bagging(BootstrapAggregating)：并行训练多个基学习器，然后通过投票
机器学习在智能金融风险评估中的应用：信用评分与欺诈检测 Blossom.118 机器学习与人工智能机器人机器学习人工智能 python 深度学习 sklearn 计算机视觉
在金融行业，风险评估是确保金融机构稳健运营的关键环节。随着大数据和机器学习技术的快速发展，金融机构开始探索如何利用机器学习算法来提高风险评估的准确性和效率。本文将探讨机器学习在智能金融风险评估中的应用，特别是信用评分和欺诈检测方面的最新进展，并分析其带来的机遇和挑战。一、智能金融风险评估中的信用评分（一）传统信用评分方法的局限性传统的信用评分主要依赖于人工规则和简单的统计模型，如逻辑回归。这些方法
机器学习在智能制造业中的应用：质量检测与设备故障预测 Blossom.118 机器学习与人工智能机器学习人工智能深度学习神经网络机器人 sklearn tensorflow
随着工业4.0和智能制造的推进，制造业正经历着一场深刻的数字化转型。智能制造业通过整合物联网（IoT）、大数据和机器学习等先进技术，实现从生产计划到质量控制的全流程优化。机器学习技术在智能制造业中的应用尤为突出，尤其是在质量检测和设备故障预测方面。本文将探讨机器学习在智能制造业中的应用，并分析其带来的机遇和挑战。一、智能制造业中的质量检测（一）传统质量检测方法的局限性传统的质量检测主要依赖于人工检
面了字节跳动的数据挖掘岗，感觉真的很难。。。大模型爱好者社区机器学习深度学习面试宝典数据挖掘人工智能数据分析算法面试
节前，我们社群组织了一场技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对新手如何入门机器学习算法、该如何备战、面试常考点分享等热门话题进行了深入的讨论。基于社群的讨论，今天我整理了一个同学的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以文末加入我们交流群。一面40min【编程题】有两种数据，分别是被转发的用户和转发的
免费学中医，这些优质资源不容错过少林659 零基础学中医免费学中医
零基础学中医，学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts想入门中医却担心成本太高？其实有不少免费又优质的学习资源，问止中医的系列免费课程就是其中的佼佼者，涵盖理论与实操，满足不同学习者的需求。问止中医旗下的精一书院，是免费学中医的绝佳平台。由问止中医联合创始人林大栋博士主讲，课程聚焦中医结构分析、人工智能中医大脑技术
思维树(Tree of Thoughts): 超越链式思维的AI推理新范式司南锤 LLM 人工智能
引言在人工智能快速发展的今天，大语言模型(LLM)的推理能力一直是研究的热点。从最初的直接问答，到链式思维(ChainofThoughts,CoT)的出现，再到如今的思维树(TreeofThoughts,TOT)，AI的推理方式正在变得越来越接近人类的思维过程。思维树作为一种全新的推理框架，不仅继承了链式思维的优势，更通过树状结构的探索和回溯机制，实现了更加复杂和深入的推理过程。本文将深入探讨TO
【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）吴师兄大模型深度学习入门到精通深度学习 cnn 人工智能 python 大模型卷积神经网络（CNN）机器学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【学习】《算法图解》第十二章学习笔记：K近邻算法程序员
前言《算法图解》第十二章介绍了一种简单而强大的机器学习算法——K近邻算法（K-NearestNeighbors，简称KNN）。这是一种基于实例的学习方法，也是机器学习领域中最基础、最直观的算法之一。本章不仅讲解了KNN的基本原理和实现方式，还探讨了特征提取、归一化等重要概念，为读者打开了机器学习的大门。本笔记将梳理KNN算法的核心思想、实现步骤以及应用场景。一、K近邻算法概述（一）基本思想K近邻算
AttributeError: module ‘openai‘ has no attribute ‘ChatCompletion‘解决方案爱编程的喵喵 Python基础课程 python AttributeError openai ChatCompletion 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了AttributeError:mod
RAG技术全面对比研究：探索最优检索增强生成策略
检索增强生成（RAG）技术全景解析：从基础到前沿在当今信息爆炸的时代，如何从海量数据中快速准确地获取所需信息，是人工智能领域的一大挑战。Retrieval-AugmentedGeneration（RAG，检索增强生成）技术应运而生，它结合了检索和生成的优势，通过从大量文档中检索相关信息，再利用这些信息生成高质量的回答。本文将系统性地介绍18种RAG技术，通过概念解析、代码示例和实际应用场景分析，帮
基于深度学习的草莓成熟度检测系统：YOLOv5 + UI界面 + 数据集 YOLO实战营深度学习YOLO实战项目深度学习 YOLO ui 人工智能目标跟踪
引言随着农业科技的发展，智能化的农业生产方式正逐步替代传统农业。果实的成熟度检测对于农业生产的管理至关重要，尤其是在果蔬的采摘、分拣和运输过程中。草莓作为一种广泛种植且受消费者喜爱的水果，其成熟度检测一直是农业智能化的重要研究方向。传统的草莓成熟度检测方法大多依赖人工经验，劳动强度大且容易出现误差，因此，基于计算机视觉和深度学习的草莓成熟度自动检测系统成为了一种理想选择。深度学习技术，尤其是卷积神
【人工智能】 AI的进化之路：大模型如何重塑技术格局蒙娜丽宁 Python杂谈人工智能人工智能 python
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界本文深入探讨了人工智能大模型的进化历程及其对技术格局的深远影响。从早期神经网络到现代大模型的突破，文章分析了关键技术进步，如Transformer架构、预训练机制和分布式计算。结合数学公式和代码示例，详细阐述了大模型的训练原理、优化方法及实际应用场景。文
数字人矩阵源码--基于深度学习的数字人面部表情合成我~18339948121 数字人源码数字人矩阵源码 123数字人源码矩阵深度学习线性代数人工智能 flask tornado python
AI正在席卷全球，数字人市场需求增长，用AI数字分身一天就能生产出几十条高质量短视频，你只需要上传一段视频，甚至都不用开口说话，直接复制粘贴文案，就能得到一个属于你的数字分身。深度学习数字人面部表情合成的关键技术3D面部建模与参数化建立高精度3D面部模型是表情合成的基础，常用Blendshape或面部动作编码系统（FACS）作为参数化控制方法。Blendshape通过线性组合基础表情形状生成新表情
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

核函数背后隐藏着怎样的映射

一、RBF 核函数背后的波包映射

二、RBF 核函数背后的复螺旋映射

三、复螺旋映射的有限维近似

参考

四、SVM中，高斯核为什么会把原始维度映射到无穷多维？

你可能感兴趣的:(机器学习,人工智能,深度学习)