Xin1203

Prototypical Networks for Few-shot Learning

小样本学习的原型网络

摘要

我们为小样本分类问题提出了原型网络，分类器必须推广到训练集中没有的新类，每个新类只给出非常小的数量的样本。
原型网络在这样一个度量空间中学习：分类可以通过计算每个类的原型之间的距离来区分。
与最近的小样本学习的几种方式，它反映了一种在这种有限数据的情况下有利的更简单的归纳偏差，并且取得了非常好的结果。
我们提供的分析结果表明一些简单的设计决策能够对最近的包含复杂的架构选择和元学习的方式产生实质性的改进。
我们进一步将原型网络扩展到零样本学习并且在鸟类数据库上完成最先进的结果。

1.介绍

图1：小样本学习中的c是每个类嵌入的支持样本的均值；零样本学习中的c是嵌入的类的元数据。在每个情况下，嵌入的查询点通过softmax函数计算距离来分类。

小样本学习的任务是调整分类器去适应训练集中未见过的新类，每种类只给出非常少的样本。
一种比较天真的做法：在这些样本上重新训练模型，这会导致严重的过拟合。

虽然这种问题很困难，但是已经证明人类可以进行一次样本分类，每种类只给出一个样本，却有很高的精度。

两种取得了实质性进展的方式：
匹配网络Matching Networks：
应用注意机制的学习嵌入处理标记好的样本（支持集）来预测未标记的点（查询集）的类别。
它可以解释为应用在嵌入空间上的加权最邻分类器。
值得注意，模型在训练期间应用了称为episodes的采样小批量，被设计用来通过二次抽样分类和数据点来模仿小样本任务。
Episodes的应用使训练问题更忠实于任务环境，从而改善了泛化问题。

长期短暂记忆 LSTM：
对上述的训练方式进一步深化，提出了小样本学习的元学习方式。他们的方式包含通过训练LSTM来产生分类器的更新，给定一个episode，能够很好的推广到测试集。
LSTM元学习器对于每一个episode都训练一个自定义模型而不是对多个episodes训练单一模型。

我们通过解决过拟合的关键问题来解决小样本学习问题。
因为数据被严格限制，我们假设分类器应当拥有非常简单的归纳偏差。
我们的原型网络基于这样的思想：存在这样一个嵌入，点群聚集在每个类的单一原型周围。
为做到这一点，我们使用神经网络将输入的非线性映射到嵌入空间，并且将类的原型作为嵌入空间的支持集的均值。
然后，就可以通过简单的找到最近的类原型对嵌入的查询点进行分类。

我们采用相同的方式来处理零射击学习：每一个类都有元数据，提供了类的高级描述而不是少量的标记例子.
因此我们将元数据嵌入到共享空间中作为每一个类的原型。
和在小样本学习中一样，分类器通过对嵌入的查询节点寻找最近的类原型来进行分类。

在本文中，我们为小样本学习和零样本学习都提出了原型网络，与匹配网络在one-shot设置上建立连接，并分析了模型中的基础距离函数。

特别地，我们将原型网络与cluster相关联，以此来证明在使用bregman散度来计算距离（例如欧氏距离平方）时以类均值作为原型的正确性。
根据经验，距离的选择是至关重要的，欧氏距离远优于通常所采用的余弦相似度。
在数次基准测试任务中，我们达到了非常杰出的性能。

原型网络比最近的元学习算法更简单更有效，是一种小样本学习和零样本学习的有吸引力的实现方式。

2.原型网络

2.1 符号

在小样本分类中给出小样本支持集，N个标记的例子S；x是样例的D维特征向量，y是对应的标记。Sk表示类k的已标记样例。

2.2 模型

原型网络通过带有可学习参数的嵌入式的函数fφ（将向量从D维转换到M维）来计算每个类的M维表示向量或原型。每个原型都是该类嵌入的支持集点的平均向量。

给定一个距离函数d，原型网络基于softmax在嵌入空间中与原型之间的距离得出对于查询点x的类的分布。

通过最小化经由SGD的真类k的负对数概率J来学习。通过随机选择训练集中类的子集来组成训练episode集，然后在每个类中选择样本的子集来作为支持集剩余的作为查询集。
下面是计算训练集的损失J的伪代码：

算法：训练原型网络的episode损失计算。
输入：训练集D，其中Dk代表D包含的所有元素都属于类k。
输出：随机生成的训练episode的损失J。
为episode选择索引->选择支持样本->选择查询样本->从支持样本中计算出原型->初始化损失->更新损失

2.3 原型网络的混合密度估计

对于特定类的距离函数，称为常规Bregman散度，原型网络的算法等效于在指数族密度对于支持集执行混合密度估计。常规Bregman散度定义为：

φ是勒让德型的可微的，严格凸函数。Bregman散度的例子包括平方欧几里得距离和马哈拉诺比斯距离。

原型的计算可以支持集上的硬聚类角度来看，每个类有一个聚类，每一个支持点都被分配到对应的类的集群。已经表明，在Bregman散度下群集原型与其分配的点之间实现的最小距离是群集的均值。因此，在应用Bregman散度时给定支持集标记，等式1的原型计算得出最优的集群原型。

此外，具有参数θ和累积量函数ψ的任何正则指数族分布都可以用唯一确定的常规Bregman散度写出：

现在考虑带有参数Γ的正则指数族混合模型：

给定Γ，未标记点z的聚类分配y的推导为：

对于每个类一个集群的等加权混合模型，群集分配的推导等价于查询类的推导。在这种情况下，原型网络有效地执行混合密度推导，其中指数族分布由dψ决定。
因此，距离的选择决定了在嵌入空间中类条件数据分布的建模假设。

2.4 重新解释为线性模型

简单分析有助于了解学习分类器的本质。当我们使用欧几里得距离时，欧几里得下的模型等效于特定参数化的线性模型。要看到这一点，将术语扩展到指数中：

等式7中的首项关于类k是常量，因此它不影响softmax概率。我们可以将剩余的项写成线性模型：

在这项工作中，我们主要关注欧几里得距离（对应于球面高斯密度）。我们的结果表明欧几里得距离是一个有效的选择虽然其与线性模型等价。我们假设这是因为所有所需要的非线性都可以在嵌入的函数中学习。实际上，这是现行的神经网络分类系统所使用的方法。

2.5 与匹配网络的比较

在小样本学习情境下原型网络与匹配网络不同，在于它在一次学习情况下具有等效性。匹配网络在给定支持集时得出加权最邻分类器，而原型网络在应用平方欧几里得距离时得出线性分类器。在一次样本学习情况下，因为每个类只有一个支持点，二者等价。

一个很自然的问题是每个类使用多个原型而不是一个原型是否合理。如果每个类的原型的个数是固定的且大于1，那么就需要一个划分的方案来进一步聚集类中的支持点。这已经被mensink和rippel提出了。但是这两种方法都需要一个与权重的更新分离的单独的划分阶段，而我们的方法用普通的梯度下降法就能简单的学习。

vinyals等提出了几种扩展,包括解耦支持和查询点的嵌入函数，以及使用考虑在每episode中特定点的第二级全条件嵌入（FCE）。这些同样可以合并到原型网络中，但是它增加了可学习参数的数量，并且FCE使用双向LSTM对支持集强加随机排序。相反，我们表明使用简单的设计选择就可以达到相同的性能水平，接下来会概述。

2.6 设计选择

距离度量
vinyals和ravi和larochelle使用余弦距离来应用匹配网络。然而对于匹配网络和原型网络，任何距离都是可允许的，我们发现使用平方欧几里得距离能够大大提高两者的结果。对于原型网络，我们推测这主要是由于余弦距离不是Bregman散度，因此在2.3节中讨论的混合密度估计的等价性并不成立。
episode构成
一种构造episode的直观方式，是vinyals等人所应用的，为每个类选择Nc类和Ns支持点，以便在测试时匹配预期的情况。也就是说，如果我们预期在测试时执行五种（5-way）分类和一次样本学习，那么训练episode可由Nc=5，Ns=1组成。我们发现在测试时，高的Nc或者way对于训练都是有益的。在实验中，我们在留存的验证集上训练Nc。另一种考虑，在训练和测试时间是否去匹配Nc或者shot。对于原型网络，我们发现最好使用相同的shot数进行训练和测试。

2.7 零样本学习

与小样本学习不同之处在于，零样本学习对于每个类给出类的元数据向量vk而不是给出一组训练点的支持集。这些可以预先设定，也可以从原始文本中学习。修正原型网络来解决零样本学习非常直观，我们将———简单定义为元数据向量的独立嵌入。图1显示了原型网络的零样本学习程序与小样本学习程序相关。因为元数据向量和查询点来自不同的输入域，我们发现根据经验固定原型嵌入g使有单位长度是有帮助的，然而我们不限制查询嵌入f。

3 实验

对于小样本学习，我们用Ravi和Larochelle提出的拆分在Omniglot和ILSVRC的mini版本上进行实验。对于零样本学习，我们在2011版UCSD鸟类数据库上进行试验。

3.1 Omniglot小样本分类

Omniglot是从50个字母表中收集的1623个手写字符的数据集。每一种字符有20个由不同人写的样本。我们依据Vinyals等人的程序将灰阶图像调整为2828大小并且通过旋转90度来扩充字符类数量。我们用1200个字符以及旋转之后的总共4800类作为训练集剩余的以及其旋转作为测试集。我们的嵌入架构反映了Vinyals等人所使用的架构并且由四个卷积块构成。每个块由64-滤波器33卷积，批量标准化层，ReLU非线性以及22最大池化层。当应用于2828Omniglot图像时该架构产生64维输出空间。我们使用相同的编码器来嵌入支持点和查询点。我们所有的模型都使用Adam通过SGD进行训练。我们使用10的-3次方初始学习速率并且每2000episodes将速率下调一半。除了批量标准化之外，不使用正则化。

我们使用平方欧几里得距离在1样本和5样本的情况下进行原型网络训练，训练episode包括60个类，每个类包括5个查询点。我们发现将训练样本和测试样本相匹配是有利的，并且每个训练episode使用更多的类也是有利的。我们比较各种基线，包括Neural Statistician，元学习器LSTM，MAML，以及匹配网络的微调以及非微调版本。我们对于从测试集中随机生成的1000个episodes进行计算分类准确度。结果显示在表1，根据我们的认知，结果在这个数据集上与目前最先进技术具有竞争力。

图2显示的是由原型网络训练的t-SNE可视化示例。为了更好了解其本质，我们将同一个字母表中的测试字符的子集可视化，尽管实际测试中是来自不同的字母表。尽管不同字符之间的变化非常小，网络仍然能将手写字符集群在其类的原型附近。

图2：在Omniglot数据集上使用原型网络学习的嵌入的t-SNE可视化。显示了一种测试集中的字母表（Tengwar）的子集。类原型用黑色表示，一些错误分类的字符使用红色显示，箭头指向其正确的分类。

3.2 miniImageNet小样本分类

miniImageNet数据集起初由Vinyals等人提出，来源于一个更大的ILSVRC-12数据集。他们所使用的部分是有60000个84*84的彩色图像，被分为100个类，每个类中有600个样本。为了与目前最先进的算法进行直接比较，我们使用了Ravi和Larochelle所使用的数据集。有100个类，其中64个训练类，16个验证类，20个测试类。我们根据他们的程序，在这64个训练类上进行训练，使用16个验证类来监控泛化性能。

我们使用与Omniglot相同的四个卷积块的嵌入架构，尽管由于图像尺寸增加，它会产生1600维的输出空间。我们还采用了与Omniglot相同的学习速率，并且训练直到验证损失停止增加。我们使用30-way episode进行1样本分类，20-way episodes进行5样本分类。我们将训练样本与测试样本相匹配，每个类的每个episode包含15个查询点。我们将其与Ravi和Larochelle提出的基准线进行比较，其中包含一个通过64个训练类学习的分类网络的简单的最邻方法。其他的基准线包括匹配网络（原始和FCE）和非微调设置的元学习器LSTM的两个非微调变体。因为Vinyals等人提出的微调程序并没有完全描述。正如表2所显示的，原型网络在5样本学习精度的大幅度提高达到了最先进水平。

我们进行了进一步分析，来确定距离量度以及每episode中训练类的数量对于原型网络和匹配网络的性能的影响。为了使这些方式具有可比性，我们使用了与我们的原型网络使用相同嵌入架构的匹配网络来实现。在图3中，我们对于1样本和5样本情况下的余弦距离和欧几里得距离，5-way和20-way episodes进行比较。我们发现20-way比5-way有更高的精度，并且推断20-way分类的难度使网络更好泛化，因为其使嵌入空间的模型做出更具细粒度的决策。此外，欧几里得距离比余弦距离提高了性能，这种影响对于原型网络更为明显。将类原型计算作为嵌入支持点的平均值更自然的适合欧几里得距离，因为余弦距离不属于Bregman散度。

图3：比较显示了距离度量和每个episode中类的数量对于5-way分类精度的影响。x轴表示训练episode配置（way，距离，样本），y轴表示相应5-way测试的精度。误差条显示的是每600个测试episode计算中的95%置信区间。注意在1样本学习中匹配网络和原型网络是一致的。

3.3 CUB零样本分类

为了检测我们的方案对于零样本学习的适用性，我们也在UCSD鸟类数据集上进行实验，它含有200种鸟的11788个图片。我们在准备阶段密切关注Reed等人的程序。我们将他们的数据集部分分为100训练集，50验证集，50测试集。对于图像，我们应用Googlenet在原始图像和水平翻转图像的中间，左上右上，左下右下部分抽象1024维特征。在测试时，我们只使用原始图像的中间部分，对于类的元数据，我们使用CUB数据集提供的312维的连续特征向量。这些特征编码了不同种类鸟的颜色，形状，羽毛图案等。

我们在1024维图像特征和312维属性向量之上学习了一个简单的线性映射，来产生一个1024维的输出空间。对于这个数据集，我们发现应当将类原型（嵌入的属性向量）规范化为单位长度，因为属性向量来自于与图像不同的域。训练episode由50个类组成，每个类有10个查询图像。嵌入通过经由SGD的Adam进行优化，学习速率固定为10的-4次方，权重延迟10的-5次方。早期的验证损失的停止用于决定在训练和验证集进行重新训练的最佳时期数。

表3显示了与使用属性作为类的元数据的方式相比，我们获得了最先进的结果。我们将我们的方式与其他零样本学习进行比较，包括ALE，SJE等嵌入方式。我们还与最近的一种聚类方式进行比较，这种方式通过在微调的Alexnet获得的学习特征空间上训练SVM。

我们用一组更强的类元数据进行了另外的零样本实验。这些实验表明即使数据点来自于类的不同域，我们的方式也足够通用。

4 相关工作

度量学习的文献有很多，我们总结了与我们的最相关的几种。
邻域成分分析（NCA）学习马哈拉诺比斯距离来最大化在变化空间中的K-最邻（KNN）的留一法精度。
Salak和Hinton通过使用神经网络执行转换来扩展NCA。
大边缘最邻分类（LMNN）也试图优化KNN精确度，但使用了铰链损失来鼓励点的局部邻域包含其他具有相同标签的点。
DNet-KNN是另一种基于边缘的方法，它通过利用神经网络执行嵌入而不是简单的线性转换来改进LMNN。
其中，我们的方式更像是NCA的非线性扩展，我们使用神经网络来执行嵌入，我们在转换空间中基于欧几里得距离来优化softmax而不是通过边际损失。与非线性NCA最关键的不同之处在于我们直接通过类形成softmax，而不是通过计算到类的原型表示的单独的点。这允许每个类具有独立于数据点数量的简明表示，并且避免在预测时需要存储整个支持集。

我们的方案也类似于最近类均值方案，每个类被其样本的均值所表示。这种方式被改进以用来快速不经过重新训练就将新的类合并到分类器中，然而它依赖的是线性嵌入并且它是被设计用于处理新的类具有非常大的样本量的情况。相反，我们的方式利用神经网络来非线性嵌入点，并且将其与episode的训练相结合来处理小样本的情况。Mensink等人也试图将他们的方法应用于非线性分类，但是他们是通过允许每个类有多个原型。他们通过在输入空间上使用k-means在预处理步骤中找到这些原型，然后执行他们线性嵌入的多模态变体。在另一方面，原型网络不经过预处理，以端到端的方式学习非线性嵌入，产生了每个类仍然只需要一种原型的非线性分类器。另一方面，我们的方式更自然的扩展到其他距离函数中，尤其是Bregman维度。

Wen等人提出的中心损失关于面部识别的应用与我们的方式相近，但是有两个主要的不同。首先，他们将类的中心作为模型的参数来学习，而我们以每episode中的标记样本来计算原型。其次，他们将中心损失与softmax损失结合起来来防止表示坍缩为0，而我们从原型中构造softmax损失，自然可以防止这种坍缩。此外，我们的方式适用于小样本学习而不是面部识别。

一个相关的小样本学习方式是由Ravi和Larochelle提出的元学习方式。它的核心是LSTM动态和梯度下降可以高效地以相同方式编写。然后可以训练LSTM自己来训练来自给定episode的模型，其性能目标是在查询点有较好的泛化。
MAML是另一种小样本学习的元学习方案，它试图学习一种经过非常少的梯度下降步骤就能适应新数据的模型。
匹配网络和原型网络也可以看做是元学习方法的一种形式，因为它们从新的训练episode中动态的生成简单的分类器，不同之处在于它们所依赖的核心嵌入在训练之后就已经固定了。匹配网络的FCE扩展包含依赖于支持集的二级嵌入。然而，在小样本学习情况下，数据样本的非常小，简单的归纳偏差似乎运作良好，不需要为每个episode学习自定义嵌入。

与Neural Statistician一样，我们为每个类得出一个汇总的统计数据。但是我们的是一个歧视性模型，这符合我们对于小样本学习的判别性任务。

关于零样本学习，原型网络对于嵌入元数据的应用预测线性分类器的权重。DS-SJE和DA-SJE的方式也学习了图像和类元数据的深度多模态嵌入函数。与我们的不同，他们的学习使用经验的风险损失。但是他们两个都没有使用episode训练，这种训练让我们加速训练并标准化模型。

5 总结

我们提出了对于小样本学习的原型网络的简单方式，它基于这种思想：我们可以在使用神经网络学习的表示空间中使用样本的均值来表示类。通过使用episode训练，这些网络在小样本设置下表现良好。原型网络比最近的元学习方式更简单也更有效，并且即使没有为匹配网络所开发的复杂扩展（它们也能应用于原型网络），它也能产生最先进的结果。我们通过谨慎选择距离度量和修正episode的学习程序来大幅度改良性能。我们进一步演示如何将其扩展到零样本学习，并且在CUB-200数据集上实现了最先进的结果。未来工作的自然的方向是利用Bregman散度而不是欧几里得距离来应对超出球面高斯的类条件分布。我们对其进行初步探索，包括为每个类的每个维度学习方差，这没有任何实质性收获。这表明嵌入网络自身具有足够的灵活性，不需要每类额外的拟合参数。总体来说，原型网络的简单和有效使其成为一种很有前景的小样本学习方法。

Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
智能产品经理的核心能力 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
智能产品经理的核心能力1.背景介绍在当今快节奏的数字时代,产品经理扮演着至关重要的角色,他们负责确保产品满足用户需求,实现商业目标,并保持竞争优势。随着人工智能(AI)和机器学习(ML)技术的不断发展,智能产品经理的概念应运而生。智能产品经理需要将传统的产品管理技能与新兴技术相结合,以创建具有创新性和智能化的产品体验。智能产品不仅需要满足功能需求,还需要提供个性化、智能化和无缝的用户体验。这对产品
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
堡垒机操作行为异常检测的机器学习算法应用
一、传统检测模式的困境与机器学习的破局价值在数字化转型浪潮中，堡垒机作为运维安全的核心防线，面临着操作行为复杂度激增与检测能力滞后的双重挑战。传统检测手段主要依赖静态规则库与统计模型，存在三大致命缺陷：规则固化与误报泛滥：某金融机构曾因规则库未及时更新，导致运维人员正常批量操作被误判为“暴力破解”，单日误报量超2000次，消耗安全团队60%的精力。动态行为适应性弱：微服务架构下，运维人员访问路径呈
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
机器学习与光子学的融合正重塑光学器件设计范式 m0_75133639 光电智能电视二维材料电子半导体人工智能顶刊 nature
Nature/Science最新研究表明，该交叉领域聚焦六大前沿方向：光子器件逆向设计、超构材料智能优化、光子神经网络加速器、非线性光学芯片开发、多任务协同优化及光谱智能预测。系统掌握该领域需构建四维知识体系：1、基础融合——从空间/集成光学系统切入，解析机器学习赋能光学的理论必然性，涵盖光学神经网络构建原理2、逆向设计革命——通过AnsysOptics实战，掌握FDTD算法与粒子群/拓扑优化技术
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
全球人工智能与机器学习大会PPT a flying bird 论文解读和大咖技术号记录人工智能
大会演讲PPT合集https://ppt.infoq.cn/list/93PPT分享|ppt|人工智能|aicon|infoq|机器学习PPT分享,前段时间的AICon北京站2021全球人工智能与机器学习大会（https://aicon.infoq.cn/2021/beijing），汇集了很多业界大佬，工业界多个方向的从业人员分享了他们在实际业……https://xw.qq.com/cmsid/2
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
数据挖掘：从理论到实践的深度探索代码老y 数据挖掘人工智能
在当今数字化时代，数据已经成为企业决策的重要依据。数据挖掘作为一门从大量数据中提取有价值信息的技术，已经广泛应用于各个领域，如金融、医疗、零售、互联网等。本文将深入探讨数据挖掘的基本概念、主要技术和实际应用案例，帮助读者更好地理解数据挖掘的价值和应用。一、数据挖掘的基本概念（一）数据挖掘的定义数据挖掘（DataMining）是从大量数据中提取有用信息的过程。它结合了统计学、机器学习、数据库技术和人
开发智能化的企业并购风险评估模型
开发智能化的企业并购风险评估模型关键词：企业并购、风险评估、人工智能、机器学习、深度学习、数学建模摘要：本文详细探讨了开发智能化企业并购风险评估模型的背景、核心概念、算法原理、系统架构设计以及项目实战。通过结合机器学习和深度学习技术，提出了一种基于数据驱动的智能化风险评估方法，旨在帮助企业更准确地识别和预测并购过程中的潜在风险，提升决策的科学性和有效性。第1章:企业并购风险评估模型的背景与问题描述
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
机器学习算法：核心原理与前沿发展综述 fmvrj34202 机器学习算法人工智能
机器学习算法作为人工智能的核心驱动力，正在重塑我们解决问题的范式。本文将系统性地探讨机器学习算法的分类体系、数学基础、优化方法以及最新发展趋势，为从业者提供技术参考。一、算法分类体系根据学习范式，机器学习算法可分为三大类：监督学习：基于标注数据的建模方法线性回归：最小化平方误差的闭式解θ=(XᵀX)⁻¹Xᵀy支持向量机：通过核技巧实现非线性分类，优化目标为max(0,1-yᵢ(w·xᵢ+b))决策
「日拱一码」020 机器学习——数据处理胖达不服输「日拱一码」机器学习人工智能数据处理 python
目录数据清洗缺失值处理删除缺失值：填充缺失值：重复值处理检测重复值处理重复值异常值处理Z-score方法IQR方法（四分位距）数据一致性检查数据转换规范化（归一化）Min-Max归一化MaxAbsScaler标准化离散化等宽离散化等频离散化数据清洗数据清洗是数据处理的第一步，目的是去除噪声数据、处理缺失值和异常值，使数据更加干净、可用缺失值处理删除缺失值：如果数据集中缺失值较少，可以直接删除包含缺
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end