追忆苔上雪

万字长文解析深度学习中的术语

引言

新手在学习深度学习或者在看深度学习论文的过程中，有不少专业词汇，软件翻译不出来，就算是翻译出来也看不懂，因为不少术语是借用其他学科的概念，这里整理了一些在深度学习中常见的术语，并对一些概念进行解释。

这里先教大家一个查概念的方法，比如我想查Ablation study，这个中文翻译是消融实验，这概念谁能明白呢，咱们可以从根源去查消融实验的含义，打开google，直接搜what is xxx in deep learning,如下面的图所示

好，下面开始总结，博主这里按照概念英文首字母进行排序，有部分概念为了方便对比也会放在一起，总结不全或有错误之处，请大家指出并多多包涵，总结不易，也请大家多多点赞收藏。

A--G

Ablation study(消融实验)

消融(ablation)是指去除人工智能系统的一个组件。消融研究通过删除某些组件来研究人工智能系统的性能，以了解该组件对整个系统的贡献。大白话就是说一个完整的框架去掉某个功能，看看系统还能运行成什么样。

Activation layer/Activation Function(激活层/激活函数)

激活层(Activation Layer)负责对卷积层抽取的特征进行激活，由于卷积操作是由输入矩阵与卷积核矩阵进行相乘的过程，是线性变化关系，需要激活层对其进行非线性的映射。

激活层主要由激活函数组成，即在卷积层输出结果的基础上嵌套一个非线性函数，让输出的特征图具有非线性关系。卷积网络中通常采用ReLU来充当激活函数（还包括tanh和sigmoid等）ReLU的函数形式如下所示，能够限制小于0的值为0,同时大于等于0的值保持不变。

Anchor box(锚框)/先验框(prior bounding box)/gound truth(真值)

(1)Anchor box

锚框是一个很难理解的概念，目标检测算法通常会对输入图像中的大量区域进行采样，确定这些区域是否包含感兴趣的目标，并调整区域的边缘，以便更准确地预测目标的真实边界框。不同的模型可能使用不同的区域采样方法。在这里，介绍一种这样的方法：它生成多个具有不同大小和长宽比的边界框，同时以每个像素为中心。这些边界框称为锚框。上文表明，锚框不过是图像中采样的区域。

(2)prior bounding box

那上面为什么把prior bounding box放到这里呢，在众多经典的目标检测模型中，均有先验框的说法，有的paper(如Faster RCNN)中称之为anchor(锚点)，有的paper(如SSD)称之为prior bounding box(先验框)，实际上是一个概念，特此说明。

这里提供一个详细的资料：动手学CV-Pytorch

(3)gound truth

那又为什么把gound truth放在这里一起解释呢，因为这几个概念往往一起出现，新手迷迷糊糊就别忽悠瘸了，如下图，我们在训练模型之前，需要先对图片进行标注(label)，比如将下图的小狗框出来。

gound truth翻译为真值还行，翻译为地面真相是真的太蠢了，个人认为(轻喷)，忘了是在哪儿看到的，gound truth来源于气象学，本意是指测量到的地面的真实数据，真么看翻译成地面真相也不是不能接受，个人还是愿意翻译为人工标注，这真的是很直观。

AP(Average Precision)

对象检测和定位算法的性能通过称为平均精度 (AP)（和平均精度，mean average precision，mAP）的指标进行评估。，AP 不是不同类别的平均精度，AP是借助其他几个指标来计算的，例如IoU、混淆矩阵（TP、FP、FN）、精度和召回率等，如下图所示。

Attention Mechanism(注意力机制)

注意力机制通过选择性地关注重要的输入元素来增强深度学习模型，提高预测精度和计算效率。他们优先考虑并强调相关信息，作为提高整体模型性能的焦点。在心理学中，注意力是选择性地集中于一件或几件事情而忽略其他事情的认知过程。神经网络被认为是一种以简化方式模仿人类大脑行为。注意力机制也是一种尝试，在深度神经网络中实现选择性地关注一些相关事物，而忽略其他事物的相同动作。

Baseline(基线)/Benchmark(基准)

这俩放一起也是为了比较，做个不恰当的比喻，就像修仙，你初期修仙的菜鸟水平就是基线，随着修行提升，相对于基线水平的菜鸟修行就有提升，基准就像是半步飞仙，你在修行的过程中向着这个目标前进并想办法超越半步飞仙这个基准成为飞仙。

(1)Baseline(基线)

基线模型本质上是一个简单的模型，在机器学习项目中充当参考。其主要功能是将训练模型的结果置于上下文中。基线模型通常缺乏复杂性，并且可能没有什么预测能力。无论如何，出于多种原因，将它们纳入其中是必要的。

(2)Benchmark(基准)

Benchmark是一种用于比较其他模型性能的模型。有不同类型的基准。有时，它是所谓的最先进模型，即给定数据集上针对给定问题的最佳模型。基准测试的目标是看看我们是否可以创建更好的模型并超越已发布的结果。

Backbone(骨干)

就这翻译谁能看懂，一般来说，术语Backbone是指将输入数据处理成某种特征表示的特征提取网络。这些特征提取网络通常在更简单的任务上作为独立网络表现良好，因此，我们可以将它们用作更复杂模型中的特征提取部分。

我们可以将许多流行的 CNN 架构用作神经网络的骨干。其中一些包括：

VGGs —— 包括具有 16 层和 19 层的 VGG-16 和 VGG-19 卷积网络。事实证明，它们在许多任务中都很有效，尤其是在图像分类和目标检测方面。
ResNets ——或残差神经网络，由卷积层和池化层块之间的跳跃连接或循环单元组成。 ResNet-50 和 ResNet 101 的一些流行版本常用于对象检测和语义分割任务。
Inception v1 —— GoogleNet 是最常用的卷积神经网络之一，作为许多计算机科学应用的支柱，包括视频摘要和动作识别。

以一篇论文是专门介绍backbone的：Backbones-Review: Feature Extraction Networks for Deep Learning and Deep Reinforcement Learning Approaches

论文链接：https://arxiv.org/abs/2206.08016

Batch(批量)/Epoch(批次)

在区分这俩概念之前要先了解一下随机梯度下降的概念

梯度下降更多参考：Gradient Descent For Machine Learning - MachineLearningMastery.com

随机梯度下降，简称 SGD，是一种用于训练机器学习算法的优化算法，尤其是深度学习中使用的人工神经网络。该算法的工作是找到一组内部模型参数，这些参数对于某些性能指标（例如对数损失或均方误差）表现良好。优化是一种搜索过程，您可以将这种搜索视为学习。该优化算法称为“梯度下降”，其中“梯度”是指误差梯度或误差斜率的计算，“下降”是指沿着该斜率向下移动到某个最小误差水平。该算法是迭代的。这意味着搜索过程发生在多个离散步骤中，每个步骤都希望稍微改进模型参数。每个步骤都涉及使用具有当前内部参数集的模型对某些样本进行预测，将预测与真实的预期结果进行比较，计算误差，并使用误差来更新内部模型参数。对于不同的算法，该更新过程是不同的，但在人工神经网络的情况下，使用反向传播更新算法。在我们深入研究批次和批量之前，让我们先看一下样本的含义。

(1)样本(Sample）

样本是单行数据。它包含输入到算法中的输入和用于与预测进行比较并计算误差的输出。训练数据集由许多行数据组成，例如许多样本。样本也可以称为实例、观察、输入向量或特征向量。

现在我们知道什么是样本，让我们定义一个Batch(批量)。

(2)Batch(批量)

批量大小(batch size)是一个超参数，定义在更新内部模型参数之前要处理的样本数量。将批次视为迭代一个或多个样本并进行预测的 for 循环。在批次结束时，将预测与预期输出变量进行比较并计算误差。根据该误差，使用更新算法来改进模型，例如沿着误差梯度向下移动。训练数据集可以分为一批或多批。当所有训练样本都用于创建一批时，该学习算法称为批量梯度下降。当批次大小为一个样本时，学习算法称为随机梯度下降。当批量大小大于一个样本且小于训练数据集的大小时，该学习算法称为小批量梯度下降。

批量梯度下降。批量大小 = 训练集大小
随机梯度下降。批量大小 = 1
小批量梯度下降。1 < 批量大小 < 训练集大小

在小批量梯度下降的情况下，流行的批量大小包括 32、64 和 128 个样本。您可能会在文献和教程的模型中看到这些值。

(3)Epoch(批次)

epoch 的数量是一个超参数，它定义了学习算法在整个训练数据集中工作的次数。一个epoch意味着训练数据集中的每个样本都有机会更新内部模型参数。一个epoch由一个或多个batch组成。例如，如上所述，一个 epoch 具有一个批次，称为批量梯度下降学习算法。可以想象一个针对 epoch 数的 for 循环，其中每个循环都在训练数据集上进行。在这个 for 循环中是另一个嵌套的 for 循环，它迭代每批样本，其中一个批次具有指定的“批量大小”数量的样本。epoch数量传统上很大，通常是数百或数千，允许学习算法运行直到模型的误差被充分最小化。您可能会在文献和教程中看到将 epoch 数量设置为 10、100、500、1000 或更大的示例。通常创建线图，将 x 轴上的历元显示为时间，并在 y 轴上显示模型的误差或技能。这些图有时称为学习曲线。这些图可以帮助诊断模型是否学习过度、学习不足或是否适合训练数据集。

(4)Batch(批量)/Epoch(批次)的区别

batch size是模型更新之前处理的样本数量。
epochs是完整通过训练数据集的次数。
Batch的大小必须大于或等于 1 且小于或等于训练数据集中的样本数。
epochs可以设置为 1 到无穷大之间的整数值。可以根据需要运行算法，甚至可以使用除固定周期数之外的其他标准来停止算法，例如模型误差随时间的变化（或缺乏变化）。
它们都是整数值，并且都是学习算法的超参数，例如学习过程的参数，而不是学习过程找到的内部模型参数。
必须指定学习算法的批量大小和批次数。
对于如何配置这些参数并没有什么神奇的规则。必须尝试不同的值，看看什么最适合自己问题。

Cascade(级联)

级联是基于多个分类器串联的集成学习的一种特殊情况，使用从给定分类器的输出中收集的所有信息作为级联中下一个分类器的附加信息。与投票或堆叠集成（多专家系统）不同，级联是多级系统。级联分类器使用特定对象的数百个“正”样本视图和相同大小的任意“负”图像进行训练。分类器经过训练后，可以将其应用于图像的某个区域并检测有问题的对象。要在整个帧中搜索对象，可以在图像上移动搜索窗口并使用分类器检查每个位置。此过程最常用于对象检测和跟踪的图像处理，主要是面部检测和识别。

Clustering(聚类)/K-means Clustering(k-均值聚类)

Clustering：聚类是在机器学习算法中将相似对象组织成组的行为。将相关对象分配到集群中对于 AI 模型是有益的。聚类在数据科学中有很多用途，例如图像处理、数据知识发现、无监督学习以及各种其他应用。聚类分析或聚类是通过扫描机器学习模型中未标记的数据集并设置特定数据点特征的测量来完成的。然后，聚类分析将对数据点进行分类并将其放置在具有匹配特征的组中。一旦数据被分组在一起，它将被分配一个簇ID号以帮助识别簇特征。使用聚类技术在机器学习模型中分解大型、复杂的数据集可以减轻破译复杂数据时的压力。

K-means Clustering：K-Means 聚类是一种无监督学习算法。与监督学习不同，此聚类没有标记数据。 K-Means 将对象划分为具有相似性但与属于另一个簇的对象不同的簇。“K”是一个数字。您需要告诉系统您需要创建多少个集群。例如，K = 2 表示两个簇。有一种方法可以找出给定数据的最佳或最佳 K 值。为了更好地理解 k 均值，我们以板球运动为例。想象一下，您收到了来自世界各地的许多板球运动员的数据，其中提供了有关该运动员得分的信息以及他们在过去十场比赛中取得的三柱门的信息。根据这些信息，我们需要将数据分为两个集群，即击球手和投球手。

Ensemble model(集成模型)

有时一个模型是不够的。

(1)什么是集成模型

集成模型是一种机器学习方法，在预测过程中结合多个其他模型。这些模型称为基本估计器。集成模型提供了一种解决方案来克服构建单个估计器的技术挑战。

(2)集成算法

单一算法可能无法对给定的数据集做出完美的预测。机器学习算法有其局限性，生成高精度模型具有挑战性。如果我们构建并组合多个模型，我们就有机会提高整体准确性。然后，我们通过聚合具有两个目标的每个模型的输出来实现模型的组合：

可以使用不同的技术(有时称为元算法)来实现这种聚合，如下图示例

end to end

在论文中经常能遇到end to end这样的描述，那么到底什么是端到端呢？其实就是给了一个输入，我们就给出一个输出，不管其中的过程多么复杂，但只要给了一个输入，机会对应一个输出。比如分类问题，你输入了一张图片，肯呢个网络有特征提取，全链接分类，概率计算什么的，但是跳出算法问题，单从结果来看，就是给了一张输入，输出了一个预测结果。End-To-End的方案，即输入一张图，输出最终想要的结果，算法细节和学习过程全部丢给了神经网络。

Embedding(嵌入)

深度学习方法都是利用使用线性和非线性转换对复杂的数据进行自动特征抽取，并将特征表示为“向量”（vector），这一过程一般也称为“嵌入”（embedding）

Fine tune(微调)

在深度学习中，Fine tune是一种迁移学习方法，其中预训练模型的权重在新数据上进行训练。 [1] 微调可以在整个神经网络上进行，也可以仅在其层的子集上进行，在这种情况下，未微调的层将被“冻结”（在反向传播步骤期间不会更新)。模型还可以使用由比原始模型少得多的参数组成的“适配器”进行增强，并通过调整适配器的权重并保持模型的其余权重冻结来以参数有效的方式进行微调。

对于某些架构，例如卷积神经网络，通常会冻结较早的层（最接近输入层的层），因为它们捕获较低级别的特征，而后面的层通常会识别与以下内容更相关的高级特征：模型训练的任务。

Feature map(特征图)

特征图也称为激活图。

从图像中提取过滤器后。

这些过滤器是图像的小部分，具有不同的特征。

输入上使用的过滤器数量应创建相同数量的特征图。

因此，具有 6 个滤波器的输入图像将具有 6 个特征图。

Feature and their locations in the input images

在上图中，有 2 个过滤器（红色轮廓和绿色轮廓）用于创建两个特征图。滤波器通过卷积运算在图像上滑动并生成特征图。还要注意从同一图像生成的这些特色地图有多么不同。每个特征图捕获同一图像的不同特征。通过更多数量的过滤器，我们将能够生成更多特征。例如，考虑一个 32 × 32 图像，以 1 的步幅宽度在学习/输入图像上滑动 5 × 5 感受野将产生 28 × 28 输出值的特征图。

32 × 32 ==> 28 × 28 ( 32–5 + 1 × 32–5 + 1 )

或者每个图像 784 个不同的激活。

Figure 2: Features

特征图（卷积特征）的大小由我们需要在执行卷积步骤之前决定的三个参数控制：

深度(Depth)：深度对应于我们用于卷积运算的滤波器的数量。在图 3 所示的网络中，我们使用三个不同的滤波器对原始船只图像进行卷积，从而生成如图所示的三个不同的特征图。您可以将这三个特征图视为堆叠的二维矩阵，因此特征图的“深度”将为三。

Figure 3: Feature Map depth parameters

步幅(Stride)：步幅是我们在输入矩阵上滑动过滤器矩阵的像素数。当步长为 1 时，我们一次移动过滤器一个像素。当步长为 2 时，当我们滑动过滤器时，过滤器一次跳跃 2 个像素。步幅较大会产生较小的特征图。
零填充(Zero-padding)：有时，在边界周围用零填充输入矩阵很方便，这样我们就可以将过滤器应用于输入图像矩阵的边界元素。零填充的一个很好的功能是它允许我们控制特征图的大小。添加零填充也称为宽卷积，不使用零填充则称为窄卷积。这在[2]中已经解释得很清楚了。

FPS

Frames Per Second，每秒帧数，就是帧率

Generative Adversarial Network(GAN，生成对抗网络)

GAN包含有两个模型，一个是生成模型（generative model），一个是判别模型(discriminative model)。生成模型的任务是生成看起来自然真实的、和原始数据相似的实例。判别模型的任务是判断给定的实例看起来是自然真实的还是人为伪造的（真实实例来源于数据集，伪造实例来源于生成模型）。

这可以看做一种零和游戏。生成器（generator）试图欺骗判别器（discriminator），判别器则努力不被生成器欺骗。模型经过交替优化训练，两种模型都能得到提升，但最终我们要得到的是效果提升到很高很好的生成模型，这生成模型所生成的产品能达到真假难分的地步。

在训练过程中，生成网络G的目标是生成尽可能多的真实图像来欺骗网络D，而D的目标是试图将G生成的假图像与真实图像区分开来。这样，G和D构成一个动态的“博弈过程”，最终的均衡点为纳什均衡点。

H--N

Hyperparameter(超参数)

超参数。模型参数是根据数据自动估算的，例如权重。但模型超参数是手动设置的，并且在过程中用于帮助估计模型参数，例如学习率。

Intersection over Union(IoU，交并比)

IoU 量化两个边界框（ground truth and prediction）的接近程度。它是一个介于 0 和 1 之间的值。如果两个边界框完全重叠，则预测是完美的，因此 IoU 为 1。另一方面，如果两个边界框不重叠，则 IoU 为 0。IoU 通过计算两个连接盒的相交面积与并集面积之比来计算，如下所示。

Learning rate(学习率)

深度学习神经网络使用随机梯度下降优化算法进行训练。学习率是一个超参数，它控制每次更新模型权重时响应估计误差而改变模型的程度。选择学习率具有挑战性，因为值太小可能会导致训练过程过长并可能陷入困境，而值太大可能会导致过快地学习次优权重集或训练过程不稳定。配置神经网络时，学习率可能是最重要的超参数。因此，了解如何研究学习率对模型性能的影响并建立关于学习率对模型行为动态的直觉至关重要。

loss function(损失函数)

在数学优化和决策理论中，损失或成本函数（有时也称为误差函数）是将事件或一个或多个变量的值映射到直观地表示与事件相关的某些“成本”的实数的函数。简单来说，损失函数是一种评估算法对数据集建模效果的方法。它是机器学习算法参数的数学函数。在简单线性回归中，使用斜率（m）和截距（b）计算预测。其损失函数是 (Yi – Yihat)^2，即损失函数是斜率和截距的函数。

Multilayer Perceptron(MLP，多层感知机)

不要将“MLP”与“NLP”混淆，“NLP”指的是自然语言处理(natural language processing)。多层感知机 (MLP) 是一类全连接的前馈人工神经网络 (ANN，artificial neural network)。 MLP 一词的使用含糊不清，有时宽松地表示任何前馈 ANN，有时严格地指由多层感知器（具有阈值激活）组成的网络。多层感知器有时通俗地称为“普通”神经网络，特别是当它们具有单个隐藏层时。

MLP 至少由三层节点组成：输入层、隐藏层和输出层。除输入节点外，每个节点都是使用非线性激活函数的神经元。 MLP 利用基于链规则的监督学习技术（称为反向传播或自动微分的反向模式）进行训练。它的多层和非线性激活将 MLP 与线性感知器区分开来。它可以区分不可线性分离的数据。

O--T

Off-the-shelf

已有的，现成的

Pipeline(超参数)

Pipeline如果直译是管道或者流水线，这谁能看懂呢。

在机器学习中，Pipeline定义是一种自动化机器学习工作流程的方法，方法是将数据转换并关联到模型中，然后对模型进行分析以实现输出。这种类型的 ML Pipeline使将数据输入 ML 模型的过程完全自动化(这么看流水线还挺形象，个人还是喜欢翻译为通道) 。

另一种类型的机器学习Pipeline是将机器学习工作流程拆分为独立的、可重用的模块化部分的艺术，然后可以将这些部分连接在一起以创建模型。这种类型的机器学习Pipeline使构建模型更加高效和简化，消除了多余的工作。

pooling(池化)

池化是一个深度学习中的操作手段，在程序中对应的就是池化层(pooling layer)，卷积神经网络中的池化是一种概括卷积滤波器(convolutional filters)提取的特征并帮助网络识别特征的技术，而与特征在图像中的位置无关。

（1）为什么卷积神经网络中需要池化

卷积层是用于图像识别等计算机视觉应用的卷积神经网络的基本构建块。卷积层在图像上滑动过滤器并提取特征，从而生成特征图，该特征图可以馈送到下一个卷积层以提取更高级别的特征。因此，堆叠多个卷积层使 CNN 能够识别图像中日益复杂的结构和对象。

卷积层的一个主要问题是过滤器生成的特征图是位置相关的。这意味着在训练过程中，卷积神经网络学习将某个特征的存在与输入图像中的特定位置相关联。这会严重降低性能。相反，我们希望特征图和网络具有平移不变性（一种奇特的表达，意味着特征的位置不重要）。

在关于填充和步幅的文章中，我们讨论了卷积运算中更大的步幅如何帮助将图像集中在更高级别的特征上。专注于更高级别的结构可以使网络更少地依赖于与特征位置相关的粒度细节。池化是让网络专注于更高级别功能的另一种方法。在卷积神经网络中，池化通常应用于由前面的卷积层和非线性激活函数产生的特征图。

（2）池化是如何进行的

池化的基本过程与卷积运算非常相似。您选择一个过滤器并将其滑动到前一个卷积层的输出特征图上。最常用的过滤器大小是 2×2，它使用 2 的步长在输入上滑动。根据您选择的池化操作类型，池化过滤器计算感受野上（过滤器下的特征图部分）的输出。有多种池化方法。最常用的方法是最大池化和平均池化。

（3）Max Pooling（最大池化）

在最大池化中，滤波器简单地选择感受野中的最大像素值。例如，如果字段中有 4 个像素，其值为 3、9、0 和 6，则选择 9。

（4）Average Pooling（平均池化）

平均池化的工作原理是计算感受野中像素值的平均值。给定 4 个像素，值为 3、9、0 和 6，平均池化层将产生 4.5 的输出。四舍五入到整数后得到 5。

（5）如何理解池化值

您可以将池化层计算和保留的数字视为指示特定特征的存在。如果神经网络仅依赖于原始特征图，则其检测特征的能力将取决于图中的位置。例如，如果仅在左上象限中找到数字 9，则网络将学习将连接到数字 9 的特征与左上象限相关联。通过应用池化，我们将该特征提取到一个更小、更通用的地图中，该地图仅指示某个特征是否存在于该特定象限中。每增加一层，地图都会缩小，只保留有关感兴趣特征的存在的重要信息。随着地图变小，它变得越来越独立于要素的位置。只要在原始位置附近检测到该特征，它就应该类似地反映在池化层生成的地图中。

由于它关注极值，最大池化关注感受野中更突出的特征和边缘。另一方面，平均池化可以创建更平滑的特征图，因为它生成平均值而不是选择极值。在实践中，最大池化应用得更频繁，因为它通常更擅长识别突出特征。在实际应用中，平均池化仅用于将特征图折叠到特定大小。由于池化能够折叠特征图，因此还可以帮助对不同大小的图像进行分类。神经网络中的分类层期望接收相同格式的输入。因此，我们通常以相同的标准尺寸提供图像。通过在池化操作期间改变偏移量，我们可以总结不同大小的图像，并且仍然生成相似大小的特征图。一般来说，当您执行图像分类任务时，您只需要检测图像中某个对象是否存在，但不关心它的具体位置，池化尤其有用。事实上，池化滤波器使用比卷积滤波器更大的步长并导致更小的输出，这一事实也支持网络的效率并导致更快的训练。换句话说，位置不变性可以极大地提高网络的统计效率。

Precision/Recall(精度/召回率)-----Accuracy(准确度)/F1 score(F1得分)

基于 TP、FP 和 FN(这仨指标下文有)，对于每个标记类别，我们计算两个参数：精度和召回率(放一起是为了好总结)。

Precision：告诉我们模型的精确度，即在检测到的猫总数中，有多少是真正的猫。因此，它是模型做出的真阳性与猫预测总数（相当于真阳性和假阳性之和）之间的比率，如下图所示。

Recall：告诉我们模型在从图像中召回类别方面有多好，即在输入图像中的猫总数中模型能够检测到多少只。因此，它是模型得出的真阳性与地面真猫总数之间的比率（相当于真阳性和假阴性的总和），如下图所示。

从上图可以看出，分类器的预测是准确的。当它说它是一只猫（狗）时，80%的时间都是正确的。但是，如果图像中存在猫（狗），则分类器只能在 50% (80%) 的时间内检测到它。因此，该模型很难回忆起猫(模型老年痴呆了乛ᴗ乛)。

Accuracy：把准确度放这儿是为了和上面的精度对比。

准确率（Accuracy）表示分类正确的样本占总样本个数的比例，计算公式如下

F1 score：F1 score是精度和召回率的一个加权平均，计算公式如下。

Precision体现了模型对负样本的区分能力，Precision越高，模型对负样本的区分能力越强；Recall体现了模型对正样本的识别能力，Recall越高，模型对正样本的识别能力越强。F1 score是两者的综合，F1 score越高，说明模型越稳健。

receptive field(RF, 感受野)

在典型CNN结构中，FC层(全连接层，FC layer)每个输出节点的值都依赖FC层所有输入，而CONV层(卷积层，Convolutional Layer)每个输出节点的值仅依赖CONV层输入的一个区域，这个区域之外的其他输入值都不会影响输出值，该区域就是感受野。

图中是个微型CNN，来自Inception-v3论文(Rethinking the Inception Architecture for Computer Vision)，原图是为了说明一个conv5x5可以用两个conv3x3代替，从下到上称为第1, 2, 3层：

第2层左下角的值，是第1层左下红框中3x3区域的值经过卷积，也就是乘加运算计算出来的，即第2层左下角位置的感受野是第1层左下红框区域
第3层唯一值，是第2层所有3x3区域卷积得到的，即第3层唯一位置的感受野是第2层所有3x3区域
第3层唯一值，是第1层所有5x5区域经过两层卷积得到的，即第3层唯一位置的感受野是第1层所有5x5区域

就是这么简单，某一层feature map(特性图)中某个位置的特征向量，是由前面某一层固定区域的输入计算出来的，那这个区域就是这个位置的感受野。任意两个层之间都有位置—感受野对应关系，但我们更常用的是feature map层到输入图像的感受野，如目标检测中我们需要知道feature map层每个位置的特征向量对应输入图像哪个区域，以便我们在这个区域中设置anchor，检测该区域内的目标。

感受野区域之外图像区域的像素不会影响feature map层的特征向量，所以我们不太可能让CNN仅依赖某个特征向量去找到其对应输入感受野之外的目标。这里说“不太可能”而不是“绝无可能”，是因为CNN很强大，且图像像素之间有相关性，有时候感受野之外的目标是可以猜出来的，什么一叶知秋，管中窥豹，见微知著之类，对CNN目标检测都是有可能的，但猜出来的结果并不总是那么靠谱。

感受野有什么用呢？

一般task要求感受野越大越好，如图像分类中最后卷积层的感受野要大于输入图像，网络深度越深感受野越大性能越好
密集预测task要求输出像素的感受野足够的大，确保做出决策时没有忽略重要信息，一般也是越深越好
目标检测task中设置anchor要严格对应感受野，anchor太大或偏离感受野都会严重影响检测性能
Region of interest(ROI)

感兴趣区域（通常缩写为 ROI）是为特定目的标识的数据集中的样本。

Region of Interest Pooling

感兴趣区域池化（也称为 RoI 池化）是一种广泛应用于使用卷积神经网络的对象检测任务中的操作。例如，在单个图像中检测多辆汽车和行人。其目的是对非均匀大小的输入执行最大池化以获得固定大小的特征图。

Prior knowledge(先验知识)

除了机器学习pipeline中常见的信息源——训练数据之外，还可以另外整合知识。如果这个知识是预先存在的，并且不依赖于学习算法，就可以称之为先验知识。剪枝主要充当网络内的架构搜索。事实上，在稀疏度较低（约 40%）的情况下，模型的泛化能力通常会稍好一些，因为剪枝起到了正则化的作用。在更高的级别上，修剪后的模型将与基线匹配。进一步推进，该模型将开始比基线更差，但具有更好的性能。例如，经过精心修剪的 ResNet-50 模型在稀疏度为 90% 时几乎可以与 ImageNet 上的基线精度相匹配（模型中 90% 的权重为零）。

Pruning(剪枝)

剪枝是删除网络中的权重连接以提高推理速度并减少模型存储大小的过程。一般来说，神经网络的参数化程度非常高。修剪网络可以被认为是从过度参数化的网络中删除未使用的参数。

Residual Network(ResNet，残差网络)

残差网络（ResNet）是一种用于计算机视觉应用的深度学习模型。它是一种卷积神经网络 (CNN) 架构，旨在支持数百或数千个卷积层。以前的 CNN 架构无法扩展到大量层，从而导致性能有限。然而，当添加更多层时，研究人员面临“梯度消失”问题。神经网络通过反向传播过程进行训练，该过程依赖于梯度下降，向下移动损失函数并找到使其最小化的权重。如果层数太多，重复的乘法最终会减小梯度，直至“消失”，并且随着每层的添加，性能会饱和或恶化。ResNet 为梯度消失问题提供了一种创新的解决方案，称为“跳跃连接”。 ResNet 堆叠多个恒等映射（首先不执行任何操作的卷积层），跳过这些层，并重用前一层的激活。跳过通过将网络压缩为更少的层来加速初始训练。然后，当重新训练网络时，所有层都会扩展，并且网络的其余部分（称为残差部分）可以探索输入图像的更多特征空间。大多数 ResNet 模型一次跳过两层或三层，中间有非线性和批量归一化。更先进的 ResNet 架构（称为 HighwayNet）可以学习“跳过权重”，动态确定要跳过的层数。ResNet 架构引入了将中间输入添加到一系列卷积块的输出的简单概念。如下图所示。

State-of-the-art (SOTA)

可翻译为最先进的，最高水平。

True Positive/False Positive/False Negative/True Negative(真阳性/假阳性/假阴性/真阴性)

这些其实都是来自统计学的概念，而且字面翻译也是云里雾里，所以要做一下解释

True Positive：模型预测某个位置存在边界框（正）并且是正确的（真）；---->我找到了正确的目标
False Positive：模型预测特定位置存在边界框（正），但结果是错误的（假）；---->我把错的当成的真的
False Negative：模型没有预测某个位置的边界框（负），并且是错误的（假），即该位置存在真实边界框；---->我把真的当成了错的
True Negative：模型没有预测边界框（负）并且它是正确的（真）； ---->我找到了错误的目标

True Negative对应于背景，即没有边界框的区域，并且不用于计算最终指标。

以下示例将有助于阐明 TP、FP 和 FN。

U--Z

Upsampling(上采样)/Downsampling(下采样)

Downsampling：读完这项技术的名称后，直观地知道它与图像的缩小有关。嗯，没错！这个想法是正确的，有人出于各种原因缩小图像的尺寸，例如：它使数据的大小更易于管理；降低数据的维度，从而加快数据（图像）的处理速度；减少数据的存储大小；根据用途，该技术还有一些其他用途。有时它与图像压缩相混淆，图像压缩是不同的事情，并且具有完全不同的用途。这里我们只关心图像的缩小。嗯，这是什么意思？这本质上意味着丢弃一些（非必要的）信息。由此，我们可以得出一个提示：我们需要从图像中丢弃一些行和/或列。我们需要丢弃一些信息。

Upsampling：另一方面，上采样只不过是下采样的相反目标：增加图像的行数和/或列数（尺寸）。这可以在多种情况下使用，例如 GAN（生成对抗网络）中使用的情况，其目的是根据随机向量样本构建图像，模仿来自真实分布或真实分布的图像。还有很多其他的比如提高图像质量等等。让我们更详细地讨论这个问题。

下采样时，我们的意图相当简单明了，但上采样时就不那么简单了。我们需要以某种方式增加图像的尺寸并填充间隙（列/行）。假设您想要将原始图像上采样 3 倍，这意味着您需要使用某种逻辑为图像中的每行/列添加 2 个行/列。一种方法可能是重复原始图像中的每一列/行。

如果您这样做，有趣的是，您会观察到两个图像：原始图像和生成的图像即使不完全相同，看起来也非常相似。为了说明这一点，您没有在生成的图像中创建任何“新”数据。由于重复的行和列是完全冗余的，因此该方法没有任何用处，并且它不提供任何新信息。添加新列的明智方法是在行/列之间插入新数据，这使用一些高级数学生成提供相当准确的中间值。

Without bells and whistles

没有花里胡哨的方法（不添加不必要，冗余的东西）

Warm up(热身)

Warm up指的是用一个小的学习率先训练几个epoch，这是因为网络的参数是随机初始化的，一开始就采用较大的学习率容易数值不稳定。

你可能感兴趣的:(深度学习,人工智能,pytorch,机器学习,神经网络)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。