wangtao990503

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏

摘要

阐述：知识蒸馏是一种通过利用教师模型的输出来增强学生模型泛化能力的技术。最近，基于特征图的变体探索了中间层中手动分配的师生对之间的知识转移，以进一步改进。

存在问题：然而，不同神经网络中的层语义可能不同，人工层关联中的语义失配将导致由于负正则化而导致性能退化。

解决方法：为了解决这个问题，提出了跨层知识蒸馏的语义校准（Semantic Calibration for cross layer Knowledge Distillement，SemCKD），它通过注意力机制为每个学生层自动分配教师模型的适当目标层。通过学习注意力分布，每个学生层提取包含在多个教师层中的知识，而不是特定的中间层，以进行适当的跨层监督。

介绍

不论在各个领域中，深度学习模型的发展趋势都可以大体分成两个个方向：更强大和更轻便。而在诸多技术之中，知识蒸馏（KD）是一条兼顾二个方向的解决方案，可以同时实现更好的模型性能，并保持轻便性。

轻量级模型的泛化能力一致被人诟病，但是最近的研究发现这一问题可以被特殊的再训练来解决。名为教师的强大模型被预先训练，其输出被用于提高名为学生的轻量级模型的性能。学生模型不使用离散标签，而是使用教师模型的班级预测作为有效的正则化，以避免让它陷入过拟合的局部最优。

传统知识蒸馏的问题在于，学生模型学习的目标仅限于教师模型的最终预测结果。尽管教师模型对于不同类别的相对概率可以包含远高于标准标签的信息量，但是这一经过复杂教师网络高度抽象化的知识转移方式忽略了中间层中所包含的有效的中间提取特征的过程。于是由前人提出了基于特征图的特殊表示，以让学生模型可以学习到更丰富的知识。基于特征图的知识提取成功的一种解释是，多层特征表示尊重分层概念学习过程，并将带来合理的归纳偏差。

特征蒸馏在提出的初期，研究者一般将教师模型一组中间层按顺序或者手动分配给学生模型中对应位置的中间层组。这样生硬的蒸馏策略可能会导致某些师生层对中的语义不匹配，从而导致学生模型训练中的负正则化和其性能的恶化。因此在特征蒸馏的过程中确保适当的层与层之间的关联成为了一个急需解决的问题，使得特征蒸馏可以更有效和更灵活的进行知识转移。

这篇文章便提出了一个跨层知识蒸馏的语义校准（Semantic Calibration for crosslayer Knowledge Distillement，SemCKD）以通过将传递保持在匹配的语义级别来开发中间知识。将注意力机制应用于自动学习软层关联，该机制有效地将学生层与多个语义相关目标层绑定，而不是教师模型中的固定目标层（即一对多的知识转移）。为了对齐每个层对中的特征图的空间维度以计算总损失，学生层的特征图被投影到与相关目标层中的特征图相同的维度。通过利用语义校准和跨多个层的特征图传输，可以在更适当的指导下有效地优化学生模型。

语义校准的蒸馏

符号化知识蒸馏

符号解释总览
$\rho = \left \{ \left ( x_{i},y_{i} \right ) \right \}_{i=1}^{N}$	N个数据的数据集，有K个类别
b	批量大小
$F_{t_{l}}^{t}\in \mathbb{R}^{bc_{t_{l}}h_{t_{l}}*w_{t_{l}}}$	教师的 l 层的输出
$F_{s_{l}}^{s}\in \mathbb{R}^{bc_{s_{l}}h_{s_{l}}*w_{s_{l}}}$	学生的 l 层的输出
$t_{l},s_{l}$	教师、学生的中间层，L为最大值且不一定相同
$g_{i}^{s}$	模型最后一层的第i个样本的输出
$\sigma \left ( g_{i}^{s} \right )$	正确类别对应的概率结果
$\L _{CE},\L _{KL}$	交叉熵损失、KL散度最小化
T	温度

公式1

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第1张图片

图1

传统知识蒸馏先令教师模型根据原本的特征-标签进行学习，然后将教师模型学习的结果，即soft-targets作为另一个标签，令学生模型同时学习原标签与新标签，并用公式1作为损失函数。

特征图蒸馏

如前所述，教师模型的特征图对于帮助学生模型获得更好的表现是有价值的。最近提出的特征图蒸馏方法可以总结为：对于尺寸为b的每个小批量，将以下损失添加到公式1中：

公式2

公式3

$Trans^{t}\left ( \cdot \right )$ ， $Trans^{s}\left ( \cdot \right )$ 表示教师模型和学生模型在进行特征图知识转移之前的格式转换操作（前人具体选择参考表2）； $\mathbb{C}$ 表示层关联集合，集合元素为一对层的匹配，候选集合： $\mathbb{C}=\left \{ \left ( 1,1 \right ) ,...,\left ( min\left ( s_{L},t_{L} \right ) ,min\left ( s_{L},t_{L} \right ) \right )\right \}$ 共计 $min\left ( s_{L},t_{L} \right )$ 个元素； $Dist\left ( \cdot \right )$ 表示计算两特征图之间的距离（前人具体选择参考表2）。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第2张图片

表2

FitNet[16]在学生模型的某个中间层上添加了卷积变换，即Conv（·），同时通过恒等变换I（·）保持教师模型的特征图不变。AT[17]鼓励学生通过引导注意力模仿老师的空间注意力图。VID[19]将知识转移表述为特征图之间的互信息（MI）最大化，并将距离函数表示为负对数似然（NLL）。

传递的知识也可以通过建立在其上的粗糙相似矩阵或混合核变换来捕获[18]，[20]。MGD[21]使得候选层对中的特征图的信道维度通过分配模块ρ（·）匹配。请注意，HKD[20]所需的计算和存储资源几乎是其两倍。由于它首先将特征嵌入从教师转移到辅助模型，辅助模型遵循与学生相同的架构，但每层具有两个参数，然后执行从辅助到学生模型的特征图提取。

所有上述方法都基于指定的师生层对之间的固定关联来执行知识转移，这可能会导致有用信息的丢失。以一对一匹配为例，当 $s_{L}$ 和 $t_{L}$ 不同时，会丢弃额外的层。此外，强制对齐来自相同层深度的特征图可能导致次优关联，因为学生层的更好选择可能来自不同或多个目标教师层。

为了解决这些问题，本文提出了一种新的跨层知识提取来促进特征图表示的开发。基于我们学习的层关联权重，简单的卷积 $Trans^{t}\left ( \cdot \right )$ ， $Trans^{s}\left ( \cdot \right )$ 和MSE距离足以获得最先进的结果。

语义校准公式

在本文的方法中，每个学生层通过注意力分配自动与那些语义相关的目标层相关联，如图2所示。使用软关联权重的训练鼓励学生模型收集和集成多层信息，以获得更合适的正则化。此外，SemCKD很容易适用于教师和学生模型中候选层的数量不同的情况。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第3张图片

图2 提出的知识蒸馏语义校准（SemCKD）概述。（a）来自学生层1的特定实例的特征图被投影成三个单独的形式，以与来自相关目标层的特征图的空间维度对齐。学习到的注意力分配自适应地帮助学生模型专注于最语义相关的信息，以进行有效的提炼。（b）首先计算每个堆叠的特征图之间的成对相似度，然后通过生成的查询向量和关键向量之间的相似度来获得关注权重。

SemCKD中的学习关联集 $\mathbb{C}$ 表示为：

公式4

相应的权重满足： $\small \sum _{t_{l}=1}^{t_{L}}\alpha _{\left ( s_{l},t_{l} \right )}=1,s_{l}\in [1,...,s_{L}]$ 。小批量实例的权重 $\alpha _{\left (s_{l},t_{l} \right )}\in \mathbb{R}^{b*1}$ 表示目标层 $t_{l}$ 在推导学生层 $s_{l}$ 的语义感知指导时所参与的程度。每个实例将为层对（ $s_{l}$ ， $t_{l}$ ）保持其自己的关联权重 $\small alpha _{\left ( s_{l},t_{l} \right )}\left [ i \right ]$ ，该权重由给定特征图的函数F（·，·）计算：

公式5

给定这些关联权重，每个学生层的特征图被投影到 $\small t_{L}$ 个单独的张量中，以与来自每个目标层的特征的空间维度对齐：

公式6

带 $F_{t_{l}}^{s`}\in \mathbb{R}^{b*c_{t_{l}}*h_{t_{l}}*w_{t_{l}}}$ 。每个函数Proj（·，·）包括一个三层堆栈，具有1×1、3×3和1×1卷积，以满足有效转换能力的需求。

损失函数：

对于每次训练中批量大小为b的实例，教师模型和学生模型将生成各自的多个层的特征图： $F_{t_{1}}^{t},...,F_{t_{L}}^{t}$ 和 $F_{s_{1}}^{s},...,F_{s_{L}}^{s}$ 。在注意力分配和维度投影之后，通过简单地使用MSE作为距离函数来获得SemCKD的特征图蒸馏损失：

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第4张图片

公式7

每个学生模型的网络层通过公式6的投影函数进行变换，而与之配对的教师层则保持恒等。配备了学习的层关联权重，总损失通过来自候选师生层对的特征图中的每个单独距离的加权和来聚合。值得一提的是，上面提到的FitNet[16]可以理解为本算法的特殊情况，即对应层对权重为1，其它层对权重为0。

注意力分配：

该部分阐述如何计算权重！

前人的工作指出，随着层深度的增加，训练神经网络中包含的特征表示逐渐变得更加抽象。因此，教师和学生模型中的层语义通常是不同的。由于语义不匹配层造成的负面影响，现有的手工策略（未考虑到这一因素）可能不够[20]。为了进一步提高特征图提取的性能，每个学生层最好与最语义相关的目标层相关联。

基于注意力机制的层关联为这一目标提供了潜在可行的解决方案。SP.[18]基于对相似实例生成的特征图可能在不同中间层中以不同距离间隔进行聚合的观察，我们将成对相似矩阵的近似度视为固有语义相似性的良好度量（即以成对相似矩阵的近似值作为两特征图语义是否相似的标准）。这些矩阵计算如下（其中R()是一个reshape操作，A矩阵形为bxb）：

公式8

作者受到自注意力结构的启发，通过MLP将每个学生层和相关目标层的成对相似矩阵分别投影到两个子空间中，以减轻噪声和稀疏性的影响（原理未知，欢迎讨论）。对于第i个实例，有：

公式9

$MLP_{Q}$ 和 $MLP_{K}$ 在训练过程中学习参数，用以生成query和key，并且由所有实例共享。然后， $\alpha _{\left (s_{l},t_{l} \right )}\left [ i \right ]$ 计算如下：

公式10

其中，用于计算注意力权重的F（·，·）被命名为非局部块中的嵌入高斯运算。

基于注意力的分配提供了一种可能的方法来抑制层配对不当造成的负面影响，并整合来自多个目标层的积极指导，在后续章节有所推理和验证。尽管我们提出的SemCKD仅提取了中间层中包含的知识，通过引入额外的正则化，例如特征嵌入蒸馏，可以进一步提高其性能。算法1总结了使用所提出的语义校准公式的完整训练过程。

软化注意力：

传统知识蒸馏有一个值得注意的点，即T--温度，在本文中一直不受“重视”，但在本节中，作者学习这一思路，对自己的算法做出了一定的改进，可以进一步提高SemCKD的性能。他们在公式10中加入了T参数，以得到软化注意力（softening attention）。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第6张图片

公式11

$\tau$ 被设置为一个常数，以抵消原始自注意框架中训练期间的极小梯度，但它被视为SemCKDτ中的一个新的超参数。

实验

实验设置

数据集：

在本文中，使用四个流行的数据集，包括CIFAR-100、STL-10、Tiny ImageNet和ImageNet，来执行一系列关于图像分类、转移学习、少镜头学习和噪声标签学习的任务。与先前的工作一样，采用了标准的预处理程序，即，通过信道均值和标准差对所有图像进行归一化。

网络架构：

基于流行网络的大量师生组合被用于评估。“VGG-”或“ResNet-”后面的数字表示网络的深度。“WRN-d-w”表示具有深度d和宽度因子w的wide-ResNet。“ResNet-8x4”、“ResNet-32x4”和“ResNet-34x4”或“ShuffleNetV2x0.5”中的“x”后面的数字表示每个层中的过滤器的数量是用特定因子扩展或收缩的。

比较方法：

本文比较了三种基于从不同位置转移知识的知识提取方法：

普通的soft-targets蒸馏
特征图蒸馏
特征编码蒸馏

评估指标：

除了在性能评估中广泛使用的Top-1测试准确度（%）外，还采用了另一种称为相对改善（RI）及其变体平均相对改善（ARI）的度量，以获得关于定量改善的直观感觉。

提出了一种称为语义不匹配分数（SM-score）的计算友好度量。SM得分是通过生成的每个相关师生层对的相似性矩阵之间的平均欧几里德距离来计算的。

不同特征图提取方法的比较

表3和表4给出了基于12种网络组合的CIFAR100的Top-1测试准确率（%），其中包括两种同质设置，即教师和学生共享相似的架构（VGG-8/13，ResNet-8x4/32x4）和十种异质设置。除了第一行和最后一行之外的每一列都包括在同一教师模型的监督下通过各种方法训练的某个学生模型的结果。还包括传统KD的结果，以供比较。有两种组合，MGD不适用，表示为“-”。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第8张图片

表三在CIFAR-100上测试特征图蒸馏方法的精度。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第9张图片

表四在CIFAR-100上测试特征图蒸馏方法的精度。

语义校准分析

在本节中，通过实验研究了由手动指定的层关联引起的负正则化，并通过提出的标准和视觉证据为SemCKD的成功提供了一些解释。

负正则化

当具有特定层关联的特征图提取比普通KD执行得差时，就会出现这一现象。为了揭示它的存在，作者在各种设置中仅使用一个指定的师生层对来训练学生模型。所涉及的网络架构包括

“VGG-8&ResNet-32x4”

“MobileNetV2&WRN-40-2”

“ShuffleNetV2&VGG-13”

“ResNet-8x4&ResNet32x4”。

每种情况下的候选目标层和学生层的数量分别为（3，4）、（3，3）、（4，3）和（3，5）。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第10张图片

图四用四种模型组合说明CIFAR-100上的负正则化。x轴上的每个刻度标记表示学生层编号。每个指定师生层对的结果用不同的颜色条显示。

图3显示了具有这12或9个师生层组合的学生模型的结果。为了更好地进行比较，普通KD和SemCKD的结果绘制为具有不同颜色的虚线水平线。我们可以看到，对于某些层关联，学生模型的性能变得非常差，这可能是由大的语义差距造成的。典型结果包括图3（a）中的“学生第4层和目标第3层”、图3（b）中的学生第1、2和目标第三层”、图3（c）中“学生第1和目标第4层”以及图3（d）中的”学生第1层、第3层和目标三层”。

另一个发现是，一对一层关联是次优的，因为通过利用不同深度的目标层中的信息可以获得更好的结果，例如图3（b）中的“学生层1和目标层2”、图3（c）中的学生层3和目标层4”以及图3（d）中的”学生层1与目标层2“。尽管在某些情况下，使用某些手工层关联进行的训练可能会优于SemCKD，例如图3（b）中的“学生层-3，4和目标层-3”，但SemCKD在大量关联选择中仍然表现良好，尤其是对于任何网络组合的最佳层关联的知识事先都不可用。然而，SemCKD低于最佳的情况表明，本文的关联策略还有额外的改进空间。

语义不匹配评分

本节研究本文所提出的方法是否真的出现较少的语义不匹配现象，除了原本的SM-score，还加入了CKA来评估提取的特征图之间的相似性。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第11张图片

表6 CIFAR-100上VGG-8和ResNet-32x4的语义匹配评估。

软注意力

在本节中，作者对大量师生组合进行了实验，以验证SemCKD中软化注意力的有效性。

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏_第12张图片

图6 八种不同型号组合的CIFAR-100软化注意力的效果说明。

如图5所示，我们测试了具有不同柔软度 $\tau$ 的每个学生模型的性能，并绘制了SemCKDτ结果的橙色曲线。为了在知识转移期间尽可能多地保留教师模型中的信息，先前的工作尝试将蒸馏位置调整到ReLU操作的前面，这被称为预激活蒸馏。我们还将此操作合并到SemCKD $\tau$ 中，并将此变体命名为SemCKD $_{\tau }$ +Pre。此外，原始SemCKD的结果绘制为水平线进行比较。

在大多数情况下，我们可以看到，软化注意力确实会显著提高SemCKD的性能。另一个支持柔软度必要性的证据是，当τ小于1时，性能会显著下降。原因是，在这种情况下，注意力权重会变大，并使整体目标方向在很大程度上受到某一个分量的影响。

结论

在本文中，我们关注基于特征图的知识提取中的一个关键但被忽略的问题，即如何减轻手动指定层对中的负正则化导致的性能退化。我们的策略是使用注意力机制进行关联权重学习，基于此，可以在匹配的语义空间中传递知识。大量实验表明，SemCKD始终优于最先进的方法，我们的软化注意力变体SemCKD $\tau$ 进一步扩大了领先优势。此外，我们的方法很容易适用于不同的任务、网络架构，并且与特征嵌入蒸馏方法高度兼容。

Python 数据分析与可视化：从基础到进阶的技术实现与优化策略女码农的重启 python 数据分析开发语言
数据分析与可视化是数据科学领域的核心技能，Python凭借其丰富的库生态和灵活的编程范式，成为该领域的首选工具。本文将系统讲解Python数据分析与可视化的技术栈实现，从基础操作到性能优化，结合实战场景提供可复用的解决方案。数据分析核心库技术解析Pandas数据处理引擎原理Pandas作为数据分析的基石，其核心优势在于基于NumPy的矢量运算和高效的内存管理。与Excel的单元格级操作不同，Pan
UGUI 性能优化系列：第三篇——渲染与像素填充率优化吉良吉影NeKoSuKi 性能优化 unity 游戏引擎 c#开发语言
在UnityUGUI性能优化之旅中，我们已经学习了基础的资源管理和Canvas与UI元素的管理。现在，我们将把目光转向更深层次的渲染层面，特别是如何优化像素填充率（PixelFillRate）。在这个环节中，Overdraw（过度绘制）是一个我们必须理解和解决的关键问题，因为它直接关系到GPU的工作效率。一、Overdraw（过度绘制）的危害与检测1.什么是Overdraw？为什么会影响性能？想象
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java 领域 MyBatis 与数据库连接池的搭配使用 Java技术栈实战 java mybatis 数据库 ai
Java领域MyBatis与数据库连接池的搭配使用关键词：MyBatis、数据库连接池、Java持久层、性能优化、Druid、HikariCP、Spring集成摘要：本文深入探讨Java领域中MyBatis框架与数据库连接池的搭配使用原理和实践。文章从基础概念入手，详细分析MyBatis的工作原理和数据库连接池的核心机制，重点讲解两者如何协同工作以提升应用性能。通过源码解析、性能对比和实际项目案例
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
C++ 性能优化指南三月微风 c++性能优化开发语言
C++性能优化指南（针对GCC编译器，面向高级工程师面试）代码优化面试常问点：如何避免不必要的对象拷贝？为什么要用引用或std::move？虚函数调用有什么性能开销？原理解释：传递对象时按值会拷贝整个对象，特别是大对象会频繁分配/释放内存，影响性能；应尽量改用引用或指针传递。C++11引入移动语义（move），允许“窃取”临时对象的资源，避免深拷贝。虚函数调用需要先通过对象的虚函数表指针（vptr
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
iOS应用性能优化指南
在移动应用开发领域，iOS应用性能优化一直是开发者关注的焦点。优化应用性能不仅能够提升用户体验，还能增强应用的竞争力。本文将从多个方面详细阐述iOS应用性能优化指南，帮助开发者打造更高效、更流畅的应用。优化内存管理内存泄漏的预防与检测内存泄漏是导致应用性能下降的常见问题。开发者应遵循ARC（自动引用计数）原则，合理管理对象的引用关系。同时，可以使用Xcode的Instruments工具检测内存泄漏
资深开发者挖掘创作潜能指南
太棒了！码龄超过4年的开发者们，你们早已不是编程新手，而是积累了宝贵经验、踩过无数坑、解决过复杂问题的宝藏创作者！是时候将这些无形的资产转化为有影响力的内容，点亮他人也成就自己了。挖掘创作潜能、展现写作才华，可以从以下几个维度入手：一、重新认识你的“创作金矿”-找到你的独特价值深度复盘你的技术旅程：“踩坑”与“填坑”史：哪些Bug让你彻夜难眠？哪些架构设计让你拍案叫绝或后悔不已？哪些性能优化带来了
操作系统级TCP性能优化：高并发场景下的内核参数调优实践 Edingbrugh.南空运维 tcp/ip 性能优化网络协议
在高并发网络场景中，操作系统内核的TCP/IP协议栈配置对系统性能起着决定性作用。本文聚焦操作系统层面，深入解析内核参数调优策略，帮助读者构建稳定高效的网络通信架构。一、连接管理参数优化：从三次握手到队列控制1.1监听队列与半连接管理1.1.1net.core.somaxconn-监听套接字队列上限作用：定义listen()系统调用的积压连接队列最大值，控制未接受连接的排队长度。默认值：128（L
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

Cross-Layer Distillation with Semantic Calibration--带有语义校准的跨层蒸馏

摘要

介绍

相关工作

知识蒸馏

特征图蒸馏

语义校准的蒸馏

符号化知识蒸馏

特征图蒸馏

语义校准公式

软化注意力：

实验

实验设置

不同特征图提取方法的比较

语义校准分析

软注意力

结论

你可能感兴趣的:(知识拓展,深度学习,人工智能,性能优化)