Phoenixtree_DongZhao

论文速读：Online Convolutional Re-parameterization

Codes are available at https: //github.com/JUGGHM/OREPA_CVPR2022.

Abstract

Structural re-parameterization has drawn increasing attention in various computer vision tasks. It aims at improving the performance of deep models without introducing any inference-time cost. Though efficient during inference, such models rely heavily on the complicated training-time blocks to achieve high accuracy, leading to large extra training cost. In this paper, we present online convolutional reparameterization (OREPA), a two-stage pipeline, aiming to reduce the huge training overhead by squeezing the complex training-time block into a single convolution. To achieve this goal, we introduce a linear scaling layer for better optimizing the online blocks. Assisted with the reduced training cost, we also explore some more effective re-param components. Compared with the state-of-the-art re-param models, OREPA is able to save the training-time memory cost by about 70% and accelerate the training speed by around 2×. Meanwhile, equipped with OREPA, the models outperform previous methods on ImageNet by up to +0.6%. We also conduct experiments on object detection and semantic segmentation and show consistent improvements on the downstream tasks.

结构重参数化的目的是在不引入任何推理时间为代价的情况下提高深度模型的性能。

虽然这种模型在推理过程中效率很高，但它严重依赖于复杂的训练时间块来获得较高的精度，导致了大量的额外训练成本。

本文提出了一种两阶段的在线卷积重参数化 (OREPA) 方法，旨在通过将复杂的训练时间块压缩成单个卷积来减少巨大的训练开销。

为了实现这一目标，引入了一个线性缩放层，以更好地优化在线 blocks。在降低训练成本的同时，本文还探索了一些更有效的重新参数化组件。

与最先进的 re-param 模型相比，OREPA 能够节省约 70%的训练时间内存成本，训练速度提高约2倍。同时，配备了 OREPA 的模型在性能上比先前的工作也有所提升。

Introduction

精度与模型效率之间的权衡问题已被广泛讨论。一般来说，精度较高的模型通常需要更复杂的 blcok （complicated block），更宽或更深的结构。然而，这样的模型往往过于笨重，难以部署，尤其是在硬件性能有限、需要实时推断的情况下。考虑到效率，更小、更紧凑（compacter）和更快的模型是首选。

为了获得部署友好的模型（deploy-friendly model）并保持较高的精度，提出了基于结构重参数化的方法[14,16,17,19]，以自由提高性能。在这些方法中，模型在训练阶段（training phase）和推理阶段（inference phase）具有不同的结构。具体来说，这些方法使用复杂的训练阶段拓扑（complicated training-phase topologies），即重新参数化的块（re-parameterized blocks），以提高性能。训练完成后，通过等效变换将复杂的块压缩成单一的线性层。压缩模型通常具有整洁的架构，例如，通常是类似 VGG 或类似 ResNet 的结构。从这个角度来看，重新参数化策略可以在不引入额外推理时间开销（inference-time cost）的情况下提高模型性能。

重新参数化普遍认为，归一化(范数)层（normalization (norm) layer）是重参数模型的关键组成部分。在重参数块 (图 1(b)) 中，总是在每个计算层之后添加一个范数层。可以观察到，去除这些规范层会导致严重的性能下降。然而，在考虑效率的同时，使用规范层却意外地给训练阶段带来了巨大的计算开销。在推理阶段，可以将复杂的数据块压缩成一个卷积层。但是，在训练过程中，范数层是非线性的，即它们以其标准差分割特征，这阻止了合并整个块。因此，存在大量的中间计算操作 (intermediate computational operations，大型 FLOPS) 和缓冲特性映射 (buffered feature maps，高内存使用)。更糟糕的是，高昂的训练预算（high training budget）使得探索更复杂和可能更强的重新参数块变得困难。自然，下面的问题就出现了

Why does normalization matter in re-param?

为什么规范化在重参数中很重要？

通过分析和实验，本文认为范数层中的比例因子（scaling factors）最重要（counts most），因为它们能够多样化不同分支的优化方向（diversify the optimization direction of different branches）。

Figure 1. Comparison of (a) a vanilla convolutional layer, (b) a typical re-param block, and (c) our online re-param block in the training phase. All of these structures are converted to the same (d) inference-time structure.

基于观察结果，本文提出了在线重参数化 (Online Re-Parameterization, OREPA) (图 1 (c))，这是一个两阶段的 pipeline，能够简化复杂的训练时间重参数块（training-time re-param blocks）。

第一阶段，块线性化（block linearization），去除所有非线性范数层，并引入线性缩放层（ linear scaling layers）。这些层具有与规范层类似的属性，它们多样化不同分支的优化（diversify the optimization of different branches）。此外，这些层是线性的，在训练时可以合并为卷积层。

第二阶段，块压缩（block squeezing），将复杂的线性块简化为单个卷积层。OREPA 通过减少中间计算层（intermediate computational layers）造成的计算和存储开销（computational and storage overhead），显著降低了训练成本（shrinks the training cost），而对性能的影响很小。此外，该算法的高效率使其可以探索更为复杂的重参数化拓扑（reparameterized topologies）。为了验证这一点，本文进一步提出了几个重新参数化的组件（re-parameterized components），以获得更好的性能。

Online Re-Parameterization

整体研究过程

首先，分析关键组成部分，即重参数化模型中的规范化层。在此基础上，提出了在线重参数化(OREPA) 方法，旨在大大减少重参数化模型的训练时间预算。OREPA 能够将复杂的训练时间块简化为单个卷积层，并保持较高的精度。OREPA 的总体流程如图 2 所示，包括 区块线性化阶段 和 区块挤压阶段。

接下来，通过分析多分支拓扑，更深入地探讨了重新参数化的有效性，并证明了所提出的线性缩放层和归一化层具有相似的效果。

最后，随着培训预算的减少，进一步探索了一些更强的重参数化的组件，略微增加了成本。

Figure 2. An overview of the proposed Online Re-Parameterization (OREPA), a two-stage pipeline. In the first stage (Block Linearization), we remove all the non-linear components in the prototype re-param block. In the second stage (Block Squeezing), we merge the block to a single convolutional layer (OREPA Conv). Through the steps, we significantly reduce the training cost while keep the high performance.

1. 重参数化模型中的规范化层（Preliminaries: Normalization in Re-param）

中间归一化层（intermediate normalization layers）是多分支结构再参数化的关键组成部分。以SoTA 模型 DBB[16]和 RepVGG[17] 为例，去除这些层会导致严重的性能下降（cause severe performance degradation），如表 1 所示。这一观测结果也得到了 Ding 等人的实验支持（experimentally supported） [16,17]。因此，认为中间规范化层对于重新参数化模型的性能至关重要。然而，中间规范层的使用意外地带来了更高的训练预算（unexpectedly brings higher training budgets）。注意到在推理阶段，重参数化块中的所有中间操作都是线性的，因此可以合并成（merged into）一个卷积层，从而得到一个简单的结构。但在训练过程中，范数层是非线性的，即它们将 feature map 除以其标准差。因此，中间操作需要单独计算，这会导致更高的计算和内存开销。更糟糕的是，如此高的成本将阻止社区探索更强大的训练模块（would prevent the community from exploring stronger training blocks）。

2. 区块线性化阶段（Block Linearization）

中间规范化层阻止（prevent）在训练期间合并单独的层。然而，由于性能问题，直接删除它们并非易事（non-trivial）。为了解决这个难题（To tackle this dilemma），本文引入了基于通道的线性缩放操作（channel-wise linear scaling operation）作为归一化的线性替代（alternative of）。

缩放层包含一个可学习的向量，用于在通道维度上缩放特征图。线性伸缩层与规范化层具有相似的效果，它们都鼓励多分支向不同方向优化（be optimized towards diverse directions），这是重参数化中性能改进的关键。

除了对性能的影响，线性缩放层可以在训练期间合并，使在线重参数化成为可能。

基于线性缩放层，本文对重参数化块进行修改，如图 3 所示。

具体来说，块线性化阶段包括以下三个步骤。

首先，去除所有非线性层，即重参数化块中的规范化层。

其次，为了保持优化多样性（maintain the optimization diversity），在每个分支的末端添加了一个尺度层，即归一化的线性选择。

最后，为了稳定训练过程，在添加所有分支之后添加一个后归一化层。一旦完成线性化阶段，在re-param 块中只存在线性层，这意味着可以在训练阶段合并块中的所有组件。

Figure 3. Three steps of block linearization. i) We first remove all the training-time non-linear normalization layers in the ra-param block. ii) Second, we add a linear scaling layer at the end of each branch to diversify the optimization directions. iii) Last, we add a post-normalization layer right after each block to stabilize training.

3. 区块挤压阶段（Block Squeezing）

得益于块线性化（Benefiting from block linearization），得到了一个线性块。本节描述了将训练时间线性块压缩到单个卷积核中的标准程序。

块压缩步骤将在中间特征映射上的操作，这是计算和内存昂贵的（computation and memory expensive），转换为在内核上的操作，这是更经济的（economic）。这意味着在计算和内存方面都减少了从 O(H × W) 到 O(KH × KW) 的额外训练成本（extra training cost），其中 (H, W)， (KH, KW) 是特征映射和卷积核的空间形状。

一般来说，无论线性重参数块有多复杂，以下两个属性始终有效。

• 区块中的所有线性层，例如，深度卷积，平均池化，以及前面提出的线性缩放，可以用一个退化的卷积层（degraded convolutional layer）表示，并具有相应的一组参数。

• 块可以由一系列并行分支表示，每个分支由一系列卷积层组成。

有了以上两个性质，如果能将 i) 一个多层 (即顺序结构) 和 ii) 一个多分支 (即并行结构) 简化为一个卷积，就可以挤压一个块。

在接下来的部分，将展示如何简化顺序结构 (图4(a)) 和并行结构 (图4(b))。

Figure 4. Simplification of sequential and parallel structures. Such simplifications convert the heavy computations on the feature maps to the lighter ones on the convolutional kernels.

定义卷积的符号：令 Ci, Co 表示 K_H × K_W 大小的二维卷积核的输入和输出通道数。

X∈R^{Ci×H×W}, Y∈R^{Co×H ' ×W '} 表示输入和输出张量。

省略了这里的偏差，卷积过程用 $\mathbf {Y} = \mathbf {W} \ast \mathbf {X}$ (式1）表示。

简化顺序结构

考虑一个由 $\mathbf{Y} = \mathbf{W}_N (\mathbf {W}_{N-1} \ast \cdots (\mathbf {W}_2 \ast (\mathbf {W}_1 \ast \mathbf {X}))$ 表示的卷积层堆栈（a stack of），其中Wj∈R^{Cj×Cj−1×KHj×KWj} 满足 C0 = Ci, CN = Co。

根据结合律 (the associative law)，这些层可以按照下式挤进 (be squeezed into) 一个卷积内核：

$\mathbf {Y} = (\mathbf {W}_N (\mathbf {W}_{N-1} \ast \cdots (\mathbf {W}_2 \ast \mathbf {W}_1)) \ast \mathbf {X} = \mathbf {W}_e \ast \mathbf {X},$

Wj 表示第 j 层的重量。

简化并行结构

并行结构的简化是微不足道的（trivial）。根据卷积的线性特性，可以根据下式多个分支合并到一个：

$\mathbf {Y} = \sum _{m=0}^{M-1} (\mathbf {W}_m \ast \mathbf {X}) = (\sum _{m=0}^{M-1} \mathbf {W}_m) \ast \mathbf {X}, \label {eq:merge-paral}$

Wm 是 m 分支的重量， $\sum ^{M-1}_{m=0} \mathbf{W}m$ 是统一的重量。

值得注意的是，当合并不同大小的内核时，需要对齐不同内核的空间中心，例如，1×1 内核应该与3×3 内核的中心对齐。

训练开销：从特征到内核

无论块有多复杂，它必须由不超过多分支和多层的子拓扑组成。因此，根据上述两种化简规则，可以将其简化为单个化简。最后，可以得到一体化的端到端映射权值，并且在训练过程中只进行一次卷积。

实际可以将中间特征映射上的运算 (卷积、加法) 转换为卷积核上的运算。因此，将重参数块的额外训练成本从 O(H × W) 降低到 O(K_H × K_W)。

‘

4. 多分支拓扑（Gradient Analysis on Multi-branch Topology）

为了理解为什么块线性化步骤是可行的，即为什么缩放层是重要的，我们对统一权重重参数化的优化进行了分析。

结论是，对于去除规范层的分支，利用伸缩层可以使其优化方向多样化，并防止其退化为单一的。

证明过程可以参考原文（我也没读，用到的时候再研究吧）。

5. 更强的重参数化的组件（Block Design）

由于提出的 OREPA 大大节省了训练成本，它能够允许我们探索更复杂的训练块。因此，通过线性化最先进的模型 DBB[16]，并插入以下组件 (图5)，设计了一种新的重参数化模型，即 OREPA-ResNet。

Frequency prior filter

在前面的工作[16]中，在块中使用池层。Qin et al.[31] 认为池化层是频率滤波器的一种特殊情况。为此，本文添加了一个 Conv1×1 - Frequency Filter 分支。

Linear depthwise separable convolution

本文稍微修改了深度可分卷积[10]，去掉了中间的非线性激活层，使其在训练时可以合并。

Re-parameterization for 1×1 convolution

以前的工作主要集中在 3×3 卷积层的重参数，而忽略了1×1 层。本文建议重新参数化 1×1 层，因为它们在瓶颈结构中发挥着重要作用[21,4]。具体来说，添加了一个额外的 Conv1×1 - Conv1×1 分支。

Linear deep stem

大型卷积核通常被放置在最开始的层，例如 7×7 stem 层[21]，目的是获得更大的接收野。Guo 等人将 7×7 conv 层替换为堆叠的 3×3 层，以获得更高的精度[19]。然而，由于高分辨率，堆叠在最开始层的卷积需要更大的计算开销。值得注意的是，可以用本文提出的线性缩放层挤压堆叠的deep stem 至 7×7 conv 层，可以大大降低训练成本，同时保持较高的精度。

对于 OREPA-ResNet 中的每个块 (图6)：

i)，添加一个频率先验滤波器（Frequency prior filter）和一个线性深度可分离卷积。

ii) 将所有 stem 层 (即初始的 7×7 卷积) 替换为提出的线性 deep stem。

iii) 在瓶颈[21]块中，除了 i) 和 ii)，还将原来的 1×1 卷积分支替换为提议的 Rep-1×1 块。

Figure 6. The design of the proposed OREPA block, corresponding to a 3×3 convolution during training and inference.

-----------------------------

结构重参数化

结构重参数化近年来受到越来越多的重视，并应用于许多计算机视觉任务，如紧凑模型设计 [18]，体系结构搜索 [9,43] 和剪枝 [15]。重新参数化是指通过参数的等效变换，可以将不同的体系结构相互转换。例如，1x1 卷积的一个分支和 3x3 卷积的一个分支，可以转换成 3x3 卷积的一个分支[17]。在训练阶段，多分支 [14,16,17] 和多层 [19,5] 拓扑被设计用来替代传统的线性层 (如 conv 或全连接层[1]) 用于增强模型。Cao 等人 [5] 在训练中讨论了如何合并深度可分卷积核。在推理过程中，将训练时间较长的复杂模型转换为简单模型，以提高推理速度。虽然受益于复杂的训练时间拓扑，目前的重新参数化方法 [14,16,19] 的训练需要不可忽略的额外计算成本。当块为了更强的表示而变得更复杂时，GPU 的内存利用率和用于训练的时间会变得越来越大，最终达到不可接受的程度。与以往的 re-param 方法不同，本文更注重训练成本。本文提出了一种通用的在线卷积重参数化策略，使训练时间结构重参数化成为可能。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt