十有久诚

论文解读：A New CNN Building Block for Low-ResolutionImages and Small Objects

引言

之前通过stride和pooling这些下采样操作，但是这些操作都会或多或少丢失图像的信息，所以这不适用于具有低分辨率图像和小物体的更困难的任务上。像池化选择maxpooling或者是averagepooling、卷积的步长(太大的话会丢失信息)都是很头疼的问题，为此设计SPD模型。

摘要

卷积神经网络(cnn)在图像分类和目标检测等计算机视觉任务中取得了巨大的成功。然而，在图像分辨率低或物体很小的复杂任务中，它们的性能会迅速下降。在本文中，我们指出，这源于现有CNN架构中有缺陷但常见的设计，即使用跨行卷积和/或池化层，这会导致细粒度信息的丢失和学习不太有效的特征表示。为此，我们提出了一个新的CNN构建块，称为SPD-Conv，以取代每个跨行卷积层和每个池化层(从而完全消除它们)。SPD-Conv由一个空间到深度(SPD)层和一个非跨行卷积(Conv)层组成，可以应用于大多数(如果不是所有的话)CNN架构。我们在两个最具代表性的计算机视觉任务中解释了这种新设计:目标检测和图像分类。然后，我们通过将SPD-Conv应用于YOLOv5和ResNet来创建新的CNN架构，并通过经验表明，我们的方法显着优于最先进的深度学习模型，特别是在具有低分辨率图像和小物体的更困难的任务上。我们已经在https://github.com/LabSAINT/SPD-Conv上开源了我们的代码。

介绍

自AlexNet[18]以来，卷积神经网络(cnn)在许多计算机视觉任务中表现出色。例如在图像分类方面，知名的CNN模型有AlexNet、VGGNet[30]、ResNet[13]等;而在目标检测方面，这些模型包括R-CNN系列[9,28]、YOLO系列[26,4]、SSD[24]、EfficientDet[34]等。然而，在训练和推理中，所有这些CNN模型都需要“高质量”的输入(精细图像，中型到大型对象)。例如，AlexNet最初在227×227的清晰图像上进行训练和评估，但在将图像分辨率降低到1/4和1/8后，其分类准确率分别下降了14%和30%[16]。在VGGNet和ResNet上也有类似的观察[16]。

在VGGNet和ResNet上也有类似的观察[16]。在对象检测的情况下，SSD在1/4分辨率的图像或相当于1/4分辨率的小物体上遭受了显著的34.1mAP损失。事实上，小物体检测是一项非常具有挑战性的任务，因为小物体本身就具有较低的分辨率，而且可供模型学习的上下文信息也有限。此外，它们经常(不幸地)与同一图像中的大物体共存，大物体往往会主导特征学习过程，从而使小物体无法被检测到。

在本文中，我们认为这种性能下降的根源在于现有cnn中存在缺陷但又常见的设计。也就是说，使用跨行卷积和/或池化，特别是在CNN架构的早期层中。这种设计的不利影响通常不会表现出来，因为大多数被研究的场景都是“友好的”，其中图像具有良好的分辨率，对象大小适中;因此，有大量的冗余像素信息，跨卷积和池化可以方便地跳过，模型仍然可以很好地学习特征。然而，在图像模糊或物体很小的复杂任务中，对冗余信息的大量假设不再成立，当前的卷积设计开始遭受细粒度信息丢失和特征学习不良的影响。

为了解决这个问题，我们为CNN提出了一个新的构建块，称为SPD-Conv，以取代(从而消除)跨行卷积和池化层。SPD- conv是一个空间到深度(SPD)层，后面跟着一个非跨行(即vanilla)卷积层。SPD层对特征映射X进行下采样，但保留通道维度中的所有信息，因此没有信息丢失。我们受到图像变换技术[29]的启发，该技术在将原始图像馈送到神经网络之前重新缩放原始图像，但我们基本上将其推广到内部和整个网络中的降采样特征映射;此外，我们在每个SPD之后添加了一个非跨行卷积操作，以使用添加的卷积层中的可学习参数减少(增加)通道数量。我们提出的方法既通用又统一，因为SPD-Conv (i)可以应用于大多数(如果不是所有的话)CNN架构，并且(ii)以相同的方式取代跨行卷积和池化。综上所述，本文做出了以下贡献:

1)我们在现有的CNN架构中发现了一个有缺陷但常见的设计，并提出了一个新的构建块，称为SPD-Conv来代替旧的设计。SPD-Conv在不丢失可学习信息的情况下对特征图进行下采样，完全抛弃了目前广泛使用的跨行卷积和池化操作。

2) SPD-Conv代表了一种通用和统一的方法，可以很容易地应用于大多数(如果不是全部的话)基于深度学习的计算机视觉任务。

3)利用两个最具代表性的计算机视觉任务，即目标检测和图像分类，评估了SPD-Conv的性能。具体来说，我们构建了YOLOv5-SPD、ResNet18-SPD和ResNet50-SPD，并在COCO-2017、Tiny ImageNet和CIFAR-10数据集上对它们进行了评估，并与几种最先进的深度学习模型进行了比较。结果表明，在AP和top-1精度方面有显著的性能提高，特别是在小物体和低分辨率图像上。预览见图1。

4) SPD-Conv可以很容易地集成到流行的深度学习库中，如PyTorch和TensorFlow，可能会产生更大的影响。我们的源代码可从https://github.com/LabSAINT/SPD-Conv获得。

本文的其余部分组织如下。第2节介绍背景并回顾相关工作。第3节描述了我们提出的方法，第4节介绍了使用目标检测和图像分类的两个案例研究。第5节提供了性能评估。本文在第6节结束。

前期工作及相关工作

我们首先概述了这一领域，更多地关注目标检测，因为它包含了图像分类。

目前最先进的目标检测模型是基于cnn的，可以分为一级和两级检测器，或基于锚点或无锚点检测器。两阶段检测器首先生成粗区域建议，然后使用头部(全连接网络)对每个建议进行分类和细化。相比之下，单阶段检测器跳过区域建议步骤，直接在密集的位置采样上运行检测。基于锚点的方法使用锚点盒，锚点盒是一个预定义的盒子集合，与训练数据中对象的宽度和高度相匹配，以改善训练过程中的损失收敛性。我们提供了表1，对一些众所周知的模型进行了分类。

一般来说，一级检测器比二级检测器更快，基于锚点的模型比无锚点的模型更准确。因此，在后面的案例研究和实验中，我们更多地关注单阶段和基于锚点的模型，即表1中的第一个单元格。

一个典型的单阶段目标检测模型如图2所示。它由一个基于cnn的主干网和一个检测头组成，前者用于提取视觉特征，后者用于预测每个被包含对象的类别和边界框。在这两者之间，增加额外层的颈部来组合多个尺度的特征，以产生用于检测不同大小物体的语义强特征。

2.1小目标检测

传统上，大小目标的检测被视为一个多尺度的目标检测问题。一种经典的方法是图像金字塔[3]，它将输入图像的大小调整为多个尺度，并为每个尺度训练一个专用检测器。为了提高精度，提出了SNIP[31]，它在每个检测器中根据不同的目标大小进行选择性反向传播。SNIPER[32]通过只处理每个对象实例周围的上下文区域而不是图像金字塔中的每个像素来提高SNIP的效率，从而减少了训练时间。采用不同的方法来提高效率，特征金字塔网络(FPN)[20]利用横向连接利用卷积层固有的多尺度特征，并使用自上而下的结构组合这些特征。

随后，引入PANet[22]和BiFPN[34]，利用更短的路径改进FPN的特征信息流。此外，引入SAN[15]将多尺度特征映射到尺度不变子空间上，使检测器对尺度变化具有更强的鲁棒性。所有这些模型都一致使用跨行卷积和最大池化，我们完全去掉了它们。

2.2低分辨率图像分类

解决这一挑战的早期尝试之一是[6]，它提出了一个端到端的CNN模型，在分类之前增加一个超分辨率步骤。

随后，[25]提出将从高分辨率训练图像中获取的细粒度知识转移到低分辨率测试图像中。然而，这种方法需要对应于特定应用程序(例如，类)的高分辨率训练图像，而这些图像并不总是可用的。

对高分辨率训练图像的同样要求也被其他一些研究所需要，如[37]。最近，[33]提出了一个包含属性级可分离性(其中属性意味着细粒度的分层类标签)的损失函数，以便模型可以学习特定于类的判别特征。然而，细粒度(分层)类标签很难获得，因此限制了该方法的采用。

3新的构建模块:SPD-Conv

SPD- conv由空间到深度(SPD)层和非跨行卷积层组成。本节将对此进行详细介绍。

3.1 Space-to-depth (SPD)

我们的SPD组件推广了一种(原始)图像变换技术[29]，对CNN内部和整个CNN的特征映射进行降采样，如下所示。

考虑任意大小为 $S\times{S\times{C_{1}}}$ 的中间特征映射X，将一系列子特征映射分割为 $f_{0,0}=X[0:S:scale,0:S:scale],f_{1,0}=X[1:S:scale,0:S:scale],...,\\ f_{scale-1,0}=X[scale-1:S:scale,0:S:scale];\\ f_{0,1}=X[0:S:scale,1:S:scale],f_{1,1},...,\\f_{scale-1,1}=X[scale-1:S:scale,1:S:scale];\\ ...\\ f_{0,scale-1}=X[0:S:scale-1:S:scale],f_{1,scale-1},...,\\ f_{scale-1,scale-1}=X[scale-1:S:scale,scale-1:S:scale].$

如图1：X的第一、二、三维度分别是 $S,S,C_{1}$ ，(c)中得到四个子图 $f_{0,0},f_{1,0},f_{0,1},f_{1,1}$ ,其中
$f_{0,0}=X[0:S:2,0:S:2]$ ，意思就是对图片第一维度从0开始，到S结束，步长为2来进行截取，第二维度也是如此，而第三维度通道 $C_{1}$ 都选取上(即不进行截取)。

一般来说，给定任意(原始)特征映射X，子图 $f_{x,y}$ 由所有组成，这些都

和可以被整除。因此，每个子地图将X的样本降低一个比例因子。图3(a)(b)(c)给出了

的例子，其中我们得到4个子图 $f_{0,0},f_{1,0},f_{0,1},f_{1,1}$ 每一个的形状为 $(\frac{S}{2},\frac{S}{2},C_{1})$

对X进行2倍的采样。

接下来，我们沿着通道维度将这些子特征映射连接起来，从而获得一个特征映射，该特征映射的空间维度减少了一个比例因子，通道维度增加了一个比例因子2。也就是说，SPD对特征映射
$X(S,S,C_{1})$ 转化为中间特征映射 $X'(\frac{S}{scale},\frac{S}{scale},scale^{2}C_{1})$ 。图3(d)给出了使用

的说明。

3.2非跨行卷积

在SPD特征变换层之后，我们在 $C_{2}<scale^{2}C_{1}$ 的条件下通过 $C_{2}$ 个卷积核增加一个无跨距(即stride=1)的卷积层，并进一步变换 $X'(\frac{S}{scale},\frac{S}{scale},scale^{2}C_{1})\rightarrow{X''(\frac{S}{scale},\frac{S}{scale},C_{2})}$ 。我们使用非跨行卷积的原因是为了尽可能多地保留所有的判别特征信息。否则，例如，使用stride=3的3 × 3过滤器，特征地图将被“缩小”，但每个像素只采样一次;如果stride=2，将发生非对称采样，其中偶数和奇数行/列将在不同时间采样。一般情况下，步长大于1的跨步会导致信息的非判别性损失，尽管在表面上，它似乎也是转换了特征图 $X(S,S,C_{1})\rightarrow{X''(\frac{S}{scale},\frac{S}{scale},C_{2})}$ (但没有)。

4如何使用SPD-Conv:案例研究

4.1目标检测(略)

4.2图像分类

分类CNN通常从一个由stride-2卷积和池化层组成的干单元开始，以将图像分辨率降低四倍。一个流行的模型是ResNet[13]，它赢得了ILSVRC 2015的挑战。

ResNet引入了剩余连接，允许训练深度高达152层的网络。它还通过仅使用单个全连接层显著减少了参数的总数。最后使用一个softmax层来规范化类预测。

ResNet18-SPD和ResNet50-SPD。ResNet-18和ResNet-50都使用了总共4个stride-2卷积和一个stride-2的max-pooling层来对每个输入图像进行2.5倍的下采样。应用我们提出的构建块，我们用SPD-Conv代替了四个跨行卷积;但另一方面，我们简单地删除了最大池化层，因为我们的主要目标是低分辨率图像，我们实验中使用的数据集具有相当小的图像(Tiny ImageNet中的64 × 64和CIFAR-10中的32 × 32)，因此池化是不必要的。对于较大的图像，这样的最大池化层仍然可以用同样的方式由SPD-Conv替换。表3显示了这两种新的体系结构。

5实验

本节使用两个代表性的计算机视觉任务，目标检测和图像分类来评估我们提出的方法SPD-Conv。

5.1目标检测(略)

5.2图像分类

数据集和设置

对于图像分类任务，我们使用了Tiny ImageNet[19]和CIFAR-10数据集[17]。Tiny ImageNet是ILSVRC-2012分类数据集的一个子集，包含200个类。每个类有500个训练图像、50个验证图像和50个测试图像。每个图像的分辨率64×64×3像素。CIFAR-10由6万张分辨率为32 × 32 × 3的图像组成，其中包括5万张训练图像和1万张测试图像。有10个类，每个类有6000张图片。我们使用top-1的准确率作为衡量分类性能的指标。

训练

我们在Tiny ImageNet上训练我们的ReseNet18-SPD模型。我们执行随机网格搜索来调整超参数，包括学习率、批大小、动量、优化器和权重衰减。图6显示了使用wandb mlop生成的样例超参数扫描图。结果是SGD优化器的学习率为0.01793，动量为0.9447，小批大小为256，权值衰减正则化为0.002113，训练epoch为200。接下来，我们在CIFAR-10上训练我们的ResNet50-SPD模型。超参数采用ResNet50论文，其中SGD优化器使用初始学习率0.1和动量0.9，批大小128，权衰减正则化0.0001,200个训练epoch。对于ReseNet18-SPD和ReseNet50-SPD，我们使用与ResNet相同的衰减函数，随着epoch数的增加而降低学习率。

测试

Tiny ImageNet上的精度是在验证数据集上评估的，因为测试数据集中的实际真实值不可用。CIFAR-10上的精度是计算在测试数据集上的。

结果

表6总结了top-1精度的结果。结果表明，我们的模型ResNet18-SPD和ResNet50-SPD明显优于所有其他基准模型。

最后，我们在图7中提供了一个使用Tiny ImageNet的视觉插图。给出了8个ResNet18错误分类和ResNet18SPD正确分类的例子。这些图像的共同特点是分辨率较低，因此我们的模型对标准ResNet提出了挑战，由于ResNet在其跨步卷积和池化操作中丢失了细粒度信息。

6 Conclusion

本文确定了现有CNN架构中常见但有缺陷的设计，即使用跨行卷积和/或池化层。这将导致细粒度特征信息的丢失，特别是在低分辨率图像和小物体上。然后，我们提出了一个新的CNN构建块，称为SPD-Conv，它通过用一个空间到深度的卷积替换它们，然后是一个非跨行卷积，从而完全消除了跨行和池化操作。这种新设计在保留判别特征信息的同时，对特征映射进行了降采样。它还代表了一种通用和统一的方法，可以很容易地应用于任何CNN架构，并以同样的方式应用于跨步转换和池化。我们提供了两个最具代表性的用例，目标检测和图像分类，并通过广泛的评估证明了SPD-Conv在检测和分类精度方面带来了显着的性能改进。我们期望它能广泛地造福研究社区，因为它可以很容易地集成到现有的深度学习框架中，如PyTorch和TensorFlow。

参考资料

论文下载

No More Strided Convolutions or Pooling: A New CNN Building Block for Low-Resolution Images and Small Objects | SpringerLink

No More Strided Convolution or Pooling A New CNN Building Block for Low-Resolution.pdf

代码地址

https://github.com/LabSAINT/SPD-Conv

核心代码

class space_to_depth(nn.Module):
    # Changing the dimension of the Tensor
    def __init__(self, dimension=1):
        super().__init__()
        self.d = dimension

    def forward(self, x):
        # 沿着通道拼接
        return torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1)

Windows下重叠I/O模型智驾 Windows开发 windows开发重叠IO模型
目录一.Windows下重叠I/O模型二．重叠模型的优点三．重叠模型的基本原理五、实现重叠模型的步骤六.客户端情况的注意事项七．已知问题原文链接：https://blog.csdn.net/zhongguoren666/article/details/1827928在此感谢原作者。一.Windows下重叠I/O模型重叠模型的优点重叠模型的基本原理关于重叠模型的基础知识重叠模型的实现步骤多客户端情况
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
el-table保持多选框选中状态稳住别慌 vue.js elementui javascript
往往我们在开发时勾选了几个多选框点击了按钮触发功能，会重新获取表格信息，这时勾选框也会被刷新。但在实际应用中使用者往往需要对勾选的列进一步操作，在这种情况下保持勾选框的状态会使得界面更加友好。解决方案：1.使用reserve-selection和row-key：//1、在标签添加:row-key="getRowKeys"//2、在type="selection"处添加:reserve-select
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
RK3588开发笔记-buildroot添加telnet服务 flypig哗啦啦 RK3588 buildroot busybox
目录前言一、Telnet服务背景与适用场景二、telnet服务开启Busybox配置三、固件编译及烧录RK3588烧录验证客户端连接测试3.1Linux/MacOS连接3.2Windows连接总结前言本文主要介绍在RK3588SDK文件包中添加telnet服务，由于sdkbuildroot默认添加的是ssh服务，如用户需要主动开启telnet，则需要另外在busybox中开启telnetd服务，下
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
麦谷科技-前端面经 dancehole 科技前端
base：车联网，uniapp小程序。面试时间：2025-03月（应届）投递岗位：前端（转正实习）面试流程比较短，可能是因为经历不匹配或者第一题答的不好Tvt时间：上午约一面，下午约二面，隔一天（第三天）约hr面。整体流程还是很快的。HR面去公司线下参观了，整体地理环境也很nice。最后因为个人原因没有入职，也是相当可惜一面自我介绍&BG：两端实习，介绍了一下自己的工作。面试官表示不太感兴趣（问了
AJAX（Asynchronous JavaScript and XML）详解与应用风亦辰739 javascript ajax xml
一、什么是AJAX？AJAX（AsynchronousJavaScriptandXML，异步JavaScript和XML）是一种用于创建异步Web应用程序的技术。它可以在不重新加载整个网页的情况下，与服务器进行数据交换，从而提供更好的用户体验。1.1AJAX的核心特点异步通信：数据请求不会阻塞页面，提升用户体验。减少服务器负担：只获取需要的数据，减少流量。提升用户体验：网页响应速度更快，减少页面刷
数据结构二叉树进阶 z一一m 数据结构数据结构算法
1.根据二叉树创建字符串1.题目2.分析原理要把二叉树元素按照前序顺序取出来，并且以字符串的形式返回，还要添加括号对于左子树和右子树，那么第一步就是向定义一个string类型来接收取出的元素，需要用到to_string函数把整型变成string类型，第二步就是递归来深度遍历了，但是需要判断一下，题目有些情况是省略了括号，有些没有省去，题目例子可以知道左为空右不为空就不能省略括号，左不为空右为空就可
A800核心加速技术深度剖析智能计算研究中心其他
内容概要作为第三代异构计算架构的典型代表，A800通过深度融合通用计算单元与专用加速模块，构建了高度灵活的资源调度体系。其核心突破在于将矩阵运算、并行任务分发与内存访问路径进行系统性重构，解决了传统架构中计算密度与能效失衡的行业痛点。通过实测数据显示，在典型AI训练场景下，A800相较于前代架构实现了3.2倍的吞吐量提升，同时单位功耗下的指令执行效率优化达47%。技术维度第二代架构A800架构提升
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
RTX 4090旗舰显卡效能实战剖析智能计算研究中心其他
内容概要作为NVIDIA新一代旗舰显卡，RTX4090凭借AdaLovelace架构的革新设计，在4K/8K分辨率下的游戏与创作场景中展现了突破性表现。本文将通过多维度实测数据，系统解析其核心性能：首先聚焦8K游戏帧率与光线追踪效果的实战表现，结合DLSS3.0技术的动态对比，揭示超分辨率技术对高负载场景的优化逻辑；随后深入探讨24GBGDDR6X显存在视频渲染与AI运算中的效率边界，同步验证显存
Axure常用交互效果二——拖动效果结构化知识课堂 Axure应用交互设计 axure
亲爱的小伙伴，在您浏览之前，烦请关注一下，在此深表感谢！在很多移动端应用中经常会涉及到界面拖动操作，那么产品经理是怎么做出来的？这节课我们就来展示操作，这里会涉及到的知识点有：移动、动态面板。滑动分为左右拖动和上下拖动，案例中我们分别做了菜单的横向拖动和内页的上下拖动，下边我们以横向菜单的左右拖动为例，进行讲解，更多内容请观看作者视频内容。课程主题：拖动效果效果描述：左右拖动，上下拖动应用场景：横
Axure常用交互设计一——选中效果结构化知识课堂 Axure应用交互设计 axure 交互
亲爱的小伙伴，在您浏览之前，烦请关注一下，在此深表感谢！从本节课开始，将陆续给大家展示Axure在产品设计中的常见的交互效果，欢迎大家持续关注我。交互效果不难做出，难的是我们要通过学习交互，懂得在哪些场景下使用，以及交互逻辑是什么才是最重要的。课程主题：选中效果主要内容：鼠标点击按钮或文字，按钮或文字背景变色，字号变大，字体变粗；应用场景：菜单模块切换、功能按钮应用步骤一：拉出矩形元件，输入功能菜
鸿蒙相机开发实战：从设备适配到性能调优 —— 我的 ArkTS 录像功能落地手记（API 15） harmonyos
引言：为什么我要写这份开发指南？作为一名老技术，最近特别喜欢研究鸿蒙相机功能，而且目前已经更新到API15了，那么咱们更要好好研究一下。而且从手持云台到车载记录仪，每个项目都面临独特挑战：车载场景的高温稳定性、可穿戴设备的低功耗限制、多设备分辨率适配的玄学……这些痛点促使我重新梳理HarmonyOS相机开发的技术脉络——这正是本文的起源。比如之前在一款运动相机项目中，我们最初直接复用Android
东南亚电商市场研究报告：机遇与挑战并存（Shopee、Lazada、TikTok、Tokopedia）萧十一郎@ 知识科普开发语言
一、引言1.1研究背景与目的在全球数字化浪潮的推动下，电子商务已成为经济发展的重要驱动力。东南亚地区，凭借其庞大的人口基数、快速增长的互联网普及率以及不断提升的经济水平，电商市场呈现出蓬勃发展的态势，成为全球电商领域中备受瞩目的新兴市场。东南亚拥有超过6.5亿的人口，其中年轻人口占比较高，消费潜力巨大。近年来，该地区互联网基础设施不断完善，智能手机的普及使得网络购物变得更加便捷，为电商的发展提供了
反激式开关电源芯片是什么？如何对反激开关电源mos管选型？ TaidL 电源IC MOS管
1.反激式开关电源芯片--简介反激式开关电源是指使用反激高频变压器隔离输入输出回路的开关电源。“反激”指的是在开关管接通的情况下，当输入为高电平时输出线路中串联的电感为放电状态；相反，在开关管断开的情况下，当输入为高电平时输出线路中的串联的电感为充电状态。与之相对的是“正激”式开关电源，当输入为高电平时输出线路中串联的电感为充电状态，相反当输入为高电平时输出线路中的串联的电感为放电状态，以此驱动负
python批量替换word内容_python win32com 库批量替换word文件内容 weixin_39657300
前言win32com模块主要为Python提供调用windows底层组件对word、Excel、PPT等进行操作的功能，只能在Windows环境下使用，并且需要安装office相关软件才行(WPS也行)。实例代码下方代码实现批量替换当前路径下word文档的指定文本内容。importwin32com.clientimportosimporttimedefupdate_replace(file):wo
SpringBoot分布式架构下字典表设计与实战应用潘多编程 spring boot 分布式架构
在分布式系统中，字典表作为基础数据的核心载体，其设计合理性直接影响系统的扩展性和维护效率。本文将结合具体代码实例，深入讲解分布式环境下字典表的设计方案与实现细节。一、分布式环境下的字典表挑战数据一致性要求：多服务节点间的字典数据同步高并发访问压力：基础数据的频繁读取需求动态更新需求：业务运行时字典数据的热更新能力多级缓存策略：本地缓存与分布式缓存的协同工作二、技术方案设计架构图：[Client]-
手机网络ip地址怎么切换？多种方法任你选 hgdlip ip 手机网络智能手机 tcp/ip
随着互联网的日益普及和移动互联网的快速发展，手机已成为我们日常生活中不可或缺的设备。其中，切换手机网络IP地址就是一个常见的需求。本文将为您介绍多种手机网络IP地址的切换方法。一、了解手机网络IP地址在深入讨论手机网络IP地址怎么切换之前，让我们先了解一下IP地址的基本知识。IP地址是互联网协议地址的简称，它用于标识互联网上的每一台设备。对于手机而言，当我们连接到网络时，运营商会为我们分配一个临时
C语言动态顺序表的实现しかし118114 数据结构数据库 c语言经验分享数据结构链表
目录（一）静态顺序表（二）动态顺序表顺序表是数据结构的入门，本篇文章将详细介绍动态顺序表的增删改补。我们先了解一下静态顺序表。（一）静态顺序表静态顺序表是顺序表的一种，由于静态顺序表的大小固定，很容易溢出或浪费空间，所以我们一般不用静态顺序表。所有顺序表的实现都是基于数组实现的，其实顺序表是顺序表的pro版，可以装更多的数据。#defineTypedataint//这里定义的顺序表是int类型的/
PX4飞控之位置控制（1）整体架构 Felix_ZL px4飞控 PX4 位置控制架构
位置控制是无人机飞控的核心算法之一，一方面根据commander中的flag标志位和Navigator中提供的航点信息进行控制（自主模式下），另一方面得到期望姿态角（setpoint）的四元数信息，给到姿态控制模块进行姿态控制。本文重点PX4飞控的位置控制的代码整体架构（mc_pos_control）,具体的控制算法将在后续文章中陆续奉上。位置控制模块的主函数：task_main()1.订阅结构体
6.5840 Lab 2: Key/Value Server idMiFeng github go
在这个实验中，你将构建一个单机版的键值服务器，该服务器能够确保每个操作在网络故障的情况下依然能被精确地执行一次，并且这些操作是线性化的。在后续实验中，你将实现类似的服务器以支持服务器崩溃的情况下进行复制。客户端可以向键值服务器发送三种不同的RPC调用：Put(key,value)、Append(key,arg)和Get(key)。服务器维护一个内存中的键值映射，键和值均为字符串：Put(key,v
java简单的小程序_编写一个简单的入门java小程序雷幺幺 java简单的小程序
1.创建一个java程序的步骤a打开editplus软件，选择左上角的file选项，在弹出来的菜单中选择new然后再从弹出来的菜单中选择normaltextb按住ctrl+s快捷键，保存。1选择要保存的位置2给文件命名(以大写的字母开头)3选择文件的后缀，以.java后缀结尾c进行代码的编写，所有字符我们必须都是英文输入状态下的d打开控制台(win+r在弹出左下角的命令行中输入cmd)e找到jav
短视频矩阵系统源码新发布技术方案有那几种？ Yxh18137784554 短视频矩阵开发矩阵算法架构
短视频矩阵系统从21年发展到现在经历了历史性的发展高潮经过各平台的反复变化政策，短视频矩阵系统目前做的为数不多的同梯队的筷子科技、云罗抖去推、超级编导都选用的是什么方式的代发解决方案呢？今天小编就来给我的技术粉们分享下一下几种常见的开发方案#短视频矩阵系统##短视频矩阵系统还能用吗？##短视频矩阵系统源码##短视频矩阵系统代发/托管发都有什么解决方案?短视频矩阵系统源码新发布的技术方案通常有以下几
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Linux中view命令姚不倒 linux 运维服务器
在Linux系统中，view命令是一个用于查看文本文件内容的命令。它是vi或vim编辑器的一个衍生版本，但主要用于只读操作，即用户可以在不修改文件内容的情况下查看文件。以下是关于view命令的详细解释：一、命令功能查看文件内容：view命令允许用户以只读模式打开并查看文本文件的内容，非常适合于需要快速浏览文件而不需要进行编辑的场景。支持多种格式：虽然主要用于查看文本文件，但view命令在某些情况下
并发安全的sync.Map 不7夜宵基础知识后端
对于并发读写map的情况下，map的数据会被写乱造成panic。Go语言原生map并不是线程安全的，因此对它进行并发读写操作时需要加锁。但是当操作频繁且要求性能的情况下，锁的优化已经无法满足业务需求，考虑到互联网应用通常是读多写少的场景，Golang的标准库提供了一个特殊的并发安全的map实现，为了与原生map区分，人们习惯性称为sync.map。一、sync.map与map的区别1.并发安全sy
linux下基本命令和扩展命令（安装和登录命令、文件处理命令、系统管理相关命令、网络操作命令、系统安全相关命令、其他命令）欢迎补充噢 h^hh Linux linux
基本命令ls:列出目录内容ls：列出当前目录内容ls-l：以长格式列出（显示详细信息）ls-a：显示隐藏文件ls-lh：以易读格式显示文件大小pwd:显示当前工作目录pwd：显示当前目录的绝对路径cd:切换目录cd/path/to/dir：切换到指定目录cd..：返回上一级目录cd~：切换到用户主目录cd-：切换到上一次所在的目录touch:创建空文件或更新文件时间戳touchfile.txt：创
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要