Activewaste

【论文笔记】：NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

&Title:

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

&Summary

目前最先进的卷积结构用于物体检测是手工设计的。
在这里，我们的目标是一个更好的学习可扩展特征金字塔结构，用于目标检测。在一个覆盖所有交叉尺度连接的可扩展搜索空间中，采用神经网络结构搜索，发现了一种新的特征金字塔结构。架构名为NAS-FPN，由自顶向下和自下而上的连接组合而成，可以跨范围地融合特性。

为了发现一个更好的FPN架构，作者充分利用了神经网络搜索技术[Neural architecture search with rein- forcement learning.],使用强化学习训练了一个控制器来在给定的搜索空间中选择最好的模型结构。控制器使用在搜索空间内子模型的准确率来作为更新参数的反馈信号(reward signal)。因此，通过这样的试错，控制器会学到越来越好的结构，搜索空间在架构成功搜索的过程中起到了很重要的作用。对于FPN的可拓展性，在搜索的过程中，作者强制让FPN重复N次然后concatenation到一起形成一个大的架构。

一句话解释：FPN就是用来特征融合的层，之前都是手工设计，现在尝试神经网络搜索设计！其实就是优化FPN。

结果：与最先进的目标检测模型相比，NAS-FPN与retinanet框架中的各种主干模型相结合，实现了更好的准确性和延迟权衡。与mobilenetv2模型的最先进的ssdlite相比，nas-fpn提高了2 ap的移动检测精度，达到48.3 ap，以更少的计算时间超越了mask r-cnn的检测精度。

&Research Objective

目标是一个更好的学习可扩展特征金字塔结构，用于目标检测。在一个覆盖所有交叉尺度连接的可扩展搜索空间中，采用神经网络结构搜索，发现了一种新的特征金字塔结构。架构名为NAS-FPN，由自顶向下和自下而上的连接组合而成，可以跨范围地融合特性。

注：神经网络搜索（理论上可以对任何东西进行搜索，就像是强化学习和进化算法
遗传算法等等，这些都是寻优算法，只不过现在把这些算法应用到了神经网络的领域）

&Problem Statement

当前目标检测网络中采用特征金字塔网络（FPN）结构解决多尺度的问题，但是这些 FPN 都是人工事先设计，并不一定是最优的结构。为了更灵活地获得更优的 FPN 结构，该文章首创性地提出了采用神经架构搜索（NAS）的方式定制化地构建 FPN，该结构又称 NAS-FPN。

特征金字塔网络（FPN）是一种典型的模型体系结构，用于生成目标检测的金字塔特征表示。它采用了一个主干模型，通常是为图像分类而设计的，通过将主干模型中的特征层次中的两个相邻层按顺序组合，通过自顶向下和横向连接来构建特征金字塔。高级特征在语义上很强，但分辨率较低，它们被放大并与高分辨率特征相结合，以生成高分辨率和语义强的特征表示。虽然fpn简单有效，但它可能不是最佳的体系结构设计。最近，panet[25]显示在fpn特性上添加额外的自下而上路径可以改进低分辨率特性的特性表示。许多最近的论文[7、16、17、34、38、39、40、43、41]提出了各种交叉尺度连接或操作，以组合特征以生成金字塔特征表示。

&Method(s)

我们的方法基于RetinaNet框架，因为它简单而有效。 RetinaNet框架有两个主要组件：骨干网络（通常是最先进的图像分类网络）和特征金字塔网络（FPN）。该算法的目标是为RetinaNet发现更好的FPN架构。图2显示了RetinaNet架构。

为了发现更好的FPN，我们利用提出的神经架构搜索框架。

神经架构搜索训练控制器使用强化学习在给定搜索空间中选择最佳模型架构。控制器使用搜索空间中的子模型的准确性作为更新其参数的奖励信号。因此，通过反复试验，控制器可以学习如何随着时间的推移生成更好的架构。

搜索空间

FPN 的众多跨连接构成了很大的搜索空间。在搜索空间中，一个 FPN 由很多 merging cells 组成，然后合并一些来自不同层融合的特征表示。一个 merging cell 将两个来自不同特征层的特征连接融合产生一个特征输出，这样的单元结构就构成了 FPN 的元结构，同时所有的可能的特征层组合由 merging cells 组建化的表示，这也就构成了我们的搜索空间（模块化）。一个 merging cell 的结构如下：

构建 merging cell 是由控制器 RNN 来做决定，它不仅要决定选取哪两个特征层，还要决定采用那种特征融合方式。

每个 merging cell 有 4 个预测步骤：

从候选中选择一个特征层;
从候选中没有替换地选出另一个特征层；
选择输出特征的分辨率；
选择一个operation操作来融合step1和step2的特征，然后生成一个分辨率为step3选定的新的特征。

在step 4中的operations有两种，sum和global pooling，因为他们简单有效.输入的特征层使用最近邻采样或者max pooling来调整到输出分辨率，merged特征层总会跟着ReLu, 3x3卷积和一个BN层。

在架构搜索期间，可以有多个候选功能共享相同的分辨率。为了减少已发现架构中的计算，我们避免在步骤3中为中间合并单元选择步长8特征。最后，最后5个合并单元被设计为输出特征金字塔{P3，P4，P5，P6，P7}。输出特征级别的顺序由控制器预测。然后通过重复步骤1,2,4生成每个输出特征层，直到完全生成输出特征金字塔。

深入监督随时检测目标

模块化金字塔架构的另一个好处是可以随时检测目标，虽然这种方法已出现，但手动设计这种架构依旧相当困难。固定分类和回归的网络进行深度监督训练。搜索的终止并不是非要全部搜索完，随时都可以退出。因为分辨率不变，所以 FPN 可以随意扩展。

利用堆叠金字塔网络缩放NAS-FPN的一个优点是可以在任何给定金字塔网络的输出处获得特征金字塔表示。此属性可以随时检测，可以在早期退出时生成检测结果。

NAS 利用强化学习训练控制器在给定的搜索空间中选择最优的模型架构。控制器利用子模型在搜索空间中的准确度作为奖励信号来更新参数。因此，通过反复试验，控制器逐渐学会了如何生成更好的架构。由于不知道 FPN 的跨连接情况，NAS-FPN 采用 RNN 作为控制器，使用该控制器来产生一串信息，用于构建不同的连接。其宏观结构如下图所示：（图源文章）

搜索得到的最优 FPN 结构如下图，其控制器收敛得到的最终 FPN 结构如 (f) 所示，并且其精度最高。

每个点代表一个特征层。同一行的特征层具有相同的分辨率。分辨率在自底向上下降。箭头表示内部层之间的连接。图中左侧是输入层。金字塔网络的输入用绿色圆圈标记，输出用红色圆圈标记。

最终收敛的 FPN 网络结构如下图：

注：图6：NAS-FPN中发现的7合并单元金字塔网络的体系结构，具有5个输入层（黄色）和5个输出要素层（蓝色）。 GP和R-C-B分别代表Global Pooling和ReLU-Conv-BatchNorm。

&Evaluation

Proxy task

为了加速RNN控制器的训练，我们需要一个代理任务，它具有较短的训练时间，并且与实际任务相关。
然后，可以在搜索期间使用代理任务来识别良好的FPN架构。我们发现我们可以简单地缩短目标任务的训练并将其用作代理任务。

我们只训练10个时期的代理任务，而不是我们用来训练RetinaNet汇聚的50个时期。为了进一步加快培训代理任务，我们使用ResNet-10的小型骨干架构，输入512×512图像大小。
通过这些减少，TPU上的代理任务的培训时间为1小时。我们在代理任务中重复金字塔网络3次。
初始学习率0.08适用于前8个时期，并且在时期8处以0.1的系数衰减。我们保留从COCO
train2017中随机选择的7392个图像作为验证集，我们用它来获得奖励
Controller

我们的控制器是递归神经网络（RNN），并使用近端策略优化（PPO）[33]算法进行训练。控制器对具有不同架构的子网络进行采样。这些体系结构使用工作池来训练代理任务。

我们实验中的工作队列由100个Tensor Processing
Units（TPU）组成。由此产生的保持定值组平均精度（AP）的检测精度用作更新控制器的奖励。
- 图5-Left显示了不同迭代训练的采样体系构结的AP。可以看出，控制器随着时间的推移产生了更好的架构。
- 图5-Right显示了采样架构的总数以及RNN控制器生成的唯一架构的总数。经过约8000步后，独特架构的数量趋于一致。
注：架构的详细信息为上文收敛的 FPN 网络结构图
Discovered feature pyramid architectures

什么使金字塔结构成为一个好的功能？ 我们希望通过可视化发现的架构来阐明这个问题。在图7（b-f）中，我们绘制了NAS-FPN架构，在RL训练期间获得了更高的奖励。我们发现RNN控制器可以在早期学习阶段快速获得一些重要的跨尺度连接。例如，它发现高分辨率输入和输出特征层之间的连接，这对于生成用于检测小物体的高分辨率特征至关重要。

当控制器收敛时，控制器会发现具有自上而下和自下而上连接的架构，这与图7（a）中的vanilla FPN不同。随着控制器的收敛，我们还发现了更好的特征重用。控制器不是从候选池中随机选择任何两个输入层，而是学习在新生成的层上构建连接以重用先前计算的特征表示。
Stacking pyramid networks

我们的金字塔网络具有很好的特性，可以通过堆叠多个重复架构将其扩展为更大的架构。在上图中，我们显示堆叠vanilla FPN（vanilla ？？？？这个是什么，刚入门不久，博主不是很清楚这个东西）架构并不总能提高性能，而堆叠NAS-FPN显着提高了准确性。这个结果突出了我们的搜索算法可以找到可扩展的架构，这可能很难手动设计。有趣的是，虽然我们在架构搜索阶段只代理任务应用了3个金字塔网络，但应用最多7个金字塔网络时性能仍然有所提高。
Adopting different backbone architectures

一种衡量对象检测体系结构准确性和速度的常用方法是改变主干架构。尽管NAS-FPN中的金字塔网络是通过使用轻量级ResNet-10骨干架构发现的，但我们表明它可以在不同的骨干架构中很好地传输。上图中显示了NAS-FPN在不同主干之上的性能，从较轻的体系结构（如MobilenetV2）到非常高容量的体系结构（如AmoebaNet-D [29]）。
Adjusting feature dimension of feature pyramid networks

增加模型容量的另一种方法是增加NAS-FPN中特征图层的特征尺寸。图8c显示了具有ResNet-50骨干架构的NAS-FPN中128,256和384特征维度的结果。毫不奇怪，增加特征尺寸可以提高检测性能，但它可能不是提高性能的有效方法。

注：点上方的数字表示网络堆叠的次数。
Architectures for high detection accuracy

通过可扩展的NAS-FPN架构，我们将讨论如何在保持高效的同时构建精确模型。在图9a中，我们首先表明NAS-FPN R-50 5 @ 256模型具有与R-101 FPN基线相比较的FLOP，但具有2.5 AP增益。这表明使用NAS-FPN比用更高容量的模型替换骨干更有效。为了获得更高精度的模型，可以使用更重的骨架模型或更高的特征尺寸。

图9（a）显示，与现有方法相比，NAS-FPN架构位于推理时间数字的左上部分。 NAS-FPN与最先进的Mask R-CNN模型一样精确，计算时间更短。
Architectures for fast inference

设计具有低延迟和有限计算预算的对象检测器是一个活跃的研究课题。在这里，我们介绍NAS-FPNLite用于移动对象检测。
NAS-FPNLite和NAS-FPN的主要区别在于我们搜索具有P3到P6输出的金字塔网络。

在图9b中，我们将NAS-FPN的特征维度控制为48或64，以便它具有相似的FLOP Pixel1上的CPU和CPU运行时作为基线方法，并显示NAS-FPNLite优于SS-DLite [32]和FPNLite。
Further Improvements with DropBlock

由于NAS-FPN架构中引入的新层数量增加，因此需要进行适当的模型正则化以防止过度拟合。我们在NAS-FPN层中的批量标准化层之后应用块大小为3x3的DropBlock。
图10显示DropBlock提高了NAS-FPN的性能。特别是，对于具有更多新引入的过滤器的架构，它进一步提高。

result

&Conclusion

本文提出利用神经架构搜索进一步优化用于目标检测的特征金字塔网络的设计过程。在 COCO 数据集上的实验表明，神经结构搜索发现的架构，名为 NAS-FPN，具有良好的灵活性和高性能，可用于构建精确的检测模型。在广泛的精度和速度权衡方面，NAS-FPN 在许多检测任务的主干架构上产生了显著改进。

&Notes

主要贡献

设计搜索空间，覆盖所有可能的跨尺度连接，以生成多尺度特征表示。 在搜索过程中，我们的目标是发现一个具有相同输入和输出特性级别并且可以重复应用的原子体系结构(博主不是特别能理解这句话：具有相同输入和输出特性级别？？？)。模块化的搜索空间使搜索金字塔结构变得易于管理。模块化金字塔结构的另一个好处是能够随时随地检测目标（或“提前退出”）。尽管已经尝试了这种早期的退出方法[14]，但是在考虑到这种约束的情况下，手工设计这种体系结构是相当困难的。
优势

NAS-FPN的优势之一是搜索空间的设计，覆盖所有可能的跨尺度连接，用来生成多尺度特征表示。 在搜索过程中，研究者的目标是发现具有相同输入和输出特征级别并且可以被重复应用的微粒架构。模块化搜索空间使得搜索金字塔架构变得易于管理。
可视化NAS-FPN架构的理解

看图理解：
仔细看图七，图（b~f）共有8列，除去输入层，也就是文章说的7个merging cell，注意每一列都有一个中间状态一共是7个代表的是7merging
cell的输出。第二列和第三列上的点，分别有一个点是蓝色的，其余都是普通的黑色。后面的五列中，蓝色点上还有红色圈圈，则为输出。

以下理解，参考来自文章
merging cell介绍了编码的方式 |输入|输入|输出|操作方式 |–|--|–|--|

不太清楚他们是不是相互独立的本文中FPN一共有7个上述cell 因此用长度28的串就可以表示一个FPN 初始状态有5个
由于采用了7个merging cells 因此又多了7个状态因此是12个状态但是上面的12的状态并不是最终的输出还有一步处理，文中说

Similar to [44], we take all feature layers that have not been connected to any of output layer and sum them to the output layer
that has the corresponding resolution

正是因为这一点，你会看到有些点的输入是三个输入（merging cell 的输入是两输入）这是二次处理的结果，但是论文中并不是上面的这种理解方式。首先得到28个编码之后，然后检查是否有没有用到的5个状态中的一个，然后与merging cell的输出进行sum。得到的结果才是中间状态。
编码：
一共有5行 8列这是因为有5个输入状态 7merging cell的结果注意每一列都有一个中间状态一共是7个代表的是7merging cell的输出如果按照12345对于中间状态的resolution进行编码的的化从下往上依次是 1 2 3 4 5对于
(b)图就是4 5 1 4 2 3 5
(f)图就是2 2 1 2 3 5 4

参考

CVPR 2019 | NAS-FPN：基于自动架构搜索的特征金字塔网络

如何在 Android Framework层面控制高通（Qualcomm）芯片的 CPU 和 GPU。 YoungHong1992 android 高通芯片 CPU GPU
如何在AndroidFramework层面控制高通（Qualcomm）芯片的CPU和GPU。参考：https://blog.csdn.net/YoungHong1992/article/details/117047839?utm_source%20=%20uc_fansmsg作为一名Framework开发者，您拥有系统级的权限，可以直接与底层硬件接口交互。但这通常不被推荐，因为现代Android系
YOLOv11 | SAConv与C3k2融合架构技术详解，替换传统下采样Conv wei子技术杂谈 YOLO 人工智能
YOLOv11|SAConv与C3k2融合架构技术详解，替换传统下采样Conv1.核心创新与技术价值1.1突破性设计理念本文提出的SAConv（SwitchableAtrousConvolution）可切换空洞卷积结合C3k2二次创新模块，在YOLOv11中实现了三大突破：动态感受野调节：支持[1,2,3]三种空洞率的实时切换多尺度特征融合：跨层级特征的无损传递计算效率优化：相比传统空洞卷积节省3
算法化资本——智能投顾技术重构金融生态的深度解析田园Coder 人工智能科普人工智能科普
金融市场的数字化进程正经历着本质性跃迁。当传统交易大厅的开放式喊价被服务器集群的低频嗡鸣取代，当投资决策从人类直觉转向概率矩阵计算，一场由人工智能驱动的资本范式革命已悄然降临。智能投顾作为这场变革的核心载体，其技术架构不仅重塑财富管理的运作逻辑，更在认知层面挑战着金融市场的存在根基。理解这场变革的深度与广度，需要穿透技术表象，审视算法与资本结合引发的复杂生态嬗变。智能投顾系统的技术支柱建立于三重认
03 数据可视化的世界非常广阔，除了已提到的类型，还有许多更细分或前沿的可视化形式。晨曦543210 信息可视化人工智能
十五、机器学习与数据科学专用图表特征重要性图（FeatureImportancePlot）用途：展示机器学习模型中各特征对预测结果的贡献度。示例：随机森林模型中影响房价预测的关键因素。混淆矩阵热力图（ConfusionMatrixHeatmap）用途：分类模型性能评估，显示预测结果与真实标签的对比。示例：疾病诊断模型的真阳性/假阳性分布。学习曲线（LearningCurve）用途：分析模型训练过程
大白话解释深度学习中多尺度特征融合及其意义来自宇宙的曹先生深度学习人工智能
想象一下，你正在看一幅城市街道的照片。在这张照片中，你可能会看到：远处的小汽车，它们在图像中看起来很小。近处的大巴士，它们在图像中看起来很大。还有一些行人，他们可能在不同的距离上，大小各异。假设你想训练一个计算机程序来识别和分割这些不同的物体（汽车、巴士、行人）。如果这个程序只能在一个固定的尺度上“看”图像，比如说只能处理大物体，它可能会错过那些远处的小汽车，因为这些小汽车在图像中占据的像素很少。
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
从0开始学习R语言--Day41--Moran‘s I Chef_Chen 学习
在处理带有空间特征的数据，我们往往都直接一股脑地处理数据点，但很多时候，空间上的信息对于处理后续衍生出来的问题会有很大帮助，例如对于城市里大小县城的发展情况，只知道单一县城的经济发展曲线，很难解释一些拐点和突然的攀升，而如果知道相邻县城存在经济发展飞快的例子，可能就是被带动了经济水平；亦或者是在处理社交网络的好有问题时，只知道谁和谁是朋友（类似于空间矩阵），是无法推断出经济收入相似的推论的，所以说
视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用
原文链接：https://tecdat.cn/?p=42891原文出处：拓端数据部落公众号分析师：ZiqiYe视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用作为数据科学领域的从业者，我们常面临这样的挑战：如何让机器真正“看懂”图像中的信息？在为客户完成服装零售行业的图像识别时，这一问题尤为突出。追溯图像识别技术的发展，早期依赖人工设计特征，如边缘检测、纹理分析等，效率低下且适
AWS MES集成：PLM到车间秒级同步方案百态老人 aws postman 云计算
以下是针对"AWSMES集成框架：通过Lambda转换PLMBOM→DynamoDB→MQTT至车间"的完整技术方案，结合AWS服务特性和制造业需求设计：一、架构设计目标数据流闭环：实现PLM系统到车间设备的自动化数据管道实时性：BOM变更秒级同步至车间可靠性：MQTTQoS1保障消息必达无服务器化：降低运维成本，按需伸缩二、技术组件详解1.PLMBOM数据解析数据结构特征：多视图结构（EBOM/
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
Manus AI与多语言手写识别 tonngw 人工智能
技术文章大纲：ManusAI与多语言手写识别引言手写识别技术的发展背景与市场需求ManusAI的定位与核心技术优势多语言场景下的挑战与机遇ManusAI的核心技术架构基于深度学习的端到端手写识别模型多模态数据融合（笔迹压力、书写轨迹等）自适应语言模型与字符集扩展机制多语言手写识别的关键技术非拉丁语系（中文、阿拉伯语等）的笔迹特征提取小样本语言数据的迁移学习策略上下文感知与语法纠错在低资源语言中的应
FPGA设计中的数据存储 cycf FPGA之道 fpga开发
文章目录FPGA设计中的数据存储为什么需要数据存储FPGA芯片内部的载体触发器查找表块存储FPGA芯片外部的资源RAM应用场合ROM特征简介实现载体应用场合FIFO特征简介FIFO使用小技巧之冗余法FIFO写接口缓存FIFO读接口缓存“冗余法”总结根据数据流的稳定性与存储操作的容错性，决定采用RAM模式还是FIFO模式STACK特征简介实现载体应用场合SummaryFPGA设计中的数据存储为什么需
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
大模型开源与国产化突围：技术路径与产业机遇深度解析梦玄海开源架构 golang 开发语言后端大数据
引言：大模型时代的双轨竞速2023年全球大语言模型（LLM）参数量突破万亿级，GPT-4、LLaMA等模型引领技术浪潮。中国在这场竞赛中面临双重命题：既要融入全球开源生态，又要构建自主可控的技术体系。本文将从技术架构、训练范式、生态建设三个维度，深入剖析大模型开源与国产化的突围路径。一、全球开源格局与中国大模型现状1.1国际开源生态的演进特征技术民主化加速：LLaMA-2（700亿参数）、BLOO
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
时序数据库：高效处理时间序列数据的核心技术时序数据说时序数据库数据库开源物联网 iotdb
时序数据库概述时序数据库（TimeSeriesDatabase，TSDB）是一种专门为存储、处理和查询时间序列数据而优化的数据库系统。随着物联网、金融科技、工业互联网等领域的快速发展，时序数据呈现出爆炸式增长，传统的关系型数据库在处理这类数据时面临诸多挑战，时序数据库应运而生并成为关键技术解决方案。时序数据的特点时序数据具有几个显著特征，这些特征直接影响了时序数据库的设计理念：时间属性：每条记录都
SAGA——Textural Features(纹理特征)提取竹_猗 SAGA GIS
由于课题需要（其实是条件有限），不得不使用SAGA软件进行特征提取，在经过一个星期的摸索之后，终于得到了一些成果，在此记录一下提取的过程。在第一篇的文章中已经简单介绍了SAGAGIS的相关概念以及如何使用SAGAGIS加载影像和进行分割。TexturalFeatures提取过程：（1）将影像的各个波段分别导出为单独影像（这一步是由于我是在服务器上进行，所以需要导出，软件上没有必要将每个波段都导出为
YOLOv11模型轻量化挑战的技术黑客飓风 YOLO 目标跟踪人工智能
YOLOv11模型轻量化挑战的技术文章大纲背景与意义YOLOv11在目标检测领域的地位与优势轻量化需求的实际应用场景（移动端、嵌入式设备等）轻量化面临的挑战：精度与速度的权衡YOLOv11模型结构分析整体架构设计特点（如主干网络、特征融合模块等）参数量与计算量分布的关键瓶颈现有轻量化改进的局限性轻量化技术路线网络结构优化深度可分离卷积替代传统卷积注意力机制的高效嵌入设计冗余模块的剪枝与删除量化与压
DPDK — App EAL options 指令行参数详解范桂飓 C/C++语言与网络编程手册 linux bash 运维
目录文章目录目录Lcore-relatedoptions（lcore相关选项）查看CPU布局系统层面的CPU隔离-cCOREMASK-lCORELIST--lcoresCOREMAPS--master-lcoreCOREID-sSERVICE_CORE_MASKMemory-relatedoptions（Memory相关参数）查看MainMemory布局OptionsOthersDevice-re
网络渗透2 指纹识别郭莉914 网络安全 web安全
一.指纹识别指纹由于其终身不变性、唯一性和方便性，几乎已成为生物特征识别的代名词。通常我们说的指纹就是人的手指末端正面皮肤上凹凸不平的纹线，纹线规律的排列形成不同的纹型。而本节所讲的指纹是指网站CMS指纹识别、计算机操作系统及Web容器的指纹识别等。在渗透测试中，对目标服务器进行指纹识别是相当有必要的，因为只有识别出相应的Web容器或者CMS，才能查找与其相关的漏洞，然后才能进行相应的渗透操作。C
Python训练打卡Day46 编程有点难 Python学习笔记 python 开发语言
通道注意力(SE注意力)知识点回顾：不同CNN层的特征图：不同通道的特征图什么是注意力：注意力家族，类似于动物园，都是不同的模块，好不好试了才知道。通道注意力：模型的定义和插入的位置通道注意力后的特征图和热力图注意力机制：一种让模型学会「选择性关注重要信息」的特征提取器，就像人类视觉会自动忽略背景，聚焦于图片中的主体（如猫、汽车）。transformer中的叫做自注意力机制，他是一种自己学习自己的
Python训练营打卡Day8(2025.4.27) 2301_80505456 python 算法开发语言
知识点见示例代码字典的简单介绍标签编码连续特征的处理：归一化和标准化至此，常见的预处理方式都说完了作业：对心脏病数据集的特征用上述知识完成，一次性用所有的处理方式完成预处理，尝试手动完成，多敲几遍代码。由于所给数据集已是处理过的数据集，以下将按所给数据集的处理情况对连续特征进行归一化和标准化。首先观察数据，需处理数据共有5列，分别是：age,trestbps,chol,thalach,oldpea
基于大模型的颅前窝底脑膜瘤诊疗全流程研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与目的1.2国内外研究现状1.3研究意义与创新点二、颅前窝底脑膜瘤概述2.1定义与分类2.2发病机制与病因2.3临床表现与症状三、大模型预测原理与方法3.1大模型介绍3.2数据收集与预处理3.3模型训练与验证四、术前预测与准备4.1肿瘤特征预测4.2手术风险预测4.3术前检查与评估4.4患者沟通与教育五、手术方案制定5.1手术入路选择5.2手术步骤规划5.3术中监测与应急
Python 3.14七大新特性总结：从t-string模板到GIL并发优化 deephub 人工智能机器学习 python
Python3.14已进入测试阶段，根据PEP745发布计划，该版本已停止引入新功能，也就是说新特征就应该已经固定下来了。所以本文基于当前最新的beta2版本，深入分析了Python3.14中的七项核心新特性。无论从事Web应用开发、数据处理管道构建，还是复杂系统调试工作，这些新特性都将对开发实践产生重要影响。本文将通过详细的代码示例，深入阐述每项特性的工作原理和应用场景。1、模板字符串字面量（T
Android 16开发者全解读
哈喽，我是老刘Android16的更新最近发布，带来了全新的系统特性和视觉体验，也在SDK版本机制、兼容性、性能优化等多个层面进行了更新。对于App开发者而言，这既意味着更多创新的可能，也带来了全新的挑战与适配需求。无论你是追求极致用户体验的产品开发者，还是专注于技术前沿的架构师，Android16的变更都有值得关注的地方。本文将从开发者视角，全面解读Android16的核心升级要点，帮助你把握新
Python 用 NumPy 进行矩阵分解
Python用NumPy进行矩阵分解关键词：NumPy,矩阵分解,线性代数,奇异值分解,QR分解,LU分解,特征值分解摘要：本文将深入探讨使用NumPy进行矩阵分解的各种技术。我们将从基础的线性代数概念出发，详细讲解五种核心矩阵分解方法：LU分解、QR分解、奇异值分解(SVD)、特征值分解和Cholesky分解。每种方法都将配有数学原理说明、NumPy实现代码和实际应用案例。文章还将介绍矩阵分解在
SEO优化技巧深度解析：从算法逻辑到实战策略的全链路突破 boyedu 网站建设网站建设网站运营网站架构
第一章搜索引擎算法逻辑：SEO优化的底层密码1.1算法进化史：从关键词匹配到意图理解搜索引擎算法经历了从简单关键词匹配到复杂语义理解的跨越式发展。早期算法以PageRank为核心，通过分析网页间链接关系评估权威性。随着Hummingbird算法的推出，搜索引擎开始解析自然语言，BERT算法进一步实现上下文语义理解。当前算法已形成多维度评估体系，涵盖内容质量、用户体验、权威性建设等层面。以Googl
TeamT5-ThreatSonar 解决方案：构建智能动态的 APT 与勒索软件防御体系江苏思维驱动智能研究院有限公司自动化网络大数据
一、核心功能深度解析：从威胁狩猎到自动化响应的闭环能力（一）威胁狩猎：主动挖掘潜伏性攻击的“数字侦探”多层级威胁识别引擎：静态特征匹配：内置超1000种APT后门签名（如Regin、Duqu等高级工具包特征），实时扫描端点文件、注册表与进程，比对全球威胁情报库（每日更新超50万条IOC）；动态行为分析：通过内核级监控技术，捕捉异常操作（如非预期的进程注入、加密API高频调用），例如某银行端点出现“
多模态融合：现代搜索引擎底层图像、视频检索的技术架构设计何雅琪¥ 搜索引擎
在多媒体内容爆炸式增长的当下，用户对搜索引擎的需求已从单纯的文本检索拓展到图像、视频等多元模态。多模态融合技术打破了信息载体的界限，使搜索引擎能够理解图像的视觉语义、视频的动态内容，并实现跨模态的精准检索。从特征提取到检索匹配，现代搜索引擎底层围绕图像、视频检索构建起复杂而精妙的技术架构，重塑了用户获取信息的方式。一、多模态数据的特征提取：解码视觉信息图像与视频包含丰富的视觉信息，其特征提取是实现
深入理解安卓系统架构与开发技术
本文还有配套的精品资源，点击获取简介：安卓基础知识课程为初学者及进阶开发者提供安卓系统架构、关键开发技术以及最新开发工具的全面介绍。课程涵盖了从系统架构层面的核心概念如HAL、系统库、应用框架、应用程序层，到应用开发的关键组件，包括Dalvik/ART虚拟机、UI设计、Intent通信机制、资源管理、权限系统、进程与线程处理、AndroidStudio/Gradle集成、应用调试与测试，以及And
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

【论文笔记】：NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

&Title:

&Summary

&Research Objective

&Problem Statement

&Method(s)

搜索空间

深入监督随时检测目标

&Evaluation

Proxy task

Controller

Discovered feature pyramid architectures

Stacking pyramid networks

Adopting different backbone architectures

Adjusting feature dimension of feature pyramid networks

Architectures for high detection accuracy

Architectures for fast inference

Further Improvements with DropBlock

result

&Conclusion

&Notes

主要贡献

优势

可视化NAS-FPN架构的理解

参考

你可能感兴趣的:(#,特征层面,目标检测,NAS-FPN)