麻花地

旷世轻量化网络ShuffulNetV2学习笔记

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Abstract

目前，神经网络体系结构的设计主要由计算复杂性的间接度量来指导，即FLOPs.。然而，速度等直接指标也取决于其他因素，如内存访问成本和平台特性。因此，这项工作建议评估目标平台上的直接度量，而不仅仅是考虑FLOPs.。基于一系列的控制实验，这项工作得出了一些有效网络设计的实用指南。因此，提出了一种新的体系结构，称为ShuffleNet V2。综合烧蚀实验证明，我们的模型在速度和精度方面是最先进的。

总结：

1 Introduction

深度卷积神经网络（CNN）的体系结构已经发展了多年，变得更加精确和快速。自AlexNet的里程碑式工作【15】以来，ImageNet的分类精度已通过新结构得到显著提高，其中包括VGG【25】、GoogLeNet【28】、ResNet【5、6】、DenseNet【11】、ResNeXt【33】、SE Net【9】和自动中性架构搜索【39、18、21】。

除了准确性之外，计算复杂性也是另一个重要的考虑因素。现实世界的任务通常旨在通过目标平台（如硬件）和应用场景（如自动驾驶要求低延迟）在有限的计算预算下获得最佳精度。这推动了一系列朝着轻量级架构设计和更好的速度精度权衡方向发展的工作，其中包括Xception【2】、MobileNet【8】、MobileNet V2【24】、ShuffleNet【35】和CondenceNet【10】等等。群卷积和深度卷积是这些工作的关键。

为了衡量计算复杂性，一个广泛使用的指标是浮点运算的数量，即FLOPs。然而，FLOPs是一个间接指标。它是一个近似值，但通常不等同于我们真正关心的直接指标，例如速度或延迟。在之前的作品中已经注意到这种差异【19、30、24、7】。例如，MobileNet v2[24]比NASNET-A[39]快得多，但它们的失败率相当。这一现象在图1（c）（d）中得到了进一步的例证，图1（c）（d）显示了具有类似FLOPs的网络具有不同的速度。因此，使用FLOPs作为计算复杂性的唯一度量是不够的，可能导致次优设计。

FLOPS和FLOPs的区别：

间接（FLOPs）和直接（speed）指标之间的差异可归因于两个主要原因。首先，对速度有相当大影响的几个重要因素没有被FLOPs考虑在内。其中一个因素是memory access cost 内存访问成本（MAC）。在某些操作（如组卷积）中，这样的成本占运行时间的很大一部分。这可能是具有强大计算能力的设备（如GPU）的瓶颈。在网络架构设计过程中，不应简单地忽略这一成本。另一个是 degree of parallelism平行度。在相同的FLOPs下，具有高并行度的模型可能比另一个具有低并行度的模型快得多。

其次，根据平台的不同，使用相同触发器的操作可能有不同的运行时间。例如，张量分解在早期的工作中被广泛使用【20,21,22】，以加速矩阵乘法。然而，最近的工作【19】发现【22】中的分解在GPU上甚至更慢，尽管它减少了75%的失败率。我们研究了这个问题，发现这是因为最新的CUDNN[23]库专门针对3×3 conv进行了优化。我们不能肯定3×3 conv比1×1 conv慢9倍。

根据这些观察结果，我们提出了有效的网络架构设计应考虑两个原则。首先，应该使用直接度量（例如速度），而不是间接度量（例如触发器）。其次，应在目标平台上评估此类指标。

在这项工作中，我们遵循这两个原则，并提出了一种更有效的网络架构。在第2节中，我们首先分析了两个具有代表性的最先进网络的运行时性能【15,14】。然后，我们推导出了四条高效网络设计准则，这些准则不仅仅考虑触发器。虽然这些指南与平台无关，但我们在两个不同的平台（GPU和ARM）上进行了一系列受控实验，并进行了专门的代码优化，以确保我们的结论是最先进的。

在第3节中，我们根据指南设计了一种新的网络结构。由于其灵感来源于ShuffleNet【15】，因此被称为ShuffleNet V2。通过第4节中的综合验证实验，证明它比之前两种平台上的网络都更快、更准确。图1（a）（b）给出了比较的概述。例如，考虑到4000万次浮点运算的计算复杂性预算，ShuffleNet v2的精度分别比ShuffleNet v1和MobileNet v2高3.5%和3.7%。

2 Practical Guidelines for Efficient Network Design

我们的研究是在CNN库的行业级优化的两个广泛采用的硬件上进行的。我们注意到，我们的CNN库比大多数开源库更高效。因此，我们确保我们的观察结果和结论是可靠的，并对行业实践具有重要意义。

1）GPU。使用单个NVIDIA GeForce GTX 1080Ti。卷积库是CUDNN 7.0[23]。我们还激活了CUDNN的基准函数，分别为不同的卷积选择最快的算法。

2）ARM。高通Snapdragon 810。我们使用高度优化的基于Neon的实现。单个线程用于评估。

其他设置包括：打开全部优化选项（例如，用于减少小操作开销的张量融合）。输入图像大小为224×224。每个网络随机初始化并评估100次。使用平均运行时间。

为了启动我们的研究，我们分析了两种最先进网络的运行时性能，即ShuffleNet v1[35]和MobileNet v2[24]。它们在ImageNet分类任务上都是高效和准确的。它们都广泛用于低端设备，如手机。虽然我们只分析这两个网络，但我们注意到它们代表了当前的趋势。其核心是组卷积和深度卷积，这也是其他最先进网络的重要组成部分，如ResNeXt【33】、Xception【2】、MobileNet【8】和CondenceNet【10】。

整个运行时针对不同的操作进行分解，如图2所示。我们注意到，FLOPs度量只考虑卷积部分。虽然这部分占用了大部分时间，但其他操作，包括数据I/O、数据无序和元素操作（AddTensor、ReLU等）也占用了大量时间。因此，FLOPs对实际运行时间的估计不够准确。

基于这一观察结果，我们从几个不同的方面对运行时（或速度）进行了详细的分析，并得出了一些有效网络架构设计的实用指南。

G1) Equal channel width minimizes memory access cost (MAC).

现代网络通常采用深度可分离卷积[12,13,15,14]，其中点方向卷积（即1×1卷积）占了大部分复杂性[15]。我们研究了1×1卷积的核形状。形状由两个参数指定：输入通道c1和输出通道c2的数量。设h和w为特征映射的空间大小，1×1卷积的触发器为 $B=hwc_1c_2$ 。

为了简单起见，我们假设计算设备中的缓存足够大，可以存储整个特征映射和参数。因此，内存访问成本（MAC）或内存访问操作的数量是 $MAC=hw（c_1+c_2）+c_1c_2$ 。请注意，这两个术语分别对应于输入/输出特征映射和内核权重的内存访问。

根据均值不等式，我们得到

因此，MAC有一个由FLOPs给出的下限。当输入和输出通道数相等时，达到下限。

结论是理论性的。实际上，许多设备上的缓存不够大。此外，现代计算库通常采用复杂的阻塞策略来充分利用缓存机制[24]。因此，实际MAC可能会偏离理论MAC。为了验证上述结论，进行了如下实验。通过重复堆叠10个构建块来构建基准网络。每个块包含两个卷积层。第一个包含c1输入通道和c2输出通道，第二个包含其他通道。

表1通过改变比率c1:c2来报告运行速度，同时固定总的触发器。很明显，当c1:c2接近1:1时，MAC变得更小，网络评估速度更快。

G2) Excessive group convolution increases MAC.

群卷积是现代网络体系结构的核心[7,15,25,26,27,28]。它通过将所有通道之间的密集卷积更改为稀疏（仅在通道组内）来降低计算复杂度（FLOPs）。一方面，它允许在给定固定触发器的情况下使用更多通道，并增加网络容量（从而提高精度）。然而，另一方面，信道数量的增加会导致更多MAC。

形式上，根据G1和等式1中的符号，1×1组卷积的MAC和FLOPs之间的关系为

其中g是组数， $B=hwc_1c_2/g$ 是触发器。很容易看出，给定固定的输入形状 $c_1×h×w$ 和计算成本B，MAC随着g的增长而增加。

为了研究实际应用中的影响，通过叠加10个逐点分组卷积层来构建基准网络。表2报告了使用修复总失败次数时使用不同的组号。很明显，使用大量组数会显著降低运行速度。例如，在GPU上使用8组比使用1组（标准密集卷积）慢两倍多，在ARM上慢30%。这主要是由于MAC的增加。我们注意到，我们的实现经过了专门的优化，比逐组计算卷积要快得多。

因此，我们建议根据目标平台和任务仔细选择组号。仅仅因为这样可以使用更多通道，使用大量组号是不明智的，因为快速增加的计算成本很容易超过精度提高的好处。

G3) Network fragmentation reduces degree of parallelism.

在GoogLeNet系列[29,30,3,31]和自动生成架构[9,11,10]中，每个网络块中都广泛采用了“多路径”结构。使用了很多小操作符（这里称为“分段操作符”），而不是几个大操作符。例如，在NASNET-A[9]中，分段操作符的数量（即一个构建块中的单个卷积或池操作的数量）是13。相反，在ResNet等常规结构中，这个数字是2或3。

虽然这种分散的结构有利于提高准确性，但它可能会降低效率，因为它对GPU等具有强大并行计算能力的设备不友好。它还引入了额外的开销，如内核启动和同步。

为了量化网络碎片如何影响效率，我们评估了一系列具有不同碎片程度的网络块。具体而言，每个构建块由1到4个1×1卷积组成，这些卷积按顺序或并行排列。块体结构如附录所示。每个砌块重复堆放10次。表3中的结果表明，碎片化显著降低了GPU上的速度，例如，4片段结构比1片段慢3倍。在ARM上，速度降低相对较小。

G4) Element-wise operations are non-negligible.

如图2所示，在像[15,14]这样的轻量级模型中，**元素操作(激活函数)**占用了大量时间，尤其是在GPU上。这里，元素级操作符包括ReLU、AddTensor、AddBias等。它们有较小的失败，但MAC相对较重。特别地，我们还将深度卷积（depthwise convolution）[12,13,14,15]视为一种元素操作，因为它也具有很高的MAC/FLOPs比。

为了验证，我们在ResNet中试验了“瓶颈”单元（1×1 conv，然后是3×3 conv，然后是1×1 conv，带有ReLU和快捷连接）。将分别删除ReLU和shortcut operations操作。表4中报告了不同变体的运行时间。我们观察到，在删除ReLU和shortcut operations后，GPU和ARM上都获得了大约20%的加速比。

结论和讨论

基于上述指导原则和实证研究，我们得出结论，一个高效的网络体系结构应该1）使用“平衡”卷积（相等的信道宽度）；2）意识到使用组卷积的成本；3）降低碎片化程度；4）减少元素操作。这些理想的特性取决于平台特性（如内存操作和代码优化）这超出了理论上的失败。在实际的网络设计中，应考虑这些因素。

轻量级神经网络结构的最新进展[15,13,14,9,11,10,12]主要基于触发器的度量，没有考虑上述属性。例如，ShuffleNet v1【15】严重依赖于组卷积（违背G2）和瓶颈状构建块（违背G1）。MobileNet v2【14】使用了一个违反G1的反向瓶颈结构。它使用深度卷积和依赖于“厚”特征图。这违反了G4。自动生成的结构【9,11,10】高度碎片化，违反G3。

3 ShuffleNet V2: an Efficient Architecture

Review of ShuffleNet v1

ShuffleNet是一种最先进的网络体系结构。它被广泛应用于低端设备，如手机。它激励着我们的工作。因此，首先对其进行回顾和分析

根据文献[15]，轻型网络面临的主要挑战是，在给定的计算预算（FLOPs）下，只能承受有限数量的特征信道。为了在不显著增加触发器的情况下增加通道数量，在[15]中采用了两种技术：逐点组卷积和瓶颈状结构。然后引入“channel shuffle”操作，以实现不同通道组之间的信息通信并提高准确性。构建块如图3（a）（b）所示。

如第2节所述，点态群卷积和瓶颈结构都会增加MAC（G1和G2）。这一成本不容忽视，尤其是对于轻型模型。此外，使用过多的组违反了G3。快捷连接中的元素级“添加”操作也是不可取的（G4）。因此，为了获得高的模型容量和效率，关键问题是如何在没有密集卷积和太多组的情况下保持大量等宽的信道。

Channel Split and ShuffleNet V2

为了达到上述目的，我们引入了一个称为通道分割的简单操作符。如图3（c）所示。在每个单元的开头，c特征通道的输入用c分为两个分支分别为 $c-c^{'}$ 和 $c^{'}$ 通道。在G3之后，一个分支仍然作为标识。另一个分支由三个具有相同输入和输出通道的卷积组成，以满足G1。这两个1×1卷积不再是分组卷积，这与[15]不同。这部分是为了遵循G2，部分是因为拆分操作已经生成了两个组。

在卷积之后，这两个分支被连接起来。因此，通道数保持不变（G1）。然后，使用与[15]中相同的“channel shuffle”操作来启用两个分支之间的信息通信。

洗牌后，下一单元开始。请注意，ShuffleNet v1【15】中的“add”操作已不存在。像ReLU和深度卷积这样的元素操作只存在于一个分支中。此外，三个连续的元素级操作“Concat”、“Channel Shuffle”和“Channel Split”被合并为单个元素级操作。根据G4，这些变化是有益的。

对于空间下采样，该单位略有修改，如图3（d）所示。已删除通道拆分操作符。因此，输出通道的数量增加了一倍。

提议的构建块（c）（d）以及由此产生的网络被称为ShuffleNet V2。基于以上分析，我们得出结论，这种架构设计是高效的，因为它遵循了所有的指导原则。

构建块被重复堆叠以构建整个网络。为简单起见，我们设置 $c^{'}=c/2$ 。整体网络结构类似于ShuffleNet v1【15】，总结见表5。只有一个区别：在全局平均池之前添加了一个额外的1×1卷积层，以混合功能，这在ShuffleNet v1中是不存在的。与文献[15]类似，每个块中的通道数被缩放以生成不同复杂度的网络，标记为0.5×、1×，等等。

Analysis of Network Accuracy

ShuffleNet v2不仅高效，而且准确。有两个主要原因。首先，每个构建块的高效性允许使用更多的功能通道和更大的网络容量。

其次，在每个块中，一半的特征通道（当c0=c/2时）直接穿过块并连接到下一个块。这可以被视为一种特征重用，其精神与DenseN et[6]和CondenceNet[16]相似。

在DenseNet[6]中，为了分析特征重用模式，绘制了层间权重的l1范数，如图4（a）所示。很明显，相邻层之间的连接比其他层更强。这意味着所有层之间的紧密连接可能会引入冗余。最近的CondenceNet[16]也支持这一观点。

因此，ShuffleNet V2的结构通过设计实现了这种类型的特征重用模式。与DenseNet[6]一样，它具有重复使用特征以获得高精度的优点，但与前面分析的结果相比，它的效率要高得多。表8中的实验验证了这一点。

4 Experiment

5 Conclusion

我们建议网络架构设计应考虑速度等直接指标，而不是像FLOPs这样的间接指标。我们提出了实用指南和一种新的体系结构，ShuffleNet v2。综合实验验证了新模型的有效性。我们希望这项工作能够启发未来的网络架构设计工作，使其具有平台意识和更实用性

ARM架构薄记小记1——ARM架构的快速介绍 charlie114514191 嵌入式面试笔记整理计算机架构学习从0开始的学习ARMv7a IMX6ULL芯片 arm开发架构
ARM架构薄记小记1——ARM架构的快速介绍笔者最近正在简单的了解一下ARM架构，特别是ARMCortexA架构的部分，这里，笔者想要薄记的问题有这样一些，也算是简单记录一下自己学习ARM架构的记录。问题1：ARM架构的历史是如何的，以此我们可以洞察ARM架构设计的一些动机问题2：我们知道，ARM架构中常见的架构是ARMv7到ARMv9，这些架构有发生怎样的变化？每一个架构的一些纲领性的东西是什么
struts1+struts2项目兼容升级到了spring boot 2.7 和稀泥 struts spring boot java
原项目比较复杂，集成了各种框架（struts1struts2spring3等），趁工作之余练练手，学习一下springboot。大概花了一周时间才调通。一、调整jar版本，寻找合适的版本。第一步、首先原项目JDK6，要用springbootJDK肯定要升级了。原来的struts2也有漏洞了，也要升级。在不升级其他框架的情况下。jdk2117都可以运行，索性选择jdk21，反正是练手。第二步、str
跨境出海必看：IPv6代理平台访问限制？如何解决？跨境一哥跨境电商网络
一、跨境业务为何频繁遭遇IPv6访问限制？尽管IPv6协议自1998年诞生以来已逐步普及，但截至2023年全球IPv6采用率仅约40%。部分海外平台由于以下原因尚未完全支持IPv6：基础设施升级成本高：改造整套网络架构需数百万美元投入，部分云服务、支付平台等未适配IPv6，无法通过IPv6访问。网络配置管理层面：IPv6地址分配管理复杂，跨境业务涉及多方，易出现地址冲突或错误配置。复杂拓扑下，设备
强化学习 Reward 百态老人算法
在强化学习中，奖励（Reward）是智能体（Agent）与环境（Environment）交互过程中获得的重要反馈信号。奖励机制在强化学习中扮演着至关重要的角色，因为它不仅指导智能体如何在环境中行动，还影响其策略的优化和最终的学习效果。奖励是智能体在执行某个动作后从环境中获得的即时反馈，用于评估该动作的好坏。这种反馈帮助智能体调整其行为策略，以期在未来获得更多的奖励。奖励可以是正数、负数或零，其或负
C++有哪些高级特性值得学习？ c++
C++是一种功能丰富且复杂的编程语言，其中许多高级特性可以帮助开发者编写更高效、更安全、更灵活的代码。以下是一些值得深入学习的C++高级特性：模板编程（Templates）模板是C++中实现泛型编程的核心机制，允许开发者编写与数据类型无关的代码。模板函数cpp复制templateTmax(Ta,Tb){return(a>b)?a:b;}优点：模板函数可以处理多种数据类型，避免了代码重复。应用场景：
北斗导航 |低轨导航研究进展单北斗SLAMer 卫星导航人工智能北斗三号 GNSS 算法低轨导航
低轨导航作为空天信息网络的重要组成部分，近年来在技术研发、系统构建及实际应用方面均取得显著进展。以下是基于最新研究动态的总结：一、技术研发与系统构建低轨导航增强系统技术突破2025年1月，青岛召开的低轨卫星导航增强系统技术发展研讨会汇集了国内26家单位的60名专家，重点讨论了低轨星座与现有导航系统（如北斗、GPS）的融合增强技术。例如：巨型导航星座数字仿真试验系统：国防科技大学刘文祥团队提出通过数
【DeepThinking】人生反思洞察之「知行合一」（经验贴）碣石潇湘无限路经验分享笔记生活人生深度思考知行合一
引言最近，我深刻体会到一种焦虑：既有生活的现实压力，也有对人生方向的迷茫与无奈。回顾自身，我发现这并不是物质层面的匮乏或欲望驱动，而是对“我是谁”“我想要什么”“我能做什么”的追问。这种焦虑，常常让我想起人的出生：起初我们依赖父母和环境，被动地活着；成年后，我们凭借主动学习、工作和不断积累的信念，去实现自我价值。但终有一天，我们会停下来审视自己，看清一些本质问题，并且发觉自己需要对这一生负责：我应
Yolo系列之Yolo的基本理解是十一月末 YOLO python 开发语言 yolo
YOLO的基本理解目录YOLO的基本理解1YOLO1.1概念1.2算法2单、多阶段对比2.1FLOPs和FPS2.2one-stage单阶段2.3two-stage两阶段1YOLO1.1概念YOLO(YouOnlyLookOnce)是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位
网络安全-黑客攻击刘林锋blog 网络规划设计师信息安全安全网络
基本知识黑客（Hacker）、骇客（Cracker）攻击，需要进行信息收集和根据需求选择攻击方式。信息收集攻击的效果和对目标的了解程度有着直接的相关性。因此信息收集在攻击过程中占据着头等重要的位置，包括财务数据、硬件配置、人员结构、网络架构和整体利益等诸多方面。主要方式如下：网络监测。一些监测网络中计算机漏洞的工具，包括嗅探应用软件，能在计算机内部或通过网络来捕捉传输过程中的密码等数据信息。社会工
IPv6网络的可操作安全考虑——RFC9099解析（四）黑带架构湿 IPv6安全网络安全安全
2.6记录和监控为了在发生安全事件或检测到异常行为的情况下进行取证（forensic）研究，网络运营商应记录多个信息片段。在某些情况下，这需要通过网络管理站对设备进行频繁的轮询。日志包括但不限于：在可用时，使用网络的所有应用程序（包括用户空间和内核空间）的日志(例如，网络运营商管理的web服务器；IPFIX数据【RFC7011】；SNMPMIBs或来自RESTCONF/NETCONF的YANG数据
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
机器学习中的贝叶斯网络：如何构建高效的风险预测模型 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术文章目录机器学习中的贝叶斯网络：如何构建高效的风险预测模型1.背景介绍2.基本概念术语说明2.1马尔科夫随机场（MarkovRandomField）2.2条件随机场（ConditionalRandomField，CRF）2.3变量elimination算法2.4贝叶斯网络3.核心算法原理和具体操作步骤以及数学公式讲解3.1原理介绍1.贝叶斯网络基础2.贝叶斯网络构建风险
红宝书第十一讲：超易懂版「ES6类与继承」零基础教程：用现实例子+图解实现 kovlistudio 前端 es6 javascript 开发语言前端学习
红宝书第十一讲：超易懂版「ES6类与继承」零基础教程：用现实例子+图解实现资料取自《JavaScript高级程序设计（第5版）》。查看总目录：红宝书学习大纲一、ES6类的核心语法：把事物抽象成“模板”想象你要设计一款「动物养成游戏」，需要创建多种动物对象。ES6的class就是一个代码模板：//基础类（Animal是模板，有名称和吃东西方法）classAnimal{constructor(name
Flutter Dart 异步支持全面解析顾林海 Flutter系列教程 flutter android 开发语言 dart 前端
引言在Flutter开发中，Dart语言提供了强大的异步支持机制。异步编程能够让程序在执行耗时操作（如网络请求、文件读写等）时，不会阻塞主线程，从而保证用户界面的流畅性和响应性。本文将详细介绍Dart中常见的异步编程方式，包括Future、async/await和Stream，并结合代码示例进行说明。1.同步与异步的概念同步编程在同步编程中，程序按照代码的顺序依次执行，当遇到耗时操作时，程序会阻塞
探索HTML5 Canvas的无限可能：一个丰富多彩的开源项目黎情卉Desired
探索HTML5Canvas的无限可能：一个丰富多彩的开源项目去发现同类优质开源项目:https://gitcode.com/在这个充满活力的数字时代，JavaScript、HTML和CSS已经成为构建互动式网页体验的核心技术。今天，我们向您推荐一个独特而有趣的开源项目，它将这些技术结合在一起，创造出一系列生动活泼的可视化元素，包括时钟、计时器、地图、国际象棋、温度计等，让您在学习和实践中感受HTM
什么是护网（HVV）？需要什么技术？网络安全零基础入门到精通教程建议收藏！程序员晓晓 web安全干货分享计算机网络安全黑客技术护网行动渗透测试
什么是护网行动？护网行动是以公安部牵头的，用以评估企事业单位的网络安全的活动。具体实践中。公安部会组织攻防两方，进攻方会在一个月内对防守方发动网络攻击，检测出防守方（企事业单位）存在的安全漏洞。通过与进攻方的对抗，企事业单位网络、系统以及设备等的安全能力会大大提高。“护网行动”是国家应对网络安全问题所做的重要布局之一。“护网行动”从2016年开始，随着我国对网络安全的重视，涉及单位不断扩大，越来越
网络安全-信息收集 One_Blanks 网络安全网络安全
声明学习视频来自B站UP主泷羽sec，如涉及侵权马上删除文章。笔记的只是方便各位师傅学习知识，以下网站只涉及学习内容，其他的都与本人无关，切莫逾越法律红线，否则后果自负。目录X一、Whois信息1.思路2.工具3.社工库二、搜索1.Google、bing、baidu三、Github四、搜索引擎FOFA：[https://fofa.info/](https://fofa.info/)360网络空间测
【JavaWeb学习Day25】 quo-te JavaWeb vue 黑马
Web前端实战ElementPlus什么是ElementPlusElementPlus：是饿了么团队研发的，基于Vue3，面向设计师和开发者的组件库。组件：组成网页的部件，例如超链接、按钮、图片、表格、表单、分页条等等。官网：一个Vue3UI框架|ElementPlus快速入门准备工作：1.创建vue项目2.参照官方文档，安装ElementPlus组件库（在当前工程的目录下）：npminstall
无人机4G双链路技术分析！云卓SKYDROID 无人机云卓科技科普遥控器高科技链路
一、技术要点1.双链路架构设计同时接入两个独立的4G网络（如不同运营商或频段），采用冗余或聚合模式。冗余模式下链路互为备份，聚合模式下带宽叠加。支持动态切换逻辑，根据信号质量、延迟等参数选择最优链路。2.多模通信模块与协议支持集成双SIM卡或eSIM，兼容多运营商网络，支持多频段（如LTE-FDD/TDD）。需适配通信协议（如TCP/IP优化、QoS保障），确保数据完整性。3.数据分流与聚合数据分
AI进化论：从图灵测试到智能革命的临界点 A达峰绮人工智能数据处理经验分享 AIGC AI人工智能
智能觉醒的起源密码（1943-2010）在曼彻斯特维多利亚大学的实验室里，1948年"Baby"计算机完成人类首个存储程序运行实验时，艾伦·图灵正在构思《计算机器与智能》。这篇划时代论文提出的"模仿游戏"测试，为人工智能奠定了哲学基础。1956年达特茅斯会议上，麦卡锡正式提出"人工智能"概念，当时学界乐观预测"二十年内机器将完成人类所有工作"。神经网络的发展轨迹充满戏剧性：1958年罗森布拉特发明
Python - 爬虫；爬虫-网页抓取数据-工具curl MinggeQingchun Python 爬虫 curl python
一、爬虫关于爬虫的合法性通用爬虫限制：Robots协议【约定协议robots.txt】robots协议：协议指明通用爬虫可以爬取网页的权限robots协议是一种约定，一般是大型公司的程序或者搜索引擎等遵守几乎每一个网站都有一个名为robots.txt的文档，当然也有部分网站没有设定robots.txt。对于没有设定robots.txt的网站可以通过网络爬虫获取没有口令加密的数据，也就是该网站所有页
javaweb学习Day10 乐一粒学编程学习 java 开发语言
来源：尚硅谷2022版javaweb今日内容：1.日期和字符串之间的格式化//String->java.util.DateStringdateStr1="2021-12-3012:59:59";SimpleDateFormatsdf=newSimpleDateFormat("yyyy-MM-ddHH:mm:ss");try{Datedate1=sdf.parse(dateStr1);}catch(
【大模型书籍PDF】从零开始大模型开发与微调：基于PyTorch与ChatGLM （推荐）_从零开始大模型开发与微调 pdf 喝不喝奶茶丫 pytorch 人工智能语言模型大模型转行大模型 AI大模型微调
今天又来给大家推荐一本大模型方面的书籍。本书使用PyTorch2.0作为学习大模型的基本框架，以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术，为读者揭示大模型开发技术。本书配套示例源代码、PPT课件。（书籍分享）
从零开始学习黑客技术，看这一篇就够了网络安全-旭师兄学习 web安全 python 密码学网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包黑客，对于很多人来说，是一个神秘的代名词，加之影视作品夸张的艺术表现，使得黑客这个本来只专注于技术的群体，散发出亦正亦邪的神秘色彩。黑客源自英文hacker一词，最初曾指热心于计算机技术、水平高超的电脑高手，尤其是程序设计人员，逐渐区分为白帽、灰帽、黑帽等。其中，白帽黑客被称为道德黑客。他们不会非法入侵用户网络，而是通过一系列测试检查
大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
个人陈述华中科技大学管理学院财务金融系 alexhus 力学AI有限元保研
t今天怀着无比激动的心情来向各位老师陈述我本科三年来的个人学习科研情况，并且十分感谢各位老师能够在百忙之中抽出时间阅读这份陈述。我来自安徽省淮北市，2009年9月通过高考进入华中科技大学学习，现为管理学院财务金融系财务管理0901班的学生。下面我将从学术背景、科研经历、学术兴趣、研究生阶段学习计划等方面来做具体的陈述。学术背景通过在华中科技大学管理学院财务金融系近三年的学习与积累，我在公司财务管理
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
自动跳动滑动门html,CSS如何实现滑动门效果_html/css_WEB-ITnose 空谷幽兰月影寒自动跳动滑动门html
CSS如何实现滑动门效果:所谓的滑动门和tab选项卡其实是一个意思，下面就通过实例介绍一下如何实现此功能，代码实例如下:以上代码实现了最基本的滑动门效果，这也是在引用的网络上的一个例子。下面就简单介绍一下如何实现的此功能：一.在头部使用四个p元素制作导航标题，并且使用左浮动让四个p元素在一行排列，同时设置了后面三个的默认CSS属性。二.在轮换内容方面，直接就是罗列显示了几个span元素而已，大家可
python arm64_PyTorch-aarch64 人类0663号 python arm64
PyTorch源码编译步骤：1、源码编译环境：操作系统：debian9.12交换空间：1GPython版本：3.5硬件：CPU：RK3399(aarch64)内存：4G2、下载依赖包：下载pytorch及其依赖包时，默认从github上下载，如果网络不好、容易断开时，可在gitee上找到对应包克隆链接，然后修改对应配置文件，进行下载。需要细致耐心。3、编译主要参数：设置最大作业数：exportMA
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

旷世轻量化网络ShuffulNetV2学习笔记

旷世轻量化网络ShuffulNetV2学习笔记

Abstract

1 Introduction

2 Practical Guidelines for Efficient Network Design

G1) Equal channel width minimizes memory access cost (MAC).

G2) Excessive group convolution increases MAC.

G3) Network fragmentation reduces degree of parallelism.

G4) Element-wise operations are non-negligible.

结论和讨论

3 ShuffleNet V2: an Efficient Architecture

Review of ShuffleNet v1

Channel Split and ShuffleNet V2

Analysis of Network Accuracy

4 Experiment

5 Conclusion

你可能感兴趣的:(深度学习,深度学习框架,经典论文阅读,网络,学习,深度学习)