Colinnnn2

轻量级网络--MobileNet V1、V2、V3(学习记录；完善ing)

MobileNet目录

前言
研究背景
研究成果
论文结构
摘要
论文精读
1. MobileNet Architecture
- 1.1 卷积块特点
- 1.2 深度可分离卷积
- 1.3 两者对比
2. MobileNet超参数
- 2.1 宽度超参数
- 2.2 分辨率超参数
3. MobileNet V2
- 3.1 线性瓶颈层（Linear Bottleneck）
- 3.2 逆残差结构(Inverted residuals)
- 3.3 MobileNet V2 网络结构
- 3.4 ReLU 6 函数
4. MobileNet V3
- 4.1 新的激活函数h-swish
- 4.2 引入SENet
5. MobileNet V2和V3 的对比
- MobileNet V3的特点
- 网络结构
- MobileNet comparison
6. 实验的结果和分析
7. 论文总结
8. 代码结构
- 1. 数据处理
9. 模型设计
10. 模型评估

参考文献：MobileNets: Efficient ConvolutionalNeural Networks for Mobile Vision Applications
作者：Andrew G. Howard, Menglong Zhu, et al
单位：Google
发表会议及时间：CVPR 2017

前言

1. 前期知识储备

卷积操作： 掌握CNNs具体卷积过程,熟悉卷积核的参数意义

ResNet： 了解残差网络基本结构，残差块的构成

激活函数： 了解激活函数的意义和优缺点

2. 学习目标

熟悉深度可分离卷积过程，体会其优势

掌握MobileNet构建方式，了解超参数概

了解后续版本创新点

代码复现MobileNet结构

研究背景

《动机》

自AlexNet以来，神经网络倾向于更深更复杂的网络结构，但不一定在时间和内存大小上高效

实际应用环境中，需要在有限的算力下实时计算

《现有方法》

模型压缩：在已经训练好的模型上进行压缩，使得网络携带更少的网络参数

直接训练一个小型网络：从改变网络结构出发，设计出更高效的网络计算方式，从而使网络参数减少的同时,不损失网络的性能。

《本文方法》

提出了一类新型网络架构,根据应用需求与资源限制(延迟,大小)，构建相匹配的小型网络

MobileNets主要致力于优化延迟，但也可以产生小型网络

MobileNets主要基于深度可分离卷积(depthwise separable convolutions)构成，通过设置两个超参数，实现准确率和延时性之间的平衡

研究成果

在ImageNet数据集上，在参数量减少了三十多倍的条件下，准确率与VGG16相近，只相差了0.9%（Table 8）

在更小结构的MobileNet中，在参数量减少了四十多倍的条件下，性能超越了Alexnet，top-1 accuracy达到60.24%，体现了本文方法的高效性。
MobileNet实现了速度与准确率的高效平衡（Table 9）

《MobileNet意义》

以MobileNet为代表的网络，可以在移动终端实现众多的应用,包括目标检测，目标分类，人脸属性识别和人脸识别等，使移动终端、嵌入式设备运行神经网络模型成为可能

MobileNet拥有更小的体积，更少的计算量，更高的精度。在轻量级神经网络中拥有极大的优势

作为谷歌推出的开源框架，该论文引用超3700次,并推出后续v2,v3版本,推动了轻量级网络的进一步发展。

论文结构

摘要

提出了针对移动和嵌入式视觉应用的高效神经网络MobileNets

以深度可分离卷积为主体构建网络结构

引入两个全局超参数实现准确率与延时性平衡

详实的实验验证了MobileNets的高效性

论文精读

1. MobileNet Architecture

Conv：标准卷积
s2：卷积步长stride为2
s1：卷积步长stride为1
Filter Shape：3×3×3×32(Filter大小为3×3；使用的是彩色图像所以输入特征深度为3；32个卷积核)
AvgPool：平均池化
FC：全连接层
将深度卷积和点卷积看做两层，共28层

1.1 卷积块特点

1.引入深度可分离卷积,将普通卷积替换为深度卷积和点卷积
2.除第一个卷积层和最后全连接层之外,所有卷积层后都有BN & ReLU相连

BN包含下面四个步骤

求平均值

求方差

归一化

加入宽度β 和分辨率γ 两个超参数

池化是一个非常有效的降低下采样的一个方式，但本文并不是
降采样方式

通过设计卷积步长stride完成降采样操作

1.2 深度可分离卷积

《标准卷积》

输入特征矩阵channel = kernel channel

输出特征矩阵channel = kernnel 个数

channel：翻译为深度
经过DW卷积之后，特征矩阵的深度是不变的

CNN的卷积核通道数 = 卷积输入层的通道数
CNN的卷积输出层通道数(深度)= 卷积核的个数
输入特征F：DF×DF×M（DF是大小；M是通道数）
卷积核K：Dk×Dk×M×N（M是通道数；一共有N个卷积核）
输出特征G：DF×DF×N（通道数：N）
在空间上：　每次连接都是卷积核与输入特征的特定区域进行稀疏连接
在通道上：　输出特征的每一个像素值都是通道与通道之间密集连接的结果

《深度可分离卷积》

输入特征F：DF×DF×M
输出特征G：DF×DF×N（通道数：N）
第一步：探索空间中的关系
第二步：用１×１的卷积将空间之间的关系在通道之间打通，联系起来

3通道需要有3个卷积核对应（分别有红橙黄3个）

深度卷积只是在空间上进行了探索，但很多特征在通道之间是有丰富联系的，故引入点卷积

深度卷积：　是空间上的信息提取或信息保存

点卷积： 是一个普通的1×1的深度卷积，特殊点在于其大小。（一般都是3×3和5×5的，而点卷积是1×1的）

每次卷积都是１个像素点，在空间上是一对一的关系

1.3 两者对比

标准卷积公式

Ｋ：是卷积核；ｉｊ是像素的位置；ｍ是卷积核的通道数；ｎ是有ｎ个卷积核

Ｆ：是卷积时对应的特征；（ｋ＋ｉ－１，ｌ＋ｊ－１）是正在卷积的位置，ｍ是第几个通道

对应位置相乘再累加之后，就是输出结果

算力：一个像素点的运算量是D_KD_KM，一共像素点的数量有DF×DF×N

深度可分离卷积公式

没有ｍ通道数的影响，因为在深度卷积中不考虑通道之间的联系，都是单通道

在训练之后，DW部分的卷积核容易废掉，因为卷积核大部分参数都为0，即DW卷积核是没起作用

运算量之比： N(输出的通道数)和K(卷积核的size)越大，比值就越大，相对于标准卷积来说算力减少就越多

2. MobileNet超参数

2.1 宽度超参数

为了构造更小型，更实时的网络模型满足实际应用需求

引入宽度超参数 α 统一规范每层的特征输入输出维度，α∈(0,1]，常设为1，0.75，0.5，0.25
作用的区域为特征的通道数

input channel：M—>αM

output channel：N—>αN
算力消耗约减少为 α² 倍

2.2 分辨率超参数

为了继续减少算力消耗
引入分辨率超参数 ρ 统一规范特征表示的分辨率大小，ρ∈(0,1] 通常跟随输入图像分辨率间接得到
Feature size: DF × DF —>ρ DF× ρ DF
算力消耗减少为原来的 ρ²

3. MobileNet V2

参考文献：MobileNetV2: Inverted Residuals and Linear Bottlenecks (2018)

3.1 线性瓶颈层（Linear Bottleneck）

线性瓶颈层(Linear Bottleneck)： 在高维空间上，诸如ReLU这种激活函数能有效增加特征的非线性表达，但是仅限于在高维空间中，如果维度降低，在低维空间，再加入ReLU则会破坏特征。

在MobileNets v2中提出了Linear Bottlenecks结构，也就是在执行了降维的卷积层后面，不再加入类似ReLU等的激活函数进行非线性转化，这样做的目的也是尽可能的不造成信息丢失，瓶颈层加入非线性结构确实会伤害性能表现（原论文中Section 6 有证明）。

均采用PW (Point-wise)+DW (Depth-wise)的卷积方式提取特征

V2版本在DW卷积之前新加入一个PW卷积，能动态改变特征通道

V2去掉了第二个PW的激活函数，最大程度保留有效特征

Filters*3的为V 1版本。

Filters*5的为V 2版本，蕴含信息更加丰富，可以提取更丰富的特征

3.2 逆残差结构(Inverted residuals)

逆残差结构(Inverted residuals)： 在ResNet中，为了构建更深的网络提出了ResNet的另一种形式，bottleneck,结构如下所示，一个bottleneck由一个1x1卷积（降维），3x3卷积和1xl卷积(升维)构成。在MobileNet中，Depthwise Conv卷积的层数是输入通道，本身就比较少，如果跟残差网络中的bottleneck一样，先压缩，后卷积提取，可得到的特征就太少了。采取了一种逆向的方法，先升维，卷积，再降维。

相同点

借鉴 ResNet，都采用了1x1->3x3->1x1的模式

借鉴ResNet，同样使用Shortcut 短路连接将输出与输入相加

不同点

ResNet利用标准卷积提取特征，V2利用深度卷积(DW)提取特征

ResNet先降维、卷积、再升维，而V2则是先升维、卷积、再降维

3.3 MobileNet V2 网络结构


另外，借鉴ResNet中的shortcut连接：防止梯度消失，加速网络收敛

3.4 ReLU 6 函数

ReLU函数

ReLU6 函数

ReLU6对移动端很友好， 如果激活值很大，分布就会在以一个非常大的范围，会造成精度的损失，移动端也无法精确描述这种大范围的表示

4. MobileNet V3

更新Block（bneck）：

加入SE模块（通道的注意力机制模块）

更新了激活函数

使用NAS搜索参数（Neural Architecture Search）

减少第一个卷积层的卷积核个数（32->16）

精简Last Stage

重新设计激活函数（因为太耗时）

4.1 新的激活函数h-swish

sigmoid激活函数消耗计算资源

新的激活函数(h-swish)：h-swish是基于swish激活函数的改进，所以先了解一下swish，swish具备无上界有下界、平滑、非单调的特性。并且Swish在深层模型上的效果优于ReLU

4.2 引入SENet

SENet是一个轻量级注意力机制网络，通过压缩激励给不同层不同的权重

压缩Squeeze： 顺着空间维度进行特征的压缩，将二维的特征通道变成一个实数

激励Excitatiion： 类似循环网络中门的机制，通过一个参数w为每一个特征通道生成权重(不同的颜色)；权重大的表明特征重要，需要保留

Scale： 不同通道的实数乘到原先的特征中，输出的权重可以看作是经过特征选择后的每个特征通道的重要性。可以区分不同通道的重要性

SENet描述

5. MobileNet V2和V3 的对比

MobileNet V3的特点

使用MobileNetV1的深度可分离卷积
使用MobileNetV2线性瓶颈层和逆残差结构
使用基于squeeze and excitation结构的注意力模型

网络结构

MobileNetV2模型中反转残差结构和变量利用1×1卷积，以便于拓展到高维的特征空间，虽然对于提取丰富特征进行预测十分重要，但却额外增加计算开销与延时。为了在保留高维特征的前提下减小延时,将平均池化前的层移除并用1*1卷积来计算特征

MobileNet comparison

6. 实验的结果和分析

实验角度

深度可分离卷积对比

超参数设置

实际视觉应用

深度可分离卷积有效性实验

在ImageNet数据集上，在算力消耗降低8倍，参数量减少将近7倍的情况下，准确率只比标准卷积相差1%，实现了速度与准确率的良好平衡

MobileNet超参数有效性实验

通过设置宽度参数α分别为1，0.75，0.5，0.25，验尺寸的平衡。0.25时下降比较明显，是因为相对原来的结构，0.25有点过于小，信息丢失严重。

在基于上述宽度参数设置的基础上，设置分辨率为224，192，160，128，准确率在缓慢下降，相比而言，算力损失下降的非常快。

实际视觉应用实验

细粒度识别： 利用323/9网络上收集的噪声数据进行预训练，然后用Stanford Dog数据集进行微调，实验结果表明,在极大程度减少了算力消耗和参员量的情况下，MobileNet准确率率逼近了SOTA

大规模地理定位： 原始的PlaNet有52million的算力消耗和5.74billion的参数量，MobileNet中只有13million和0.58million，且在某些尺度上,MobileNet超越了SOTA

目标检测: 以SSD和Faster-RCNN为framework,构建不同目标检测框架

面部识别: 基于FaceNet蒸馏一个MobileNet模型

7. 论文总结

A.关键点

移动计算需求

引入深度可分离卷积

B.创新点

算法模型基础:日臻成熟的卷积神经网络

引入宽度和分辨率超参数

构建轻量级网络MobileNet结构，实现准确率，速度，大小的平衡

C.启发点

移动计算的需求

轻量级网络的设计方向

卷积方式的创新

如何评估轻量级网络的效果

8. 代码结构

数据处理

模型统计

模型评估

1. 数据处理

1. 数据预处理模块（transforms）

数据规范化处理(Normalization)

公式：(x-mean) /std（mean：均值，表示图像的平均水平；std：标准差，表示离散程度）

作用：保证所有图像具有相似分布，在训练时更加容易收敛，训练更快更好

数值范围：[0,1]

zero-centered：只减去均值

Randomcrop(size,padding：随机裁剪，根据跟定size，随机裁剪

RandomHorizontalFlip()：以0.5的概率随机水平翻

ToTensor()：转化为pytorch接受的tensor格式（所有预处理必须的）
compose：相当于一个容器这3个操作囊括起来

2. Pytorch数据加载模块（datasets）

训练集：验证集划分为(9:1)

shuffle：顺序打乱

SubsetRandomSampler()：无放回的按照给定样本采样

9. 模型设计

1. 深度卷积

一个卷积核对应输入特征一个通道

每组对应一个通道的特殊分组卷积

深度卷积块包括深度卷积，BN层，ReLU层

2. 点卷积

卷积核size为1x1的标准卷积

点卷积块包括点卷积，BN层，ReLU层

3. MobileNet网络结构

28层网络结构

针对大图像和小图像，设置两组MobileNets结构，步长stride不同

10. 模型评估

1.损失函数:

nn.CrossEntropyLoss()交叉嫡损失函数
Softmax-log-NLL Loss
2. 模型评估

max()返回tensor中所有元素的最大值及索引

view_as()转换为相同格式

eq()统计相等个数

Linux系统中的Rsync服务入眼皆含月 linux 运维服务器
一、Rsync服务概述Rsync是一种功能强大的文件同步工具，广泛应用于Linux系统中的数据备份和文件同步任务。它通过比较文件的修改时间和大小来实现增量备份，大大提高了同步效率，减少了网络带宽的使用，并且支持多种同步选项，如压缩、加密和排除特定文件等。二、Rsync主要特点1、增量同步Rsync通过比较文件的修改时间和大小，只同步发生变化的部分，而不是整个文件。这使得同步过程更加高效，特别是在处
DeepSeek R1本地化部署与联网功能实战指南：从零搭建智能对话系统 Coderabo python DeepSeek R1
前言在人工智能技术快速发展的今天，如何将先进的对话模型DeepSeekR1部署到本地环境并赋予其联网能力，成为许多开发者和企业关注的重点。本文将深入讲解完整的本地化部署流程，并通过实例代码演示如何为模型添加实时网络访问功能。一、环境准备与基础架构1.1硬件需求推荐配置：NVIDIAGPU（RTX3090或更高）+32GB内存+50GB存储空间最低配置：CPU（支持AVX2指令集）+16GB内存+3
【小白学AI系列】NLP 核心知识点（三）Word2Vec Blankspace空白人工智能自然语言处理 word2vec
Word2Vec定义：Word2Vec是一种将单词转化为向量的技术，基于神经网络模型，它能够将单词的语义关系通过向量空间的距离和方向进行表示。通过Word2Vec，我们可以将单词从一个离散的符号转化为一个稠密的向量（一般是高维的），并且能够捕捉到单词之间的语义关系和相似性。历史来源：Word2Vec由TomasMikolov等人于2013年在谷歌提出，它迅速成为了词向量表示（wordembeddi
计算网络--地址结构 IT艺术家-rookie 计算机网络网络
IP作用：标识了网络流量的来源与去向分类ipv4（32位）ipv6（128位）表示方法点分四组表示法(ipv4)（点分十进制表示法）例：165.195.130.107（ipv4）其中的每个数字范围[0,255]–>2^8个数四个十六进制数（ipv6）例：5f05:2000:80ad:5800:0058:0800:2023:1d71块（字段）：其中每个冒号分割的部分简化表示一个块的前导零必须压缩，用
Meta首席科学家Yann LeCun预言：5年内AI架构将颠覆，当前大模型的4大核心缺陷机器小乙人工智能
✨引言：一场颠覆AI行业的预言在2025冬季达沃斯“技术辩论”现场，Meta首席AI科学家、图灵奖得主杨立昆（YannLeCun）抛出一个震撼观点：“当前的大语言模型（LLM）范式将在3-5年内被淘汰。”这位深度学习先驱的论断，不仅直指ChatGPT等明星产品的技术天花板，更揭示了下一代AI进化的核心路径——构建理解物理世界的“世界模型”（WorldModel）。作为Meta人工智能实验室负责人，
[车联网安全自学篇] Car Hacking之CAN总线初探橙留香Park 车联网安全自学篇之Car Hacking 网络安全渗透测试信息安全
也许每个人出生的时候都以为这世界都是为他一个人而存在的，当他发现自己错的时候，他便开始长大少走了弯路，也就错过了风景，无论如何，感谢经历0x01前言在汽车制造商不断完善和推进车辆系统的同时，对底层网络的需求进一步增加。为了打造智能汽车，越来越多的零部件在一辆汽车中相互连接。这导致基于标准化技术构建的专用且通常是专有的汽车协议。这些协议中的大多数都基于总线协议：这种总线网络中的所有网络节点都使用单个
【小白学AI系列】NLP 核心知识点（五）Transformer介绍 Blankspace空白人工智能自然语言处理 transformer
TransformerTransformer是一种基于自注意力机制（Self-AttentionMechanism）的深度学习模型，首次由Vaswani等人于2017年在论文《AttentionisAllYouNeed》中提出。与RNN和LSTM不同，Transformer不需要依靠序列顺序进行递归，而是通过全局注意力机制一次性处理整个输入序列，从而具备了更高的计算效率和更强的并行化能力。Tran
Kafka的内部通信协议优人ovo kafka 分布式
引言kafka内部用到的常见协议和优缺点可以看看原文Kafka用到的协议本文奖详细探究kafka核心通信协议和高性能的关键网络层通信的实现基于JavaNIO：Kafka的网络通信层主要基于JavaNIO来实现，这使得它能够高效地处理大量的连接和数据传输。在KafkaChannel类中，通过Selector来管理多个连接的读写操作，实现了非阻塞的I/O模型，能同时处理多个客户端连接，提高了系统的并发
dubbo 负载均衡策略和集群容错策略都有哪些？动态代理策略呢？码农小旋风后端
面试题dubbo负载均衡策略和集群容错策略都有哪些？动态代理策略呢？面试官心理分析继续深问吧，这些都是用dubbo必须知道的一些东西，你得知道基本原理，知道序列化是什么协议，还得知道具体用dubbo的时候，如何负载均衡，如何高可用，如何动态代理。说白了，就是看你对dubbo熟悉不熟悉：dubbo工作原理：服务注册、注册中心、消费者、代理通信、负载均衡；网络通信、序列化：dubbo协议、长连接、NI
【课程设计推荐】基于JSP的书店系统设计与实现想念@思恋课程设计 jsp java 课程设计 java jsp
关注【墨岚创客】，回复【毕设】，赠送免费毕设资源，具体联系方式见文末引言二十一世纪是一个集数字化，网络化，信息化的，以网络为核心的社会。当钱天白教授于1986年9月14日在北京计算机应用技术研究所内向德国卡尔斯鲁厄大学发出第一封电子邮件“穿越长城，走向世界”的时候，他也许不知道自己推开了中国信息时代的大门；1994年4月20日，中国科学院计算机中心通过美国Sprint公司连入Internet的64
HTTP详解计算机毕设定制辅导-无忧学长技术分享专栏 http 网络协议网络
一、HTTP概述HTTP（HyperTextTransferProtocol，超文本传输协议）作为互联网通信的重要基石，在网络通信中占据着至关重要的地位。它是一种应用层协议，工作于可靠的TCP协议之上，确保了数据传输的稳定性和可靠性。HTTP的主要特点之一是其简单、灵活且易于扩展。它被设计为人类可阅读的协议，使得开发人员在调试过程中更容易理解和排查问题，降低了新手的学习门槛。同时，HTTP基于请求
新媒体特点 Fadeland 媒体
1、变化快，更新快。信息更新及时。热得快，但也散得快。2、互动性强。评论点赞转发，通过互动，受众可以发表自己的想法，也增进了彼此的沟通。与用户轻松交流，给用户更好的体验。3、创新多，形式多样化。除去文字还有表情包，小视频等4、众化，平民化。门坎很低，有手机就行，所以应该经常在网上看到有人说“未来人人都是自媒体”。5、媒体的个性化很突出；经常发明出一些网络名言金句，网络段子。6、受众选择性的增多；新
零基础如何学习 Web 安全？_web安全字节全栈_ZKt 安全学习前端
随着网络安全行业的快速发展，Web安全也出现在大众视野中，尤其是当Web2.0、社交网络、微博等等一系列新型的互联网产品的诞生，基于Web环境的互联网应用越来越广泛，企业信息化的过程中将各种应用都架设在Web平台上，于是接踵而至的Web安全威胁逐渐凸显出来，题主零基础学习Web安全，首先需要了解其定义，然后再进行系统化的学习。下面就为题主一一例举如何学习Web安全的学习步骤。一、了解Web安全定义
Nginx与Web安全：遵循OWASP最佳实践墨夶 Nginx学习资料1 nginx web安全 hibernate
在当今数字化时代，网络安全已成为企业不可忽视的重要环节。Web应用程序面临着各种威胁，包括SQL注入、跨站脚本攻击（XSS）、跨站请求伪造（CSRF）等。Nginx作为高性能的HTTP和反向代理服务器，提供了丰富的功能来增强Web应用的安全性。结合OpenWebApplicationSecurityProject(OWASP)的最佳实践，可以有效提升Web应用的安全防护水平。本文将详细介绍如何使用
Day31-【AI思考】-深度学习方法论全解析——科学提升学习效率的终极指南一个一定要撑住的学习者 #AI深度思考学习方法人工智能
文章目录深度学习方法论全解析——科学提升学习效率的终极指南**一、影子跟读法（Shadowing）——听力突破核武器****二、番茄工作法（Pomodoro）——时间管理手术刀****三、费曼技巧（FeynmanTechnique）——知识内化加速器****四、康奈尔笔记（CornellNotes）——信息处理引擎**效能倍增组合技常见问题解决方案深度学习方法论全解析——科学提升学习效率的终极指南
Day31-【AI思考】-关键支点识别与战略聚焦框架一个一定要撑住的学习者 #AI深度思考学习方法人工智能
文章目录关键支点识别与战略聚焦框架**第一步：支点目标四维定位法****第二步：支点验证里程碑设计****第三步：目标网络重构方案****第四步：动态监控仪表盘**执行工具箱核心心法关键支点识别与战略聚焦框架让思想碎片重焕生机的灵魂：在当前纷繁复杂的目标清单中，哪一项是只要达成就能引发其他目标多米诺式突破的关键支点？这个支点是否具备可被验证的阶段性里程碑？”这个问题像精准的手术刀，旨在帮助您：识别
Android网络请求框架OKHttp的使用详解心之向往！ android 网络 okhttp Android
Android网络请求框架OKHttp的使用详解OKHttp是一个高效、可靠的开源HTTP客户端，被广泛应用于Android开发中。它提供了简洁的API接口，使得进行网络请求变得非常方便。本文将介绍如何在Android项目中正确地使用OKHttp，并提供相应的源代码示例。一、添加OKHttp依赖首先，在你的Android项目中的build.gradle文件中添加OKHttp的依赖项。打开该文件，找
字节跳动小姐姐教你用Retrofit-+-RxJava-＋-OkHttp-让网络请求变的简单-基础篇(1) 2401_84132449 程序员 retrofit rxjava okhttp
.build();说明：配置了接口的baseUrl和一个converter,GsonConverterFactory是默认提供的Gson转换器，Retrofit也支持其他的一些转换器，详情请看官网Retrofit官网3，创建一个接口，代码如下：publicinterfaceMovieService{//获取豆瓣Top250榜单@GET(“top250”)CallgetTop250(@Query(“
【人工智能时代】-Deepseek用到的技术架构 xiaoli8748_软件开发人工智能
以下是DeepSeek技术架构的详细介绍：1.混合专家架构（MoE）DeepSeek-V3采用了混合专家（Mixture-of-Experts,MoE）架构，这种架构通过将模型分解为多个“专家”网络来处理不同的输入特征。具体配置如下：层数：61层，其中58层为MoE层。专家数量：每层有257个专家（1个共享专家+256个路由专家），整个模型共有14,906个专家。激活机制：每个Token激活9个专
Gateway API：Kubernetes中的动态基础设施配置与流量路由大大宝的博客 k8s gateway kubernetes 容器
摘要：本文详细介绍了Kubernetes中的GatewayAPI，包括其设计原则、资源模型、请求流程、一致性等方面。GatewayAPI提供了动态基础设施配置和高级流量路由功能，通过可扩展、面向角色和协议感知的配置机制使网络服务可用。一、引言GatewayAPI是一系列API类型，用于提供动态基础设施配置和高级流量路由功能。它利用可扩展、面向角色且具有协议感知的配置机制，使网络服务得以应用。Gat
电路研究9.2.6——合宙Air780EP中HTTP——HTTP GET 相关命令使用方法研究 esmember http 网络协议网络 AT指令
这个也是一种协议类型：14.16使用方法举例根据之前多种类似的协议的相关信息：HTTP/HTTPS：超文本传输协议（HTTP）用于Web数据的传输，而HTTPS是HTTP的安全版本，使用SSL/TLS进行加密。与FTP相比，HTTP/HTTPS更多用于网页内容的传输，且HTTPS提供了数据加密。这个算网络的相关，我们一般浏览网页用到了呢。所以我们如果用到我需要的设计中，毕竟算下位机跟上位机之间的通
03-2.python爬虫-Python爬虫基础(一) 执着的小火车 python入门到项目实践爬虫 python 开发语言
HTTP基本原理HTTP（HyperTextTransferProtocol），即超文本传输协议，是互联网通信的关键所在。它作为应用层协议，构建于可靠的TCP协议之上，保障了数据传输的稳定与可靠，犹如网络世界的“交通规则”，规范着客户端与服务器之间的数据往来。HTTP的请求响应过程是其核心机制。当用户在浏览器中输入一个URL并按下回车键，浏览器就会作为客户端向服务器发送HTTP请求。请求由请求行、
图像超分，提高图像分辨率的方法和工具风暴之零 python 图像处理深度学习
图像超分是一种图像处理技术，旨在提高图像的分辨率，使其具有更高的清晰度和细节。这一技术通常用于图像重建、图像恢复、图像增强等领域，可以帮助我们更好地理解和利用图像信息。图像超分技术可以通过多种方法实现，包括插值算法、深度学习等。其中，深度学习的方法在近年来得到了广泛的关注和应用。基于深度学习的图像超分技术，可以利用深度神经网络学习图像的高频部分，从而提高了图像的分辨率和清晰度。总结：传统方法效果不
关于C/S架构和B/S架构是栗子yaya 学习笔记数据库
C/S结构：CS架构即客户机和服务器（Client/Server）结构，是软件系统体系结构，通过它可以充分利用两端硬件环境的优势，将任务合理分配到Client端和Server端来实现，降低了系统的通讯开销。C/S结构通常采取两层结构。服务器负责数据的管理，客户机负责完成与用户的交互任务。客户机通过局域网与服务器相连，接受用户的请求，并通过网络向服务器提出请求，对数据库进行操作。服务器接受客户机的请
C/S架构与B/S架构嗯嗯= 架构
一.C/S架构与B/S架构的简述1.1什么是C./S架构C/S架构（Client/ServerArchitecture）是一种软件系统的基本架构模式，客户端负责用户界面和业务逻辑，服务器负责数据存储和处理。C/S架构是一个分布式的计算架构，客户端通过网络连接与服务器通信，完成任务。C/S架构的优点是数据处理效率高，实现灵活，但缺点是维护和安全方面的要求较高，且需要长期维护客户端和服务器。1.2什么
centOS虚拟机配置固定ip地址深圳卢先生 centos tcp/ip linux
首先观察主机的虚拟网卡的ip地址如上所示：VMnet8的网段是192.168.172.1.2.进入cent的网络配置，命令如下。不同机器路径可能略有不同vi/etc/sysconfig/network-scripts/ifcfg-ens33修改配置如下TYPE=EthernetBOOTPROTO=static//静态ipNAME=ens33//网络名称，一般就定义为ens33UUID=73cb66
一体化运维监控管理平台：产品架构与功能解析 MXsoft618 一体化运维平台一体化监控平台运维管理软件数据库大数据运维
在当今的信息化时代，运维监控管理平台已成为确保企业IT系统稳定运行不可或缺的工具。本文旨在深入探讨一体化运维监控管理平台的产品架构及其核心功能，以期为运维团队提供有益的参考。随着企业信息化建设的不断深入，IT系统日益复杂，涉及的设备和系统越来越多。传统的分散式监控方式已无法满足现代运维的需求。一体化监控应运而生，它能够集中监控各类IT资源，包括服务器、网络设备、安全设备、数据库等，实现统一的管理和
监控易：一体化智能运维在复杂网络环境的架构优势 MXsoft618 智能运维管理系统运维管理一体化监控平台智能运维数据库
在现代企业中，IT基础设施已成为业务成功的重要基石。面对海量设备与复杂的网络结构，传统的监控工具往往难以满足动态化、海量化的需求。监控易以其“一体化智能运维”的产品理念，成为运维领域的优势品牌。本文将从架构优势入手，深入探讨监控易如何通过领先的技术实现分布式复杂网络的灵活扩展，并为企业提供高效、稳定、可靠的运维支持。监控易的功能与竞争力一体化智能运维的核心理念监控易定位为“一体化智能运维”平台，致
车联网技术的隐私和数据安全挑战色宁科技人工智能人工智能
引言：随着科技的迅猛发展，车联网技术正逐渐改变着我们的出行方式和交通系统。这项技术将汽车、互联网和通信技术相结合，使车辆能够相互通信、共享数据和连接到外部网络。然而，随之而来的是隐私和数据安全的挑战。本文将探讨车联网技术在隐私保护和数据安全方面所面临的挑战，并提出应对这些挑战的措施。第一部分：车联网技术的隐私挑战车联网技术的发展给我们带来了许多便利，但同时也对个人隐私构成了潜在威胁。以下是一些车联
离线环境下通过docker安装redis镜像 MonkeyKing.sun docker redis 容器
1.在其他机器上下载Redis镜像你可以在一台能够访问外网的机器上拉取Redis镜像，并将其导出为文件，然后将文件传输到你的目标机器进行加载。步骤：在有网络访问的机器上拉取Redis镜像：在有网络的机器上，使用以下命令拉取Redis镜像：dockerpullredis将镜像保存为tar文件：使用dockersave命令将拉取的镜像保存为一个tar文件：dockersave-oredis_image
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

轻量级网络--MobileNet V1、V2、V3(学习记录；完善ing)

MobileNet目录

前言

研究背景

研究成果

论文结构

摘要

论文精读

1. MobileNet Architecture

1.1 卷积块特点

1.2 深度可分离卷积

1.3 两者对比

2. MobileNet超参数

2.1 宽度超参数

2.2 分辨率超参数

3. MobileNet V2

3.1 线性瓶颈层（Linear Bottleneck）

3.2 逆残差结构(Inverted residuals)

3.3 MobileNet V2 网络结构

3.4 ReLU 6 函数

4. MobileNet V3

4.1 新的激活函数h-swish

4.2 引入SENet

5. MobileNet V2和V3 的对比

MobileNet V3的特点

网络结构

MobileNet comparison

6. 实验的结果和分析

7. 论文总结

8. 代码结构

1. 数据处理

9. 模型设计

10. 模型评估

你可能感兴趣的:(论文阅读,网络,深度学习,神经网络)