飞翔的河马F

各种分类网络

20问--各种网络类

LeNet
- 各层参数
- - 1、Input层
  - 2、C1卷积层
  - 3、S2池化层（下采样层）
  - 4、C3卷积层
  - 5、S4池化层（下采样层）
  - 6、C5卷积层
  - 7、F6全连接层
  - 8、Output层-全连接层
AlexNet
- 网络亮点：
- Alexnet数据增强操作：
- 局部相应归一化
- 网络参数：
VGG
- 网络结构
- 特点
Resnet
GoogLeNet--InceptionV1
- 亮点
- 1*1conv的作用
- Inception结构
- 网络结构
- 网络结构解析
- 亮点
InceptionV2
- 1、卷积分解（Factorizing Convolutions）
- 2、降低特征图大小
- labelsmoothing
BN-Inception
- V1到BN的改动
- 网络结构图：
InceptionV3
InceptionV4
- inceptionV4
- Inception-Resnet
- - inception-resnet v1
  - inception-resnet v2
  - residual模块的scaling
EfficientNet
- 网络结构
SPP-NET
- SPPNet 的训练
ZFNet
- 特征可视化
- 上采样
- 论文做了什么
- 总结
DenseNet
NasNet
- Scheduled Drop Path
- 总结
- Block结构
ResNeXt
- “split-transform-merge”结构
- 总结

找到一个简单总结的文章，可以先看一下1

这是2

LeNet

本模块参加该blog，侵删

LeNet-5 这个网络虽然很小，但是它包含了深度学习的基本模块：卷积层，池化层，全连接层。

各层参数

1、Input层

	输入图像的尺寸统一归一化为32*32

2、C1卷积层

	输入图片：32*32
	卷积核大小：5*5
	卷积核种类：6		
	输出featuremap大小：28*28 （32-5+1）=28		
	神经元数量：28*28*6
	可训练参数：（5*5+1) * 6（每个滤波器5*5=25个unit参数和一个bias参数，一共6个滤波器）
	连接数：（5*5+1）*6*28*28=122304

3、S2池化层（下采样层）

	输入：28*28
	采样区域：2*2
	采样方式：4个输入相加，乘以一个可训练参数，再加上一个可训练偏置。结果通过sigmoid
	采样种类：6
	输出featureMap大小：14*14（28/2）
	神经元数量：14*14*6
	可训练参数：2*6（和的权+偏置）
	连接数：（2*2+1）*6*14*14
	S2中每个特征图的大小是C1中特征图大小的1/4。

4、C3卷积层

	输入：S2中所有6个或者几个特征map组合
	卷积核大小：5*5
	卷积核种类：16
	输出featureMap大小：10*10 (14-5+1)=10
	C3中的每个特征map是连接到S2中的所有6个或者几个特征map的，表示本层的特征map是上一层提取到的特征map的不同组合。
	存在的一个方式是：C3的前6个特征图以S2中3个相邻的特征图子集为输入。接下来6个特征图以S2中4个相邻特征图子集为输入。然后的3个以不相邻的4个特征图子集为输入。最后一个将S2中所有特征图为输入。则：可训练参数：6*(3*5*5+1)+6*(4*5*5+1)+3*(4*5*5+1)+1*(6*5*5+1)=1516
	连接数：10*10*1516=151600

为什么采用这样的组合？
1）减少参数，2）这种不对称的组合连接的方式有利于提取多种组合特征

5、S4池化层（下采样层）

	输入：10*10
	采样区域：2*2
	采样方式：4个输入相加，乘以一个可训练参数，再加上一个可训练偏置。结果通过sigmoid
	采样种类：16
	输出featureMap大小：5*5（10/2）
	神经元数量：5*5*16=400
	可训练参数：2*16=32（和的权+偏置）
	连接数：16*（2*2+1）*5*5=2000
	S4中每个特征图的大小是C3中特征图大小的1/4

6、C5卷积层

	输入：S4层的全部16个单元特征map（与s4全相连）
	卷积核大小：5*5
	卷积核种类：120
	输出featureMap大小：1*1（5-5+1）
	可训练参数/连接：120*（16*5*5+1）=48120

7、F6全连接层

	输入：c5 120维向量
	计算方式：计算输入向量和权重向量之间的点积，再加上一个偏置，结果通过sigmoid函数输出。
	可训练参数:84*(120+1)=10164

8、Output层-全连接层

   Output层也是全连接层，共有10个节点，分别代表数字0到9，且如果节点i的值为0，则网络识别的结果是数字i。采用的是径向基函数（RBF）的网络连接方式。假设x是上一层的输入，y是RBF的输出，则RBF输出的计算方式是：

上式w_ij 的值由i的比特图编码确定，i从0到9，j取值从0到7*12-1。RBF输出的值越接近于0，则越接近于i，即越接近于i的ASCII编码图，表示当前网络输入的识别结果是字符i。该层有84x10=840个参数和连接。

AlexNet

本模块参考该博客，侵删

网络亮点：

首次利用GPU进行加速
使用了Relu激活函数
使用了LRN局部响应归一化，增强了模型的泛化能力。
全连接层的前两层中使用了dropout随机失活，减小过拟合
在CNN中使用重叠的最大池化

Alexnet数据增强操作：

AlexNet中对数据做了以下操作：

随机裁剪，对256×256的图片进行随机裁剪到227×227，然后进行水平翻转。
测试的时候，对左上、右上、左下、右下、中间分别做了5次裁剪，然后翻转，共10个裁剪，之后对结果求平均。
对RGB空间做PCA（主成分分析），然后对主成分做一个（0, 0.1）的高斯扰动，也就是对颜色、光照作变换，结果使错误率又下降了1%。

局部相应归一化

LRN一般是在激活、池化后进行的一中处理方法。
侧抑制（lateral inhibitio），即指被激活的神经元抑制相邻的神经元。归一化（normaliazation）的目的就是“抑制”,LRN就是借鉴这种侧抑制来实现局部抑制，尤其是我们使用RELU的时候，这种“侧抑制”很有效，因而在alexnet里使用有较好的效果。

归一化有什么好处？
1.归一化有助于快速收敛；
2.对局部神经元的活动创建竞争机制，使得其中响应比较大的值变得相对更大，并抑制其他反馈较小的神经元，增强了模型的泛化能力。

网络参数：

输入是224×224，不过经过计算(224−11)/4=54.75并不是论文中的55×55，而使用227×227作为输入，则(227−11)/4=55。

卷积层C1
该层的处理流程是：卷积–>ReLU–>池化–>归一化。
- 卷积，输入是227×227，使用96个11×11×3的卷积核，得到的FeatureMap为55×55×96。
- ReLU，将卷积层输出的FeatureMap输入到ReLU函数中。
- 池化，使用3×3步长为2的池化单元（重叠池化，步长小于池化单元的宽度），输出为27×27×96（(55−3)/2+1=27)
- 局部响应归一化，使用k=2,n=5,α=10−4,β=0.75进行局部归一化，输出的仍然为27×27×96，输出分为两组，每组的大小为27×27×48
卷积层C2
该层的处理流程是：卷积–>ReLU–>池化–>归一化
- 卷积，输入是2组27×27×48。使用2组，每组128个尺寸为5×5×48的卷积核，并作了边缘填充+ padding=2，卷积的步长为1. 则输出的FeatureMap为2组，每组的大小为27×27 times128. （(27+2∗2−5)/1+1=27）
- ReLU，将卷积层输出的FeatureMap输入到ReLU函数中
- 池化运算的尺寸为3×3，步长为2，池化后图像的尺寸为(27−3)/2+1=13，输出为13×13×256
- 局部响应归一化，使用k=2,n=5,α=10−4,β=0.75进行局部归一化，输出的仍然为13×13×256，输出分为2组，每组的大小为13×13×128
卷积层C3
该层的处理流程是：卷积–>ReLU
- 卷积，输入是13×13×256，使用2组共384尺寸为3×3×256的卷积核，做了边缘填充padding=1，卷积的步长为1.则输出的FeatureMap为13×13 times384
- ReLU，将卷积层输出的FeatureMap输入到ReLU函数中
卷积层C4
该层的处理流程是：卷积–>ReLU 该层和C3类似。
- 卷积，输入是13×13×384，分为两组，每组为13×13×192.使用2组，每组192个尺寸为3×3×192的卷积核，做了边缘填充padding=1，卷积的步长为1.则输出的FeatureMap为13×13 times384，分为两组，每组为13×13×192
- ReLU，将卷积层输出的FeatureMap输入到ReLU函数中
卷积层C5
该层处理流程为：卷积–>ReLU–>池化
- 卷积，输入为13×13×384，分为两组，每组为13×13×192。使用2组，每组为128尺寸为3×3×192的卷积核，做了边缘填充padding=1，卷积的步长为1.则输出的FeatureMap为13×13×256
- ReLU，将卷积层输出的FeatureMap输入到ReLU函数中
  池化，池化运算的尺寸为3×3，步长为2，池化后图像的尺寸为 (13−3)/2+1=6,即池化后的输出为6×6×256
全连接层FC6
该层的流程为：（卷积）全连接 -->ReLU -->Dropout
- 卷积->全连接：输入为6×6×256,该层有4096个卷积核，每个卷积核的大小为6×6×256。由于卷积核的尺寸刚好与待处理特征图（输入）的尺寸相同，即卷积核中的每个系数只与特征图（输入）尺寸的一个像素值相乘，一一对应，因此，该层被称为全连接层。由于卷积核与特征图的尺寸相同，卷积运算后只有一个值，因此，卷积后的像素层尺寸为4096×1×1，即有4096个神经元。
- ReLU,这4096个运算结果通过ReLU激活函数生成4096个值
- Dropout,抑制过拟合，随机的断开某些神经元的连接或者是不激活某些神经元
全连接层FC7
流程为：全连接–>ReLU–>Dropout
全连接，输入为4096的向量
- ReLU,这4096个运算结果通过ReLU激活函数生成4096个值
- Dropout,抑制过拟合，随机的断开某些神经元的连接或者是不激活某些神经元
输出层
第七层输出的4096个数据与第八层的1000个神经元进行全连接，经过训练后输出1000个float型的值，这就是预测结果。

VGG

该模块参考于此，侵删
"Very Deep Convolutional Networks for Large-Scale Image Recognition"从文章题目能看出来特点：
通过堆叠多个3*3的卷积核来代替大尺度卷积核，减小所需参数。

2个3*3 = 5*5
3个3*3 = 7*7
拥有相同的感受野，减少参数，增加深度

网络结构

作者多了很多尝试，但是常用的是D结构。

特点

VGG16包含了16个隐藏层（13个卷积层和3个全连接层）
VGG19包含了19个隐藏层（16个卷积层和3个全连接层）
VGG网络的结构非常一致，从头到尾全部使用的是3x3的卷积和2x2的max pooling
- conv的stride是1，padding为1，不改变特征矩阵尺寸
- maxpooling的size为2，stride为2，使高度变为一半
缺点：参数多，全连接层参数很多，而且又有三个全连接层

Resnet

我们发现过深的网络仍然还会使分类准确度下降。
所以不是网络越深效果越好，有两个问题：

梯度消失或梯度爆炸
- 小梯度或者大梯度的连乘导致梯度消失
- 解决办法：
  - 对数据标准化处理
  - 权重初始化
  - BN
退化问题
- 残差网络

网络中亮点：

超深的网络结构，突破1000层
提出residual模块
使用BN加速训练，丢弃dropout

residual结构：

注意：

其是在相同的维度进行相加，主分支与shortcut的输出矩阵的shape必须相同
1*1的卷积核用来升维和降维，因为更深层使用bottleneck

网络结构图：

细节：

每个残差块有两个3*3卷积核
周期性2倍增卷积核组数和2倍下采样减尺寸
网络初始有单独的卷积层
只有一个全连接层

GoogLeNet–InceptionV1

22层，500万参数，仅为Alexnet 1/12， VGGNet参数又是AlexNet的3倍

亮点

引入Inception结构，融合不同尺度的特征信息。
使用1*1卷积核进行降维以及映射处理
添加两个辅助分类器帮助训练
丢弃全连接层，使用平均池化层（大大减少了参数）

1*1conv的作用

在Network in network中提出：

降维或升维
跨通道的信息交融
减少参数量
增加模型深度，提高非线性表示能力

Inception结构

卷积池化后的尺寸相同，在通道层面上进行连接，但是通道数会增大
增加了网络宽度
增加了多维度信息，增加了对网络适应性
在这些层之上，在每一个卷积层后都要做一个ReLU操作
在3x3前、5x5前、max pooling后分别加上了1x1的卷积核，以起到了降低特征图厚度的作用
减少参数量，减少计算量，减少通道数
每个分支得到的矩阵的高和宽必须相同

网络结构

网络结构解析

原始输入图像为224x224x3，且都进行了零均值化的预处理操作（图像每个像素减去均值）。
Conv后接Relu，Maxpooling后接Relu

亮点

Inception结构
网络最后采用了average pooling（平均池化）来代替全连接层，该想法来自NIN（Network in Network），实际在最后还是加了一个全连接层，主要是为了方便对输出进行灵活调整
但是网络中依然使用了Dropout
额外增加了2个辅助的softmax用于向前传导梯度（辅助分类器）（4a,4d）,辅助分类器是将中间某一层的输出用作分类，并按一个较小的权重（0.3）加到最终分类结果中，这样相当于做了模型融合.
而在实际测试的时候，这两个额外的softmax会被去掉。
浅层的辅助分类器后面被证实没有太大作用，作者在InceptionV2/V3的论文里去掉了浅层分类器
Global Average Pooling便于迁移学习。

InceptionV2

该模块参考此链接，侵删

如何在不增加过多计算量的同时提高网络的表达能力就成为了一个问题。
Inception V2版本的解决方案就是修改Inception的内部计算逻辑，提出了比较特殊的“卷积”计算结构。

1、卷积分解（Factorizing Convolutions）

GoogLeNet团队提出可以用2个连续的3x3卷积层组成的小网络来代替单个的5x5卷积层，即在保持感受野范围的同时又减少了参数量。那么这种替代方案会造成表达能力的下降吗？通过大量实验表明，并不会造成表达缺失。
大卷积核完全可以由一系列的3x3卷积核来替代，那能不能再分解得更小一点呢？GoogLeNet团队考虑了nx1的卷积核
因此，任意nxn的卷积都可以通过1xn卷积后接nx1卷积来替代。GoogLeNet团队发现在网络的前期使用这种分解效果并不好，在中度大小的特征图（feature map）上使用效果才会更好（特征图大小建议在12到20之间）。

具体流程如图所示：

总结一下，怎么减小参数量，增加计算效率：

大卷积核，换成多层堆叠的小卷积核。
1*1卷积用来降维或升维
N*N换成1X N和NX1

以上所有操作：更少参数量、计算量，更多的非线性变换

2、降低特征图大小

一般情况下，如果想让图像缩小，可以有如下两种方式：

先池化再作Inception卷积，或者先作Inception卷积再作池化。但是方法一（左图）先作pooling（池化）会导致特征表示遇到瓶颈（特征缺失），方法二（右图）是正常的缩小，但计算量很大。为了同时保持特征表示且降低计算量，将网络结构改为下图，使用两个并行化的模块来降低计算量（卷积、池化并行执行，再进行合并）

网络结构图：

labelsmoothing

在Inception v2中被提出，是一种正则化的策略。

one-hot：正确类别对应的分数Logit会一味增大，直到正无穷，
- 过拟合，模型死记硬背无法泛化
- 鼓励模型死记硬背，不计一切增加某一类的logit
labelsmoothing：正确答案对应的分数上界不会再增加到正无穷了。

其通过"软化"传统的one-hot类型标签，使得在计算损失值时能够有效抑制过拟合现象。label smoothing相当于减少真实样本标签的类别在计算损失函数时的权重，最终起到抑制过拟合的效果。

label smoothing将真实概率分布作如下改变：

与之对应，label smoothing将交叉熵损失函数作如下改变：

BN-Inception

亮点：

加入BN层，增加了模型的鲁棒性，可以以更大的学习率学习，收敛更快，初始操作更随意，同时作为一种正则化技术，可以减少dropout层使用。
2个3X3代替5X5
LRN是不必要的
加大learning rate decay
对数据更加彻底的shuffle
减少了数据的图像变形

如果要对输入做白化，那么梯度下降时就要计算每个输入特征之间的协方差，这个运算量非常大，因此作者提出BN再做归一化时仅在每个特征维度上做，而不是计算所有特征共同的特征。

V1到BN的改动

2个 3X3 代替 5X5 。
28*28 modules从2个增加到3个。
在modules中，pooling有时average ，有时maximum 。
没有across board pooling layers在任意两个inception modules。只在3c，4e里会有stride-2的卷积和pooling。

网络结构图：

InceptionV3

作者注意到辅助分类器直到训练过程快结束时才有较多贡献，那时准确率接近饱和。作者认为辅助分类器的功能是正则化，尤其是它们具备 BatchNorm 或 Dropout 操作时。是否能够改进 Inception v2 而无需大幅更改模块仍需要调查。

解决方案：
Inception Net v3 整合了前面 Inception v2 中提到的所有升级，还使用了：

RMSProp 优化器；
Factorized 7x7 卷积；
辅助分类器使用了 BatchNorm；
标签平滑（添加到损失公式的一种正则化项，旨在阻止网络对某一类别过分自信，即阻止过拟合）。
Inception V3一个最重要的改进是分解（Factorization），将7x7分解成两个一维的卷积（1x7,7x1），3x3也是一样（1x3,3x1），这样的好处，既可以加速计算，又可以将1个卷积拆成2个卷积，使得网络深度进一步增加，增加了网络的非线性（每增加一层都要进行ReLU）。
另外，网络输入从224x224变为了299x299。

InceptionV4

本模块参考此文章，侵删

Inception V4研究了Inception模块与残差连接的结合。
Inception V4主要利用残差连接（Residual Connection）来改进V3结构，得到Inception-ResNet-v1，Inception-ResNet-v2，Inception-v4网络。

准确率：

Inception-ResNet-v1 约等于 InceptionV3
Inception-ResNet-v2 约等于 InceptionV4

作者认为不用残差连接也可以训练很深的网络，但残差连接能显著加快训练。

亮点如下：

将Inception模块和ResidualConnection结合，提出了Inception-ResNet-v1，Inception-ResNet-v2，使得训练加速收敛更快，精度更高。
设计了更深的Inception-v4版本，效果和Inception-ResNet-v2相当。
网络输入大小和V3一样，还是299*299

inceptionV4

在inception网络设计中，最开始的几层总是不建议使用inception等模块来节省计算以抽取信息的，因此它们多是只采用简单的conv层或者相对简单的inception模块。

下面为inception v4之上的各个不同大小的feature map grid所使用的inception模块及它们之间的连接。细看就会发现它的设计也主要遵循之前在inception v3中所使用的原则，只是更复杂了些。

最终的Inception v4网络

Inception-Resnet

在inception-resnet中所用的inception-resnet模块里都在inception子网络的最后加入了一个1x1扩展conv 操作用于使得它的输出宽度（channels数目）与子网络的输入宽度相同，从而方便相加。

inception-resnet v1

主要被用来与inception v3模型性能进行比较。

inception-resnet C模块：

最后下面为inception-resnet v1的网络输入模块，注意它与inception v4和inception-resnet v2的并不相同。

inception-resnet v2

下面为inception-resnet v2所使用的各个主要模块。

下面为inception-resnet v1/v2网络的整体结构：

residual模块的scaling

作者们实验发现如果对inception-resnet网络中的residual模块的输出进行scaling（如以0.1-0.3），那么可以让它的整个训练过程更加地稳定。如下图为scaling的具体做法示意。

卷积核个数超过1000个时残差块会很不稳定，在训练早期，最后Avg、pool层之前的feature map里有很多0。
使用更小的学习率和BN都不能解决这个问题，
解决方法：在加法融合之前对残差分支的结果乘以幅度缩小系数，幅度缩小不是必须的，但它并不会损伤准确率，且会让训练更稳定。

EfficientNet

本模块参考该文章，侵删

作者重新审视了前人提出的模型放缩的几个维度：网络深度、网络宽度、图像分辨率

网络深度Depth：层的个数
网络宽度Width：每个层的通道数，卷积核个数
图像分辨率Res：输入图片大小，尺寸越大，输入信息越多

卷积神经网络可以看做一个映射，从输入到最后的输出。具体分析看上边模块连接。
那个在卷积层，即卷积函数不考虑的情况下，即固定网络结构，只变动上面提到的三个放缩维度，网络深度(Li)，网络宽度(Ci)，输入分辨率大小(Hi, Wi)。F_i（L_i）表示第 i 个 stage ，它由卷积层 F_i 重复 L_i 次构成，表示该 stage 输入 tensor 的维度。

作者接着做实验得出来：三个维度中任一维度的放大都可以带来精度的提升，但随着倍率越来越大，提升却越来越小。

有了上边的结果，作者接着做实验得出：作者又得到一个观点，得到更高的精度以及效率的关键是平衡网络宽度，网络深度，图像分辨率三个维度的放缩倍率(d, r, w)。

直观的理解：如果图片大的话（Res），就需要增加层（Depth）去增加感受野，并且需要增加通道（Width）去捕捉更加细粒度的特征；宽度（Width）很长但深度（Depth）很浅的网络往往不能提取到图片的高层语义信息。

作者提出了一种混合维度放大法(compound scaling method)，该方法使用一个混合系数来决定三个维度的放大倍率

$\alpha$ , $\beta$ , $\gamma$ 均为常数(不是无限大的因为三者对应了计算量)，可通过网格搜索获得。混合系数 $\phi$ 可以人工调节。即卷积操作的计算量(FLOPS) 与 d,w²,r² 成正比，在该约束条件下，指定混合系数 $\phi$ 之后，网络的计算量大概会是之前的 2^ $\phi$ 倍。

网络结构

该网络的核心结构为移动翻转瓶颈卷积（mobile inverted bottleneck convolution，MBConv）模块，该模块还引入了压缩与激发网络（Squeeze-and-Excitation Network，SENet）的注意力思想

移动翻转瓶颈卷积
也是通过神经网络架构搜索得到的，该模块结构与深度分离卷积（depthwise separable convolution）相似，该移动翻转瓶颈卷积首先对输入进行1x1的逐点卷积并根据扩展比例(expand ratio)改变输出通道维度（如扩展比例为3时，会将通道维度提升3倍。但如果扩展比例为1，则直接省略该1x1的逐点卷积和其之后批归一化和激活函数）。接着进行kxk的深度卷积（depthwise convolution）。如果要引入压缩与激发操作，该操作会在深度卷积后进行。再以1x1的逐点卷积结尾恢复原通道维度。最后进行连接失活（drop connect）和输入的跳越连接（skip connection）

注意：

在EfficientNets中，只有当相同的移动翻转瓶颈卷积重复出现时，才会进行连接失活和输入的跳越连接，且还会将其中的深度卷积步长变为1
该模块中的每一个卷积操作后都会进行批归一化
激活函数使用的是Swish激活函数。

移动翻转瓶颈卷积模块中的压缩与激发操作，以下简称SE模块，
是一种基于注意力的特征图操作操作，SE模块首先对特征图进行压缩操作，在通道维度方向上进行全局平均池化操作（global average pooling），得到特征图通道维度方向的全局特征。然后对全局特征进行激发操作，使用激活比例（R，该比例为浮点数）乘全局特征维数（C）个1x1的卷积对其进行卷积（原方法使用全连接层），学习各个通道间的关系，再通过sigmoid激活函数得到不同通道的权重，最后乘以原来的特征图得到最终特征。本质上，SE模块是在通道维度上做（注意力）attention或者（门控制）gating操作，这种注意力机制让模型可以更加关注信息量最大的通道特征，而抑制那些不重要的通道特征。另外一点是SE模块是通用的，这意味着其可以嵌入到现有的其它网络架构中。

注意

在移动翻转瓶颈卷积模块中，与激活比例相乘的是移动翻转瓶颈卷积模块的输入通道维度，而不是模块中深度卷积后的输出通道维度。

系列所有网络模型架构：
所有8个模型的开始和结尾

之后，每个主干包含7个block。这些block还有不同数量的子block，这些子block的数量随着EfficientNetB0到EfficientNetB7而增加。

我们使用这5个模块来构建整个结构。

模块1 — 这是子block的起点。
模块2 — 此模块用于除第一个模块外的所有7个主要模块的第一个子block的起点。
模块3 — 它作为跳跃连接到所有的子block。
模块4 — 用于将跳跃连接合并到第一个子block中。
模块5 — 每个子block都以跳跃连接的方式连接到之前的子block，并使用此模块进行组合。

这些模块被进一步组合成子block，这些子block将在block中以某种方式使用：

子block1 — 它仅用于第一个block中的第一个子block。
子block2 — 它用作所有其他block中的第一个子block。
子block3 — 用于所有block中除第一个外的任何子block。

EfficientNet-B0：

EfficientNet-B1：

EfficientNet-B2：
它的架构与上面的模型相同，唯一的区别是特征图(通道)的数量不同，增加了参数的数量。

········

具体介绍参考该链接，侵删

基于MobileNetV2 + SE Module的NAS搜索。
网络结构作者主要借鉴了 MnasNet，采取了同时优化精度(ACC)以及计算量(FLOPS)的方法，由此产生了初代 EfficientNet-B0，其结构如下图：

EfficientNet-B0的结构，它由16个移动翻转瓶颈卷积模块，2个卷积层，1个全局平均池化层和1个分类层构成。图中不同的颜色代表了不同的阶段。

以上网络具体步骤分析看以下链接，侵删

有了初代的网络结构之后，放大就分为下面两步：

第一步，首先固定 $\phi$ 为 1，即设定计算量为原来的 2 倍，在这样一个小模型上做网格搜索(grid search)，得到了最佳系数为 $\alpha$ =1.2, $\beta$ =1.1, $\gamma$ =1.15 。
第二步，固定 $\alpha$ =1.2, $\beta$ =1.1, $\gamma$ =1.15，使用不同的混合系数 $\phi$ 来放大初代网络得到 EfficientNet-B1 ～ EfficientNet-B7。

	width	depth	res	dropout
EfficientNetb0	1.0	1.0	224	0.2
EfficientNetb1	1.0	1.1	240	0.2
EfficientNetb2	1.1	1.2	260	0.3
EfficientNetb3	1.2	1.4	300	0.3
EfficientNetb4	1.4	1.8	380	0.4
EfficientNetb5	1.6	2.2	456	0.4
EfficientNetb6	1.8	2.6	528	0.5
EfficientNetb7	2.0	3.1	600	0.5

该链接存了没看，应该挺好的可以看一下

SPP-NET

该模块参考此文章，侵删

问题1：形变耗时又损失信息，为什么要形变
很简单，因为CNN的输入必须是固定尺寸。
问题2：为什么CNN的输入必须固定尺寸
CNN主要由两部分组成，卷积层和全连接层，卷积层可以接受任意尺寸的图像，只是不同的输入卷积后的特征图尺寸不同，而全连接必须是固定的输入，所以任意尺寸生成了不同的特征图，不符合全连接的输入，由此我们发现，CNN固定输入的需求完全来自于全连接层。

既然只有全连接需要固定输入，那么能否在全连接前面加上一个网络层，使得卷积的不同输出被转化成固定尺寸呢？空间金字塔池化(spatial pyramid pooling，SPP)层来解决这个问题。

SPP层放在最后一个卷积层后面，对特征图进行池化操作，并产生固定长度的输出，喂给全连接层。

优点：
这种方法不仅解决了形变的问题，还有一个有意思的说法，就是通过裁剪或者缩放的形变使得信息在一开始就被暴力的删减，可能损失有用信息，而SPP是在卷积之后，对信息的一种汇总，放弃无效信息，这有助于提高模型的精度，作者也通过实验证明了这个观点。

具体操作如图：

黑色代表特征映射图
把不同尺寸的特征映射图分为1份、4份、16份，然后在每个块上进行最大池化，池化后的特征拼接到一起，形成固定输出
由此我们发现分成几块 pool nn，跟我们的池化野没有关系，池化野可以是任意的合理尺寸，只要最终能生成 nn 块就行了。

SPPNet 的训练

因为深度学习框架是需要固定输入的：我的理解，每次喂给网络batch个样本，如果样本尺寸不一样，那怎么卷积呢？ok，如果你说一张一张卷积，也可以，但是这样卷积后的尺寸不同，要分开存储，而且，GPU是并行计算的，属于矩阵间的计算，尺寸不同，根本无法存储在一个矩阵里，何谈并行，所以肯定要固定输入。

作者将网络的训练分为两种：Single-size 和 Multi-size。

具体细节看这篇吧，没看懂其实

ZFNet

可视化并理解卷积神经网络

FNet(2013)在AlexNet(2012)的基础上，性能再次提升。

网络架构;

ZFNet的网络架构是在AlexNet基础上修改而来，与AlexNet相比，差异不大：

第1个卷积层，kernel size从11减小为7，将stride从4减小为2（这将导致feature map增大1倍）
为了让后续feature map的尺寸保持一致，第2个卷积层的stride从1变为2
和AlexNet基本一致。权重初始化不同，权重初始化为0.01，bias初始化为0。
通过可视化发现第一层的卷积核影响大，于是对第一层的卷积核做了规范化，如果RMS（Root Mean Square）超过0.1，就把卷积核的均方根normalize为固定0.1。

特征可视化

该模块参考，侵删

与提出一个性能更好的网络结构相比，这篇论文更大的贡献在于提出一种将卷积神经网络深层特征可视化的方法。

卷积神经网络通过逐层卷积将原始像素空间逐层映射到特征空间，深层feature map上每个位置的值都代表与某种模式的相似程度，但因为其位于特征空间，不利于人眼直接观察对应的模式，为了便于观察理解，需要将其映射回像素空间

可视化操作，针对的是已经训练好的网络，或者训练过程中的网络快照，可视化操作不会改变网络的权重，只是用于分析和理解在给定输入图像时网络观察到了什么样的特征，以及训练过程中特征发生了什么变化。

可视化操作的步骤如图所示：

可视化时每一层的操作如下：

Unpooling：在前向传播时，记录相应max pooling层每个最大值来自的位置，在unpooling时，根据来自上层的map直接填在相应位置上，如上图所示，Max Locations “Switches”是一个与pooling层输入等大小的二值map，标记了每个局部极值的位置。
Rectification：因为使用的ReLU激活函数，前向传播时只将正值原封不动输出，负值置0，“反激活”过程与激活过程没什么分别，直接将来自上层的map通过ReLU。
Deconvolution：可能称为transposed convolution更合适，卷积操作output map的尺寸一般小于等于input map的尺寸，transposed convolution可以将尺寸恢复到与输入相同，相当于上采样过程，该操作的做法是，与convolution共享同样的卷积核，但需要将其左右上下翻转（即中心对称），然后作用在来自上层的feature map进行卷积，结果继续向下传递。

上采样

上采样有三种形式：双线性插值，反卷积，反池化

双线性内插法
双线性内插法是利用待求象素四个邻象素的灰度在两个方向上作线性内插，其核心思想是在两个方向分别进行一次线性插值。如下图所示：
转置卷积–反卷积

在上面的双线性插值方法中不需要学习任何参数。而转置卷积就像卷积一样需要学习参数。
并不是正向卷积的完全逆过程，是一种特殊的正向卷积，按照一定比例补0扩大输入图像尺寸，接着旋转卷积核，在进行正向卷积。
反卷积只能回复尺寸，不能恢复数值。
而且当stride>=2 时，即使用完全相同的参数进行转置卷积，输入尺寸也不能恢复。
反卷积可将中间层feature map重构回原始输入像素空间，可视化。

更多关于反卷积参考这个

反卷积也称为转置卷积，如果用矩阵乘法实现卷积操作，将卷积核平铺为矩阵，则转置卷积在正向计算时左乘这个矩阵的转置WT，在反向传播时左乘W，与卷积操作刚好相反，需要注意的是，反卷积不是卷积的逆运算。

一般的卷积运算可以看成是一个其中非零元素为权重的稀疏矩阵C与输入的图像进行矩阵相乘，反向传播时的运算实质为C的转置与loss对输出y的导数矩阵的矩阵相乘。

逆卷积的运算过程与卷积正好相反，是正向传播时做成C的转置，反向传播时左乘C

反池化
unsampling和unpooling可以通过一个图来简单理解：

严格意义上的反池化是无法实现的。作者采用近似的实现，在训练过程中记录每一个池化操作的一个z*z的区域内输入的最大值的位置，这样在反池化的时候，就将最大值返回到其应该在的位置，其他位置的值补0。

论文做了什么

训练过程中不同层特征可视化：
通过对各层卷积核学习到的特征进行可视化发现神经网络学习到的特征存在层级结构。

可视化的步骤
1. 把输入图像给网络，正向计算，计算出中间层的feature map
2. 除指定某层的某个feature map不为0，其他均设为0，然后把这个feature map反向传回输入像素空间。
3. 反池化，反激活，反卷积
整个过程：输入图片–卷积–Relu–最大池化–得到特征结果图–反池化–Relu–反卷积
特征演化
- 特征收敛：底层快，高层慢。低层特征经过较少epoch的训练过程之后就学习的比较稳定了，层数越高越需要更多的epoch进行训练。因此需要足够多的epoch过程来保证顺利的模型收敛。
- 网络越深越关注语义信息，网络浅关注空间信息。
平移、缩放、旋转敏感性分析：
卷积神经网络具有平移和缩放不变性，并且层数越高不变性越强。但是不具有旋转不变性。
- 变换对底层影响显著，对高层影响小
- 网络对平移缩放不敏感
- 对旋转敏感，除非旋转到对称位置
模型改进
- 第1个卷积层，kernel size从11减小为7，将stride从4减小为2（这将导致feature map增大1倍）。因为步长太大导致网格特征，无用。11*11导致高频信息，有些神经元失效。
- 为了让后续feature map的尺寸保持一致，第2个卷积层的stride从1变为2。
局部遮挡敏感性能分析：
遮挡实验说明图像的关键区域被遮挡之后对分类性能有很大的影响，说明分类过程中模型明确定位出了场景中的物体。在识别一个物体时，起重要判别依据的是物体本身而非背景环境等不相干的信息。
相关性遮挡分析：
做了图片的部分遮挡探究物体部件之间的关系，发现了深度网络非显式地计算了这些关系。
不同图像的指定目标局部块之间是否存在一致性的关联，作者认为深度模型可能默认学习到了这种关联关系。不同图像的指定目标局部块之间是否存在一致性的关联，作者认为深度模型可能默认学习到了这种关联关系。作者通过对五张不同的狗的图像进行局部遮挡，然后分析原图和遮挡后的图像的特征之间的汉明距离的和值，值越小说明一致性越大。实验表明，对不同的狗的图像遮挡左眼、右眼和鼻子之后的汉明距离小于随机遮挡，证明存在一定的关联性。
模型迁移泛化能力：
之后仅用少数图片重新训练softmax层，在不同数据集上将imagenet训练所得的卷积网络当做特征提取器。都表现良好，有种迁移学习的感觉。
全连接层和卷积层去除后的性能分析：
- 改变全连接层的节点个数对分类性能影响不大
- 改变中间卷积层的节点数对训练结果有帮助，但是加大了过拟合的可能。
各层特征有效性分析。较高层通常产生更多的区分性特征

总结

在扩充训练集的时候，调整图像角度是关键，不需要过多的将图像切割成多片进行训练
仔细考虑，每个层对奇特层的影响，特别是全连接层
可先进行其他数据集的预训练

DenseNet

本模块参考该链接，侵删—可直接转过去看这个博客，超级详细

DenseNet模型，它的基本思路与ResNet一致，但是它建立的是前面所有层与后面层的密集连接（dense connection），它的名称也是由此而来。
另一大特色是通过特征在channel上的连接来实现特征重用（feature reuse）。这些特点让DenseNet在参数和计算成本更少的情形下实现比ResNet更优的性能
那就是在保证网络中层与层之间最大程度的信息传输的前提下，直接将所有层连接起来！
简单讲，就是每一层的输入来自前面所有层的输出。

dense block图：

先列下DenseNet的几个优点，感受下它的强大：

减轻了vanishing-gradient（梯度消失）
加强了feature的传递
更有效地利用了feature
一定程度上较少了参数数量
网络更窄，参数更少，很大一部分原因得益于这种dense block的设计，后面有提到在dense block中每个卷积层的输出feature map的数量都很小（小于100），而不是像其他网络一样动不动就几百上千的宽度。同时这种连接方式使得特征和梯度的传递更加有效，网络也就更加容易训练。
dense connection有正则化的效果，因此对于过拟合有一定的抑制作用
由于特征复用，最后分类器使用了低级特征。

ResNet：

DenseNet：

DenseNet的结构图：

作者将DenseNet分成多个dense block，原因是希望各个dense block内的feature map的size统一，这样在做concatenation就不会有size的问题。

参数图：

k是growth rate，作者的实验也表明小的k可以有更好的效果
dense block的33卷积前面都包含了一个11的卷积操作，就是所谓的bottleneck layer，目的是减少输入的feature map数量，既能降维减少计算量，又能融合各个通道的特征。
DenseNet-B：Bn+Relu+1X1conv+BN+Relu+3X3conv
如果你看到DenseNet-C这个网络，表示增加了这个Translation layer，该层的1*1卷积的输出channel默认是输入channel到一半。
Transition：Bn+Relu+1X1conv+2X2avgpooling
另外Transition起到压缩模型的作用。压缩系数(0,1].
如果你看到DenseNet-BC这个网络，表示既有bottleneck layer，又有Translation layer。

NasNet

参考自该文章，侵删—讲的比较详细，我这是阉割版，看不懂的话直接转

作者将用于ImageNet的NAS简称为NASNet。
在NASNet中，完整的网络的结构还是需要手动设计的，NASNet学习的是完整网络中被堆叠、被重复使用的网络单元。

两种类型的网络块：

Normal Cell：输出Feature Map和输入Feature Map的尺寸相同；
Reduction Cell：降采样，对使用Input Feature作为输入的操作（卷积或者池化）会默认步长为2。

控制器结构图：

每个网络单元由 B的网络块（block）组成，在实验中 B=5 。

更精确的讲，NASNet网络单元的计算分为5步：

从第 h_i-1个Feature Map或者第 h_i 个Feature Map或者之前已经生成的网络块中选择一个Feature Map作为hidden layer A的输入
采用和1类似的方法为Hidden Layer B选择一个输入；
为1的Feature Map选择一个运算；
为2的Feature Map选择一个元素；
选择一个合并3，4得到的Feature Map的运算。

其中：

Scheduled Drop Path

在优化类似于Inception的多分支结构时，以一定概率随机丢弃掉部分分支是避免过拟合的一种非常有效的策略，例如DropPath。但是DropPath对NASNet不是非常有效。在NASNet的Scheduled Drop Path中，丢弃的概率会随着训练时间的增加线性增加。这么做的动机很好理解：训练的次数越多，模型越容易过拟合，DropPath的避免过拟合的作用才能发挥的越有效。

总结

NASNet最大的贡献是解决了NAS无法应用到大数据集上的问题，它使用的策略是先在小数据集上学一个网络单元，然后在大数据集上堆叠更多的单元的形式来完成模型迁移的。
NASNet已经不再是一个dataset interest的网络了，因为其中大量的参数都是人为设定的，网络的搜索空间更倾向于密集连接的方式。这种人为设定参数的一个正面影响就是减小了强化学习的搜索空间，从而提高运算速度
NASNet的网络单元本质上是一个更复杂的Inception，可以通过堆叠网络单元的形式将其迁移到任意分类任务，乃至任意类型的任务中。因此搜索网络时，只搜索最优block。
比较完整的一个文章，没仔细看，可以看一下

Block结构

ResNeXt

该模块参考此文章，侵删

ResNeXt是ResNet和Inception的结合体
但是 Inception 系列网络有个问题：网络的超参数设定的针对性比较强，当应用在别的数据集上时需要修改许多参数，因此可扩展性一般。
不同于Inception v4的是，ResNext不需要人工设计复杂的Inception结构细节，而是每一个分支都采用相同的拓扑结构。
cardinality：the size of the set of transformations
每个被聚合的拓扑结构都是一样的(这也是和 Inception 的差别，减轻设计负担)
ResNeXt的本质是分组卷积（Group Convolution），通过变量基数（Cardinality）来控制组的数量。组卷机是普通卷积和深度可分离卷积的一个折中方案，即每个分支产生的Feature Map的通道数为N（N>1）。

“split-transform-merge”结构

Split：将数据X split成 D个特征；
Transform：每个特征经过一个线性变换；
Merge：通过单位加合成最后的输出。
是通用的神经网络的标准范式
4相当于说：Inception、resnet、通道分组卷积网络，都只是ResNeXt这一范式的特殊形式而已，进一步说明了该结构的普通性和有效性，以及抽象程度更高，更本质一点。

Inception是一个非常明显的“split-transform-merge”结构，作者认为Inception不同分支的不同拓扑结构的特征有非常刻意的人工雕琢的痕迹，而往往调整Inception的内部结构对应着大量的超参数，这些超参数调整起来是非常困难的。

所以作者的思想是每个结构使用相同的拓扑结构

ResNeXt和Inception v4是非常像的。不同之处有两点：

ResNeXt的分支的拓扑结构是相同的，Inception V4需要人工设计；
ResNeXt是先进行1*1卷积然后执行单位加，Inception V4是先拼接再执行1*1卷积。
增大Cardinality比增大模型的width或者depth效果更好
在更多环境中发现InceptionV4效果是优于ResNeXt
类似结构的ResNeXt的运行速度应该是优于V4的

列举了 ResNet-50 和 ResNeXt-50 的内部结构，另外最后两行说明二者之间的参数复杂度差别不大。

与 ResNet 相比，ResNeXt 参数更少，效果更好，结构更加简单，更方便设计
相同层数的ResNet和ResNeXt的对比：（32*4d表示32个paths，每个path的宽度为4，如fig3）。实验结果表明ResNeXt和ResNet的参数复杂度差不多，但是其训练误差和测试误差都降低了。

32*4d:
32指进入网络的第一个ResNeXt基本结构的分组数量C(即基数)为32
4d depth每一个分组通道数为4
所以第一个基本结构输入通道数为128

这里作者展示了三种相同的 ResNeXt blocks：

明确说明这三种结构严格等价，并且用这三种结构做出来的结果一模一样
fig3.a 就是前面所说的aggregated residual transformations。
fig3.b 则采用两层卷积后 concatenate，再卷积，有点类似 Inception-ResNet，只不过这里的 paths 都是相同的拓扑结构。
fig 3.c采用的是grouped convolutions，这个 group 参数就是 caffe 的 convolusion 层的 group 参数，用来限制本层卷积核和输入 channels 的卷积，最早应该是 AlexNet 上使用，可以减少计算量。
这里 fig 3.c 采用32个 group，每个 group 的输入输出 channels 都是4，最后把channels合并。

总结

作者的核心创新点就在于提出了 aggregrated transformations，用一种平行堆叠相同拓扑结构的blocks代替原来 ResNet 的三层卷积的block，在不明显增加参数量级的情况下提升了模型的准确率
同时由于拓扑结构相同，超参数也减少了，便于模型移植。
ResNeXt的本质是分组卷积，通过变量基数（cardinality）来控制组的数量
组卷积是普通卷积和深度可分卷积的一个折中办法，即每个分支产生的feature map的通道数为n（n>1）

你可能感兴趣的:(20问系列)

STM32F103C8T6点灯/流水灯（指定IO，正向反向） BDXiaotianYA stm32 嵌入式硬件单片机
参加2023年电赛后，到现在上班一年多，长达两年时间内，几乎没有再碰过单片机，由于现在工作中需要接触到一些代码，先退回来复习下32单片机。本人在此做一件事情，傻瓜式代码，让代码足够简洁，足够规范，让你复制我的代码百分百能够使用。此账号仅作为分享本人复习过程中记录使用，如果无法使用，或者或者有优化的地方，欢迎留言，看到后第一时间给予回复。有空会将2023激光打靶代码开源出来。在使用本程序的时候，默认
【达梦数据库学习】数据库体系架构-逻辑结构理解合作愉快：）数据库数据库架构学习
1.1数据库和实例在有些情况下，数据库的概念包含的内容会很广泛。如在单独提到DM数据库时，可能指的是DM数据库产品，也有可能是正在运行的DM数据库实例，还可能是DM数据库运行中所需的一系列物理文件的集合等。但是，当同时出现DM数据库和实例时，DM数据库指的是磁盘上存放在DM数据库中的数据的集合，一般包括：数据文件、日志文件、控制文件以及临时数据文件等。实例一般是由一组正在运行的DM后台进程/线程以
蓝桥杯——算法训练——粘木棍大柠丶蓝桥杯蓝桥杯算法职场和发展
问题描述有N根木棍，需要将其粘贴成M个长木棍，使得最长的和最短的的差距最小。输入格式第一行两个整数N,M。一行N个整数，表示木棍的长度。输出格式一行一个整数，表示最小的差距样例输入32102040样例输出10数据规模和约定N,M<=7packagecom.study.蓝桥杯.算法训练;importjava.util.Arrays;importjava.util.Scanner;/***@autho
蓝桥杯——算法训练——共线大柠丶蓝桥杯蓝桥杯算法职场和发展
问题描述给定2维平面上n个整点的坐标，一条直线最多能过几个点？输入格式第一行一个整数n表示点的个数以下n行，每行2个整数分别表示每个点的x,y坐标。输出格式输出一个整数表示答案。样例输入50011220323样例输出3数据规模和约定n<=1500，数据保证不会存在2个相同的点。点坐标在int范围内importjava.util.Scanner;/***@authorsjn*@date2022-2-
RK3568平台（音频篇）音频ALSA框架嵌入式_笔记瑞芯微音视频
一.ALSA框架简介ALSA表示先进linux声音架构（AdvancedLinuxSoundArchiecture），它由一系列的内核驱动、应用程序编程接口（API）以及支持linux下声音的应用程序组成、ALSA项目发起的原有是linux下的声卡驱动（OSS）没有获得积极的维护，而且落后于新的声卡技术。JaroslavKysela早先写了一个声卡驱动，并由此开始了ALSA项目，随后，更多的开发者
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
连续10年国内销售冠军，科沃斯在AWE发布新地宝X9系列 TMT星球家电人工智能
3月20日，中国扫地机器人市场连续10年规模第一的服务机器人品牌，科沃斯机器人携全场景智慧清洁解决方案亮相AWE2025（中国家电及消费电子博览会）。作为服务机器人技术革新的引领者，科沃斯秉持"让机器人服务每个人"的品牌使命，在E1馆1F11/1F21携手添可智能生活电器，双品牌联动打造智能家居沉浸体验。据「TMT星球」了解，现场展出了行业首款双核旗舰洗地机器人地宝X9PRO、上市即登顶天猫&京东
TCL空调携手中家院发布“SHE空调智慧健康绿色评价标准” TMT星球家电科技
3月20日，2025年TCL空调「智慧健康再进化」发布会于上海AWE圆满举办。据「TMT星球」了解，发布会现场，TCL空调携手中国家用电器研究院，联合发布《房间空气调节器智慧、健康和环境可持续评价规范》，以Smart（智慧）、Healthy（健康）、Environmental（环境可持续）为核心维度，首次构建空调行业智慧、健康、低碳的全链路标准，让用户购买智慧健康空调有标准可依、有标准可查。破解行
spring的自动配置原理 LCY133 spring后端 spring
Spring自动配置（Auto-Configuration）原理详解SpringBoot的自动配置是其核心特性之一，旨在根据应用的依赖和配置环境，自动完成Bean的创建与配置，减少开发者的手动配置工作。其核心思想是“约定优于配置”，通过智能化的默认行为简化开发流程。1.自动配置的核心机制a.条件化配置（Conditional）SpringBoot通过@Conditional系列注解判断是否满足条件
官宣 | Fluss 0.6 发布公告 Apache Flink flink 大数据
Fluss社区很高兴地宣布Fluss0.6.0版本正式发布。这一版本历时3个多月的密集开发，凝聚了全球45位贡献者的智慧与努力，累计完成200+次代码提交。衷心感谢每一位贡献者的支持！此次版本的发布带来了诸多功能亮点：列压缩：保留列裁剪性能的同时，降低6倍存储空间！MergeEngine：新增灵活的主键数据合并策略，满足不同的实时处理场景需求。PrefixLookup：DeltaJoin功能，Fl
mysql 游标分页_MySQL采用游标分页的方式，“下一页”很好实现，那“上一页”如何实现呢？... 酸流 mysql 游标分页
为让mysql达到最佳查询性能，我将分页查询改为cursor查询方式：select*fromreplywherereply_id>last_idlimit20orderbyreply_idASC;上面的last_id为本页最后一条回复的reply_id，这样就能实现“下一页”的查询了，但是“上一页”如何实现呢？我想过改变排列顺序select*fromreplywherereply_id,这样不管是
JavaScript数组-遍历数组咖啡の猫 javascript 开发语言
在JavaScript开发过程中，数组是一种非常常见且强大的数据结构，用于存储一系列有序的数据项。遍历数组是处理这些数据项的基础操作之一，无论是为了显示、转换还是过滤数据。本文将详细介绍几种常见的遍历数组的方法及其应用场景，帮助你选择最适合当前任务的方式。一、为什么需要遍历数组？遍历数组意味着逐一访问数组中的每个元素，以便执行特定的操作，如打印输出、修改值或基于条件筛选数据。不同的场景可能需要不同
自制C++小游戏走迷宫 ccw_china c++开发语言
直接上代码，有不足请指正，最新编辑于2025.3.22#include#include#include#includeusingnamespacestd;chara[100][100]={"####################","#O#####","###############","#################","#############","##################
摸鱼神器（保持Teams一直处于绿色状态） PhilipJ0303 java
packageorg.cloud.sonic.controller.tools;importjava.awt.*;importjava.time.DayOfWeek;importjava.time.LocalDateTime;importjava.time.LocalTime;/***@authorPhilipLee*@date2024/1/916:10*/publicclassTest{publ
Python列表1 cfjybgkmf Python python 开发语言
#coding:utf-8print("————————————列表——————————————")'''列表是指一系列按照特定顺序排列的元素组成是Python中内置的可变序列使用[]定义列表，元素与元素之间使用英文的逗号分隔列表中的元素可以是任意的数据类型''''''列表的创建：（1）使用[]直接创建列表列表名=[element1,element2,...,elementN]（2）使用内置函数l
深入了解 Cookiecutter：Python 项目模板的强大工具 boringhex.top python 开源 python 开发语言
在软件开发过程中，创建新的项目往往需要重复执行一系列繁琐的步骤，尤其是在设置项目结构、配置文件和依赖方面。Cookiecutter是一个开源的命令行工具，旨在帮助开发者快速生成项目模板，从而提高开发效率。本文将深入探讨Cookiecutter的功能、工作原理、常见用法以及一些最佳实践。什么是Cookiecutter？Cookiecutter是一个用于创建项目模板的工具，支持多种语言和框架。它允许开
Hadoop 集群规划与部署最佳实践 AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2009年2月2日，ApacheHadoop项目诞生。它是一个开源的分布式系统基础架构，用于存储、处理和分析海量的数据。Hadoop具有高容错性、可靠性、可扩展性、适应性等特征，因而广泛应用于数据仓库、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。由于Hadoop采用“分而治之”的架构设计理念，因此可以轻松应对数据量、计算能力和存储成本的增长。2013年底，
通用AI Agent的进化图谱：架构革新与安全可控的双重突破——以Manus为范本的启示我也秃了人工智能架构安全
通用AIAgent的进化路径：架构创新与安全管控的双重突破引言近年来，AI智能体正经历前所未有的变革。2025年3月，中国团队Monica推出的全球首款通用AIAgent——Manus，以“全链路自主执行”为核心，通过多签名系统架构和渐进式任务执行引擎，实现了从“生成建议”到“自主闭环交付任务”的范式跃迁。具体而言，Manus通过规划（Planner）-执行（Executor）-验证（Verifi
2023华为OD机试真题-最佳对手(JAVA、Python、C++) huaweiod123 华为OD机试真题2023 java c++算法华为 python
题目描述：游戏里面，队伍通过匹配实力相近的对手进行对战。但是如果匹配的队伍实例相差太大，对于双方游戏体验都不会太好。给定n个队伍的实力值，对其进行两两实力匹配，两支队伍实例差距在允许的最大差距d内，则可以匹配。要求在匹配队伍最多的情况下，匹配出的各组实力差距的总和最小。输入描述：第一行，n，d。队伍个数n。允许的最大实力差距d。(2<=n<=50,0<=d<=100)。第二行，n个队伍的实力值，空
c++算法赛万能模板个人笔记适用蓝桥杯，天梯赛，acm等赛事 a东方青个人笔记 c++算法笔记
算法笔记-更新与2025-3-22点赞收藏+关注持续更新算法基础二分整数二分//在一个单调区间里面去找答案boolcheck(intx){/*...*/}//检查x是否满足某种性质//区间[l,r]被划分成[l,mid]和[mid+1,r]时使用：intbsearch_1(intl,intr){while(l>1;if(check(mid))r=mid;//check()判断mid是否满足性质el
【Azure 架构师学习笔记】- Azure Networking(1) -- Service Endpoint 和 Private Endpoint 發糞塗牆 Azure 架构师学习笔记 Azure 网络安全 azure Network
本文属于【Azure架构师学习笔记】系列。本文属于【AzureNetworking】系列。前言最近公司的安全部门在审计云环境安全性时经常提到serviceendpoint（SE）和priavateendpoint（PE）的术语，为此做了一些研究储备。云计算的本质就是网络，默认情况下资源间及外部都是通过公网也就是互联网访问。为了安全，Azure引入了SE和PE等服务。云环境网络流动主要有两个：inb
MySQL 8.0新特性深度解析：窗口函数与JSON数据处理的10大技巧墨瑾轩一起学学数据库【一】mysql json
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第1章：MySQL8.0简介嗨，亲爱的小伙伴们！欢迎来到MySQL8.0的奇妙世界，这里充满了新鲜和惊喜。MySQL8.0是一个数据库界的超级英雄，它带着一系列令人兴奋的新特性，比如窗口函数和JSON数据处理，来拯救我们的数据处理任务。1.1MySQL8.0的
L2-4 吉利矩阵小竹子14 矩阵深度优先算法
输入样例：73输出样例：666这道题是暴力纯搜，但是很难想，我这个是看的别人的代码#include"bits/stdc++.h"usingnamespacestd;intx[20][20];intl,n;intcnt=0;intsumx[5],sumy[5];voiddfs(intx,inty){if(x==n+1){cnt++;return;}//其实不需要考虑列的和是否满足l,因为如果超出l的
力扣刷题-热题100题-第20题（c++、python） weixin_44505472 c++python leetcode
48.旋转图像-力扣（LeetCode）https://leetcode.cn/problems/rotate-image/?envType=study-plan-v2&envId=top-100-liked使用辅助矩阵直接创建一个新矩阵来装旋转好的矩阵，不过需要注意的是要将新矩阵的值赋值回原矩阵，在c++中是可以直接=，但python中要注意matrix[:]=matrix1才是赋值，直接=是改
SOFABoot-01-蚂蚁金服开源的 sofaboot 是什么黑科技？后端java
前言大家好，我是老马。sofastack其实出来很久了，第一次应该是在2022年左右开始关注，但是一直没有深入研究。最近想学习一下SOFA对于生态的设计和思考。sofaboot系列SOFABoot-00-sofaboot概览SOFABoot-01-蚂蚁金服开源的sofaboot是什么黑科技？SOFABoot-02-模块化隔离方案SOFABoot-03-sofaboot介绍SOFABoot-04-快
SOFABoot-00-sofaboot 概览后端java
sofaboot前言大家好，我是老马。sofastack其实出来很久了，第一次应该是在2022年左右开始关注，但是一直没有深入研究。最近想学习一下SOFA对于生态的设计和思考。sofaboot系列SOFABoot-00-sofaboot概览SOFABoot-01-蚂蚁金服开源的sofaboot是什么黑科技？SOFABoot-02-模块化隔离方案SOFABoot-03-sofaboot介绍SOFAB
「Kubernetes Objects」- Service（学习笔记） @20210227 k4nzdroid
Service，服务，用于暴露Pod以供访问。官方文档及手册KubernetesAPIv1.18/Servicev1coreService?Pod会被创建，并且还会消失，这由ReplicaSets控制。每个Pod都有自己的IP地址，但是这些IP地址不能视为可靠的。那么，如果前端的一部分Pod依赖于后端的Pod，那前端的这些Pod如何找出并追踪后端的Pod？ServiceService是一个抽象，定
比特币全节点同步加速记录（使用Bitcoin Core钱包） wusimpl 区块链区块链全节点同步加速 bitcoin core
1.预先下载或从别的地方拷贝区块数据而不是直接在BitcoinCore钱包中下载这方面可以参考截止到2022年8月的区块数据2.将区块头数据和区块实体数据分开存储区块头数据放到SSD中，区块实体数据放到HDD中这方面可以参考BitcoinCore节点同步加速原理和方法实验-CodeAntenna3.使用代理下载剩余的数据最好用全局代理，并且在bitcoin.conf中配置proxy可添加离自己区域
【LetMeFly】牛客-美团暑期2025-20250322-前两题和第三题的思路 Tisfy 题解 #牛客NowCoder 题解牛客美团笔试字符串回文暴力
【LetMeFly】牛客-美团暑期2025-20250322-前两题和第三题的思路第三题刚开始想复杂了，后面想到了个思路但是没来得及实现。一：对称回文串标签：回文串题目描述判断一个字符串有多少个长度大于1的对称回文子串。一个字符串为对称回文串当且仅当：该字符串为回文串该字符串只由字母AHIMOTUVWXY组成数据范围：字符串长度不超过100100100解题思路O(n2)O(n^2)O(n2)枚举每
负载均衡策略之轮询策略 Time-Traveler Python 算法与数据结构
本文转自:https://mozillazg.com/2019/02/load-balancing-strategy-algorithm-weighted-round-robin.html#hidround-robin,尊重原创前言:本文简单介绍一下轮询(RoundRobin)这个负载均衡策略。轮询选择(RoundRobin):轮询选择指的是从已有的后端节点列表中按顺序依次选择一个节点出来提供服务
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/