人工智能与算法学习

10 大 CNN 核心模型完全解析（附源代码，已全部跑通）

文章转载自知乎，版权归属作者目录：

1 LeNet
2 AlexNet
3 VGG
4 GoogLeNet
5 ResNet
6 DenseNet
7 Non-Local Networks
8 Deformable Convolutional Networks
9 Dilated Convolutional Networks

10 SENET

本文原文：

https://zhuanlan.zhihu.com/p/66215918

GitHub地址：

https://github.com/liuyuemaicha/cnn_model

GitHub代码依赖：python 2.7, Pytorch 0.3.1

LeNet

LeNet虽然不是CNN的起点，但却是后来CNN兴起的标志模型。LeNet-5是1998年YannLeCun设计用于手写数字识别的模型。

图1.1：LeNet-5网络结构

图1.2：LeNet-5网络结构

在当年神经网络还是MLP（Multilayer Perceptron，多层感知机）大行其道时，能设计出这样的模型已实属不易，也为后来CNN模型的发展奠定了基础。

特点：

1.相比MLP，LeNet使用了相对更少的参数，获得了更好的结果。

2.设计了maxpool来提取特征。

AlexNet

AlexNet是Hinton和他的学生Alex在2012设计的网络，并获得了当年的ImageNet竞赛冠军。

图2.1: AlexNet网络

图2.2: AlexNet网络

特点：

1.相比LeNet，AlexNet设计了更深层的网络。

2.在每个卷机后面添加了Relu激活函数，解决了Sigmoid的梯度消失问题，使收敛更快。

3.添加了归一化LRN（Local Response Normalization，局部响应归一化）层，使准确率更高。

4. 设计并使用了dropout层，减轻了模型的过拟合。

5.通过裁剪，旋转等方式增强了训练数据。

6.受于当时的算力限制，Alexnet创新地将图像分为上下两块分别训练，然后在全连接层合并在一起（AlexNet网络图1，可以看到有上下两部分）。

VGGNet

VGGNet在2014年的ImageNet比赛中，分别在定位和分类跟踪任务中取得第一名和第二名。VGGNet主要特点：

1.探索了更深层次的网络结构图，可以看成是AlexNet的加强版本。

2.在卷机设计上，使用了更小的卷机核，验证了小尺寸的卷机核在深度网络中，不仅减少了参数，也达到了更好的效果。

图3.1: VGGNet网络结构图

GoogLeNet

4.1 GoogLeNet v1

GoogLeNet v1版本诞生于2014年，在ILSVRC 比赛中获得冠军，其性能与同年诞生的VGG差不多，但参数量少于VGG。该模型并没有单纯的将网络加深，而是引入了Inception概念，通过多个卷积核提取图像不同尺度的信息，最后进行融合，可以得到图像更好的表征。

特点：

1.引入Inception概念，在当时流行模型‘加深’情况下，设计了‘加宽’的思路

2.采用Network in Network中用Average pool来代替全连接层的思想。实际在最后一层还是添加了一个全连接层，是为了大家做finetune。

3.另外增加了两个辅助的softmax分支，作用有两点，一是为了避免梯度消失，用于向前传导梯度。反向传播时如果有一层求导为0，链式求导结果则为0。二是将中间某一层输出用作分类，起到模型融合作用。最后的loss=loss_2 + 0.3 * loss_1 + 0.3 * loss_0。实际测试时，这两个辅助softmax分支会被去掉。

图4.1: Inception

图4.2

图4.3: GoogLeNet V1整体结构

4.2 GoogLeNet V2，V3

在2015年，同篇论文中发布了 GoogLeNet V2和V3版本。

V2特点：

学习VGGNet的特点，用两个3*3卷积代替5*5卷积，降低参数量，提高计算速度，从而提升性能。
（下图Figure5）
它们将滤波器大小nxn的卷积分解为1xn和nx1卷积的组合。
例如，3x3卷积相当于首先执行1x3卷积，然后在其输出上执行3x1卷积。
他们发现这种方法比单个3x3卷积便宜33％。
（下图Figure6）
模块中的滤波器组被扩展（更宽而不是更深）以消除代表性瓶颈。
如果模块变得更深，则尺寸会过度减少，从而导致信息丢失。
（下图Figure7）

图4.4: 3种Inception结构

图4.5: GoogLeNet v2结构

V3包含了为V2规定的所有上述改进，另外还使用了以下内容：

RMSProp优化器。
学习Factorization into small convolutions的思想，将7x7分解成两个一维的卷积（1x7,7x1），3x3也是一样（1x3,3x1），这样的好处，既可以加速计算（多余的计算能力可以用来加深网络），又可以将1个conv拆成2个conv，使得网络深度进一步增加，增加了网络的非线性，还有值得注意的地方是网络输入从224x224变为了299x299，更加精细设计了35x35/17x17/8x8的模块。
辅助分类器中的BatchNorm。
BN算法是一个正则化方法，可以提高大网络的收敛速度。
简单介绍一下BN算法。
就是对输入层信息分布标准化处理，使得规范化为N(0,1)的高斯分布，收敛速度大大提高。
标签平滑（添加到损失公式中的一种正规化组件，可防止网络对类过于自信。
防止过度拟合）。

4.3 GoogLeNet V4 ，Inception-ResNet v1和v2

图4.6: V4版本 3种Inception结构

图4.7: 4种Reduction结构

图4.8: 3种Inception-ResNet-V1结构

图4.9: 3种Inception-ResNet-V2结构

图4.10: Inception-ResNet结构中加入 Activation Scaling，防止网络“死亡”

4.11: Stem与最终网络结构图

V4与之前的V3，V2版本主要改动有：

修改了stem，这里的stem是指在引入Inception块之前执行的初始操作集。
V4引入了专门的“Reduction Blocks”，用于改变网格的宽度和高度。
早期版本没有显式Reduction Blocks，但实现了类似功能。
V4版本的3种Inception与之前版本的3种Inception非常相似，但也做了细节的修改。

Inception-ResNet V1和V2特点：

在Inception设计中加入了ResNet思想。
从图4.8和图4.9可以看到，V1和V2中的3种Inception-ResNet结构相同，不同的只是超参数。
Inception-ResNet V1与V2的整体结构不同，Inception-ResNet V1的计算成本与Inception v3类似，Inception-ResNet V2的计算成本与Inception v4类似。
为了实现残差加法，卷积后的输入和输出必须具有相同的尺寸。
因此，我们在Inception卷积之后使用1x1卷积来匹配深度大小（卷积后的深度增加）。
主要Inception模块内的池化操作被替换为有利于残差连接。
但是，您仍然可以在reduction blocks中找到这些操作。
Reduction Block A与Inception v4中的相同。
如果滤波器的数量超过1000，那么网络架构中更深的残差单元会导致网络“死亡”。
因此，为了增加稳定性，作者将残差激活量调整，系数为0.1到0.3，如图4.10。
为了在单个GPU上训练模型，原始论文在求和之后没有使用BatchNorm（以使整个模型适合单个GPU）。
结果发现，Inception-ResNet模型能够再用较少的epoch时获得更高的精度。

ResNet

随着算力的不断更新，越来越深的网络能够得到计算，但研究者发现随着网络的加深，模型变得越来越不能够训练，遇到了梯度消失或爆炸问题。在ResNet出现之前，人们通过BN，Relu等方式去缓解此问题，但仍然不能把网络做到足够深。

15年何恺明提出了ResNet网络，该思路启发于LSTM的控制门的思想。

y = H(x,WH)•T(x,WT) + X•(1- T(x,WT))

可以看出，当T(x,WT) = 0，y=x，当T(x,WT) = 1，y= H(x,WH)

图5.1 ResNet中的block示意图

从图5.1可以看出：相比传统网络：y=f(x)，ResNet Block公式为：y=f(x) + x，可以称之为skip connect。

图5.2 ResNet网络中使用的两种Block

图5.3 不同层数的ResNet设计方式

图5.4 34层ResNet与其他网络的比较

题外话：

Orhan等发表的论文《Skip connections eliminate singularities》提出神经网络的退化才是难以训练深层网络根本原因所在，而不是梯度消散。虽然梯度范数大，但是如果网络的可用自由度对这些范数的贡献非常不均衡，也就是每个层中只有少量的隐藏单元对不同的输入改变它们的激活值，而大部分隐藏单元对不同的输入都是相同的反应，此时整个权重矩阵的秩不高。并且随着网络层数的增加，连乘后使得整个秩变的更低。这也是我们常说的网络退化问题，虽然是一个很高维的矩阵，但是大部分维度却没有信息，表达能力没有看起来那么强大。残差连接正是强制打破了网络的对称性。总的来说一句话，打破了网络的对称性，提升了网络的表征能力。也可查看文献《Understanding and Improving Convolutional Neural Networks via Concatenated Rectified Linear Units》。

DenseNet

从图6.1中可以看出，DenseNet是借鉴了ResNet，是ResNet的升级版，从上述ResNet可以看到，一般每个Block会有一个skip connect，而DenseNet会在每层conv间有一个skip connect。

图6.1 ResNet Block与DenseNetBlock区别

图6.2DenseNet Block示意图

图6.3 DenseNet 各网络结构图

图6.4 DenseNet 网络

神经网络越深，网络的能力越强，就越有可能过度学习数据集，导致过拟合。大家应该还记得，作为第一个深层网络Alexnet网络，它提出了重要的策略dropout，对于提高模型的泛化能力非常有效。alexnet网络至今仍然可以用于很多的任务，这足以说明其鲁棒性。后来BN和数据增强等正则化策略替代dropout也在一定程度上缓解了过拟合的问题。文《Deep networks with stochastic depth》（Huang G, Sun Y, Liu Z, et al. ）是DenseNet作者们早期的研究，它们通过训练时随机丢掉一些网络层，提高了ResNet的泛化性能。
从这里可以看出来一个重要特性，这也是神经网络中大家比较关心的问题，网络的冗余性绝对是存在的，而且不小，通过探索dropout值的比例对性能的影响可以去估算这个冗余。
既然丢掉某些层间连接或者整个层不影响性能，就说明这一层学习到的非线性转变很小，既然转变很小，那么每一层学习几百个通道，还有必要吗？这几百个通道，正是万恶的计算量所在。
考虑到这一点，densenet就同时做了两件事情，一是将网络中的每一层都直接与其前面层相连，提高特征的利用率；二是把网络的每一层设计得很窄，也就是卷积的输出通道数通常很小，只有几十，该层学习非常少的特征图并与输入concat使用。
这实现了资源的最大化利用和计算量的压缩。ImageNet分类数据集上达到同样的准确率，DenseNet 所需的参数量不到ResNet的一半，所需的计算量也只有ResNet的一半左右。
引用自【模型解读】“全连接”的卷积网络，有什么好？

Non-Local Networks

Non-Local Networks启发于non-local means滤波算法，该滤波算法是经典的图像去噪算法之一。在CNN模型中不论是conv层还是pool层（全局pool除外），它们对数据的感受野都是局部的。为了增大conv或pool的感受野，传统方式是增加网络的深度（网络越深，后面conv和pool的感受野越大），但这样会增加训练的难度（越深越难训练），而且降低效率（参数增加）。该论文提出的Non-local Networks可以在每层计算中参考全局信息。

该方法属于自注意力机制的范畴

图7.1 non-local means 滤波示意图：non-local顾名思义，将这个邻域扩展到全图。如上图p作为中心像素，q1，q2，q3对p的滤波都有贡献，实际上图像上任意一个点都有贡献。

图7.2 None-local的实现方式

图7.3 None-local公式

Non-Local Networks 代码（pytorch）：

self.g = conv_nd(in_channels=self.in_channels, out_channels=self.inter_channels, kernel_size=1, stride=1, padding=0)
self.theta = conv_nd(in_channels=self.in_channels, out_channels=self.inter_channels, kernel_size=1, stride=1, padding=0)
self.phi = conv_nd(in_channels=self.in_channels, out_channels=self.inter_channels, kernel_size=1, stride=1, padding=0)
self.W = conv_nd(in_channels=self.inter_channels, out_channels=self.in_channels, kernel_size=1, stride=1, padding=0)

g_x = self.g(x).view(batch_size, self.inter_channels, -1).permute(0, 2, 1)
theta_x = self.theta(x).view(batch_size, self.inter_channels, -1).permute(0, 2, 1)
phi_x = self.phi(x).view(batch_size, self.inter_channels, -1)
f = torch.matmul(theta_x, phi_x)
f_div_C = F.softmax(f, dim=-1)
y = torch.matmul(f_div_C, g_x).permute(0, 2, 1).contiguous()
y = y.view(batch_size, self.inter_channels, *x.size()[2:])
W_y = self.W(y)
z = W_y + x

图7.4 Non-local 网络结构

特点：

对于视频分类，non-local会好于相应的一般网络，毕竟没有大的感受野未必能很鲁棒的捕捉一个动作到底是跳高还是跳水。
依据作者们的结论，在网络浅层效果会更好，毕竟随着网络深度增加，传统网络感受野也会增加了，Non-local的效果也就不再明显。

Deformable Convolutional Networks

同样的物体在图像中可能呈现出不同的大小、姿态、视角变化甚至非刚体形变，如何适应这些复杂的几何形变是物体识别的主要难点。而Deformable Conv模型尝试着解决这类问题。

首次在卷积神经网络（convolutional neutral networks，CNN）中引入了学习空间几何形变的能力，得到可变形卷积网络（deformable convolutional networks），从而更好地解决了具有空间形变的图像识别任务。研究员们通过大量的实验结果验证了该方法在复杂的计算机视觉任务（如目标检测和语义分割）上的有效性，首次表明在深度卷积神经网络（deep CNN）中学习空间上密集的几何形变是可行的。
作者：微软亚洲研究院
链接：https://www.zhihu.com/question/57493889/answer/184578752

当前深度模型对物体的几何形变适应能力几乎还是来自于数据本身的多样性，模型内部并不具有适应几何形变的机制。作者认为造成这样的问题是卷积操作本身就是固定的几何结构。

图7.5 展示了卷积核大小为 3x3 的正常卷积和可变形卷积的采样方式，(a) 所示的正常卷积规律的采样 9 个点（绿点），(b)(c)(d) 为可变形卷积，在正常的采样坐标上加上一个位移量（蓝色箭头），其中(c)(d) 作为 (b) 的特殊情况，展示了可变形卷积可以作为尺度变换，比例变换和旋转变换的特殊情况作

图7.6 示例图

Dilated Convolutional Networks

Dilated Convolution 被中文翻译为“空洞卷积”或“膨胀卷积”，我更倾向于称之为“膨胀卷积”。该模型最早由Fisher Yu在2016年ICLR上发表的论文《Multi-Scale Context Aggregation by Dilation Convolutions》中提出。该模型最早应用于图像分割，因为传统CNN模型需要通过pooling层来缩小图像尺寸，并扩大下一层的感受野，即进行下采样（down sampling）；这一过程肯定会有信息丢失。因为图像分割是pixel-wise的，且在图像预测时还需要进行上采样（up sampling）操作，丢失的信息在上采样过程中也很难再找回。

为了解决上述问题，Fisher Yu提出了Dilated Convolution方法，通过Dilated Convolution来替代pooling层进行下采样操作，不仅扩大了感受野，也不会丢失信息。

下面看一下dilated conv原始论文中的示意图：

(a)图对应3x3的1-dilated conv，和普通的卷积操作一样，(b)图对应3x3的2-dilated conv，实际的卷积kernel size还是3x3，但是空洞为1，也就是对于一个7x7的图像patch，只有9个红色的点和3x3的kernel发生卷积操作，其余的点略过。也可以理解为kernel的size为7x7，但是只有图中的9个点的权重不为0，其余都为0。可以看到虽然kernel size只有3x3，但是这个卷积的感受野已经增大到了7x7（如果考虑到这个2-dilated conv的前一层是一个1-dilated conv的话，那么每个红点就是1-dilated的卷积输出，所以感受野为3x3，所以1-dilated和2-dilated合起来就能达到7x7的conv）,(c)图是4-dilated conv操作，同理跟在两个1-dilated和2-dilated conv的后面，能达到15x15的感受野。对比传统的conv操作，3层3x3的卷积加起来，stride为1的话，只能达到(kernel-1)*layer+1=7的感受野，也就是和层数layer成线性关系，而dilated conv的感受野是指数级的增长。

SENET

SENET在ImageNet 2017中的Image Classification夺得冠军。并在CVPR 2017中发表论文《Squeeze-and-excitation networks》。

作者大概总结了前人对CNN模型的改进：卷积核作为卷积神经网络的核心，通常被看做是在局部感受野上，将空间上（spatial）的信息和特征维度上（channel-wise）的信息进行聚合的信息聚合体。卷积神经网络由一系列卷积层、非线性层和下采样层构成，这样它们能够从全局感受野上去捕获图像的特征来进行图像的描述。

近很多工作被提出来从空间维度层面来提升网络的性能，如Inception结构中嵌入了多尺度信息，聚合多种不同感受野上的特征来获得性能增益；还如Non-local，deformable conv，dilated conv等都是在空间层面进行改进。

本文提到的SENet另辟蹊径，尝试着从channel特征中寻找优化点。作者认为在每层卷积中输出的每个channel，其信息重要性是不同的，我们需要为每个channel的feature map设置一个权重，来重新量化每个channel的特征信息。作者的设计如下图所示：

图中Fsq为Squeeze操作，将每个二维的特征通道变成一个实数，这个实数某种程度上具有全局的感受野，并且输出的维度和输入的特征通道数相匹配。

图中Fex为Excitation操作，它是一个类似于循环神经网络中门的机制。通过参数来为每个特征通道生成权重，其中参数被学习用来显式地建模特征通道间的相关性。

图中Fscale是一个Reweight操作。完成了每个channel的特征图权重计算。

SE作为一个模块，可以跟其他CNN模型进行组合使用，下图是分别于Inception和ResNet进行组合

参考文献：

https://mp.weixin.qq.com/s/IMkvod2Lj2VOIWbFtAirzA

https://zhuanlan.zhihu.com/p/45189981

https://www.zhihu.com/question/312556066

https://www.zhihu.com/question/57493889/answer/184578752

https://www.zhihu.com/question/54149221/answer/192025860

推荐阅读

人工智能学习梳理和总结

6+1高效课堂清澈与明亮
高效“6+1”课堂的基本形态，是由两部分组成的，第一部分是高效“6+1”课堂模式中的“6”，是指课堂教学中依次进行的六个环节，包括“导、思、议、展、评、检”6个教学环节；第二部分是高效6+1模式中的“1”，谓之“练或做”，这是在课后自习中进行的一个教学环节。高效“6＋1”课堂模式的创立、特色、应用、成果及模式解析【特色】通过高效“6+1”课堂带来的变化有：①颠覆了原有的课堂面貌；②推动了教师观念与
从专业角度来说,618与双十一有什么区别高省APP
618大促又叫做年中大促，双十一也是个重大的电商日，但是每个活动总有一些区别，那么618和双十一的区别是什么呢?相信有很多的用户们都想了解一下这两者之间的区别是什么。时间：5.29日20点—6.20日每天抽三次红包，最高可领28888r‼️参与方式很简单，直接去桃宝搜官方密令即可领取，现在分享给大家！密令：【天降红包61666】这是官方密令，中大包的概率更高，现在就可以去搜一下有记录，5.29日2
历史上的今天7月14日，维也纳战役，法国大革命，最早的选美比赛文史走廊
7月14日是公历一年中的第195天，离全年的结束还有170天（闰年则还有171天）。“安莫安于知足；危莫危于多言；乐莫乐于好善；苦莫苦于多贪。”1、汉武帝刘彻诞生公元前156年7月14日（农历公元前156年6月9日），汉武帝刘彻诞生。汉武帝刘彻(公元前156年7月14日/8月10日——公元前87年3月29日，距今已2106年)，中国西汉皇帝(公元前141—前87年在位)。西汉王朝是中国封建王朝史上
第10天 | openGauss逻辑结构：表空间管理 yBmZlQzJ oracle 数据库 opengauss gaussdb
接着昨天继续学习openGauss,今天是第10天了。今天学习内容是openGauss逻辑结构：表空间管理。老规矩，先登陆墨天轮为我准备的实训实验室root@modb:~#su-ommomm@modb:~$gsql-r作业要求1、创建表空间t_tbspace、用户test，并使用test，在这个表空间上创建表t1omm=#CREATETABLESPACEt_tbspaceRELATIVELOCAT
腾讯音乐要去美国上市了，但能先解决音乐人的版权费吗？财经宅急送
传闻已久的腾讯音乐IPO的消息，今天终于得到了证实。7月9日，腾讯发布公告宣布拟将旗下的在线音乐业务分拆，以腾讯音乐集团的身份在美国独立上市，该提议已得到联交所确认。如此一来，腾讯音乐的估值也在一路飙升，最初盛传是100亿美元，随后变成了25亿美元，最新的数字已经达到了300亿美元。就想问，坐拥如此高估值，能先将音乐人的版权费结一下吗？最近著名音乐人李志被腾讯《明日之子》逼上了维权道路。《明日之子
【商城实战(45)】商城系统优化：从蹒跚学步到健步如飞奔跑吧邓邓子商城实战商城实战商城系统优化
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
2022-02-26 charonfrompluto
刚从秦皇岛回来没两天，太过于享受那样惬意的生活，到了科学城各种不适，开三个小时才会变暖和的电热毯，又冷又无法上大号的同层卫生间，洗着洗着会变凉的热水器，冰凉刺骨的水，睡觉翻来覆去一晚上要醒好几回，办公室的同学都发了小论文能毕业了，而我小论文还没发要毕不了业了，大家的大论文都写完了，我仔细想了下自己的基本跟没写一样，差的很多；因为长胖裤子又紧又勒，强迫自己少吃的两天在今天下午崩溃，饿的不行，于是区超
长板决定你跑多快，短板决定你跑多远 Lifly初心
S:我是Lifly，曾是一名普通的办公文员，由于不甘于现状，又改行了美业行业，随着互联网的发展，2017年下半年做了一名自由职业者，自媒体人。C：办公文员是一个轻松，但没有什么技术含量的职位，随时随地都会被淘汰，被取代。为此个人感觉很有危机感，一想到，也许未来的某一天无工可打，那第一批饿死的可能就是我们这样一些人吧，所以趁年轻，必须有个长远的打算，不是吗？沉思熟虑下，离职去学了美业，大概是为了找回
#100天遇到更好的自己杨泽琴
《100天遇到更好的自己行动营》打卡第21天你可以选择那些会鼓励你获得幸福和成就的思考方式，而舍弃那些不能支持你获得幸福的思考方式。有段时间自己选择了躺平模式，工作之外其他啥也不想干。这边追着剧那边又感觉大好的时间被这样浪费很不应该。纠结来纠结去，追剧也没追好自己还产生了深深的负罪感。好朋友打过电话说有好消息，要我过去一趟。原来她工作履新了，还有其他要庆祝的事情。听到闺蜜讲的自己的事，我真心觉察到
该拿什么爱家人祺祺妈G6
今天早课玉珍老师的分享主题是：《该拿什么爱家人》，看到这个题目，可能大家都会不由自主的想到，给到家人最好的物质生活。是的，给到家人富裕的生活，听起来再正常不过了，也完全没有问题，我之前也是这么认为的，可是在经历了亲人惨遭病痛的折磨时，我渐渐改变了这种认知。最近比较热门的话题之一是：央视名嘴李咏的病逝，李咏一家应该是娱乐界比较另人羡慕的幸福家庭，两人均事业有成、夫妻恩爱、家庭和谐。可是，疾病的到来却
2022-10-27 一生暖暖的
今天的课上今天本来应该是放假的日子，因为种种原因，没有放假。学生们知道后，并没有闹，也没有哭，表现得很淡定，也很坚强。早读的时候我和学生们解释今天为什么不能放假了，学生们都能理解，他们也知道闹哭，不能解决问题，学生们都很正常，问老师：“有放假的日子吗？”我告诉他们，只要确定了放假的日子，我一定马上告诉你们。现在我们在学校，所以要好好学习，虽然，咱们希望回家，但是，因为疫情咱们只能在学校，现在我们就
2022-10-13 时光浅浅
怎样使教育者的话进入受教育者的内心？作为老师，我们希望自己的话对孩子有所触动，能让孩子的心有一丝波动，能让孩子接受老师的建议，然而结果往往是事与愿违。这是为什么呢？苏霍姆林斯基说“假如儿童在家里没有受到情感教育，他就不可能用心灵认识世界和接受教师的话。他所能了解的，只是他听到和读到的东西的逻辑意义，而情感上、心灵上的潜台词，他是不会明白的。”为什么有些调皮的孩子对老师苦口婆心的教育无动于衷？可能与
成都，最快乐的就是你——孙兆琪游蜀都图说（三）远心笃行
杜甫草堂成都杜甫草堂博物馆杜甫草堂，全国重点文物保护单位，国家AAAA级旅游景区，国家一级博物馆，全国古籍重点保护单位。杜甫草堂坐落成都市西门外的浣花溪畔，是中国唐代大诗人杜甫流寓成都时的故居。杜甫先后在此居住近四年，创作诗歌240余首。唐末诗人韦庄寻得草堂遗址，重结茅屋，使之得以保存，宋元明清历代都有修葺扩建。今天的草堂占地面积近300亩，仍完整保留着明弘治十三年（公元1500年）和清嘉庆十六年
22、Python 多线程编程与GIL锁机制深度解析 wolf犭良 python python 开发语言
Python多线程编程与GIL锁机制深度解析引言：多线程的意义与挑战在Python并发编程领域，多线程技术因其轻量级和易用性广受欢迎。然而全球解释器锁（GIL）的存在使得Python多线程在CPU密集型任务中表现特殊。本文将通过理论解析、代码实战和性能测试，带你全面掌握线程同步机制，深入理解GIL的工作机制，并提供绕过性能瓶颈的解决方案。一、多线程编程基础1.1线程创建方式Python通过thre
揭秘FloodFill算法：图像填充利器 KENYCHEN奉孝 python实践大全算法 python 开发工具
FloodFill算法概述FloodFill是一种用于填充连通区域的算法，常用于图像处理、绘图工具（如“油漆桶”工具）和迷宫求解等场景。其核心思想是从一个起始点出发，向四周（四邻域或八邻域）扩展，直到遇到边界或满足停止条件。算法原理连通性定义：根据需求选择四邻域（上、下、左、右）或八邻域（包含对角线方向）作为填充方向。边界条件：填充需在指定区域内进行，遇到边界颜色或特定标记时停止。实现方法递归实现
地支子水你知道多少，属鼠之人在各流年运势如何？曌澍
子水诗曰：月支子水占魁名，溪涧汪洋不尽情；天回道阳行土旺，人间水暖寄金生。若逢午破应无定，须遇卯刑还有情；柱中申辰来合局，即成江海发涛声。月支子水排在十二地支的首位，犹如溪涧之水汇流到大江里边一样，子水需要旺土和戊癸化合为最有利。子水以火为财，金为印绶为其保驾护航。若果见到午则非常不利，因为子午相冲。还有就是子和卯相刑，为无礼之行，虽相刑但并无大的害处。四柱中如果见到申子辰会合成水局，则是非常好的
Rust+ChatBoxAI：实战
ChatboxAIChatboxAI是一款基于人工智能技术的智能助手工具，旨在通过自然语言交互帮助用户完成多种任务。以下是其核心功能与特点：功能概述多模型支持：可连接OpenAI、Claude、Gemini等主流大语言模型，用户能自由切换不同AI服务。本地运行：支持离线使用，数据隐私性较强，适合敏感信息处理场景。跨平台兼容：提供Windows、macOS和Linux客户端，同步支持移动端应用。核心
高速通道的实用建模
正如MolexCorp.的DaveDunham喜欢说的那样，“在设计超过10GB/s的高速串行链路时，一切都很重要”。为了确保以这样的速度首次成功，准确的通道建模是先决条件。对于长背板通道尤其如此。尽管许多EDA工具都包含最新、最出色的导体表面粗糙度和宽带介电特性模型，但获得正确的参数来为模型提供数据始终是一项挑战。通常，唯一的来源仅来自数据表。但在大多数情况下，这些数字并不能直接转化为EDA工具
5、网络基础：从协议到各层解析 juice 探索Java网络编程精髓网络协议 TCP/IP OSI模型
网络基础：从协议到各层解析1.网络协议概述在网络通信中，协议是计算机之间进行数据交换的规则集合。不同的协议定义了网络通信的不同方面。例如，超文本传输协议（HTTP）规定了网页浏览器和服务器之间的通信方式；而IEEE802.3标准则定义了在特定类型的线缆上将比特编码为电信号的协议。开放且公开的协议标准使得不同厂商的软件和设备能够相互通信，比如你的网页浏览器无需关心服务器是Unix工作站、Window
固态硬盘哪个牌子好？笔记本固态硬盘哪个牌子好氧惠佣金真的高
固态硬盘相比于传统机械硬盘，有着更快的速度，通过升级或加装固态可以大大提高电脑加载速度，那么固态硬盘哪个牌子好呢，想购买的可以看看下面固态硬盘十大品牌排行榜。购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位团队长体验！也期待你的
书讯 | 影响力的关键——让自己变得激情澎湃斯坦威
您有没有发现因为一些琐事而让自己彻夜难眠？比如在想，您回过那封电子邮件了吗？您拔掉熨斗插头了吗？门上的防盗链放到门上了吗？无论您怎么尝试，就是无法把这些思绪甩出脑海。当我们情绪激动时，我们的观点也会扭曲。我们阻止不了。这完全是人之常情。尽管扭曲的观点常常和不成熟、幼稚等联系在一起，但是事实上人类学家认为扭曲观点的能力发展，代表了人类进化很重要的一步。大脑中的布罗卡区开始扩大时，我们在历史上可以看到
读乔伊斯短篇小说《伊芙琳》小成和大成
第四篇伊芙琳从这一篇开始，乔氏开始转向青年期。并且叙述的视角从一个旁观者小孩转到主人公自己——青年。具体刻划人物来表现主旨。和前三篇风格完全不同。第一段，她，伊芙琳出场。场景描写。最后一句【她累了】总领全文。何去何从。第二段，回忆，介绍背景，家境的变化，邻居的变迁。人物描写几句交代，但很有特色。以景、事代情，自然转入伊芙琳的内心世界。如你是伊芙琳触景生情似的。第三段，回顾现实。现实虽然穷窘、无奈，
基于R、Python的Copula变量相关性分析及AI大语言模型应用阁楼里的小花儿 R语言 Python Copula变量相关性分析 AI大语言模型结构方程模型贝叶斯网络统计学
前言：在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果，但这些系数都存在着无法克服的困难。例如，皮尔逊相关系数只能反映变量间的线性相关，而秩相关则更多的适用于等级变量。大多数情况下变量间的相关性非常复杂，而且随着变量取值的变化而变化，而这些相关系数都是全局性的，因此无法提供
Spring AOT（Ahead-of-Time）深度解析：下一代云原生架构核心 csdn_tom_168 Spring spring 云原生架构 AOT
SpringAOT（Ahead-of-Time）深度解析：下一代云原生架构核心SpringAOT（Ahead-of-Time）编译是Spring框架6和SpringBoot3的革命性创新，彻底改变了Java应用的部署范式。本文将全面解析SpringAOT的工作原理、核心组件及企业级实践方案。一、AOT编译范式转变1.传统JVM模式vsAOT模式对比维度JVM模式AOT模式启动时间秒级（2-10s）
C#复习资料洁辉 c#java jvm
核心目标：理解原理、掌握应用、避开陷阱、应对提问。一、类型系统(TypeSystem)-面试基石&高频考点值类型(ValueTypes)vs引用类型(ReferenceTypes)本质区别：值类型(struct,enum,基本类型如int,double,bool,char,decimal,DateTime):存储：数据本身直接存储在变量位置（通常栈上，或嵌入在引用类型对象中）。赋值/传参：复制整个
轻松入门学python（四）python类的继承、添加与覆盖 Sunhen_Qiletian python 开发语言
Python类的继承、添加与覆盖：从语法到设计思想的完整指南————————————————————（全文约2000字，示例基于Python3.11）一、为什么要继承1.代码复用：子类自动拥有父类的属性与方法，减少重复。2.扩展与特化：在父类基础上增加新功能（添加），或改写已有实现（覆盖），使类型体系更符合领域模型。3.多态：通过继承+方法覆盖，实现“一个接口，多种实现”，让高层代码只依赖父类接口
基于单片机的住宅防盗报警系统的设计 QQ2193276455 单片机单片机嵌入式硬件
**单片机设计介绍，基于单片机的住宅防盗报警系统的设计文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于单片机的住宅防盗报警系统的设计概要主要涵盖硬件设计、软件设计、工作原理以及功能实现等方面。以下是对这一设计的简要概述：一、系统概述基于单片机的住宅防盗报警系统采用单片机作为核心控制器，结合传感器技术、通信技术及报警装置，实现对住宅环境的全面监控和安全防护。系统
基于STM32的ONENET物联网远程智能家居控制系统 QQ2193276455 单片机单片机嵌入式硬件
**单片机设计介绍，基于STM32的ONENET物联网远程智能家居控制系统文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于STM32的ONENET物联网远程智能家居控制系统是一个结合了STM32微控制器和中国移动OneNET物联网平台的智能家居解决方案。以下是该系统的概要：系统核心：该系统以STM32系列微控制器（如STM32F103C8T6）作为核心控制单元
C语言--内存管理小蘑菇二号 c++算法数据结构 c语言
在C语言中，内存管理是一项重要的编程任务，它涉及到了解程序如何分配、使用和释放内存。C语言提供了多种内存管理方式，主要包括静态内存分配、栈内存分配和动态内存分配。1静态内存分配全局变量和静态变量：编译时就已经确定了内存空间，它们在整个程序生命周期内持续存在，直到程序结束。这类内存由编译器自动分配和回收。intglobalVar=10;//全局变量，静态分配staticintstaticVar=20
java-MT31_硬币兑换 d3y1 java 算法开发语言
java-MT31硬币兑换import java.util.Scanner;public class Main { private static int[] coins = new int[]{1, 2, 5, 10, 20, 50, 100}; public static void main(String[] args){ Scanner in = new Scanne
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

10 大 CNN 核心模型完全解析（附源代码，已全部跑通）

本文原文：

https://zhuanlan.zhihu.com/p/66215918

GitHub地址：

你可能感兴趣的:(10 大 CNN 核心模型完全解析（附源代码，已全部跑通）)