荼靡，

【论文阅读总结】ResNet残差网络翻译总结

基于深度残差学习的图像识别

1.摘要
2.引言
- 2.1 增加深度带来的问题
- - 2.1.1梯度消失与爆炸问题
  - 2.1.2退化问题
- 2.2 模型优化思想
- 2.3 深度残差学习框架
- - 2.3.1构建思想
- 2.4 实验结论
- - 2.4.1ImageNet数据
  - 2.4.2 CIFAR-10数据
  - 2.4.3 实验证据表明
3. 文献综述【不知道在讲什么】
- 3.1 残差表示【Residual Representations】
- 3.2 快捷连接【Shortcut Connections】
4.深度残差网络【重点】
- 4.1 残差学习
- 4.2 通过快捷连接进行恒等映射
- 4.3 网络体系结构
- - 4.3.1 Plain Network【普通网络】
  - 4.3.2 Residual Network【残差网络】
- 4.4 实现步骤
5.实验
- 5.1 ImageNet分类数据集
- - 5.1.1 普通网络
  - 5.1.2 残差网络
  - 5.1.3 投影捷径对比
  - 5.1.4 更深层次的瓶颈架构
6.总结

论文链接：
- https://arxiv.org/pdf/1512.03385.pdf

1.摘要

深度对于许多视觉识别任务是至关重要的。
残差学习框架：由于更深层次的神经网络更难训练。提出了残差学习框架，以简化比以前网络深度更深的网络训练。
- 将这些层重新定义为学习参考层输入的残差函数，而不是学习未引用的函数
- 表明了’这些残差网络更容易优化，并且可以从显著增加的深度中获得准确性。
在ImageNet数据集上，我们评估了深度高达152层的残差网络，比VGG网络深8倍，但仍然具有较低的复杂性。

2.引言

深度卷积神经网络在图像分类方面取得了一系列突破。
深度网络自然地将【低-中-高】级特征和分类器以端到端的多层方式集成在一起，特征的“层”可以通过堆叠层数(深度)来丰富。
最近揭示了网络深度是至关重要的：在ImageNet数据集上的主要结果都利用了“非常深的”模型，深度为16到30。许多其他重要的视觉识别任务也已完成受益于非常深入的模型.

2.1 增加深度带来的问题

2.1.1梯度消失与爆炸问题

梯度消失与爆炸:一开始就阻碍了收敛。
解决：这个问题已经通过归一化，初始化和中间归一化层得到了很大程度的解决，这使得具有数十层的网络开始收敛随机梯度下降(SGD)与反向传播。

2.1.2退化问题

当更深层的网络能够开始收敛时，退化问题就会暴露。但是，这种退化并不是由过拟合引起的，在适当深度的模型中增加更多的层会导致更高的训练误差。
- 退化问题：随着网络深度的增加，准确度会饱和，然后迅速退化。

2.2 模型优化思想

让我们考虑一个较浅的体系结构和在其上添加更多层的较深的对应结构。通过构造深层模型存在一个解决方案:添加的层是身份映射，其他层是从学习的浅层模型复制而来。这个构造解的存在表明，较深的模型应该不会比较浅的模型产生更高的训练误差。但实验表明，我们现有的求解器无法找到这样的解

退化问题表明，并非所有系统都同样容易优化。
构造深层模型：在一个较浅的体系结构上添加更多层的较深的对应结构。
- 构造深层模型思想:添加的层是恒等映射，其他层是从浅层模型学习复制而来。【上一层的模型输出+上一层的模型输出残差=下一层的模型输入】
  - 表明了较深的模型应该不会比较浅的模型产生更高的训练误差。
- 实验表明：我们现有的求解器无法找到比构造模型相当好或更好的解(或在可行时间内无法做到)。

2.3 深度残差学习框架

引入深度残差学习框架解决退化问题。

2.3.1构建思想

我们不是希望每几个堆叠层直接适合底层映射，而是让这些层适合残差映射。【自我理解：不希望适应于由几个堆叠的层拟合得到的底层函数H(x)=F(x)+x，而是适应于堆叠的非线性层拟合得到的残差函数F(x):= H(x)−x】。
我们假设优化残差映射比优化原始的、未引用的映射更容易。
在极端情况下，如果一个恒等映射是最优的，那么将残差推到零比通过一堆非线性层来拟合一个恒等映射要容易得多。
F(x) + x公式可以通过具有“快捷连接”的前馈神经网络来实现。
快捷连接
- 含义：跳过一个或多个层的连接【跨层连接】。
- 快捷连接只执行恒等映射，输出被添加到堆叠层的输出中。
- 快捷连接不会增加额外参数与计算复杂度。整个网络仍然可以由SGD通过反向传播进行端到端训练，并且可以很容易地使用公共库(例如Caffe）而无需修改求解器。

2.4 实验结论

2.4.1ImageNet数据

在ImageNet上进行了全面的实验，以显示退化问题并评估方法。表明:
- “普通”网络(简单地堆叠层)在深度增加时表现出更高的训练误差，但极深残差网络很容易优化。
- 深度残差网络可以很容易地从深度的大幅增加中获得精度收益，产生的结果比以前的网络要好得多。
在ImageNet分类数据集上，我们利用极深残差网获得了很好的结果。我们的152层残差网络是ImageNet上最深的网络，但仍然比VGG网络的复杂度低。

2.4.2 CIFAR-10数据

在CIFAR-10集合上也显示了类似的现象，这表明此方法的优化困难和效果不仅仅类似于特定的数据集。在这个超过100层的数据集上展示了成功训练的模型，并探索了超过1000层的模型。

2.4.3 实验证据表明

证据表明：残差学习原理是通用的，我们期望它适用于其他视觉和非视觉问题。

3. 文献综述【不知道在讲什么】

3.1 残差表示【Residual Representations】

在图像识别中，VLAD是由残差向量相对于字典进行编码的表示，Fisher Vector可以表述为VLAD的概率版本。它们都是用于图像检索和分类的强大浅层表示。对于矢量量化，编码残差向量被证明比编码原始向量更有效。
在低级视觉和计算机图形学中，为了求解偏微分方程，广泛使用的多重网格方法将系统重新定义为多个尺度上的子问题，其中每个子问题负责粗尺度和细尺度之间的残差解。 Multigrid的另一种替代方案是分层基预处理，它依赖于表示两个尺度之间的残差向量的变量。已经证明这些求解器比不知道解的残差性质的标准求解器收敛得快得多。这些方法表明，良好的重新配方或预处理可以简化优化过程。

3.2 快捷连接【Shortcut Connections】

快捷连接的实践和理论已经被研究了很长时间。
训练多层感知器(mlp)的早期实践是添加一个从网络输入连接到输出的线性层。一些中间层直接连接到辅助分类器，用于处理消失/爆炸梯度。提出了定心层响应、梯度和传播误差的方法，通过快捷连接实现。“初始”层由一个快捷分支和一些较深的分支组成。
“highway networks”【门控函数】提供了带有控制功能的快捷连接。这些门控函数依赖于数据并具有参数，我们定义的快捷连接与此相反没有参数。
当门控捷径是“封闭的”(接近零)时，门控函数中的层表示非残差函数。门控函数在深度极大增加(例如超过100层)时，并没有显示出精度的提高。
**注意：**我们的公式总是学习残差函数;我们的身份捷径永远不会关闭，所有的信息总是传递出去，还有额外的残差函数需要学习。

4.深度残差网络【重点】

4.1 残差学习

如果假设多个非线性层可以渐近逼近复杂函数，就等价于假设它们可以渐近逼近残差函数，即H(x)−x(假设输入和输出具有相同的维度)。
期望堆叠层近似H(x)，这些层近似残差函数F(x):= H(x)−x。原始函数因此变成F(x)+x。尽管这两种形式都应该能够渐近地近似所需的函数(如假设的那样)，但学习的容易程度可能是不同的。
如果添加的层可以构造为恒等映射，那么较深的模型的训练误差应该不大于较浅的模型。
退化问题表明:求解器可能有困难逼近的单位映射由多个非线性层。通过残差学习重构，如果单位映射是最优的，求解器可以简单地将多个非线性层的权值向零驱动以接近单位映射。
在实际情况下，单位映射不太可能是最优的，但我们的重新表述可能有助于解决这个问题。如果最优函数更接近恒等映射而不是零映射，那么求解者就更容易找到与恒等映射相关的扰动，而不是将其作为一个新函数来学习。通过实验表明，学习到的残差函数通常具有较小的响应，这表明恒等映射提供了合理的前提条件

4.2 通过快捷连接进行恒等映射

我们对每几个堆叠层采用残差学习。将构建块定义为:

参数	含义
x	输入
y	输出
$F(x，\{W_i\})$	学习的残差映射
$\sigma(x)$	Relu激活函数,为了简化符号，省略了偏差
H(x)	作为一个底层映射【由几个堆叠的层(不一定是整个网络)拟合】

公式(1)不会增加额外参数与计算复杂度，这不仅在实践中很有吸引力，而且在我们比较普通网络和剩余网络时也很重要。我们可以公平地比较同时具有相同数量的参数、深度、宽度和计算成本的普通/剩余网络(除了可以忽略不计的元素添加)。
x和F的维数必须相等。
如果维数不相等(例如，当改变输入/输出通道时)，通过快捷连接执行线性投影 $W_s$ 来匹配维度
也可以在公式(1)中使用一个方阵 $W_s$ 。但实验证明，恒等映射足以解决退化问题，并且是经济的，因此仅在匹配维度时使用 $W_s$
残差函数F的形式是灵活的。本实验的函数F有两层或三层，也可以有更多的层。但如果F只有单层，则公式(1)类似于线性层:y = W1x + x，对此我们没有观察到优势。
尽管上面的符号是关于全连接层的，但它们适用于卷积层。函数F(x， {Wi})可以表示多个卷积层。逐个通道地在两个特性映射上执行元素添加。

4.3 网络体系结构

测试了各种普通网络/残差网络，并观察到一致的现象

4.3.1 Plain Network【普通网络】

我们的朴素基线主要是受到VGG nets理念启发。
- 卷积层大多具有3×3过滤器.
- 遵循两个简单的设计规则:
  - 对于相同的输出特征映射大小，层具有相同数量的过滤器;
  - 如果特征图大小减半，则过滤器数量加倍，以保持每层的时间复杂度。
- 通过步幅为2的卷积层直接执行下采样。网络以全局平均池化层和softmax的1000全连接层结束,加权层数为图中的34层。
此模型比VGG nets的过滤器更少，复杂度更低。我们的34层基线有36亿次flop(乘法-加法)，仅为VGG-19(196亿次flop)的18%

4.3.2 Residual Network【残差网络】

普通网络的基础上，插入快捷连接，将网络变成对应的残差版本。
当输入和输出维度相同时，可以直接使用公式.(1)(图中实线)进行快捷连接。
当维度增加时(图中虚线)，有两种选择:
- 1.快捷键仍然执行单位映射，增加维度时填充额外的零项。该选项不引入额外参数;
- 2.公式(2)中的投影快捷方式用于匹配维度(由1×1 卷积完成)。
当维度增加时，当快捷连接穿过两种大小的特征映射时，它们的步幅为2。

4.4 实现步骤

训练
- 调整图像大小，其较短的一侧随机采样在[256,480]规模扩大。
- 224×224裁剪是从图像或其水平翻转中随机抽取的，逐像素平均值减去。使用标准颜色增强。
- 在每次卷积之后激活之前，采用批量归一化(BN)。
- 初始化权重，并从头训练所有普通/残差网络。
- 我们使用SGD， mini-batch批量大小为256。
- 学习率从0.1开始，当误差达到峰值时除以10，训练模型最多60 × 104次迭代。
- 使用的权重衰减为0.0001，动量为0.9。
- 没有使用dropout。
在测试中，为了进行比较研究，采用标准的10作物测试。为了获得最佳结果，我们采用全卷积形式，并在多个尺度上平均分数(图像调整大小，使较短的边为{224,256,384,480,640})

5.实验

5.1 ImageNet分类数据集

该数据集包含1000个类。模型在128万张训练图像上进行训练，并在50k张验证图像上进行评估。我们还获得了测试服务器报告的100k测试图像的最终结果。评估了top-1和top-5的错误率

5.1.1 普通网络

评估18层和34层普通网络。结构如图：
结果：深34层普通网络比浅18层普通网络具有更高的验证误差。
原因:比较了在训练过程中的训练/验证误差。观察到退化问题
认为这种优化困难不太可能是由消失的梯度引起的。这些普通网络使用BN训练，确保前向传播的信号具有非零方差。
我们还验证了反向传播梯度与BN表现出健康的规范。所以前进和后退信号都不会消失。事实上，34层普通网络仍然能够达到竞争精度，说明该求解器在一定程度上是可行的。我们推测深层普通网络可能具有指数级的低收敛速度，这影响了训练误差的减小。造成这种优化困难的原因将在以后进行研究。

5.1.2 残差网络

评估了18层和34层残差网络(ResNets)。
基线架构与上面的普通网络相同，每对3×3过滤器添加一个快捷连接。我们对所有快捷连接使用恒等映射，对增加维度使用零填充(选项A)。因此，与普通的对应项相比，它们没有额外的参数。
结果
- 34层ResNet比18层ResNet好(2.8%)。34层ResNet显示出相当低的训练误差，并可推广到验证数据。
  - 这表明退化问题在这种设置中得到了很好的解决，我们设法从增加深度中获得精度增益。
- 与普通的34层相比ResNet将top-1误差降低了3.5%，这是由于成功地降低了训练误差。
  - 这个比较验证了残差学习在极深系统上的有效性
- 18层普通网络/残差网络相对准确，但18层ResNet收敛更快。
- 当网“不太深”(这里是18层)时，当前的SGD求解器仍然能够找到普通网的良好解。在这种情况下，ResNet通过在早期提供更快的收敛来简化优化。
相关图

5.1.3 投影捷径对比

无参数的标识快捷方式有助于训练。接下来我们研究投影捷径(公式2)。
我们比较了三种选项:
- (A)使用零填充快捷方式来增加维度，并且所有快捷方式都是无参数的;
- (B)投影捷径用于增维，其他捷径为恒等;
- (C)所有的捷径都是投影
结果
- 这三个选项都比普通选项好得多。
- B比A略好，我们认为这是因为A中的零填充维度确实没有残差学习。
- C比B稍微好一点，我们把这归因于许多(13个)投影快捷方式引入的额外参数。但A/B/C之间的微小差异表明，投影捷径对于解决退化问题不是必要的。
- 因此，我们在本文的其余部分不使用选项C，以减少内存/时间复杂度和模型大小
标识快捷方式对于不增加下面介绍的瓶颈体系结构的复杂性特别重要。
相关图

5.1.4 更深层次的瓶颈架构

ImageNet的深层网络。考虑到我们所能承受的培训时间，我们将构建块修改为瓶颈设计4。
- 对于每个残差函数F，我们使用3层的堆栈而不是2层。
- 这三层是1×1, 3×3和1×1卷积，其中1×1层负责减少然后增加(恢复)维数，使3×3层成为输入/输出维数较小的瓶颈。，其中两种设计具有相似的时间复杂度。
无参数的标识快捷方式对于瓶颈体系结构特别重要。如果将身份快捷键替换为投影，可以看出时间复杂度和模型大小都增加了一倍，因为快捷键连接到两个高维端点。因此，标识捷径可以为瓶颈设计带来更有效的模型。
50-layer ResNet
- 我们用这个3层瓶颈块替换了34层网络中的每个2层块，生成了
  50层ResNet。我们使用选项B增加尺寸。该模型具有38亿FLOPs。
101-layer and 152-layer ResNets
- 我们通过使用更多的3层块构建101层和152层ResNet。
- 尽管深度显著增加，但152层ResNet(113亿FLOPs)的复杂度仍然低于VGG-16/19网络(153 / 196亿FLOPs)。
- 50/101/152层resnet比34层resnet更准确。
- 没有观察到退化问题，因此从相当大的深度增加中获得了显著的精度提高。深度的好处在所有评价指标中都得到了证实
之前的最佳单模型结果进行了比较
- 基线34层ResNets已经达到了非常有竞争力的准确性。
- 152层ResNet的单模型top-5验证误差为4.49%。
- 这个单一模型的结果优于之前所有的集成结果。我们将六个不同深度的模型组合起来形成一个集成(在提交时只有两个152层的模型)。这导致测试集的top-5误差为3.57%。

6.总结

实现思想
- 由于更深层次的神经网络更难训练并且会出现退化问题。提出了残差学习框架
- 希望网络学习的是残差函数，提出了恒等映射与快捷连接
- F(x)与x必须是相同纬度，提出了不同投影捷径方式
自我总结
- 模型结构的提出需要多次的实验总结，最后才能呈现一个完整的算法。算法的思想是容易明白的，但是真正的是现实困难的，需要高昂的算力与时间。
- 论文大部分内容都是实验结果与总结，需要实践中得到结论，作为学习者，我们需要理解其原理，实现可能需要不错的硬件设备，让我感觉到现在的我们是真正的站在巨人的肩膀上学习，也感觉自己的智商不够，有些东西还是理解不了。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
openssl+keepalived安装部署 _小亦_ 项目部署 keepalived openssl
文章目录OpenSSL安装下载地址编译安装修改系统配置版本Keepalived安装下载地址安装遇到问题安装完成配置文件keepalived运行检查运行状态查看系统日志修改服务service重新加载systemd检查配置文件语法错误OpenSSL安装下载地址考虑到后面设备可能没法连接到外网，所以采用安装包的方式进行部署，下载地址：https://www.openssl.org/source/old/
Some jenkins settings SnC_
Jenkins连接到特定gitlabproject的特定branch我采用的方法是在pipeline的script中使用git命令来指定branch。如下：stage('Clonerepository'){steps{gitbranch:'develop',credentialsId:'gitlab-credential-id',url:'http://gitlab.com/repo.git'}}
2023.5.10 周三早7:38 努力逆流而上
榜样的力量前一段时间追一个《一生一世》的电视剧，脑残剧，但居中的周生辰，稳重。润玉一般的性格，坚持着10年如一日的自律习惯，养成的性格也是这样温文尔雅，虽然是剧中塑造，但我感觉现实中一定是有的，让我觉得人生就是这样的修行，自律不是强迫自己，是形成的习惯，坚持的习惯！结果五一回家，太无聊，看了韩剧的《继承者》让孩子也跟着一起看手机，昨天跑了步，但发现没有很快乐，不知道起的太晚还是怎么着，7点的大街上
看不懂的秋天騎黑馬的東北漢
金风玉露,秋高气爽,咋一看欲冷还暖,初秋不知何时悄悄来到了我们身边,遍野金涂,层林墨染。虽然少了几分绚丽的花飞蝶舞,却多了一抹简约的秋水长天,艳阳当空高照,满月亲人团圆,每个人情不自禁走进了秋,不带一丝残花落叶的凄凉,只多了一种喜悦期盼的情愫。图片发自App每个人都有自己喜欢的季节，在自己的内心里也会有着对季节的诠释。然而我却看不懂，说实话我不太喜欢秋，即使秋天是收获的季节。图片发自App连续几年
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
esp32开发快速入门 8 : MQTT 的快速入门，基于esp32实现MQTT通信 z755924843 ESP32开发快速入门服务器网络运维
MQTT介绍简介MQTT（MessageQueuingTelemetryTransport，消息队列遥测传输协议），是一种基于发布/订阅（publish/subscribe）模式的"轻量级"通讯协议，该协议构建于TCP/IP协议上，由IBM在1999年发布。MQTT最大优点在于，可以以极少的代码和有限的带宽，为连接远程设备提供实时可靠的消息服务。作为一种低开销、低带宽占用的即时通讯协议，使其在物联
ARM V8 base instruction -- Debug instructions xiaozhiwise Assembly arm
/**Debuginstructions*/BRK#imm16进入monitormodedebug，那里有on-chipdebugmonitorcodeHLT#imm16进入haltmodedebug，连接有外部调试硬件
高中抓住这两招，帮你实现从学渣到学霸的逆袭以读攻独
富兰克林曾说：“宝贝放错了地方便是废物。”一句话戳中了“位置”的重要性。大多数人，最初对位置的明显感受，似乎就来源于上高中时的座位：成绩好的，坐前排，那里安静，学习氛围浓，受关注度高；成绩差的坐后面，嘈杂，充斥着汗味、食品味、香水味，也经常被点名。所以，位置不仅代表了分数，也给你打上了“学渣”或“学霸”的标签。在《逆袭》这本书中，就真实地讲述一个参加了2014年高考的高中生，用三年的奋斗史，从班级
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
线上分享会感悟（关于教育）猫咪小妖的城堡
未来的理想的教育，是细化到个人的。即，关注每个人的成长，个人的优势发展。教师需要做的，是营造足够好的氛围，提供足够多的支。每个孩子都是一颗种子，老师是园丁，提供营养的土壤，悉心呵护，浇水，施肥，修剪，给予恰当的引导，种子自然会依照本性，长成自己的样子。世界因此而美好，多姿多彩。教育，是连接到本人，对人本心的沟通。从表面上的一个点（一个行为），深究到背后的动机，而非简单的评判与术的运用。这涉及到心理
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
组诗·三国群英颂（周瑜、马超、贾诩、赵云）颍川荀清
念奴娇·怀周郎矶头万仞、若关情，仍叹当年英物！一揽长江，龙流怒，化作孙吴阵壁。浪里船城，铁锁平川，袖挽千堆雪。烈胆豪情，斗牛惊认奇杰！但看戎马余生，纵横万里，正英姿勃发。宏图霸业弹指间，惟见涛生云灭。苍天轻狂，妒意猖作，帅将难华发。难忆郎顾，青史相伴别月。古体·西凉天将军大漠狂烟起，孑然佩青锋。神威震羌月，锦袍曜汉空。终囚蜀山险，瘴疠掩长虹。天地一孤啸，匹马又西风。水调歌头·文和乱武山水应将残，清
利用等价无穷小替换求极限（二）肇事小姐
2limx➡️0（（1-cosx）/x^2）分析：当x➡️0时，cosx➡️1，故此极限其实满足0/0的形式故第一感觉可以用洛必达法则求解，分子求一次导=sinx，分母求一次导=2x分子、分母求2次导数分别=cosx，=2，故最后答案=1/2另一种方法，考虑将1-cosx视作整体，用等价无穷小替换。利用1-cosx～2（sin（x/2）^2）推导cosx=cos（ｘ/2+x/2）利用三角和差公式=
RabbitMQ生产者重复机制与确认机制 java炒饭小能手 java-rabbitmq rabbitmq java
重复机制生产者发送消息时，出现了网络故障，导致与MQ的连接中断。为了解决这个问题，SpringAMQP提供的消息发送时的重试机制。即：当RabbitTemplate与MQ连接超时后，多次重试。需要修该发送端模块的application.yaml文件，添加下面的内容：spring:rabbitmq:connection-timeout:1s#设置MQ的连接超时时间template:retry:ena
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
python爬取微信小程序数据,python爬取小程序数据 2301_81900439 前端
大家好，小编来为大家解答以下问题，python爬取微信小程序数据，python爬取小程序数据，现在让我们一起来看看吧！Python爬虫系列之微信小程序实战基于Scrapy爬虫框架实现对微信小程序数据的爬取首先，你得需要安装抓包工具，这里推荐使用Charles，至于怎么使用后期有时间我会出一个事例最重要的步骤之一就是分析接口，理清楚每一个接口功能，然后连接起来形成接口串思路,再通过Spider的回调
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
[实验室服务器使用]使用VSCode、PyCharm、MobaXterm和CMD连接远程服务器 YuanDaima2048 工具使用服务器 vscode pycharm cmd 代理模式机器学习实验
文章总览：YuanDaiMa2048博客文章总览实验室服务器使用：使用VSCode、PyCharm、MobaXterm和CMD连接远程服务器在进行实验室工作时，远程连接服务器是常见的需求之一。本篇文章根据个人的一些使用介绍使用不同工具连接服务器的方法，并提供优化功能，使服务器能够使用本机代理的说明。准备服务器账号信息Host（主机）:10.XXX.XX.XXXPort（端口）:[SSHPort]U
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

【论文阅读总结】ResNet残差网络翻译总结

基于深度残差学习的图像识别

1.摘要

2.引言

2.1 增加深度带来的问题

2.1.1梯度消失与爆炸问题

2.1.2退化问题

2.2 模型优化思想

2.3 深度残差学习框架

2.3.1构建思想

2.4 实验结论

2.4.1ImageNet数据

2.4.2 CIFAR-10数据

2.4.3 实验证据表明

3. 文献综述【不知道在讲什么】

3.1 残差表示【Residual Representations】

3.2 快捷连接【Shortcut Connections】

4.深度残差网络【重点】

4.1 残差学习

4.2 通过快捷连接进行恒等映射

4.3 网络体系结构

4.3.1 Plain Network【普通网络】

4.3.2 Residual Network【残差网络】

4.4 实现步骤

5.实验

5.1 ImageNet分类数据集

5.1.1 普通网络

5.1.2 残差网络

5.1.3 投影捷径对比

5.1.4 更深层次的瓶颈架构

6.总结

你可能感兴趣的:(#,论文阅读,#,深度学习,Resnet,resnet残差网络,快捷连接,深度学习,残差连接)