蓝子娃娃

VggNet 论文分析

文章目录

题目：
论文总览
Part 1：论文导读
- 研究背景
- 研究成果
Part 2：论文精读
- 摘要
- 论文小标题
- 2. VGGNet 网络结构
- 3. Classification Framework
- - 3.1 Training
  - 3.2 Testing
  - 3.3 Implementation Details
- 4. Classification Experiments
- - 4.1 Single Scale Evaluation
  - 4.2 Multi-Scale Evaluation
  - 4.3 Multi-Crop Evaluation
  - 4.4 Convent Fusion
  - 4.5 Comparison With The State Of The Art
- 论文总结

题目：

VggNet：《Very Deep Convolutional Networks for Large-Scale Image Recognition》，大规模图像识别的深度卷积网络。

论文总览

首先，读一篇论文，我们第一遍通常需要泛读，即读这篇论文的题目，摘要，各个部分的标题和小标题，以及图片和表格。

下面是泛读之后整理出该篇论文大致分成5个部分。

Part 1：论文导读

研究背景

VGGNet 这篇论文的主要贡献就是在于从网络深度这一角度出发，对卷积神经网络进行了改进。非常详细的评估了网络深度所带来的影响，证明了网络的深度对于性能的提升具有举足轻重的作用。而且由于文中训练的两个16层和19层的网络由于其强大的泛化能力，在之后得到了非常广泛的应用。

VGGNet 主要特点：

网络很深

卷积层中使用的卷积核很小，且都是3*3的卷积核

研究成果

VGGNet 在2014年的 ImageNet Challenge 中获得了分类任务的第二名和定位任务的第一名。而且在分类任务中，只和获得冠军的 GoogLeNet 只相差了 0.1%，而且在单个网络中，VGG 是表现最好的，误差是 7.0%，比 GoogLeNet 的 7.9% 高了 0.9 个百分点。

Part 2：论文精读

摘要

下面，我们先来看看摘要。

我们可以将摘要总结如下：

这篇论文主要研究的是卷积神经网络深度对分类准确度的影响
我们整个网络都使用 3*3 的卷积核，成功将深度扩大了16-19层，并且得到了一个很好的效果
VGGNet 获得了2014年 ImageNet Challenge 的定位任务第一名和分类任务第二名
该模型的泛化能力很强，运用到其它数据集上也得到了很好的效果
表现最好的两个模型已经投入到未来的研究中

论文小标题

从小标题的个数可以看出，第4部分的子标题最多，我们应该重点关注，其次应该关注第2、3部分。

当我们正式进入某一部分时，我们可以先看一下，该部分有没有 Overall、Conclusion、Discussion等等。或许我们先从该部分入手，先了解到该部分的大体内容，再返回去看具体的实现细节。

那么我们先从网络的架构（Configurations）入手，从上面的小标题可以看出，我们可以先从 2.3 小节入手。

2. VGGNet 网络结构

我们先看 2.3 的 discussion。

可以从上面一段文字总结如下：

整个神经网络都是使用的 3*3的卷积核
通过堆叠多个33的卷积核来代替大尺度卷积核，堆积2个33的卷积代替一个55的卷积，堆叠3个33的卷积代替一个7*7的卷积
这样做的好处：不仅能使决策函数更有区别，而且使得参数大大减少

可以从上面一段文字总结如下： 使用 1*1 的卷积可以在不影响卷积层的结果的情况下增加决策函数的非线性。

可以从上面一段文字总结如下： 这次比赛的冠军 GoogLeNet 也使用了非常深的网络（22层）和小的卷积核（11，33，5*5）。它们使用为了减少计算量，设计更为复杂，更积极地减少了第一层的特征图的空间分布。但是从单个网络的分类准确率来看，VGGNet 的表现要优于 GoogLeNet。

接下来，我们再来看 2.3 小节中的图。

在实验中，一共尝试了上面六种模型（每一列是一种模型），模型中都使用了是 3x3 的卷积核大小，在模型 C 中尝试了 1x1 的卷积核，模型的深度从左向右依次增加。为了简洁方便，表格中只展示了卷积操作和池化操作，没有显示激活函数（在每个卷积层和全连接层后都有激活函数）。而且我们发现每层的通道数很小，第一层的通道数只有64，之后每进行一次最大池化，通道数变为之前的2倍，直到增加到512为止。

下面是16层的 VGGNet 的模型图。

图中符号表示：

conv3-64：卷积核的大小为 3*3，输出通道数为 64
conv1-256：卷积核大小为 1*1，输出通道数为 256
FC-4096：全连接层，输出神经元个数为 4096
FC-1000：全连接层，输出神经元个数为 1000
maxpool：采用最大池化

关于Table 2 的描述，在 2.2 小节中，我们来看看 2.2 小节。

Table 2 展示了上面六种模型中的参数个数，从 Table 1 中，我们知道模型的深度是从11层增加到了19层，尽管深度很深，但是网络的权重的数量是不大于一个更浅更宽的网络的。

最后我们在来看看整体网络的架构（2.1）。

从上面几段话，可以总结如下：

每个模型的输入都是 224x224 大小的RGB图片，而且需要在训练集上进行正则化。
在卷积层中使用的是 3x3 的卷积核，在模型 C 中使用了 1x1 的卷积核
六个模型都有5个最大池化层，并且池化层中使用的都是 2x2 的卷积核，并且 stride 为 2
所有的隐藏层都有激活函数
LRN（局部响应正则化）不能改善性能，反而会导致增加内存消耗和时间消耗

3. Classification Framework

下面我们接着看第3节，该节主要描述的是网络中训练和评估的细节。我们先从 3.1 的 Training 开始。

3.1 Training

以上几段主要介绍了在训练过程中参数的设置以及初始化，以及扩充数据集的方法。总结如下：

batch_size = 256
momentum = 0.9
$L_2$ 正则项： $5·10^{-4}$
dropout：p = 0.5
learning rate：0.01（当验证集准确度不变时，learning rate 变为原来的 1/10）
随机初始化权重，然后用模型 A 进行训练，然后将优化后得到的权重作为更深层的网络的前4层卷积层和最后3个全连接层的初始化权重，并且这些层的学习率不进行衰减。其余层进行进行随机初始化，权重初始化为均值为0，方差为0.01的正态分布，偏差为0。
但是他们在论文提交之后发现，可以不用上面的方法初始化权重，直接使用 Glorot & Bengio(2010) 的随机初始化程序就能得到很好的效果。下面是 Glorot & Bengio 的初始化方法。
他们使用随即裁剪的方式将输入的图片大小固定在 224x224。为了扩充数据集，采用随机水平翻转和随机RGB颜色扰动

下面是对于训练图片大小的设置。

上面采取了两种方法来设置训练图片的大小 S。

第一种方法：固定 S，在实验中，评估模型用了两种图片大小：256 和 384。第一次训练固定图像大小 S = 256，为了加快 S = 384 的网络，将 S = 256 模型训练得到的参数作为 S = 384 模型的初始化权重，初始化学习率为 0.001
第二种方法：多尺度的训练。不固定训练图片的大小，将其固定在一个范围中 [256, 512]，在训练时，考虑到不同尺度的图片作为训练集训练网络对训练是有益的，也可以看做通过尺度抖动增加训练数据集。这样训练出来的模型可以识别各种大小的图片，由于速度方面的原因，我们训练多尺度模型的方法是对相同配置的单尺度模型的所有层进行微调，预先用固定的S = 384进行训练。

3.2 Testing

下面让我们来看一下测试数据集。

总结如下：

用一张测试图片的不同大小进行测试，最后取这些结果的平均值作为该图片的结果，这样也会改善性能。
在最后一个卷积层的最后我们需要做一个最大/平均池化，为了使得能够和全连接层连接上，所以需要将最后一个卷积层的输出进行规定。

举个栗子：假设输入的图片大小为 224x224x3，那么最后一个卷积层的输出为 7x7x512。那么如果输入图片大小为 448x448x3，那么最后一个卷积层的输出为 14x14x512。这样两个不同的尺度就不能连接同一个全连接层，所以需要对最后一个卷积层的输出做一个规定大小。那么只需要对他们做一个均值（最大）池化操作，7x7x512 池化之后就是 512，14x14x512 池化之后也是 512，这样就能与全连接层相连接了。

通过水平翻转图像增加扩充测试数据集，最后将原始图片和翻转后的图片的结果平均值作为该图片的最终结果。
我们在评估网络时，把每张图片变为3个尺寸，从每个尺寸的图片中随即裁剪出50个不同的图片，然后一张图片就变成了150张图片

3.3 Implementation Details

最后我们再来看看实现细节（3.3）

总结：

网络进行训练和评价以及训练和评估全尺寸多尺度图像都是使用一个系统上的多个 GPU 。多 GPU 训练利用数据并行性，将每批训练图像分割成若干 GPU 批次，在每个GPU上并行处理。计算完 GPU 批处理梯度后，取其平均值，得到整个批处理的梯度。梯度计算是同步的跨 GPU，因此结果和单一 GPU 训练是完全相同的。

网络在4个 NVIDIA Titan Black GPUs 训练单个网络花费了 2-3 周。

4. Classification Experiments

在第4节中，主要呈现了在 ILSVRC-2012 数据集上的分类结果，分类表现主要有两种评价指标：top-1 and top-5 errro，top-5 error 是 ILSVRC 的主要评价指标。

4.1 Single Scale Evaluation

单尺度评估。首先我们来看看4.1小节给出的表格。

对于模型 A，A-LRN，B，它们都采用的是固定 S = 256，并且我们发现模型 A-LRN 的表现还没有模型 A 好，所以对于后面的模型，都没有使用 LRN（局部响应正则化），但是我们观察到从模型 A 到模型 B，随着深度的增加，top-1 和 top-5 error 也在下降。

再来观察模型 C、D、E，它们的 train 都测试了3种图片尺度，分别是 S=256，S=384，S=[256;512]。我们只看三个模型的 S=256 和 S=384，我们很容易发现不管哪一种模型，当 S=384，其模型的 top-1 和 top-5 是要优于 S=256 的。那是因为图片的分辨率越高，我们能够更容易捕捉到一些空间特征，所以其分类准确度就越高。

最后，我们再来看看的三种模型的 S=[256;512] 的这种情况，我们很容易发现这种情况的分类结果不管在哪一种模型中都是表现最好的。这也证明了通过尺度来扩充训练集确实有助于捕获多尺度图像统计。

4.2 Multi-Scale Evaluation

多尺度评估。主要评估在测试阶段尺度抖动对分类准确度影响。当用固定图片大小S进行训练得到的模型，会用一张测试图片的三种尺寸大小进行评估，那么三种图片大小分别为：S-32，S，S+32。当训练时不是使用的固定 S 进行训练，S 是一个变量，属于 [ $S_{min}$ , $S_{max}$ ]，那么我们在评估时，测试图片的大小分别是： $S_{min}$ , $0.5(S_{min} + S_{max})$ , $S_{max}$ 。

评估结果如下：

根据表格我们可以得出结论：在测试阶段的尺度抖动相较于单尺度的相同模型会有更好的表现。其中模型 D 和 E 表现最好。表现最好的单个网络在验证数据集上 top-1 和 top-5 error 达到了 24.8%/7.5%，在测试数据集上，模型 E 达到了 7.3 % 的 top-5 error。

4.3 Multi-Crop Evaluation

多裁剪评估。这里主要用到两种评估方法，一种是 dense，即评估时所使用的图片是整张图片，不经过任何裁剪。那么另一种就是 multi-crop，就是评估时使用的是裁剪后的图片。评估结果如下表：

从评估结果来看，使用 multi-crop 要比使用 dense 的表现稍微好一些，而且两种方法结合使用的表现比单独使用任何一种方法的效果都要好，因为两种方法是互补的。

4.4 Convent Fusion

模型融合。通过融合几种模型，最后取各个模型的 soft-max 结果的平均值作为模型的输出。下面是融合不同模型得到的实验结果。

可以从实验结果发现，融合一个模型 D 和模型 E ，并且在评估时使用 multi-crop 和 dense 的方法得到的表现最好。

4.5 Comparison With The State Of The Art

主要是和 ILSVRC 比赛中表现比较好的模型进行比较，下表是在挑战赛中表现比较好的模型。

在 2014 年的挑战赛中，GoogLeNet 以 6.7% 的 error 夺冠，VGGNet 以 6.8% 的 error 获得第二名。但是如果从一个网络的分类准确度来看，VGG 是以 7.0% 的 error 要优于 GoogLeNet 的 7.9%。

论文总结

在研究完每篇论文之后，我们都需要做一个总结。

那么我们先来看一下这篇论文的总结是什么?

再次强调了深度确实能够增加分类准确度。

下面就来进行自我总结。

创新点

整个网络都采用 3x3 的卷积核，从而增加神经网络的深度。两个3x3卷积核的堆叠代替一个5x5卷积核，三个3x3卷积核代替一个7x7卷积核。这样一方面能够减少参数的数量，另一方面拥有更多的非线性变化。
在卷积结构中引入1x1的卷积核，在不影响输入输出维度的情况下，引入非线性变换，增加网络的表达能力，降低计算量
通过预训练的方式来更好的初始化权重，加快训练的收敛速度
采用 Multi-Scale 的方式训练和预测，可以扩充数据集，防止过拟合，提升预测准确率。
深层网络更适合于大的数据集

启发点

深度能够提高网络的分类准确率
为了加快收敛速度，可以使用预训练的方式初始化权重
在更深层的网络中，LRN方法并没有什么用，反而会导致内存和时间的消耗
通过堆叠小卷积核可以减少网络参数，增加网络深度，提升网络性能
在训练和测试使用 Multi-Scale 可以扩充数据集，防止过拟合

复现代码见 VGGNet

最好分类准确度达到了 80% 左右。

深度学习论文: CAS-ViT: Convolutional Additive Self-attention Vision Transformers mingo_敏 Paper Reading 深度学习人工智能
深度学习论文:CAS-ViT:ConvolutionalAdditiveSelf-attentionVisionTransformersforEfficientMobileApplicationsCAS-ViT:ConvolutionalAdditiveSelf-attentionVisionTransformersforEfficientMobileApplicationsPDF:https:/
深度学习论文: Image Segmentation Using Text and Image Prompts mingo_敏 Paper Reading Semantic Segmentation 深度学习人工智能
深度学习论文:ImageSegmentationUsingTextandImagePromptsImageSegmentationUsingTextandImagePromptsPDF:https://arxiv.org/abs/2503.10622v1PyTorch代码:https://github.com/shanglianlm0525/CvPytorchPyTorch代码:https://g
SD模型微调之LoRA 好评笔记补档深度学习计算机视觉人工智能面试 AIGC SD stable diffusion
大家好，这里是Goodnote（好评笔记），关注公主号Goodnote，专栏文章私信限时Free。本文是SD模型微调方法LoRA的详细介绍，包括数据集准备，模型微调过程，推理过程，优缺点等。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习论文概念核心原理优点训练过程预训练模型加载选择微调的层LoRA优化的层Cross-Attention（跨注意力）层Self
深度学习论文阅读路线图喜欢打酱油的老鸟深度学习论文阅读路线图深度学习论文阅读路线图论文阅读路线图
https://www.toutiao.com/a6703859415763649031/作者：floodsun编译：ronghuaiyang这是作者一年前整理的东西，有些最新的论文没有包含进去，但是对于新手来说，入门足够了！如果你是深度学习领域的新人，你的第一个问题可能是“我该从哪些论文开始读起呢？”这就是深度学习论文的阅读路线图！这个路线图是根据下面几个规则构建的：从概要到细节从老的到最新的业
深度学习论文: Cultivated Land Extraction from High-Resolution Remote Sensing Image mingo_敏 Paper Reading Deep Learning Instance Segmentation python 人工智能机器学习
深度学习论文:CultivatedLandExtractionfromHigh-ResolutionRemoteSensingImageTheWinningSolutiontotheiFLYTEKChallenge2021CultivatedLandExtractionfromHigh-ResolutionRemoteSensingImagePDF:https://arxiv.org/pdf/22
深度学习论文精读（7）：MTCNN hwl19951007 计算机视觉论文精读
深度学习论文精读（7）：MTCNN论文地址：JointFaceDetectionandAlignmentusingMulti-taskCascadedConvolutionalNetworks译文地址：https://zhuanlan.zhihu.com/p/37884254参考博文1：https://zhuanlan.zhihu.com/p/38520597官方地址：https://kpzhan
易 AI - 使用 TensorFlow 2 Keras 实现 AlexNet CNN 架构 CatchZeng
原文：https://makeoptim.com/deep-learning/yiai-alexnet-implementation前言网络结构实现SequentialSubclassingDemo小结参考前言上一篇笔者使用如何阅读深度学习论文的方法阅读了AlexNet。为了加深理解，本文带大家使用TensorFlow2Keras实现AlexNetCNN架构。网络结构image从上一篇可以得到Al
【初读论文】 Selvaggia 深度学习 python
这里写目录标题万字长文解析深度学习中的术语面向小白的深度学习论文术语（持续更新）deepsolo不懂的知识pipelinebaselineRoI(RegionofInterest)分类问题中的正例负例指示函数（indicatorfunction）模型性能评估指标（PRF1……）深度学习中的FPN详解CNN解码Transformer：自注意力机制与编解码器机制详述与代码实现deepsolo前言知乎深
第4周：Pytorch——综合应用和实战项目 Day 28-30: 学习资源和社区参与 M.D 学习 pytorch tensorflow
第4周：综合应用和实战项目Day28-30:学习资源和社区参与在这个阶段，我们将探索更多的学习资源并鼓励参与PyTorch和TensorFlow的社区，以进一步提升技术和融入开发者社群。学习资源：论文：阅读最新的机器学习和深度学习论文，了解领域的最新进展。推荐资源包括arXiv、GoogleScholar。博客和教程：关注行业知名博客和教程，如TowardsDataScience,Medium,P
深度学习论文解读分享之diffGrad：一种卷积神经网络优化方法曦曦逆风深度学习深度学习 cnn 人工智能
IEEETNNLS2020：diffGrad:一种卷积神经网络优化方法题目diffGrad:AnOptimizationMethodforConvolutionalNeuralNetworks作者ShivRamDubey,Member,IEEE,SoumenduChakraborty,SwalpaKumarRoy,StudentMember,IEEE,SnehasisMukherjee,Membe
AI 论文精读，中文视频讲解：剖析人工智能本质 | 开源日报 No.120 开源服务指南开源日报人工智能开源
mli/paper-readingStars:21.8kLicense:Apache-2.0深度学习论文精读是一个深度学习相关论文列表，包括计算机视觉、生成模型、自然语言处理等多个领域。该项目的核心优势和特点包括：提供了大量关于深度学习各领域热门文章内容对不同年份发表的有较高引用率或近期比较有意思的文章进行详尽解读涵盖了计算机视觉、生成模型、自然语言处理等多个方面，为广大研究者提供全面而专业的知识
深度学习论文阅读：Generative Pre-Training(GPT) 阿正的梦工坊 DL Papers 深度学习 GPT BERT transformer
文章目录GPTAbstract1Introduction6Conclusion2RelatedWork3Framework3.1Unsupervisedpre-trainingGPT和BERT的区别3.2Supervisedfine-tuning3.3Task-specificinputtransformations4Experiments总结参考GPT核心点：预训练一个transformerde
推荐·人工智能+深度学习论文阅读小组我的昵称违规了
Pytorch学习到第5篇论文，这篇论文解读很少，就在网上搜了一下，不经意发现这个小组，推荐给大家。似乎不让放外链？我试一下PaperWeeklyPaperWeekly论文阅读小组阅读论文是小众活动，阅读者分散在全球各地。PaperWeekly论文阅读小组，把分散在全球的华人阅读者，聚合在一起。不仅互帮互助读懂论文，而且通过讨论，激发灵感。进入PaperWeekly的网站，阅读者不仅可以看到本周热
经典深度学习论文中英文翻译 MrUncle德鲁机器学习论文翻译深度学习中英文
DeepLearningPapersTranslation(CV)仅为方便查看。本文转自：SnailTyan的Github（侵删）ImageClassificationAlexNetImageNetClassificationwithDeepConvolutionalNeuralNetworks中文版中英文对照VGGVeryDeepConvolutionalNetworksforLarge-Sca
使用 PointNet 进行3D点集（即点云）的分类 TD程序员深度学习开发实践系列分类数据挖掘人工智能机器学习神经网络 3d
点云分类介绍无序3D点集（即点云）的分类、检测和分割是计算机视觉中的核心问题。此示例实现了开创性的点云深度学习论文PointNet（Qi等人，2017）。设置如果使用colab首先安装trimesh!pipinstalltrimesh。importosimportglobimporttrimeshimportnumpyasnpimporttensorflowastffromte
[深度学习论文笔记]Hybrid Window Attention Based Transformer Architecture for Brain Tumor Segmentation SerendipityQYK 深度学习之医学图像分割论文深度学习 transformer 医学图像处理肿瘤分割人工智能
HybridWindowAttentionBasedTransformerArchitectureforBrainTumorSegmentation基于混合窗口注意力的Transformer结构脑肿瘤分割Author：HimashiPeiris,MunawarHayat,ZhaolinChen,GaryEgan,MehrtashHarandiUnit：MonashUniversitySubmitt
FlyAI小课堂：深度学习论文翻译解析（3）：丰富的特征层次结构，可实现准确的目标检测和语义分割 iFlyAI 竞赛深度学习目标检测机器翻译目标检测语义分割深度学习
论文标题：Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation标题翻译：丰富的特征层次结构，可实现准确的目标检测和语义分割论文作者：RossGirshickJeffDonahueTrevorDarrellJitendraMali论文地址：http://fcv2011.ulsan.ac.kr/files/ann
深度学习论文翻译 -- Inception-v4，Inception-ResNet and the Impact of Residual Connections on Learning X_Imagine 深度学习论文翻译 Inception-V4 图像分类深度学习
本文翻译论文为深度学习经典模型之一：Inception-V4论文链接：https://arxiv.org/pdf/1602.07261.pdf摘要：近些年，超深度卷积网络成为图像识别领域的核心算法。其中，Inception结构在图像分类中表现优秀，并且计算代价很低。最近，残差与更加传统的结构相结合，在ILSVRC挑战中获得Start-of-art的结果（与Inception-v3）的分类精度差不多
机器学习/深度学习论文里的损失函数 L字体书写方式 Echo_ac python
损失函数L\mathcal{L}L：\mathcal{L}损失函数l\mathcal{l}l：\mathcal{l}
深度学习论文: ISTDU-Net：Infrared Small-Target Detection U-Net及其PyTorch实现 mingo_敏 Paper Reading Deep Learning Semantic Segmentation 深度学习 pytorch 人工智能
深度学习论文:ISTDU-Net：InfraredSmall-TargetDetectionU-Net及其PyTorch实现ISTDU-Net：InfraredSmall-TargetDetectionU-NetPDF:https://doi.org/10.1109/LGRS.2022.3141584PyTorch代码:https://github.com/shanglianlm0525/CvPy
深度学习论文: Rethinking Mobile Block for Efficient Attention-based Models及其PyTorch实现 mingo_敏 Paper Reading Deep Learning 深度学习 pytorch 人工智能
深度学习论文:RethinkingMobileBlockforEfficientAttention-basedModels及其PyTorch实现RethinkingMobileBlockforEfficientAttention-basedModelsPDF:https://arxiv.org/pdf/2301.01146.pdfPyTorch代码:https://github.com/shang
ICCV 2023 | Ada3D: 利用动态推理挖掘3D感知任务中数据冗余性 AITIME论道 3d
点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入！以下内容来源于将门创投作者：赵天辰机构：清华大学电子工程系研究方向：硬件友好的高效深度学习论文标题：Ada3D:ExploitingtheSpatialRedundancywithAdaptiveInferenceforEfficient3DObjectDetection论文地址：https://arxiv.org/abs/2307.0820
深度学习论文分享（六）Simple Baselines for Image Restoration 澪mio 深度学习论文分享深度学习人工智能
深度学习论文分享（六）SimpleBaselinesforImageRestoration前言Abstract1Introduction2RelatedWorks2.1ImageRestoration2.2GatedLinearUnits3BuildASimpleBaseline3.1Architecture3.2APlainBlock3.3Normalization3.4Activation3.
深度学习论文分享（七）Denoising Diffusion Probabilistic Models for Robust Image Super-Resolution in the Wild 澪mio 深度学习论文分享深度学习人工智能
深度学习论文分享（七）DenoisingDiffusionProbabilisticModelsforRobustImageSuper-ResolutionintheWild前言Abstract1.Introduction2.BackgroundonDiffusionModels3.RelatedWork4.Methodology4.1.Architecture4.2.Higher-orderde
深度学习论文分享（八）Learning Event-Driven Video Deblurring and Interpolation 澪mio 深度学习论文分享深度学习人工智能
深度学习论文分享（八）LearningEvent-DrivenVideoDeblurringandInterpolation前言Abstract1Introduction2Motivation2.1PhysicalModelofEvent-basedVideoReconstruction2.2SpatiallyVariantTriggeringThreshold3ProposedMethods3.
深度学习论文: Segment Any Anomaly without Training via Hybrid Prompt Regularization mingo_敏 Unsupervised Anomaly Detection Paper Reading Deep Learning 深度学习 prompt 人工智能
深度学习论文:SegmentAnyAnomalywithoutTrainingviaHybridPromptRegularizationSegmentAnyAnomalywithoutTrainingviaHybridPromptRegularizationPDF:https://arxiv.org/pdf/2305.10724.pdfPyTorch代码:https://github.com/sh
年末回顾：2021年 AI 领域十大研究趋势及必读论文夕小瑶人工智能大数据算法编程语言 python
编|小轶，Yimin_饭煲在本文中，我们将梳理近百篇的最新深度学习论文，以总结出“2021年十大AI研究趋势”。AI领域的论文可谓层出不穷。这篇文章或许能帮助你跟踪总体趋势和重要研究。下文中提及的部分工作可能并不发表于2021年，但对于形成2021年的AI趋势也起到了重要作用，因而也在本文中列出。1.OpenAICLIPOpenAI今年年初发布的CLIP模型可以说是今年AI行业最重要的里程碑。CL
深度学习论文: RepViT: Revisiting Mobile CNN From ViT Perspective及其PyTorch实现 mingo_敏 Paper Reading Deep Learning 深度学习 cnn pytorch
深度学习论文:RepViT:RevisitingMobileCNNFromViTPerspective及其PyTorch实现RepViT:RevisitingMobileCNNFromViTPerspectivePDF:https://arxiv.org/pdf/2307.09283.pdfPyTorch代码:https://github.com/shanglianlm0525/CvPytorch
深度学习论文: Towards Total Recall in Industrial Anomaly Detection及其PyTorch实现 mingo_敏 Unsupervised Anomaly Detection Paper Reading Deep Learning 深度学习 pytorch 人工智能
深度学习论文:TowardsTotalRecallinIndustrialAnomalyDetection及其PyTorch实现TowardsTotalRecallinIndustrialAnomalyDetectionPDF:https://arxiv.org/pdf/2106.08265.pdfPyTorch代码:https://github.com/shanglianlm0525/CvPyt
万字长文解析深度学习中的术语追忆苔上雪深度学习人工智能 pytorch 机器学习神经网络
引言新手在学习深度学习或者在看深度学习论文的过程中，有不少专业词汇，软件翻译不出来，就算是翻译出来也看不懂，因为不少术语是借用其他学科的概念，这里整理了一些在深度学习中常见的术语，并对一些概念进行解释。这里先教大家一个查概念的方法，比如我想查Ablationstudy，这个中文翻译是消融实验，这概念谁能明白呢，咱们可以从根源去查消融实验的含义，打开google，直接搜whatisxxxindeep
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修