freefly0706

VGGNet学习笔记

1 简介

VGGNet 是牛津大学计算机视觉组等在 2014 年提出的深度卷积神经网络，该网络在 ILSVRC-2014 的定位和分类任务中分别获得了第一名和第二名。2012 年 AlexNet 的提出引爆了神经网络的应用热潮，随后有很多改进 AlexNet 的尝试，比如：2013 年的 ZFNet 在第一个卷积层使用更小的卷积核和更小的卷积步长、在整张图像和多个尺度上密集地训练和测试网络等，而 VGGNet 讨论了卷积网络架构设计的另一个重要方面——深度。VGGNet 的结构定义非常简洁，卷积层具有相同大小的卷积核，都为 3×3，并且 stride=1，采用 SAME padding；池化层的核大小为 2×2，并且 stride=2。由于使用了很小的卷积核，通过添加更多的卷积层来稳定地增加网络深度的方案变得可行。VGGNet 的拓展性很强，迁移到其它的数据集上也具有很好的泛化能力，另外，VGGNet 还可以被用做图像特征提取。

2 网络架构

在训练阶段，VGGNet 网络输入的是大小为 224 × 224 的图像，作者对图像做了一个预处理：每个像素减去在训练集上计算的 RGB 均值。VGGNet 的所有卷积层使用了相同的 3 × 3 大小的卷积核 (这是捕获左/右、上/下、中心概念的最小尺寸)，卷积步长固定为 1，各卷积层采用 SAME padding。VGGNet 的池化层使用了最大池化，核大小为 2 × 2，步长为 2，相当于将输入减半。VGGNet 拥有 5 个卷积段，每一段内有 2 ~ 3 个卷积层，段内的卷积核数量相等，卷积层的通道数起始为 64，随后每经过一个卷积段通道数乘以 2，直至 512，每个卷积段都后接了一个最大池化层，即共有 5 个池化层。不同级别的 VGGNet 网络结构如图 2.1 所示，其中，A-LRN 在第一个卷积层使用了 AlexNet 中的 LRN (局部响应归一化)，但该归一化没有改善模型 A 在 ILSVRC 数据集上的性能，反而增加了内存消耗和计算时间；另外，模型 C 较模型 B 添加了 1 × 1 卷积层，1 × 1 卷积在不影响卷积层感受野的情况下增加了决策函数的非线性 (虽然 1 × 1 的卷积操作是线性的，但是 ReLU 增加了非线性)，与模型 B 相比，模型 C 具有更好的性能。但是模型 C 的性能不如模型 D，表明了尽管附加非线性确实有助于模型性能的提升，但是通过使用具有更大感受野的卷积核来捕获空间上下文也非常重要。

图 2.1 VGGNet 网络结构图

      VGGNet 的网络配置与 AlexNet 和 ZFNet 有很大的不同，与 AlexNet 和 ZFNett 在第一层使用较大的感受野不同 (AlexNet 使用了 11 × 11 的卷积核，4 的卷积步长；ZFNet 中使用 7 × 7 的卷积核，2 的卷积步长)，VGGNet 整个网络都是用了非常小的 3 × 3 的感受野，卷积步长为 1。两个 3 × 3 的卷积层(中间不带空间池化)和一个 5 × 5 的卷积层具有相同的感受野(假设输入的是一个 5 × 5 的图像，用 3 × 3 的卷积核卷积之后输入图像变成 3 × 3，再用一个 3 × 3 的卷积核卷积后输入图像变成 1 × 1。这和直接用一个 5 × 5 的卷积核卷积图像是一样的效果)，三个 3 × 3 的卷积层串联相当于一个 7 × 7 卷积层的感受野。使用三个 3 × 3 的卷积层替代单个 7 × 7 的卷积层有如下两个好处：
      1) 增加非线性。引入三个 ReLU 单元而不是单单一个，使得决策函数更具辨别力；
      2) 减少模型参数。假设输入与输出的通道数都为 C，则三组 C 个 3 × 3 × C 卷积核的参数个数为

3×(32C)×C=27C2 3 × ( 3 2 C ) × C = 27 C 2 ，而一组 C 个 7 × 7 × C 卷积核的参数个数为

(72C)×C=49C2 ( 7 2 C ) × C = 49 C 2 。
使用多个串联的小的卷积层替代单个大的卷积存在一个不足：在进行反向传播时，中间的卷积层可能会导致占用更多的内存。

3 分类框架

3.1 训练

      VGGNet 通过使用带有动量的小批量梯度下降来优化多项逻辑回归目标函数以进行模型的训练，使用了L2正则化并且在前两个全连接层中使用了 Dropout。与 AlexNet 训练时学习率的设置相同，采用启发式的方法进行学习率的调整，即在验证错误率停止下降时将当前的学习率除以 10，整个训练过程学习率共减小了 3 次。虽然 VGGNet 较 AlexNet 具有更多的参数，但是 VGGNet 的收敛速度比 AlexNet 快，原因可能为：① 更大的深度和更小的卷积核所带来的隐性的正则化；② 某些层的预初始化。
      网络权重的初始化很重要，因为坏的初始化可能由于深度网络中梯度的不稳定性而导致网络停止学习。为了规避这个问题，作者使用了一个小技巧：先训练图 2.1 中较浅的网络 A，使用随机初始化的方法初始化 A 的权重；然后在训练更深的模型时使用 A 初始化前四个卷积层和最后的三个全连接层，对中间的层应用随机初始化。随机初始化的中，从均值为 0，方差为 0.01 的正态分布中抽样权重，偏置初始化为 0。
      为了获得VGGNet固定大小的输入(224 × 224)，作者采用了从重缩放训练样例中随机裁剪的方法，每一次 SGD 迭代裁剪一个。为了进一步扩大训练集，对裁剪的图片进行随机的水平翻转和随机的颜色转移。
      训练图片大小。令 S 表示各向同性缩放的训练图片中较小的边，从中截取网络的输入。当裁剪尺寸固定为 224 × 224 时，原则上 S 可以取不小于 224 的任何值：当 S = 224 时，裁剪将会捕获整个图像的统计数据，将会完整横跨训练图像的最小边；当 S >> 224 时，裁剪仅对应于原始图片很小的一部分，包含一个目标或者目标的一部分。作者使用了两种设置训练尺寸 S 的方法：
      1）固定 S 的大小，对应了单一尺度的训练。作者使用了两个 S 值，分别为 S = 256 和 S = 384。给定一个网络配置，首先使用 S = 256 进行训练，为了加快对 S = 384 网络的训练，使用 S = 256 预训练的结果进行权重初始化；
      2）多尺度(Multi-scale)训练，使用从 [Smin,Smax] 中随机抽样的 S 对每个训练图片单独地进行重缩放(作者设置 Smin=256 ， Smax=384 )。因为图像中的目标可能具有不同的大小，因此在训练期间将这一点考虑进去是非常有益的，也可以认为通过尺度抖动(scale jittering)增加了训练集的数量，其中训练的单个模型可以识别较大范围尺度上的目标。出于速度上的考虑，作者通过微调具有相同配置的单尺度模型的所有层来训练多尺度模型，使用固定的 S = 384 进行预训练。

3.2 测试

      测试流程如下：
      1）将输入图片各向同性缩放发到尺寸 Q，Q 是预定义的图像的最小边。Q 并不一定与 S 相等，对于每个 S 使用几个不同的 Q 值可以带来网络性能的提升。
      2）将缩放后的测试图片输入到网络中进行计算。首先将全连接层转化为卷积层(第一个 FC 层转换为 7 × 7 的卷积层，后两个 FC 层转化为 1 × 1 卷积层)，然后将得到的全卷积网络应用于整个(未裁剪)图片。网络计算的结果是一个类别分数图，其中通道数量等于类别数量，可变的空间像素取决于输入图片的大小。最后，对类别分类图进行空间平均，从而获得测试图像的固定大小的类别分数向量(即将不同窗口的分类结果平均)。另外，作者对测试图片进行了水平翻转，将原始图像和翻转图像的 soft-max 分类后验概率进行平均以获得该图像分类的最终分数。
      因为在整个图像上应用了全卷积神经网络，所以在测试时不需要从多个裁剪中进行抽样。采用抽样的方式很低效，因为网络需要对每个裁剪重新进行计算。但是与此同时，使用大量的裁剪相较于全卷积网络具有更精细的采样，因此可以带来精度的提升。此外，由于不同的卷积边界条件，多裁剪评估与密集评价互补：当将网络应用于剪裁的图像时，卷积特征图用 0 进行填充；而在密集评估时，用于相同的裁剪的图像的填充自然来自于图像的相邻部分，这大大增加了整个网络的感受野，因此可以捕获到更多的上下文信息。但是作者认为，在实践中多采样所带来的计算时间的增加与潜在的准确率提升并不相称。

3.3 实现细节

可以在单系统多 GPU 的环境中训练和评估 VGGNet，并且可以在多尺度上对全尺寸的图片进行训练和评估。多 GPU 训练利用了数据并行化，通过将每批训练图像分割成若干个 GPU 小批块来在每块 GPU 上并行处理。在计算出 GPU 小批块梯度之后，对它们进行平均以获得整个批次的梯度。梯度计算在多个GPU上是同步的，因此与在单个GPU上训练时的结果完全相同。

4 分类实验

在大部分的实验中，作者使用验证集作为测试集，在测试集上也进行了一些实验并提交给了官方的 ILSVRC 服务器。

4.1 单一尺度评估

测试图片的大小设置如下：对于固定的 S，Q = S；对于抖动的 S∈[Smin,Smax] ， Q=0.5(Smin+Smax) 。测试结果图表 4.1 所示。

表4.1 单测试尺度网络性能

从表 4.1 可以看出，① 使用局部响应归一化(A-LRN)并没有改善模型 A (没有使用任何归一化层)的性能；② 分类误差随着网络深度的增加而减小。作者构建了一个使用 5 × 5 卷积的浅层神经网络，该网络的构建是通过将 B 中每一对 3 × 3 卷积替换为 5 × 5 卷积实现的，因此两个模型的卷积层拥有相同的感受野，最后 5 × 5 卷积的浅层神经网络的 top-1 错误率比模型 B 高了 7%，证明了使用小卷积核的深层网络比使用大卷积核的浅层网络性能更好。此外，即使在测试时使用单一的尺度，训练时的尺度抖动 (

S∈[Smin,Smax] S ∈ [ S m i n , S m a x ] ) 比在具有固定最小边 (

S=256或S=384 S = 256 或 S = 384 ) 的图像上训练具有更好的结果。这证实了通过尺度抖动增加训练集确实有助于捕获多尺度图像统计数据。

4.2 多尺度评估

多尺度评估在测试的时候评估尺度抖动的影响。它包括在一个测试图像的几个重缩放版本上 (对应于不同的 Q 值) 运行一个模型，然后平均所得到的类的后验概率。考虑到训练和测试尺度之间大的差异会导致性能的下降，使用固定的 S 训练的模型在三个测试图像尺度（接近于训练时的尺度：Q={ S - 32, S , S + 32}）上进行评估。同时，训练时的尺度抖动使得网络在测试时应用于更宽的尺度范围，因此使用变化的 S∈[Smin,Smax] 训练模型，并在较大的尺度范围内进行评估 ( Q={Smin,0.5(Smin+Smax),Smax} )。测试结果如表 4.2 所示。

表 4.2 多测试尺度网络性能

表 4.2 表明，测试时的尺度抖动可以带来更好的性能。另外，以之前一样，最深的配置(D 和 E)表现最好，并且使用尺度抖动比固定最小边 S 的训练效果要好。

4.3 多裁剪评估

在表 4.3 中，作者比较了密集 ConvNet 评估和多裁剪评估。此外，作者还通过平均它们的 Softmax 输出来评估两种评估技术的互补性。可以看出，使用多剪裁表现要略好于密集评估，并且这两种方法确实是互补的，因为它们的结合优于它们中的每一种。如 3.2 节描述，作者猜测这是由于卷积边界条件的不同处理造成的。

表 4.3 多裁剪评估

4.4 模型融合

不同模型融合方案的结果如表4.4 所示。

表 4.4 多模型融合结果

从表中可以看出，只融合 D 和 E 两个模型比融合 7 个模型的测试误差更小。

5 结论

深度有益于分类准确度。

参考文献

[1] https://blog.csdn.net/wangsidadehao/article/details/54311282
[2] https://blog.csdn.net/marsjhao/article/details/72955935
[3] https://blog.csdn.net/wcy12341189/article/details/56281618

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程牙牙要健康深度学习 onnx onnxruntime 深度学习 python 人工智能
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论文章目录【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程前言模型转换--pytorch转onnxWindows平台搭建依赖环境onnxruntime调用onnx模型ONNXRuntime推理核
基于深度学习的多模态信息检索 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的多模态信息检索（MultimodalInformationRetrieval,MMIR）是指利用深度学习技术，从包含多种模态（如文本、图像、视频、音频等）的数据集中检索出满足用户查询意图的相关信息。这种方法不仅可以处理单一模态的数据，还可以在多种模态之间建立关联，从而更准确地满足用户需求。1.多模态信息检索的挑战异构数据表示：多模态数据通常具有不同的特征和表示形式（如文本的词嵌入与图
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h