hrsstudy

Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning 论文笔记

Abstract

近年来，机器视觉图像识别领域取得了很大的突破，非常深的卷积神经网络为此立下首功。一个典型的例子是Inception结构在一个相对较低的计算代价下取得了较好的性能。ILSVRC 2015 竞赛中残差连接和传统网络结构相结合取得了state-of-the-art的性能，几乎和InceptionV3网络相近。因此我们自然而然的想到，把Inception结构和残差连接进行结合，会不会更好？作者通过实验证明，残差连接可以显著加速Inception网络的训练，同时加入了残差连接的Inception网络比计算量相近的没有残差连接的Inception网络性能略好一点点。作者在论文中提出了几个新的流线型网络结构，包括有残差连接的和没有残差连接的Inception网络，这些网络的变种在ILSVRC 2012 分类任务上显著改善了单框架识别性能。作者还进一步证明了合适的激活值缩放比例如何稳定较宽residual Inception的训练。使用3个Inception-ResNet-V2模型和1个InceptionV4模型进行集成，作者在ImageNet 分类任务的测试集上取得了3.08% top-5 error。

一、Introduction

自从Krizhevsky使用AlexNet赢得2012 ImageNet 竞赛，AlexNet被成功应用在很多机器视觉领域，如目标检测、分割、人体姿态识别、视频分类、目标跟踪、超分辨率。这些例子只是深度卷积网络成功应用的应用场景中的一部分。
在本篇论文中作者研究了两种思想的结合：何恺明的Deep residual learning for image recognition论文中提出的残差连接和另一篇论文Rethinking the inception architecture for computer vision中提出的InceptionV3。在论文Deep residual learning for image recognition中讨论了残差连接对于训练非常深的网络很重要。因为Inception网络通常都很深，在Inception结构的连接阶段使用残差连接是很自然的，这使新的Inception网络在享受到残差方法带来的好处的同时保留计算效率。
除了把InceptionV3和残差连接进行直接的前向传播集成，作者也研究了是否可以通过让Inception变得更宽、更深来使其更有效。出于这个目的，作者设计了结构更整齐、简单，比InceptionV3拥有更多Inception模块的InceptionV4。从历史的观点来看，InceptionV3继承了其他早期Inception版本的包袱，技术上的约束主要来自使用DistBelief分布式训练时需要分割模型。现在，因为移植到了TensorFlow，这些约束已经不是问题，作者可以更加简洁的设计网络结构。在本文的第三部分会详细介绍简化后的模型结构。
在论文中，作者将InceptionV3、InceptionV4两个模型和计算量相近的Inception-ResNet模型进行了比较。这些Inception-ResNet模型是在约束参数量和计算量与不加入残差连接的InceptionV3、InceptionV4相近的前提下人工挑选的。事实上，作者也测试了更大更宽的Inception-ResNet网络，但是在ImageNet图像分类数据集上表现出的性能没有大的变化。
论文最后的实验报告是对所有最好性能模型的集成模型的评估。InceptionV4和Inception-ResNet-V2的性能相近，在ImageNet 验证集上的性能都超过了其他state-of-the-art的单模型的精度。作者想把这些state-of-the-art的模型结合起来，看下集成后的模型精度能在ImageNet取得怎样的突破。让人吃惊的是，单模型精度的提高并没有给集成后的模型带来相近的精度提高。虽然如此，集成了4个模型的集成模型在验证集上依然达到了据作者当时所知的最高精度，top-5 error 降低到了3.1%。
在论文的最后一部分，作者研究了分类错误的图像，总结了模型的集成没有很好的处理数据集中标记的噪声，针对预测还有改进的空间。

二、Related Work

卷积网络在Krizhevsky赢得ImageNet 2012后变得越来越流行，在其发展历程上有一些突破性的里程碑，包括M. Lin提出的Network in network，Simonyan提出的VGG，Szegedy提出的GoogLeNet (InceptionV1)，Ioffe提出的加入BN的InceptionV2，Szegedy提出的使用因式分解改进网络的InceptionV3和何恺明提出的残差连接。Deep residual learning for image recognition论文中针对在图像识别尤其是目标检测领域中利用附加的融合后的残差信号的好处给出了令人信服的理论和实验依据。何恺明等作者讨论了残差连接对于训练非常深的卷积模型的内在必须性。但是本论文作者的研究结果并不支持这一观点，起码在图像识别领域如此。不过，可能需要在更深的网络结构中进行更多的研究来理解残差连接所带来的真正有益的方面。在实验部分，作者证明了不用残差连接来训练一个具有竞争性的很深的网络并不是很难。但是利用残差连接可以显著的提高训练速度，在何恺明的论文中这是一个重要的论据。

三、Architectural Choices

3.1 Pure Inception blocks

以前的Inception模型训练是以一种分割的方式进行的，为了能够在内存中恰好装下模型，模型的每份复制被分割成多个子网络。Inception的结构是高度可调的，很多层的滤波器的数量的改变很可能不影响整个训练好的网络的质量。为了优化训练速度，以前训练Inception模型的时候要小心翼翼的调整每一层的尺寸来平衡各个不同的子网络的计算量。在使用TensorFlow之后，我们不再需要在训练时分割模型的每份复制。这要得益于通过仔细考虑在梯度计算时哪些tensor是需要的，并构造计算来减少这些tensor的数量所实现的反向传播时内存使用的优化。以前，我们在改变网络结构时相对保守，限制修改孤立的网络组件以保证剩余网络的稳定。不简化之前的选择导致网络看起来比实际需要的样子显得更复杂。在新的实验中，针对InceptionV4 作者决定摆脱这种不必要的负担，对Inception模块每个特征图的尺寸进行了统一。图9是整个InceptionV4的网络结构，图3、4、5、6、7、8是网络中各个组件的细节。所有没有标记“V”的卷积层使用same-padded使输出特征图的尺寸和输入一致。标记“V”的卷积层使用valid padded，即卷积层的输入和上一层的输出完全相同，并且卷积层的输出的特征图的尺寸会响应的减小。

3.2 Residual Inception Blocks

针对加入残差连接版本的Inception网络，作者没有直接使用原始的Inception模块，而是用了计算代价更低的简化版本。每个Inception模块的后面都加了一个不带激活函数的1 × 1的卷积层，通过1 × 1的卷积层的卷积核数量来补偿Inception模块带来的通道损失，使Inception模块输出的维度可以匹配Inception模块输入的维度从而进行残差连接。
作者尝试了几种不同版本的引入残差连接的Inception网络，论文里只给出了两个版本的细节，分别是和InceptionV3的计算量相近的Inception-ResNet-v1以及和InceptionV4的计算量相近的Inception-ResNet-v2。图15是这两种网络的大致网络结构，和图中不太一致的是Inception-ResNet-v2的Inception-ResNet-A模块重复了10次；Inception-ResNet-B模块重复了20次；Inception-ResNet-C模块重复了9次之后又加了一个不带激活函数， scale=1 的Inception-ResNet-C模块，总计10个。值得一提的是，训练InceptionV4时每个step花费的时间明显增加了，可能是因为网络更大更深了。
还有一点需要注意的是，加入了残差连接的Inception网络没有对所有卷积层的输出都使用BN。虽然对所有卷积层的输出都使用BN规范化是有帮助的，但是GPU内存的开销会增大。在一个GPU上就能够训练整个模型的复制的前提下，每个Inception后新加的补偿通道损失的1 × 1的卷积层的输出没有使用BN进行规范化，节省下的GPU内存用来增加Inception模块的数量，这是作者再三权衡之后采取的方案。

3.3 Scaling of the Residuals

作者在训练模型的时候发现了一个问题，如果卷积核的数量超过1000，加入残差连接的Inception模型变得很不稳定，在训练的早期模型会死亡，即在平均池化层前面的最后一层的输出会在上万次iterations后只输出0。无论降低学习率或者是对这一层加入额外的BN都不能阻止模型死亡。
作者发现，在残差连接前以一定比例线性降低Inception模块的输出可以稳定训练。这个比例参数通常选择在0.1到0.3之间。如图20所示。

何恺明在残差网络的论文中有提到在很深的残差网络训练时出现过类似的不稳定，他的解决方案是把训练分成2个阶段，第一个阶段是warm-up阶段，使用一个非常低的学习率进行训练，然后在第二阶段用一个高学习率训练。作者发现，如果卷积核的数量非常多，即便用低到0.00001的学习率也不能有效的解决这个问题，而且第二阶段用高学习率训练有可能毁掉warm-up阶段的效果。作者发现对残差进行线性缩小更可靠一些，虽然这种线性缩小不是严格必须的，但是确实对稳定训练有帮助，退一步说，起码不会降低最终的模型精度。

四、Training Methodology

作者训练网络时使用的随机梯度下降算法，使用TensorFlow在20个NVidia Kepler GPU进行分布式训练。实验早期使用decay为0.9的momentum，但是最佳实验结果是用decay=0.9，ε=1.0的RMSProp算法得到的。作者使用的初始学习率是0.045，每2个epochs进行0.94的指数衰减。模型的评估是在训练时持续进行的。

五、Experimental Results

作者首先忽略了验证集中1700个在blacklisted中的bbox标注质量很差的图像，得到一个验证集的子集，在该子集上观察了四种模型的top-1和top-5的validation-error变化。用执行了本来应该只在准备CLSLOC benchmark时才用到的忽略黑名单中的图像的操作后得到的结果和其他报告（包括作者团队的早期报告）中的结果相比较有点不太具有可比性，因为结果会更乐观。模型评估结果的区别在top-1 error上约有0.3%，在top-5 error上约有0.15%。因为在比较模型评估结果时，这些差异是持续存在的，所有作者认为这种曲线间的比较还是公平的。

作者还在包含5万张图像的完整验证集上对模型进行了multi-crop评估，也对模型做了集成进行评估。最终的多个模型集成得到的模型在测试集上进行了预测，将最终结果提交到ILSVRC测试服务来验证模型没有over-fitting。作者着重强调了最终的集成模型的验证只做了一次，而且在之前一年也只在ILSVRC测试服务上提交了两次结果，一次是为了BN-Inception的paper，一次是ILSVR-2015 CLSLOC竞赛时。因此作者相信最终的测试集的结果能够真实的评估模型的性能。
最后，作者对4种模型进行了比较。
表2是单模型的单次crop评估结果：

表3是单模型的10/12 crops的评估结果：

表4是ResNet的dense crops评估结果和Inception变种模型的144 crops评估结果：

表5是模型集成后的评估结果，其中ResNet的集成用的dense crops评估结果，Inception变种模型的集成用的144 crops评估结果：

Conclusions

作者在论文中提出了3中网络结构：

Inception-ResNet-v1：一种既有Inception模块又有残差连接的和InceptionV3计算量相近的网络。
Inception-ResNet-v2：一种既有Inception模块又有残差连接的和InceptionV4计算量相近的网络，显著提高了识别性能。
InceptionV4：一种新的纯净的没有残差连接的Inception网络，性能和Inception-ResNet-v2相近。

作者还研究了怎么在Inception网络中加入残差连接来显著的提升训练速度。
最终InceptionV4和Inception-ResNet-v2都通过增大模型尺寸得到了超越以前网络的识别精度。

【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
LLM辅助编程：代码自动生成与优化 AI智能涌现深度研究计算机软件编程原理与应用实践 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
LLM,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化，程序员面临着越来越高的开发压力和效率要求。传统的编程方式依赖于手动编写代码，这不仅耗时费力，而且容易出现错误。近年来，随着深度学习技术的快速发展，基于大型语言模型（LLM）的代码生成和优化技术逐渐成为软件开发领域的新兴热点。LLM是一种强大的人工智能模型，能够理解和生成人类语言。通过训练大量
国内开源深度学习框架 we19a0sen 深度学习人工智能
目录一、国内开源深度学习框架1、PaddlePaddle（百度飞浆）2、MindSpore（华为昇思）3、MegEngine（旷视天元）4、OneFlow（一流科技）5、Jittor（清华计图）二、快速入手1、PaddlePaddle（百度飞浆）2、MindSpore（华为昇思）3、MegEngine（旷视天元）4、OneFlow（一流科技）5、Jittor（清华计图）三、基础教程1、Paddle
神经网络ＶＳ决策树 Persistence is gold 神经网络决策树人工智能
神经网络（NeuralNetworks）和决策树（DecisionTrees）是两种不同的机器学习算法，各自具有独特的优点和适用场景。以下是它们的详细比较：神经网络优点:强大的学习能力:神经网络，尤其是深度神经网络，能够自动学习数据中的复杂特征，可以处理高维和非线性的问题。适用性广泛:神经网络适用于分类、回归、图像处理、语音识别、自然语言处理等多种任务。多层结构:通过增加隐藏层，神经网络可以逐层提
【免费收藏】清华大学DeepSeek使用手册合集 600页完整版周师姐 AI写作学习人工智能 pdf
DeepSeek资料链接：https://pan.quark.cn/s/c927326f70c5在人工智能席卷全球的当下，DeepSeek作为前沿深度学习技术，正推动着全面AI时代的到来。今日，特别为大家推荐《DeepSeek：从入门到精通》，本书由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心编写。它深度解析DeepSeek的技术核心，详尽阐释其应用场景与操作方法，尤
深度神经网络——决策树的实现与剪枝知来者逆人工智能 dnn 决策树人工智能神经网络深度学习机器学习
概述决策树是一种有用的机器学习算法，用于回归和分类任务。“决策树”这个名字来源于这样一个事实：算法不断地将数据集划分为越来越小的部分，直到数据被划分为单个实例，然后对实例进行分类。如果您要可视化算法的结果，类别的划分方式将类似于一棵树和许多叶子。这是决策树的快速定义，但让我们深入了解决策树的工作原理。更好地了解决策树的运作方式及其用例，将帮助您了解何时在机器学习项目中使用它们。决策树的结构决策树的
YOLOv12改进之A2(区域注意力) 清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法
注意力回顾注意力机制作为深度学习领域的核心技术，已广泛应用于自然语言处理和计算机视觉等多个领域。在YOLOv12改进之A2中，注意力机制扮演着关键角色。已有研究成果包括：Transformer架构：引入了自注意力机制，有效捕捉输入序列中的长距离依赖关系。CBAM模块：提出了通道和空间注意力的结合，显著提升了图像分类和目标检测的性能。SENet：引入了通道注意力机制，通过自适应学习特征通道的重要性，
Grok 3能否打破大模型的魔咒？ TGITCIC AI-大模型的落地之道 grok grok3 大模型小模型 scaling law 开源大模型
新模型旧魔咒Grok3的问世，仿佛是科技界的一声惊雷。面对老掉牙的大模型法则，大家不禁要问：这到底意味着什么？以前，一提深度学习就能引出一场血雨腥风，现如今却有人说“没钱也能玩”。这风浪可真是一波未平一波又起。也许这就是科技的魅力：一统江湖的法则瞬间瓦解。缩小与提升大模型不再是唯一的解决方案，大家发现，原来小模型也可以撬动市场。不过，面对如何提升模型的智商，各路英雄却依然不得不面对两个选择：大力度
深度学习_第二轮 Humingway 深度学习深度学习人工智能
损失函数对偏置和权重求导，x、y作为常量确实，当进行模型训练时，(x)和(y)分别代表输入特征和对应的输出值，它们以数据点对的形式存在，一个数据集中通常包含多对这样的数据。每一对((x_i),(y_i))代表了数据集中的一个样本。在计算损失函数的梯度（即关于权重的偏导数）时，需要考虑整个数据集中的所有样本。对于每个样本((x_i),(y_i))，我们计算其对损失函数的贡献，并通过求和或平均这些贡献
对深度学习中的基本概念—梯度的理解 Humingway 深度学习深度学习人工智能
本文讨论一下对“梯度”的理解。“梯度”是深度学习中基本又非常核心的概念，没有它就没有人工智能的今天。然而，即使抛开令人眼花缭乱的术语（比如sgd、ada、moment、adam）不谈，即使最简单的“梯度”本身，也值得讨论一下。1.提出问题该如何理解梯度？让我们结合具体的例子来体会一下。2.定义例子首先，我们定义一个简单的例子，来模拟一下深度学习的学习过程。已知：有一个正确的数据对（或者叫样本），(
YOLOv5的Conv是什么，Conv就是卷积吗（1） hjs314159 YOLO 深度学习人工智能
不论是看YOLOv5还是最新的YOLOv12的网络结构，里面都有一个看起来雷打不动的部分，ConvConvolutionConvolution是卷积的意思，我们看一张图来简单理解一下神经网络里面的卷积的过程是什么样的。卷积一定是一个输入矩阵（特征）和一个卷积核矩阵做图中这样的计算。我们可以想象输入的就是一张单通道的黑白图像，特征矩阵的每一个数字代表了颜色的深浅（简单理解）。卷积核就相当于一个特征提
《基于WebGPU的下一代科学可视化——告别WebGL性能桎梏》 Eqwaak00 matplotlib webgl 微服务架构云原生分布式
引言：科学可视化的算力革命当WebGL在2011年首次亮相时，它开启了浏览器端3D渲染的新纪元。然而面对当今十亿级粒子模拟、实时物理仿真和深度学习可视化需求，WebGL的架构瓶颈日益凸显。WebGPU作为下一代Web图形标准，通过显存直存、多线程渲染和计算着色器三大革新，将科学可视化性能提升至10倍以上。本文将深入解析如何利用WebGPU突破大规模数据渲染的极限。一、WebGPU核心架构解析1.1
【故障诊断】三角测量拓扑聚合器优化双向时间卷积神经网络TTAO-BiTCN轴承数据故障诊断【含Matlab源码 5101期】 Matlab武动乾坤 matlab
Matlab武动乾坤博客之家
自动驾驶---Perception之大模型应用智能汽车人自动驾驶人工智能机器学习
1背景自动驾驶感知（Perception）模块在自动驾驶系统中扮演着至关重要的角色，它负责收集、处理并理解车辆周围的环境信息。随着深度学习技术的快速发展，大模型也逐渐在自动驾驶感知模块中得到了广泛应用。本篇博客主要介绍大模型在感知模块的应用。前面也介绍过如下几篇Perception相关的文章，有兴趣的读者可以了解相关内容：《自动驾驶---Perception之IPM图和BEV图》《自动驾驶---P
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能图像识别人工智能深度学习
一、介绍害虫识别系统，本系统使用Python作为主要开发语言，基于TensorFlow搭建卷积神经网络算法，并收集了12种常见的害虫种类数据集【"蚂蚁（ants）","蜜蜂（bees）","甲虫（beetle）","毛虫（catterpillar）","蚯蚓（earthworms）","蜚蠊（earwig）","蚱蜢（grasshopper）","飞蛾（moth）","鼻涕虫（slug）","蜗牛
详解：Grok中文版 _Grok 3 国内中文版本在线使用人工智能
GrokAI是由XAI公司推出的一款尖端人工智能系统。作为该公司核心技术之一，GrokAI专注于推动人工智能在各行各业的实际应用，尤其在数据分析、自然语言处理（NLP）、自动化决策、机器学习等领域表现出色。Grok的最大亮点在于其强大的数据处理能力。它能够高效地从大量复杂数据中提取有价值的信息，并做出精准预测。借助深度学习与强化学习等先进技术，GrokAI具备自我学习的能力，可以通过不断的训练来优
基于OpenCV的Java人脸识别系统设计与实现小呀白呀兔 java spring boot
基于OpenCV的Java人脸识别系统设计与实现1.引言随着计算机视觉技术的发展，人脸识别在安全监控、身份验证等领域得到了广泛应用。本文将详细介绍如何使用OpenCV库和Java语言构建一个简单的人脸识别系统。该系统能够从图像中检测人脸，并通过深度学习模型提取特征进行比对，最终输出相似度评分及置信度等级。2.环境搭建为了确保项目顺利运行，请按照以下步骤配置开发环境：安装JDK：确保已安装JavaD
智能教育：DeepSeek在个性化学习中的创新应用与代码实现 Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 #深度学习学习
教育是塑造未来的基石，而个性化学习则是现代教育的重要趋势。随着人工智能技术的飞速发展，教育领域正迎来一场深刻的变革。DeepSeek作为人工智能领域的领军者，正在通过其强大的技术能力，推动个性化学习的创新应用。本文将结合代码实现，深入探讨DeepSeek在个性化学习中的应用。一、个性化学习路径：从数据到洞察个性化学习的核心在于根据学生的学习数据，生成定制化的学习路径。DeepSeek通过深度学习算
大白话聊聊“深度学习”和“大模型” 程序员鬼鬼深度学习人工智能 AI编程 AIGC chatgpt ai
1950年图灵发表论文《计算机器与智能》（ComputingMachineryandIntelligence），提出了“机器智能”（MachineIntelligent）的概念，并且提出了著名的“图灵测试”的方法来判断机器是否有智能。1956年，达特茅斯会议，“人工智能”（ArtificialIntelligent）概念被首次提出，人工智能作为一个学科开始被研究。科学家梦想着未来可以用复杂物理结构
【精华推荐】AI大模型学习必逛的十大顶级网站大模型入门学习人工智能学习大模型入门 llama 大模型教程大模型学习大模型
随着人工智能技术的快速发展，AI大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。对于希望深入学习AI大模型的开发者和研究者来说，找到合适的学习资源至关重要。本文将为大家推荐十大必备网站，帮助你更好地理解和应用AI大模型。1.CourseraCoursera是一个在线学习平台，提供各类AI和机器学习课程，包括斯坦福大学的机器学习课程和深度学习专项课程。通过视频讲解
深度学习分类回归（衣帽数据集）何仙鸟深度学习分类回归
一、步骤1加载数据集fashion_minst2搭建classNeuralNetwork模型3设置损失函数，优化器4编写评估函数5编写训练函数6开始训练7绘制损失，准确率曲线二、代码导包，打印版本号：importmatplotlibasmplimportmatplotlib.pyplotasplt%matplotlibinlineimportnumpyasnpimportsklearnimport
BP神经网络计算过程：从数学原理到实践优化 Acd_713 BP神经网络神经网络人工智能深度学习
引言：神经网络的时代意义与BP算法地位在深度学习重构人工智能边界的今天（Goodfellowetal.,2016），误差反向传播（Backpropagation，BP）算法作为神经网络训练的基石，其数学优雅性和工程实用性完美统一。本文将深入剖析BP神经网络的计算本质，揭示其如何在非线性空间中构建认知通道。第1章神经网络拓扑结构的数学建模1.1生物神经元到M-P模型的抽象跃迁McCulloch-Pi
成为LLM大师的必读书籍：这几本大模型书籍，详细到让你一篇文章就收藏足够 AGI大模型老王产品经理大模型教程学习大模型人工智能 LLM 大模型书籍
以下是几本关于大模型和人工智能领域的经典书籍，它们各自具有独特的特点和适用人群：《深度学习》（DeepLearning）作者：伊恩·古德费洛（IanGoodfellow）、约书亚·本吉奥（YoshuaBengio）、亚伦·库维尔（AaronCourville）简介：《深度学习》是深度学习领域的经典之作，全面介绍了深度学习的基础知识、主要模型及其应用。书中详细讲解了神经网络、卷积神经网络、循环神经网
深度学习模型未来可能会在这些领域取得突破性进展 xinxiyinhe 人工智能深度学习人工智能深度学习模型深度学习
深度学习模型作为人工智能的核心技术之一，未来有望在多个领域取得突破性进展。以下是一些可能的方向：1.通用人工智能（AGI）目标：开发具有通用智能的模型，能够像人类一样处理多种任务。潜在突破：更强的推理和抽象能力，解决复杂问题。结合多模态数据（文本、图像、声音等）实现更全面的理解。自我学习和适应能力，减少对大量标注数据的依赖。2.医疗与生命科学目标：提升疾病诊断、药物研发和个性化治疗的水平。潜在突破
深度学习进阶：TensorFlow实战指南 ELSON麦香包
本文还有配套的精品资源，点击获取简介：《TensorFlow实战Google深度学习框架》详细指导读者学习TensorFlow，涵盖基础概念、数据流图、API使用、张量和变量操作，深度学习基础如CNN和RNN，以及自定义层和优化算法。书中还提供使用TensorFlow构建和训练深度学习模型的实例，包括AlexNet、VGG、ResNet以及LSTM和GRU，并通过图像分类和文本情感分析等实战案例，
TensorFlow.js - 使用 CNN(卷积神经网络) 识别手写数字宁静_致远_ 前端开发 javascript tensorflow cnn
目录index.htmldata.jsscript.js备注参考文献index.htmlTensorFlow.jsTutorialdata.js/***@license*Copyright2018GoogleLLC.AllRightsReserved.*LicensedundertheApacheLicense,Version2.0(the"License");*youmaynotusethisf
Python深度学习之路：TensorFlow与PyTorch对比步入烟尘 Python超入门指南全册 python 深度学习 tensorflow
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
深度学习实战：TensorFlow 开源项目指南劳治亮
深度学习实战：TensorFlow开源项目指南Deep-Learning-TensorFlow项目地址:https://gitcode.com/gh_mirrors/dee/Deep-Learning-TensorFlow项目介绍本项目基于GitHub仓库https://github.com/blackecho/Deep-Learning-TensorFlow.git，旨在提供一个全面的学习与开发
卷积神经网络应用-训练手写体数字数据集并展示识别精度 yeahamen 深度学习 python 机器学习卷积神经网络手写体数字识别
#卷积神经网络(CNN)训练手写体数据集importnumpyasnpimportmatplotlib.pyplotaspltimporttensorflow.kerasaskaimportdatetime#python3.X版本显示图片还需导入此库importpylabnp.random.seed(0)#定义加载数据集函数defload_data_npz(path):#np.load文件可以加载
深度学习实战：用TensorFlow构建高效CNN的完整指南芯作者 DD：日记深度学习
一、为什么每个开发者都要掌握CNN？在自动驾驶汽车识别路标的0.1秒里，在医疗AI诊断肺部CT片的精准分析中，甚至在手机相册自动分类宠物的日常场景里，卷积神经网络（CNN）正悄然改变着我们的世界。本文将以工业级实践标准，带您从零构建一个在CIFAR-10数据集上达到90%+准确率的CNN模型，深入解析TensorFlow2.x的最新特性，并揭秘模型优化的七大核心策略。[外链图片转存失败,源站可能有
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持