小麦粒

GoogLeNet （二） Inception 相关概念

文章目录

一、原始Inception的基本结构

1.1 Filter concatenation
1.2 降低特征图厚度演进出V1、V2、V3、V4
1.3 1x1的卷积核有什么用呢？
1.4 搭建Inception网络问题
1.5 InceptionV1参数少但是效果好的原因

二、Inception 知识点

2.1 MLP 多层神经网络
2.2 Network In Network 瓶颈层降低网络的计算成本
2.3 全局平均池化
2.4 DepthConcat
2.5 LRN (Local RespNorm）
2.6 GAP（全局平局均池化）
2.7 全连接FC 目的

三、GoogLeNet网络结构明细表解析

3.0 输入
3.1 第一层（卷积层）
3.2 第二层（卷积层）
3.3 第三层

3.1.1 Inception 3a层
3.1.1 Inception3b

3.4 第四层

四、Inception网络原理

4.1 原始 Inception网络原理
4.2 previous layer
4.3 Inception v1的亮点总结
4.4 GoogleNet网络结构

有趣的事，Python永远不会缺席
培训说明

GoogLeNet （一）VGG、AlexNet和Inception关系\GoogLeNet从Inception v1到v4的演进 https://blog.csdn.net/u010986753/article/details/98980390

一、原始Inception的基本结构

Inception网络即是Inception模块的重复拼接，其中插有额外的有池化层来改变模型的宽度和高度。所有卷积和池化操作均使用Padding=”SAME”卷积/池化方式。

AleXNet (8层）
VGGNet（19层）
inception V1 具有22层。包括池化层的话是 27 层，该模型在最后一个 inception 模块处使用全局平均池化。

1.1 Filter concatenation

Filter concatenation不需要混合不同大小的图。换句话说就是Filter concatenation混合的是相同的尺寸的图。确切地说，Filter Concatenation其实很简单，就是把图按深度链接起来。举个例子，如有2个3×3×4的输入，1个3×3×2的输入，3个3×3×1的输入，可以看到输入中一共有2×4+1×2+3×1 =13个通道那么经过Filter Concatenation后就是3×3×13。

通过设计一个稀疏网络结构，但是能够产生稠密的数据，既能增加神经网络表现，又能保证计算资源的使用效率。谷歌提出了最原始Inception的基本结构：

1.2 降低特征图厚度演进出V1、V2、V3、V4

该结构将CNN中常用的卷积（1x1，3x3，5x5）、池化（3x3) 操作堆叠在一起（卷积、池化后的尺寸相同，将通道相加），一方面增加了网络的宽度，另一方面也增加了网络对尺度的适应性。

网络卷积层中的网络能够提取输入的每一个细节信息，同时5x5的滤波器也能够覆盖大部分接受层的的输入。还可以进行一个池化操作，以减少空间大小，降低过度拟合。在这些层之上，在每一个卷积层后都要做一个 ReLU操作，以增加网络的非线性特征。

然而这个Inception原始版本，所有的卷积核都在上一层的所有输出上来做，而那个5x5的卷积核所需的计算量就太大了，造成了特征图的厚度很大，为了避免这种情况，在3x3前、5x5前、max pooling后分别加上了1x1的卷积核，以起到了降低特征图厚度的作用，这也就形成了演进版本的Inception v1、Inception v2、Inception v3、Inception v4的网络结构，如下图原始Inception 架构所示：

原始结构：

参数：(1×1×192×64) + (3×3×192×128) + (5×5×192×32) = 153600
最终输出的feature map：64+128+32+192 = 416

加入不同channel的1×1卷积后：

参数
1×1×192×64+（1×1×192×96+3×3×96×128）+（1×1×192×16+5×5×16×32）=15872
最终输出的feature map： 64+128+32+32=256

所以加入1×1的卷积后，在降低大量运算的前提下，降低了维度。
降低维度也是inception module一个非常明智的举措。

如下图 Inception V1 架构所示：

1.3 1x1的卷积核有什么用呢？

1x1卷积的主要目的是为了减少维度，还用于修正线性激活（ReLU）。比如，上一层的输出为100x100x128，经过具有256个通道的5x5卷积层之后(stride=1，pad=2)，输出数据为100x100x256，其中，卷积层的参数为128x5x5x256= 819200。而假如上一层输出先经过具有32个通道的1x1卷积层，再经过具有256个输出的5x5卷积层，那么输出数据仍为为100x100x256，但卷积参数量已经减少为128x1x1x32 + 32x5x5x256= 204800，大约减少了4倍。

1.4 搭建Inception网络问题

当构建卷积层时，你要决定卷积核的大小究竟是1∗3还是3∗3或者是5∗5.并且什么时候加入池化层。这些都是十分繁琐而纠结的。
而Inception网络的作用就是代替你来做决定以构建网络的结构。虽然网络结构因此变得更加复杂，但是网络变现却非常好。

1.5 InceptionV1参数少但是效果好的原因

去除了最后的全连接层，大大减少了参数量，并减轻了过拟合。用“全局平均池化层来代替”（该想法来源于 Network In Network）
精心设计的“inception model”提高了参数的利用率。

二、Inception 知识点

2.1 MLP 多层神经网络

多层感知器(Multi-Layer Perceptron，MLP)也叫人工神经网络(Artificial Neural Network，ANN)，除了输入输出层，它中间可以有多个隐层，最简单的MLP只含一个隐层，即输入层、隐层和输出层才能称为一个简单的神经网络。
在这个模型中，我们输入的x特征会连接到隐层的神经元，隐层的神经元再连接到输入层的神经元。在这个多层感知器层与层之间是全连接的(全连接的意思就是：上一层的任何一个神经元与下一层的所有神经元都有连接)。

神经网络要解决的最基本问题是分类问题。我们将特征值传入隐层中，通过带有结果的数据来训练神经网络的参数(W，权重；b，偏置)，使输出值与我们给出的结果一致，既可以用来预测新的输入值了。

2.2 Network In Network 瓶颈层降低网络的计算成本

注： Network In Network 网络中的网络是对每一个感受野都进行一个NIN的操作。 1∗1的卷积也被称为Network in Network

提出一个NIN深度网络结构用来增强模型在感知野对局部图像块的辨别力。
提出在卷积层使用“非线性”替代现有的“线性模型”
使用由MLP组成micro neural网络zoo为非线性模型去提取特征

使用Network in Network瓶颈层降低网络的计算成本

假设输入层的大小为28∗28∗192 的192个通道的特征图，想要使192个通道的特征图压缩为具有32个通道的特征图，则可以使用32个1∗1∗192的卷积核对这个特征图进行卷积操作。具体而言，一般只需要设置卷积核的长和宽而无需设置卷积核的通道数维度。因为一般而言卷积核的第三个维度是和原始特征图的通道数量保持一致的。

目的就是将左边较大的特征图压缩成较小的中间层，这个中间层有时被称为瓶颈层(bottleneck layer)

瓶颈层所有神经元计算成本为
28∗28∗16∗1∗1∗192=2.4M=240W

第二个卷积层得计算成本为
28∗28∗32∗5∗5∗16=10M=1000W

所以这两层的计算成本之和为
240W+1000W=1240W

这使得原来的120M的计算成本降低成大约原来的10分之1即12.4M，所需的加法次数与乘法次数相近，所以只统计了乘法运算的次数。

事实证明，只要合理构建瓶颈层，你既可以显著的缩小表示层规模又不会降低网络性能，从而大大节省了计算

2.3 全局平均池化

在MLPconv最后一层为每一个分类任务的相应种类生成一个特征映射。

优点：

（1）全局平均池化更原生的支持卷积结构，而通过加强特征映射与相应分类的对应关系。
（2）没有需要优化的参数，避免归一化
（3）汇总了空间信息，因此对空间变化时健壮的。

2.4 DepthConcat

聚合操作，在输出通道这个维度上聚合（一个inception module每个分支通道数可能不一样，但是feature map大小应该是一样的。strides=1，padding=same）
https://blog.csdn.net/u010986753/article/details/98980390

2.5 LRN (Local RespNorm）

Local Response Normalization，即局部响应归一化层。
归一化化是归纳统一样本的统计分布性。就是要把你需要处理的数据经过处理后（通过某种算法）限制在你需要的一定范围内。

为什么要归一化，归一化目的是什么？
（1）为了后面数据处理的方便，归一化的确可以避免一些不必要的数值问题。
（2）为了程序运行时收敛加快。
（3）同一量纲。样本数据的评价标准不一样，需要对其量纲化，统一评价标准。这算是应用层面的需求。
（4）避免神经元饱和。啥意思？就是当神经元的激活在接近0或者1时会饱和，在这些区域，梯度几乎为0，这样，在反向传播过程中，局部梯度就会接近0，这会有效地“杀死”梯度。
（5）保证输出数据中数值小的不被吞食。

2.6 GAP（全局平局均池化）

全局平均池化（Global average Pooling），一个feature map 全局平均池化后得到一个值，再进行全连接（softmax）就会少很多参数。

2.7 全连接FC 目的

全连接的目的是什么呢？因为传统的网络我们的输出都是分类，也就是几个类别的概率甚至就是一个数–类别号，那么全连接层就是高度提纯的特征了，方便交给最后的分类器或者回归。
但是全连接的参数实在是太多了，所以现在的趋势是尽量避免全连接，近期的大部分论文FC多用全局平均池化层（GAP，Global Average Pooling）的方法代替。GAP的思想就是：用 feature map 直接表示属于某个类的 confidence map，比如有10个类，就在最后输出10个 feature map，每个feature map中的值加起来求平均值，这十个数字就是对应的概率或者叫置信度。然后把得到的这些平均值直接作为属于某个类别的 confidence value，再输入softmax中分类，更重要的是实验效果并不比用 FC 差。

GAP的优势是：

1.因为FC的参数众多，这么做就减少了参数的数量（在最近比较火的模型压缩中，这个优势可以很好的压缩模型的大小）。
2.因为减少了参数的数量，可以很好的减轻过拟合的发生。

三、GoogLeNet网络结构明细表解析

3.0 输入

原始输入图像为224x224x3，且都进行了零均值化的预处理操作（图像每个像素减去均值）。

3.1 第一层（卷积层）

使用7x7的卷积核（滑动步长2，padding为3），64通道，输出为112x112x64，卷积后进行ReLU操作，经过3x3的max pooling（步长为2），输出为((112 - 3+1)/2)+1=56，即56x56x64，再进行ReLU操作。

3.2 第二层（卷积层）

使用3x3的卷积核（滑动步长为1，padding为1），192通道，输出为56x56x192，卷积后进行ReLU操作，经过3x3的max pooling（步长为2），输出为((56 - 3+1)/2)+1=28，即28x28x192，再进行ReLU操作.

3.3 第三层

3.1.1 Inception 3a层

分为四个分支，采用不同尺度的卷积核来进行处理

64个1x1的卷积核，然后RuLU，输出28x28x64
96个1x1的卷积核，作为3x3卷积核之前的降维，变成28x28x96，然后进行ReLU计算，再进行128个3x3的卷积（padding为1），输出28x28x128
16个1x1的卷积核，作为5x5卷积核之前的降维，变成28x28x16，进行ReLU计算后，再进行32个5x5的卷积（padding为2），输出28x28x32
pool层，使用3x3的核（padding为1），输出28x28x192，然后进行32个1x1的卷积，输出28x28x32。

将四个结果进行连接，对这四部分输出结果的第三维并联，即64+128+32+32=256，最终输出28x28x256。

3.1.1 Inception3b

128个1x1的卷积核，然后RuLU，输出28x28x128
128个1x1的卷积核，作为3x3卷积核之前的降维，变成28x28x128，进行ReLU，再进行192个3x3的卷积（padding为1），输出28x28x192
32个1x1的卷积核，作为5x5卷积核之前的降维，变成28x28x32，进行ReLU计算后，再进行96个5x5的卷积（padding为2），输出28x28x96
pool层，使用3x3的核（padding为1），输出28x28x256，然后进行64个1x1的卷积，输出28x28x64。

将四个结果进行连接，对这四部分输出结果的第三维并联，即128+192+96+64=480，最终输出输出为28x28x480。

3.4 第四层

第四层（4a,4b,4c,4d,4e）、第五层（5a,5b）……，与3a、3b类似，在此就不再重复。

从GoogLeNet的实验结果来看，效果很明显，差错率比MSRA、VGG等模型都要低，对比结果如下表所示：

四、Inception网络原理

4.1 原始 Inception网络原理

Inception网络可以代替人工来确定卷积层中卷积核的类型，或者确定是否需要创建卷积层或池化层。
假设输入为28∗28∗192的具有192个通道的图片。以下卷积都是通过”SAME”方式进行卷积。使用64个1∗1的卷积核得到的特征图大小为28∗28∗64，如果使用128个3∗3的卷积核进行卷积，得到的特征图的大小为28∗28∗128.
假设Inception网络的输入是一个28∗28∗192的具有192个通道的特征图片，使用32个5∗5的卷积核以Padding=”SAME”的方式进行卷积，则输出为28∗28∗32 ，.此时将三个特征图堆叠在一起。
使用了32个过滤器，每个过滤器的大小为5∗5∗192因为输入图片的信道数量为192。所以对于输出特征图中的28∗28∗32个节点，每一个都需要进行5∗5∗192次乘法运算，即每个输出值所需的乘法运算次数乘以输出值的个数。
28∗28∗32∗5∗5∗192=120M=1.2亿
当然你也可以直接使用最大值池化层，输出的结果为28∗28∗32。也将结果特征图堆叠在一起。为了使所有的特征图长和宽一致，需要对池化层也使用Padding=“SAME”操作。此时，这个堆叠起来的28∗28∗256的结构被称为”Inception模块”。
基本思想是Incetion 网络不需要人为决定使用哪个过滤器，或者是否需要池化，而是由网络自行决定确定这些参数。你可以给模块增加这些参数，然后把这些输出连接起来，让网络自己学习它需要什么样的参数，采用哪些过滤器组合。

4.2 previous layer

假设previous layer的大小为28*28*192，则，
a的weights大小，1*1*192*64+3*3*192*128+5*5*192*32=387072
a的输出featuremap大小，28*28*64+28*28*128+28*28*32+28*28*192=28*28*416
b的weights大小，1*1*192*64+(1*1*192*96+3*3*96*128)+(1*1*192*16+5*5*16*32)+1*1*192*32=163328
b的输出feature map大小，28*28*64+28*28*128+28*28*32+28*28*32=28*28*256

写到这里，不禁感慨天才般的1*1 conv，从上面的数据可以看出一方面减少了weights，另一方面降低了dimension。

4.3 Inception v1的亮点总结

(1)卷积层共有的一个功能，可以实现通道方向的降维和增维，至于是降还是增，取决于卷积层的通道数（滤波器个数），在Inception v1中1*1卷积用于降维，减少weights大小和feature map维度。

(2)1*1卷积特有的功能，由于1*1卷积只有一个参数，相当于对原始feature map做了一个scale，并且这个scale还是训练学出来的，无疑会对识别精度有提升。

(3)增加了网络的深度

(4)增加了网络的宽度

(5)同时使用了1*1，3*3，5*5的卷积，增加了网络对尺度的适应性

4.4 GoogleNet网络结构

(1)整个网络为了保证收敛，有3个loss

(2)最后一个全连接层之前使用的是global average pooling，全局pooling使用的好了，还是有好多地方可以发挥的。

'''
【干货来了|小麦苗IT资料分享】
★小麦苗DB职场干货：https://mp.weixin.qq.com/s/Vm5PqNcDcITkOr9cQg6T7w
★小麦苗数据库健康检查：https://share.weiyun.com/5lb2U2M
★小麦苗微店：https://weidian.com/s/793741433?wfr=c&ifr=shopdetail
★各种操作系统下的数据库安装文件（Linux、Windows、AIX等）：链接：https://pan.baidu.com/s/19yJdUQhGz2hTgozb9ATdAw  提取码：4xpv
★小麦苗分享的资料：https://share.weiyun.com/57HUxNi
★小麦苗课堂资料：https://share.weiyun.com/5fAdN5m
★小麦苗课堂试听资料：https://share.weiyun.com/5HnQEuL
★小麦苗出版的相关书籍：https://share.weiyun.com/5sQBQpY
★小麦苗博客文章：https://share.weiyun.com/5ufi4Dx
★数据库系列（Oracle、MySQL、NoSQL）：https://share.weiyun.com/5n1u8gv
★公开课录像文件：https://share.weiyun.com/5yd7ukG
★其它常用软件分享：https://share.weiyun.com/53BlaHX
★其它IT资料（OS、网络、存储等）：https://share.weiyun.com/5Mn6ESi
★Python资料：https://share.weiyun.com/5iuQ2Fn
★已安装配置好的虚拟机：https://share.weiyun.com/5E8pxvT
★小麦苗腾讯课堂：https://lhr.ke.qq.com/
★小麦苗博客：http://blog.itpub.net/26736162/
'''

有趣的事，Python永远不会缺席

欢迎关注小婷儿的博客

文章内容来源于小婷儿的学习笔记，部分整理自网络，若有侵权或不当之处还请谅解

如需转发，请注明出处：小婷儿的博客python https://blog.csdn.net/u010986753

博客园 https://www.cnblogs.com/xxtalhr/

CSDN https://blog.csdn.net/u010986753

有问题请在博客下留言或加作者：
     微信：tinghai87605025 联系我加微信群
     QQ ：87605025
     python QQ交流群：py_data 483766429

培训说明

OCP培训说明连接 https://mp.weixin.qq.com/s/2cymJ4xiBPtTaHu16HkiuA

OCM培训说明连接 https://mp.weixin.qq.com/s/7-R6Cz8RcJKduVv6YlAxJA

小婷儿的python正在成长中，其中还有很多不足之处，随着学习和工作的深入，会对以往的博客内容逐步改进和完善哒。重要的事多说几遍。。。。。。

深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
时尚搭配助手，深度解析用Keras构建智能穿搭推荐系统忆愿高质量领域文章 keras 人工智能深度学习机器学习 python
文章目录引言：当算法遇见时尚第一章数据工程：时尚系统的基石1.1数据获取的多元化途径1.2数据预处理全流程1.2.1图像标准化与增强1.2.2多模态数据处理第二章模型架构设计：从分类到推荐2.1基础CNN模型（图像分类）2.2多任务学习模型（属性联合预测）第三章推荐算法核心3.1协同过滤与内容推荐的融合第四章系统优化4.1注意力机制应用第五章实战演练5.2实时推荐API实现第六章前沿探索：时尚AI
用Keras构建爱情模型：破解情侣间的情感密码忆愿高质量领域文章 keras 人工智能深度学习 python 机器学习自然语言处理神经网络
文章目录一、给情话穿上数字马甲1.1中文分词那些坑1.2停用词过滤玄学二、给神经网络装个情感温度计2.1记忆增强套餐2.2注意力机制实战三、给模型喂点狗粮数据3.1数据增强七十二变3.2标注的艺术四、调参比哄对象还难4.1超参数扫雷指南4.2可视化调参黑科技五、实战演练之保命指南5.1部署成求生APP5.2案例分析库六、当AI遇见现实：模型局限与伦理困境6.1隐私雷区七、从玩具模型到生产系统7.1
lstm 输入数据维度_keras中关于输入尺寸、LSTM的stateful问题 weixin_39856269 lstm 输入数据维度
补充：return_sequence,return_state都是针对一个时间切片(步长)内的h和c状态，而stateful是针对不同的batch之间的。多层LSTM需要设置return_sequence=True,后面再设置return_sequence=False.最近在学习使用keras搭建LSTM的时候，遇到了一些不明白的地方。有些搞懂了，有些还没有搞懂。现在记下来，因为很快就会忘记!-_
英伟达终为 CUDA 添加原生 Python 支持，他有什么目的？朱卫军 AI python 开发语言
CUDA原来只支持C/C++/Fortran，在2025的CES上宣布支持原生Python其实是不得已而为之，一方面现在Python的AI开发者数量过于庞大，达到数千万级别，而CUDA仅几百万，CUDA想扩大自己的用户圈子，只能拉Python入伙。另一方面，Python生态的计算库实在太强大，比如numpy，几乎垄断了数组计算，还有像scipy、keras等，已经成为机器学习的主流工具，CUDA必
使用AutoKeras2.0的AutoModel进行结构化数据回归预测
1、FirstofAll:ReadTheFuckingSourceCodeimportautokerasasakimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportmean_squared_error#生成数据集np.random.seed(42)x=np.random.r
python2.7.13安装keras记录呜哇哈哈嗝～ Python基础 keras tensorflow python
keras给出的版本大多对应的是python3.x版本，但有时一些项目需要用到python2.x的环境，版本找起来很麻烦。故喇宝准备写此篇来记录以及总结一下自己的安装过程（也为了防止下次自己又要重新装的时候各种百度不到）！python版本2.7.13condacreate--namepython27python=2.7.13在anaconda中使用命令新建一个名为python27的虚拟环境，新环境
PyTorch实战：从零构建CNN模型，轻松搞定MNIST手写数字识别
PyTorch实战：从零构建CNN模型，轻松搞定MNIST手写数字识别大家好！欢迎来到我的深度学习博客！对于每个踏入计算机视觉领域的人来说，MNIST手写数字识别就像是编程世界的“Hello,World!”。它足够简单，能够让我们快速上手；也足够完整，可以帮我们走通一个深度学习项目的全流程。之前我们可能用Keras体验过“搭积木”式的快乐，今天，我们将换一个同样强大且灵活的框架——PyTorch，
Keras环境复现代码（三） yanyiche_ keras 深度学习人工智能
DQN雅达利Breakout强化学习实验要求明确实验目的：学习和实现深度Q学习（DQN），这是一种结合了Q学习和深度神经网络的强化学习算法，用于解决复杂的决策问题。清楚实验原理：1、深度Q学习（DeepQ-Network）将卷积神经网络与Q学习结合，解决高维视觉输入的强化学习问题：2、经验回放：将状态转换存储到缓冲区，打破数据相关性，稳定训练。3、目标网络：定期更新目标Q值计算网络，减少训练中的目
Keras环境复现代码（二） yanyiche_ Keras 机器学习人工智能
PPOCartPole控制算法实践实验要求明确实验目的：学习和实现PPO算法，这是一种改进的策略梯度方法，通过限制策略更新的幅度来提高训练的稳定性。清楚实验原理：PPO算法是一种基于策略梯度的强化学习算法，它旨在解决传统策略梯度方法（如REINFORCE算法）在训练过程中可能出现的策略更新不稳定问题。PPO算法通过引入一种新的策略更新机制，限制每次更新的幅度，从而提高训练的稳定性和效率。PPO算法
深刻解析如何解决在pycharm中导入tensorflow的子模块keras时的报错（导入语法正确） lovingf pycharm python tensorflow keras
只是导入时报错，但代码仍可以运行1.导入方式正确，但pycharm将其标红2.通过查看tensorflow的官方文件，猜测可能是python版本不适配python需为python3.6-3.9，而我的为python3.113.配置python3.9的环境（详情可看我的另一篇文章），但依然报错4.经过仔细分析，觉得可能是pycharm与tensorflow的适配问题，pycharm无法寻找到tens
CIANNA由天体物理学家提供/为天体物理学家提供的卷积交互式人工神经网络 struggle2025 神经网络
一、软件介绍文末提供程序和源码下载CIANNA是一个通用的深度学习框架，主要用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。CIANNA可用于为各种任务构建和训练大型神经网络模型，并提供高级Python接口（类似于keras、pytorch等）。CIANNA的特点之一是它定制实施了受YOLO启发的对象探测器，用于2D或3D射电天文数据产品中的星系探测。该框架通过低级CUDA编程完全实
python打卡训练营Day41 珂宝_ python打卡训练营 python
importnumpyasnpfromtensorflowimportkerasfromtensorflow.kerasimportlayers#加载和预处理数据(x_train,y_train),(x_test,y_test)=keras.datasets.mnist.load_data()x_train=x_train.reshape(-1,28,28,1).astype("float32")
LSTM价格预测模型：基于技术指标与市场情绪数据 pk_xz123456 仿真模型算法深度学习 lstm 人工智能 rnn 深度学习开发语言目标检测神经网络
LSTM价格预测模型：基于技术指标与市场情绪数据一、模型架构设计importnumpyasnpimportpandasaspdimporttensorflowastffromsklearn.preprocessingimportStandardScalerfromtensorflow.keras.modelsimportSequentialfrom
【深度学习-Day 21】框架入门：神经网络模型构建核心指南 (Keras & PyTorch) 吴师兄大模型深度学习入门到精通深度学习神经网络 keras 人工智能 python pytorch LLM
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Python实现简单的深度学习实践 master_chenchengg python python Python python开发 IT
Python实现简单的深度学习实践Python：通往深度学习世界的钥匙动手搭建你的第一个神经网络模型从零开始，用Python解析MNIST手写数字识别超越基础：使用Keras快速构建卷积神经网络实战演练：训练一个简单的图像分类器Python：通往深度学习世界的钥匙在当今这个数据驱动的时代，Python无疑成为了打开深度学习大门的金钥匙。它不仅语法简洁、易于上手，而且拥有强大的社区支持和丰富的库资源
初识 Tensorflow.js【Plan - June - Week 3】 kuiini Plan 人工智能 tensorflow 人工智能
一、TensorFlow.jsTensorFlow.js是TensorFlow的JavaScript实现，支持在浏览器或Node.js环境中训练和部署机器学习模型。1、TensorFlow.js能做什么？在浏览器中训练机器学习模型加载并使用已有的模型（TensorFlowSavedModel、Keras模型、TensorFlowHub等）在Node.js环境中训练和部署模型将模型从PythonTe
Keras深度学习框架第十四讲：使用TensorFlow进行多GPU分布式训练 MUKAMO AI Python应用 Keras框架深度学习 keras tensorflow
使用TensorFlow进行多GPU分布式训练1、绪论1.1使用TensorFlow进行多GPU分布式训练概念TensorFlow是一个流行的开源机器学习框架，它支持多GPU分布式训练，允许开发者利用多个GPU并行处理数据和模型参数，从而加速训练过程。多GPU分布式训练在深度学习领域尤其重要，因为它可以极大地提高模型的训练速度和效率。在使用TensorFlow进行多GPU分布式训练时，通常需要遵循
重新编译一个不支持 AVX、AVX2的 TensorFlow 1.15的python3.7的安装包 babytiger tensorflow 人工智能 python
事情是这样的，以前写过一个图像识别程序，是在python3.7centos7上实现的，是要求cpu支持avx指令的，但是最近在一台电脑上部署时发现这台电脑不支持avx的，参才之前的文章在不支持avx指令集的cpu上部署tensorflow及keras._6133指令集-CSDN博客但是安装包没有linux下的python版本，得自己编译生成了。这里面问题也不小。我的系统是ubuntu2404，下载
AI人工智能深度学习入门指南：从基础到实践_副本 AI大模型应用实战 C 人工智能深度学习 ai
AI人工智能深度学习入门指南：从基础到实践关键词：人工智能、机器学习、深度学习、神经网络、梯度下降、反向传播、实战案例摘要：本文是为零基础或初级学习者打造的深度学习入门指南。我们将从“人工智能-机器学习-深度学习”的关系讲起，用“教机器人认猫”的故事串联核心概念，结合生活比喻（如“多层蛋糕”解释神经网络）、数学公式（如梯度下降的“下山游戏”）和Python实战代码（用Keras实现手写数字识别），
Keras.preprocessing.image kakak_ CV
ImageDataGeneratorImageDataGenerator是keras.preprocessing.image模块中的图片生成器，同时也可以在batch中对数据进行增强，扩充数据集大小，增强模型的泛化能力。比如进行旋转，变形，归一化等等。fromkeras.preprocessing.imageimportImageDataGeneratorimage_datagen=ImageDa
【深度学习】嘿马深度学习笔记第1篇：深度学习基本概要【附代码文档】某miao 深度学习笔记人工智能
图片无法加载本教程的知识点为：深度学习介绍1.1深度学习与机器学习的区别TensorFlow介绍2.4张量2.4.1张量(Tensor)2.4.1.1张量的类型TensorFlow介绍1.2神经网络基础1.2.1Logistic回归1.2.1.1Logistic回归TensorFlow介绍总结每日作业神经网络与tf.keras1.3神经网络基础神经网络与tf.keras1.3Tensorflow实
如何在Keras中使用Lambda层构建、保存和加载模型 t0_54program stable diffusion 个人开发
在深度学习领域，Keras是一个广受欢迎且易于使用的构建深度学习模型的库。它支持多种常见的层类型，如输入层、全连接层、卷积层、转置卷积层、重塑层、归一化层、随机失活层、展平层以及激活层等。然而，有时我们可能需要对数据执行现有层无法实现的操作，这时Lambda层就派上用场了。本文将详细介绍如何在Keras中使用Lambda层来构建、保存和加载模型。一、使用Keras的函数式API构建模型在Keras
深度学习入门：Python搭建简单神经网络模型缑宇澄 python
在人工智能浪潮中，深度学习凭借强大的特征提取与模式识别能力成为核心技术，而神经网络则是深度学习的基石。从图像识别到自然语言处理，神经网络以独特的结构和学习机制，让计算机能够模拟人类大脑处理复杂信息的过程。本文将带领你从基础理论出发，使用Python和Keras库搭建一个简单的神经网络模型，开启深度学习的探索之旅。一、神经网络基础理论1.1神经元与网络结构神经网络的基本单元是人工神经元（又称节点或单
超实用！零基础打造微信表情识别小程序，源码+数据集全公开 Uyker 小程序人工智能前端
一、技术原理与核心模型基础表情分类使用FER（FacialExpressionRecognition）模型，支持7种基础表情识别：愤怒、厌恶、恐惧、快乐、悲伤、惊讶、中性。技术栈：Python+TensorFlow/Keras+OpenCV，模型基于卷积神经网络（CNN），输入48x48灰度图，输出概率分布。情绪强度量化（进阶）三维情绪模型：通过愉悦度（Valence）、唤醒度（Arousal）、
外汇交易预测平台：综合经济指标与情绪分析的自适应模型应用电竞小潘安
本文还有配套的精品资源，点击获取简介：本文介绍了一个名为"Forex_Technical_Analysis_Platform"的外汇技术分析平台，它采用自适应模型，融合经济指标和情绪分析来预测汇率。平台集成了Python、AWS、TensorFlow、Keras、Scrapy和JupyterNotebook等多种现代数据分析工具和技术，以提供高效的决策支持系统。自适应模型能够自我调整，学习历史数据
第23篇：AI技术实战：基于深度学习的图像识别与分类 CarlowZJ AI+Python 人工智能深度学习分类
目录一、深度学习在图像识别中的应用（一）卷积神经网络（CNN）的关键组件（二）预训练模型迁移学习二、代码示例（一）使用TensorFlow和Keras实现CNN进行图像分类1.数据准备与预处理2.构建CNN模型3.模型训练与评估（二）使用预训练模型进行迁移学习1.使用ResNet-50预训练模型2.微调预训练模型三、应用场景（一）安防监控（二）医疗影像诊断（三）智能零售（四）工业制造四、注意事项（
python第三方库 SherlyYang_ Python python
深度学习框架：Tensorflow、Theano包装深度学习框架的库：Keras（tf和Theano）、tflearn(tf)机器学习库：sklearn、Gensim
使用PyGAD训练Keras模型：从入门到实践 t0_54program 大数据与人工智能 keras 人工智能深度学习个人开发
在机器学习领域，如何高效地训练模型是一个关键问题。PyGAD作为一个开源的Python库，为我们提供了利用遗传算法来训练机器学习算法的有力工具，特别是在训练Keras模型方面，展现出独特的优势。一、PyGAD库简介PyGAD允许开发者构建遗传算法，并用于训练各类机器学习算法。它提供了丰富的参数，能针对不同类型的问题定制遗传算法。比如在解决一些复杂的优化问题时，我们可以通过调整这些参数，使遗传算法更
python第31天打卡 zdy1263574688 python打卡 python 开发语言
importnumpyasnpfromtensorflowimportkerasfromtensorflow.kerasimportlayers,optimizers,utils,datasets#数据加载和预处理函数defload_and_preprocess_data():(x_train,y_train),(x_test,y_test)=datasets.mnist.load_data()#
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那