鲸落于北

YOLOv3，YOLOv4学习

YOLOv3，YOLOv4神经网络学习

前面刚刚学过了YOLO以及YOLOv2神经网络的架构原理，不过要学还是要学最新的网络，YOLOv3，乃至YOLOv5都是在YOLO网络的基础进一步改进而来，这篇博客是基于《YOLOv3: An Incremental Improvement》和《YOLOv4: Optimal Speed and Accuracy of Object Detection》，以及结合一些网上的解读来写的，主要是个人的一些理解。

YOLOv3：渐进式改进

YOLOv3与YOLO9000一样，采用维度簇作为anchor box来预测bounding box。

YOLOv3使用逻辑回归预测每个bounding box对象得分，每个grid cell都会预测多个不同size的bounding box，v1中是2个，v2是5个，v3是3个，但是3个预测框里只有与真实框（ground truth）重合度最高的那个，才是真正用来预测对象的bounding box，这个重合度阈值作者定义为0.5

分类预测

原先都是单标签分类，即网络层上使用softmax层来进行单标签多分类，但是YOLOv2中作者就提到了多标签分类的WordTree方法，所以他们改用了多标签多分类的逻辑回归层替代softmax层。逻辑回归层主要用到sigmod函数。

跨尺度预测（Predictions Across Scales）

YOLOv3预测3中不同size的box，从金字塔网络相似的概念下提取不同尺度的特征信息，在YOLOv2中，他们是通过连接passthrough层来获取2626的feature map，而在YOLOv3中则是采用了类似FPN的做法，再融合了2626和52*52两个feature map。

说回上文，为什么YOLOv3又减少了每个grid cell预测的bounding box数量，其实是因为实际上增多了太多。 YOLOv2是融合特征，但是只在1313的feature map上进行bounding box的预测，而YOLOv3在3个size的feature map上分别预测，也就是YOLOv2的预测数量是13135=845，而YOLOv3的预测数量是(1313+2626+5252)*3=10647，不得不减少。

每个bounding box是（4+1+80）个参数（四个框参数，一个对象参数，80个种类参数）。

bounding box的先验预测仍然使用K-means聚类来实现，随意选择9个集群和3个scale，然后在不同scale上均匀地划分集群。

特征提取网络

是的他们又改了新的网络，所以说神经网络的发展是真的快，这次Joseph等人采用的是YOLOv2用的DarkNet-19的同族，DarkNet-53，包含53个卷积层。

Joseph等人指出DarkNet-53甚至比ResNet-101或ResNet-152效率更高，实现了每秒最高的浮点运算。这意味着该网络结构更好地利用了GPU，使其评估更有效，运行速度更快。

DarkNet-53有几个特点，一是全卷积，不再使用pooling层来压缩图像，二是引入了ResNet的residual结构，降低了网络加深带来的训练难度。DarkNet-53只是特征提取层，multi-scale的特征融合和预测支路并没有在该网络结构中体现。

YOLOv4

YOLOv4比YOLOv3是更大的突破，可以说在速度和精度上都做到了第一梯队，碾压同济。

作者简介了他们在YOLOv4设计过程中提出的一些调优手段：

加权残差连接（WRC）；跨阶段部分连接（CSP）；跨小批量标准化（CmBN）；自对抗训练（SAT）；Mish激活；马赛克数据增强；CmBN；DropBlock正则化；CIOU Loss等

经过一系列的调优，最终在Tesla V100上达到了43.5%的AP。YOLOv4实现了真正的可以让每个人都使用1080Ti或2080TiGPU来训练一个快速且准确的目标检测器。

作者对现有目标检测算法进行了总结，如上图。目标检测器都可以划分为如下结构，不过不同算法的设计与改进重点不同：

Input：输入，图片、补丁或图像金字塔；

Backbones：网络骨干，主要指特征提取网络，如VGG16等，可以在ImageNet上进行预训练；

Neck：指特征提取网络和预测网络之间的插入层，这些层通常用于收集不同阶段的特征图。通常，Neck由多条自下而上的路径和多条自上而下的路径组成，具有这种机制的网络包括特征金字塔网络FPN、路径聚合网络PAN、BiFPN和NAS-FPN等。

Head：指可以用来预测物体类别和边框的部分，一般可以分为单阶段目标检测算法和双阶段目标检测算法。最具代表性的双阶段目标检测算法是RCNN系列，包括fast RCNN、Faster RCNN、R-FCN、Libra RCNN。

单阶段的目标检测算法最具代表性的就是YOLO、SSD和RetinaNet，以及一些无锚式检测算法，如CenterNet、CornerNet、FCOS等。

除了上述模型外，也有一些研究人员把重点放在了直接构建一个新的主干（DetNet、DetNAS）或一个新的整体模型（SpineNet、HitDetector）用于目标检测。

Bag of freebies

虽然不太懂作者为啥要取了这个名字，不过他们确实把这章称为免费赠品包，这一章主要指只改变培训策略或只增加培训成本的方法，比如常用的数据增强，主要用于在离线训练阶段提高精度。

数据增强

数据增强的目的是增加输入图像的可变性，提高系统在不同环境下的鲁棒性，光度畸变和几何畸变是两种最常用的数据增强方法。

光度畸变主要包含亮度、对比度、色调、饱和度和噪声的调整，几何畸变则主要包含随机缩放、剪切、翻转和旋转等。这些都属于像素级的调整。

还有一些研究把重点放在了模拟物体遮挡问题上，例如random erase和cut out，hide-and-seek和grid mask等。此外，还有一些研究将多幅图像一起进行数据增强，例如MixUp将两张图乡使用不同系数比例相乘叠加，然后根据叠加比例调整标签，CutMix则是将图像裁剪后覆盖到其他图像上。

语义分布偏差

语义分布偏差问题是不同类别之间存在数据不平衡的问题，这一问题通常通过双阶段目标检测算法中的困难否定例挖掘（hard negative example mining）或在线难例挖掘（online hard example mining）。

但是实例挖掘并不适用单阶段目标检测器，因为这类检测器属于密集预测体系结构。

边界框回归目标函数

传统的目标检测器使用均方误差（MSE）直接执行中心点坐标以及BBox（Bounding Box）宽高的回归，或者左上角点和右下角点的回归。基于锚点的方法是估计相应的偏移量，但是，直接估计的BBox每个点的坐标值是将这些点视作了独立变量，没有考虑对象本身的完整性。

于是有研究提出了IoU Loss，将预测的BBox区域与ground truth BBox区域的重合度纳入考虑。IoU Loss的计算过程将通过计算预测BBox与ground truth BBox的IoU，触发计算BBox四个坐标点。

由于IoU是尺度不变的表示法，可以解决传统方法计算{x,y,w,h}时的随尺度增大的损失。他们提出寻找最小的BBox，同时覆盖预测BBox和ground truth BBox，利用这个BBox为分母，代替原来用于计算IoU损失的分布。DIoU损失考虑物体中心的距离，CIoU则同时考虑了重叠面积、中心点之间的距离和长宽比。CIoU可以在BBox回归问题上取得较好的收敛速度和精度。

Bag of specials

特殊包指的是一些插件模块和后处理方法，只增加少量推理成本，但能够显著提高目标检测的准确性。

一般来说，这些插件是为了增强模型中的某些属性，比如扩大接受野、引入注意机制、增强特征整合能力等，后处理则是对模型预测结果进行筛选的一种方法。

增强感受野

常用的增强感受野的模块有SPP、ASPP和RFB。SPP模块源于空间金字塔匹配（Spatial Pyramid Matching，SPM），SPMs的原始方法是将feature map分割成几个 $d\times d$ 的区块，其中 $d$ 可以是1,2,3……，从而形成金字塔，进而提取词袋特征。

SPP将SPM集成到CNN中，使用max-pooling操作而不是bag-of-word操作。YOLOv3加入了升级版的SPP模块，在MS COCO目标检测任务上提升了2.7%的 $AP_{50}$ ，但是增加了0.5%的额外计算负担。

注意力模块

目标检测中常用的attention module主要分为channel-wise attention和point-wise attention，这两种attention module的代表分别是SE(Squeeze-and-Excitation)和SAM(Spatial Attention Module)。

SE module能够在提高ImageNet的图像分类任务top-1正确率1%的同时仅提高2%的计算负担，但是在GPU上它会增加10%的计算时间，所以更适合用于移动设备。

SAM只需要0.1%的额外计算就能提高ResNet50-SE 0.5%的top-1正确率，而且不会影响GPU运行速度。

特征集成

早期的做法是使用跳跃连接或超列来将低级物理特征集成到高级语义特征中。

随着FPN等多尺度预测方法六星，人们提出许多集成不同特征金字塔的轻量级模型。

激活函数

也有人重点研究寻找一个好的激活函数，一个好的激活函数可以促使梯度更有效地传播，同时不会造成太多额外的计算成本。

2010年，Nair和Hinton提出了ReLU，根本上解决了传统的tanh和sigmoid激活函数中经常遇到的梯度消失问题。随后，LRReLU、PRReLU、ReLU6等等激活函数也被提出。LRReLU和PRReLU是为了解决当输出小于零时ReLU梯度为零的问题。ReLU6和hard-Swish则是专门为量化网络设计的。SELU则是为了对神经网络进行自归一化。

后处理方法

NMS是常用的后处理方法之一，用于过滤那些预测不好的BBox，只保留响应较高的候选BBox。NMS试图改进的方法与优化目标函数的方法是一致的。

原始的NMS方法没有考虑上下文信息，因此Girshick等人参考R-CNN加入分类置信度，并根据置信度的顺序，按照从高到低的顺序运行greedy NMS。对于soft NMS，考虑对象遮挡问题可能导致带有IoU评分的greedy NMS置信度下降的问题。

调优方法

基础目的是提高神经网络在生产系统中的运行速度和并行计算优化，而不是低计算量的理论指标（BFLOP）。作者提出了两种实时神经网络选择：

GPU使用了卷积层数较少的网络：CSPResNeXt50/CSPDarknet53

VPU使用分组卷积，但是避免使用SE模块，具体来说包括以下模型：EfficientNet-lite/MixNet/GhostNet/MobileNetV3

结构选择

结构选择的目标是贼输入网络分辨率、卷积层数、参数数（滤波器尺寸2filterschannel/groups）和输出层数（滤波器）之间找到最佳的平衡。

作者通过大量研究表明，在ILSVRC2012（ImageNet）数据集上的对象分类方面，CSPResNext50比CSPDarknet53要好得多。但是在MS COCO数据集上进行目标检测方面，CSPDarkNet53比CSPResNext50要好。

下一个目标是选择额外的块来增加接受场，并从不同的骨干级别对不同的检测器级别进行参数聚合的最佳方法，例如FPN、PAN、ASFF、BiFPN。

最适合分类的参考模型并不总是最适合检测器的。与分类器不同，检测器需要以下条件：

更高的输入网络大小（分辨率）-用于检测多个小型对象
更多的层次-为了一个更高的接受野，以覆盖扩大的输入网络
更多的参数-为更大的容量的模型，以在单张图片上检测多个不同大小的目标

假设可以选择一个接受野尺寸较大（ $3\times3$ 的卷积层数较大）和参数数量较大的模型作为body。实验表明，CSPDarknet53神经网络作为检测器的body更优。

不同大小的感受野的影响归纳如下：

根据对象大小-能够查看整个对象
根据网络size-能够查看对象周围的内容
超出网络size-增加图像点和最终激活之间的连接数量

作者在CSPDarknet53上添加SPP块，因为它显著增大了接受野，分离出最重要的纹理信息，而且几乎不会损失运行速度。再使用PANet作为不同骨干级别对不同检测器级别的参数聚合方法，而不是YOLOv3中使用的FPN。

最后，选择了CSPDarknet53作为body，SPP作为附加模块，PANet路径聚合作为neck，YOLOv3（anchor based）作为head，共同构建了YOLOv4。

BoF和BoS的选择

CNN通常用以下方法来改进目标检测训练：

（1）激活函数：ReLU，leaky-ReLU，parametric-ReLU，ReLU6，SELU，Swish，Mish
（2）BBox回归损失：MSE，IoU，GIoU，CIoU，DIoU
（3）数据增强：CutOut，MixUp,CutMix
（4）正则化方法：DropOut，DropPath，Spatial DropOut，DropBlock
（5）通过其均值和方差对网络激活进行标准化
（6）跳跃连接：残差连接，加权残差连接，多输入加权残差连接，跨阶段部分连接

训练激活函数方面，PReLU和SELU训练比较困难，而ReLU6是专门为量化网络设计的，因此从优化候选列表中排除。在正则化的方法上，使用了DropBlock作为正则化方法。

额外提高

为了使设计的检测器更适合在单个GPU上训练，作者还做了一些额外的改进：

（1）引入了一种新的数据增强拼接方法和自对抗训练；
（2）在应用遗传算法时，选择了最优超参数；
（3）修改了一些现有的方法，是设计更适合高效训练和检测-modified SAM，modified PAN，Cross mini-Batch Normalization（CmBN）。

Mosaic是一种新的混合训练图像的数据增强方法，可以混合四种不同的纹理。这使得系统能够检测超过正常纹理的对象。此外，批归一化计算每一层上4个不同图像的激活统计。这大大减少了对小型批量的需求。

自对抗训练（SAT）也代表了一种新的数据增强技术，在两个前向后向阶段操作。在第一阶段，神经网络改变原始图像而不是网络权值。通过这种方式，神经网络对自己实施了一种对抗性的攻击，改变原始图像，制造出图像上没有想要的物体的假象。第二阶段，训练神经网络以正常的方式检测修改后的图像上的目标。

YOLOv4

上面讲了一堆，最后到底YOLOv4到底是怎样的构成呢？

YOLOv4的组成：
（1）Backbone：CSPDarknet53
（2）Neck：SPP，PAN
（3）Head：YOLOv3

YOLOv4使用的优化手段：
（1）BoF for backbone：CutMix，马赛克数据增强，DropBlock正则化，类标签平滑
（2）BoS for backbone：Mish激活，跨阶段部分连接（CSP），多输入加权残差连接（MiWRC）
（3）BoF for detector：CIoU-loss，CmBN，DropBlock正则化，马赛克数据增强，自对抗训练，消除网格敏感性，使用多个锚定义一个真实物体，Cosine annealing scheduler，最优超参数，随机训练形状
（4）BoS for detector：Mish激活，SPP-block，SAM-block，PAN path-aggregation block，DIoU-NMS

深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
《从依赖纠缠到接口协作：ASP.NET Core注入式开发指南》后端
在C#的ASP.NETCore开发中，依赖注入绝非简单的技术技巧，而是重构代码关系的底层逻辑。它像一套隐形的神经网络，让程序模块摆脱硬编码的束缚，在运行时实现动态连接，从而为系统注入可测试、可进化的核心生命力。理解其深层价值，需要穿透"服务注册与获取"的表层操作，触及它对软件设计哲学的重塑。依赖注入的本质，是对"依赖关系"的去中心化治理。传统开发中，模块间的依赖如同藤蔓缠绕的树木，一个组件直接创建
根茎式装配体（RA）作为下一代协同智能范式的理论、架构与应用由数入道人工智能思维框架软件工程智能体
一、引言——范式危机与新大陆的召唤1.1表征主义的黄昏：当前AI协同范式的认知天花板自艾伦·图灵在《计算机器与智能》中播下思想的种子以来，人工智能的漫长征途始终被一个强大而内隐的哲学范式所笼罩——我们称之为“表征主义”（Representationism）。这一范式，无论其外在形态如何演变，从早期的符号逻辑、专家系统，到如今风靡全球的深度学习神经网络，其核心信念从未动摇：智能的核心，在于构建一个关
【零基础学AI】第36讲：GPT模型原理 1989 0基础学AI 人工智能 gpt lstm rnn YOLO 目标检测
本节课你将学到理解GPT模型的基本原理掌握Transformer解码器的工作机制实现一个简单的文本生成应用开始之前环境要求Python3.8+安装包：pipinstalltransformerstorch硬件：CPU即可运行（GPU可加速）前置知识了解基本的神经网络概念（第23讲内容）熟悉Python编程基础核心概念什么是GPT？GPT（GenerativePre-trainedTransform
【零基础学AI】第31讲：目标检测 - YOLO算法 1989 0基础学AI 人工智能目标检测 YOLO rnn lstm tensorflow
本节课你将学到YOLO算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU（非必须）前置知识基本Python编程能力了解卷积神经网络（CNN）的基本概念（第24讲内容）核心概念什么是目标检测？目标检测就像教计算机"看"图片中的物体。它不仅要
前沿交叉：Fluent与深度学习驱动的流体力学计算体系 m0_75133639 流体力学深度学习人工智能航空航天 fluent 流体力学材料科学 CFD
基础模块流体力学方程求解1、不可压缩N-S方程数值解法（有限差分/有限元/伪谱法）·Fluent工业级应用：稳态/瞬态流、两相流仿真（圆柱绕流、入水问题）·Tecplot流场可视化与数据导出2、CFD数据的AI预处理·基于PCA/SVD的流场数据降维·特征值分解与时空特征提取深度学习核心3.物理机理嵌入的神经网络架构·物理信息神经网络（PINN）：将N-S方程嵌入损失函数（JAX框架实现）·神经常
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
机器学习与光子学的融合正重塑光学器件设计范式 m0_75133639 光电智能电视二维材料电子半导体人工智能顶刊 nature
Nature/Science最新研究表明，该交叉领域聚焦六大前沿方向：光子器件逆向设计、超构材料智能优化、光子神经网络加速器、非线性光学芯片开发、多任务协同优化及光谱智能预测。系统掌握该领域需构建四维知识体系：1、基础融合——从空间/集成光学系统切入，解析机器学习赋能光学的理论必然性，涵盖光学神经网络构建原理2、逆向设计革命——通过AnsysOptics实战，掌握FDTD算法与粒子群/拓扑优化技术
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
【第三章:神经网络原理详解与Pytorch入门】02.深度学习框架PyTorch入门-(4)Pytorch实战 IT古董人工智能课程深度学习神经网络 pytorch
第三章:神经网络原理详解与Pytorch入门第二部分：深度学习框架PyTorch入门第四节：Pytorch模型构建内容：如何搭建复杂网络以及如何修改模型与保存一、构建复杂神经网络结构在PyTorch中，构建复杂模型通常通过继承nn.Module类，分模块组织层与前向传播逻辑。示例：自定义一个卷积神经网络（CNN）importtorch.nnasnnimporttorch.nn.functional
Transformer、BERT等模型原理与应用案例程序猿全栈の董（董翔）人工智能热门技术领域 transformer bert 深度学习
Transformer、BERT等模型原理与应用案例Transformer模型原理Transformer是一种基于注意力机制的深度学习模型架构，由Vaswani等人在2017年的论文"AttentionIsAllYouNeed"中提出。与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同，Transformer完全依赖自注意力机制来处理输入序列的全局依赖关系。核心组件多头自注意力机制(Mul
大模型卷积神经网络（CNN）的架构原理 hao_wujing cnn 架构人工智能
大家读完觉得有帮助记得关注和点赞！！！一、卷积神经网络（CNN）的核心原理与架构CNN是一种专为结构化数据（如图像、文本）设计的深度学习模型，其核心在于层次化特征提取与参数高效共享，使其成为大模型中视觉和多模态任务的基础组件。1.核心结构分层解析输入层接收预处理后的数据（如图像去均值、归一化），为后续卷积操作提供标准化输入39。卷积层（核心）局部感知：每个卷积核（如3×3）仅处理输入数据的局部区域
用Keras构建爱情模型：破解情侣间的情感密码忆愿高质量领域文章 keras 人工智能深度学习 python 机器学习自然语言处理神经网络
文章目录一、给情话穿上数字马甲1.1中文分词那些坑1.2停用词过滤玄学二、给神经网络装个情感温度计2.1记忆增强套餐2.2注意力机制实战三、给模型喂点狗粮数据3.1数据增强七十二变3.2标注的艺术四、调参比哄对象还难4.1超参数扫雷指南4.2可视化调参黑科技五、实战演练之保命指南5.1部署成求生APP5.2案例分析库六、当AI遇见现实：模型局限与伦理困境6.1隐私雷区七、从玩具模型到生产系统7.1
Python结合TensorFlow实现图像风格迁移 Python编程之道 Python人工智能与大数据 Python编程之道 python tensorflow 开发语言 ai
Python结合TensorFlow实现图像风格迁移关键词：Python、TensorFlow、图像风格迁移、神经网络、内容损失、风格损失摘要：本文将带领大家探索如何使用Python结合TensorFlow来实现图像风格迁移。图像风格迁移是一项神奇的技术，它能将一幅图像的风格应用到另一幅图像上。我们会从基础概念讲起，解释图像风格迁移背后的原理，通过Python代码详细展示实现过程，还会探讨实际应用
深度学习最简单的神经网络线性回归网络
用最简单的线性模型讲清神经网络训练全流程，让你5分钟看懂AI是怎么学会预测的1真实神经元结构真实神经元包括：树突接收其他神经元传来的电信号（输入）。细胞核负责整合输入信号并产生动作电位。轴突传导动作电位到下一个神经元。突触释放神经递质，将信号传递给下一个神经元的树突。2线性回归神经网络原理（与神经元对比）假设输入是x_1,x_2,x_3x\_1,x\_2,x\_3x_1,x_2,x_3，权重是w_
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
lstm 输入数据维度_[mcj]pytorch中LSTM的输入输出解释||LSTM输入输出详解萬重 lstm 输入数据维度
最近想了解一些关于LSTM的相关知识，在进行代码测试的时候，有个地方一直比较疑惑，关于LSTM的输入和输出问题。一直不清楚在pytorch里面该如何定义LSTM的输入和输出。首先看个pytorch官方的例子：#首先导入LSTM需要的相关模块importtorchimporttorch.nnasnn#神经网络模块#数据向量维数10,隐藏元维度20,2个LSTM层串联(如果是1，可以省略，默认为1)r
Gemini vs DeepSeek：Transformer 架构下的技术路线差异与企业级选择 charles666666 transformer 架构深度学习语言模型产品经理人工智能
一、引言：从商业价值切入Gemini和DeepSeek都基于Transformer架构，但在技术路线和应用场景上各有侧重。本文将解密同源Transformer下的技术分野，帮助企业做出更明智的大模型选型决策。二、Transformer核心机制精要Transformer架构是现代大语言模型的基础，其核心机制包括自注意力机制和前馈神经网络。自注意力机制使模型能够捕捉序列中元素的全局依赖关系，但也是GP
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
神经网络初步学习3——数据与损失 X Y O 神经网络学习人工智能
一、传统机器学习与神经网络前言：该部分需要一定的机器学习与数学基础（很浅的基础），如果有不理解的地方可以自行查阅。（1）区别这里不妨以图像识别为例子：（1）在传统的机器学习视角中：我们需要人工手动去设置并提取我们的特征量，例如常见的SIFT、SURF和HOG等，随后需要我们选择合适的分类器（例如：SVM、KNN等分类器）,接着把我们的参数训练出来。（2）而在神经网络的视角中：我们只需要把图片喂给它
量化价值投资中的深度学习技术：TensorFlow实战
量化价值投资中的深度学习技术：TensorFlow实战关键词：量化价值投资,深度学习,TensorFlow,股票预测,因子模型,LSTM神经网络,量化策略摘要：本文将带你走进"量化价值投资"与"深度学习"的交叉地带，用小学生都能听懂的语言解释复杂概念，再通过手把手的TensorFlow实战案例，教你如何用AI技术挖掘股票市场中的价值宝藏。我们会从传统价值投资的痛点出发，揭示深度学习如何像"超级分析
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

YOLOv3，YOLOv4学习

YOLOv3，YOLOv4神经网络学习

YOLOv3：渐进式改进

分类预测

跨尺度预测（Predictions Across Scales）

特征提取网络

YOLOv4

Bag of freebies

数据增强

语义分布偏差

边界框回归目标函数

Bag of specials

增强感受野

注意力模块

特征集成

激活函数

后处理方法

调优方法

结构选择

BoF和BoS的选择

额外提高

YOLOv4

你可能感兴趣的:(神经网络学习,神经网络)