当交通遇上机器学习

基于卷积神经网络和小波变换的视频监控中的火灾探测

1. 文章信息

本次介绍的文章是2022年发表在EngineeringApplications of Artificial Intelligence上的一篇关于火灾检测的文章，作者团队来自清华大学。

2. 摘要

火灾是威胁公共安全和社会发展的最常见的突发事件之一。近年来，以卷积神经网络为代表的智能火灾探测技术受到了学术界和工业界的广泛关注，大大提高了火灾探测的精度。然而，基于CNN的火灾探测系统仍然受到虚警的干扰和计算能力的限制。本文利用传统光谱分析在火灾图像检测技术中的优势，提出了一种新的小波- CNN方法，该方法利用二维Haar变换提取图像的光谱特征，并将其输入到不同层次阶段的CNN中。利用ResNet50和MobileNet v2(MV2)两个经典骨干网对该方法进行了测试，在一个基准火灾数据集和一个视频数据集上的实验结果表明，该方法提高了火灾探测的准确性，减少了误报，特别是对于轻型MV2。尽管计算需求低，小波- mv2达到的精度可与最先进的方法相媲美。

3. 介绍

火灾往往危及人的生命财产安全。为了最大限度地减少火灾损失，早期有效的火灾探测和自主响应非常重要和有用。在普通建筑中，基于物理信号的探测器，如烟雾传感器、热释放红外火焰探测器、紫外线火焰探测器等，被广泛用于火灾报警。然而，这些传统的物理传感器需要接近火源，因此无法在大型空间建筑和开放空间（如工厂和港口）中工作，并且无法提供火灾位置、大小和燃烧程度等火灾细节。为了克服这些限制，人们提出了基于视觉传感器的火灾探测系统。

视觉火灾探测系统具有以下优点：（1）依赖于越来越多的现有监控摄像头的低成本；（2）大的监控区域；（3）不等待火灾扩散的相对快速的响应时间；（4）不访问火灾现场的火灾确认；（5）火灾细节的可用性。因此，视觉火灾探测方法在过去十年中引起了特别的关注。

尽管进行了上述研究，但在实际应用中仍存在一些挑战。很难消除虚假火灾警报，因为这些方法可能会错误地将自然物体分类，如红色衣服、日落和光线反射。一旦大规模投入使用，高误报率可能会大大降低火灾探测效率，甚至导致火灾报警系统瘫痪。因此，视觉火灾探测的难点在于区分类火灾物体和实际火灾。

此文章将CNN和光谱分析相结合的方法引入火灾早期探测。具体来说，应用小波变换提取图像的光谱特征，然后将这些特征输入到CNN的不同层阶段。文章选择了最简单的小波2D Haar，因为它足以描述不同频率的火焰信息，但文章的方法并不局限于Haar。关键思想是，CNN中的卷积层和池层可以被视为光谱分析的一种有限形式。因此，这两层可以通过2D Haar变换进行推广，以实现光谱分析。为了评估该方法的效率，文章使用了来自多个来源的图像，其中包含大量的火焰和火焰颜色的图像。文章的主要贡献可以总结如下：

（1）它通过结合基于CNN的空间特征和基于小波变换的光谱特征，在准确性和误报率方面主导了最先进的视觉火灾探测方法。

（2）文章的方法显著提高了轻量级CNN的性能，平衡了准确性和计算复杂性。这通常有利于在资源受限的监控网络中进行适应。

（3）介绍了一个包含多种来源图像的多样化、平衡的火灾数据集。文章的数据集包括来自科西嘉火灾数据库（CFDB）的图像（图卢兹等人，2017年）、从福贾和夏尔马的数据集（福贾等人，2015年）中采样和增强的一些火灾和非火灾图像，以及来自互联网的背景中带有类似火灾物体的火灾和非火灾图像。

4. 模型

联合火灾探测方法的总体框架基于Faster R-CNN。

如上图所示，它有三个步骤：特征提取、区域建议生成以及分类和回归。Faster R-CNN进程使得它可以被视为一种分而治之的策略。基于块的模块化网络实现的分治策略具有一些优势。一方面，它为当前占主导地位的端到端方法提供了更多的可解释性。另一方面，已被证明是更有效和高效的任务分割成子任务和应用子网络模块，以找到非常复杂的任务。Faster R-CNN的具体流程如下。首先，将图像输入预先训练好的CNN层，得到特征金字塔网络（FPN）。FPN通常用于Faster R-CNN，其结构如上图右侧的插图所示。它是一种自上而下的体系结构，具有横向连接，用于在所有尺度上构建高层语义特征图。为了更好地分析火灾的光谱特征，文章采用了小波卷积神经网络代替传统的CNN。然后，使用提取的特征映射，区域建议网络（RPN）可以提出一定数量的ROI（兴趣区域）。最后，池层将ROI和特征图进行池化，然后输入到ROI头部（由完全连接的层和softmax层组成），以确定这些ROI的类别并微调其位置。文章的研究重点是为火灾探测设计更好的主干网络，而不是FPN或探测头的设计，并且忽略了自上而下的扩展和后来的连接。

A. 基于小波变换的特征提取

小波CNN模型的关键思想是将小波层与CNN层连接起来。文章进行了三次Haar变换。文章测试了两个典型的骨干网络；一个是高精度、重重量的ResNet50，另一个是轻重量的MobileNet v2。它们分别是服务器端和移动应用程序的代表性体系结构。这两种方法在计算机视觉和火灾探测文献中经常被用作baseline。

上图显示了小波CNN模型的概述，其中（a）是小波NET50，（b）是小波MV2。为了简单起见，文章使用3×224×224的输入图像来说明小波CNN结构。上图中的蓝色立方体代表ResNet50和MV2的卷积特征映射，橙色立方体代表小波特征。一般来说，FPN的计算成本和检测小目标的能力之间存在折衷。如果文章在FPN中重用更多的高分辨率特征映射，文章就能够检测更小的对象。在实际应用中，人们需要平衡FPN的层数和小目标的检测。在文章的实验中，文章发现上图中给出的FPN连接可以在文章的数据集上以相对较小的火提供令人满意的结果。

对原始图像进行第一次Haar小波变换，得到四个小波特征：LL1、HL1、LH1和HH1，每个特征有3个通道，大小为112×112。这些小波特征使用固定参数进行分解，而不会显著增加计算复杂度。然后，文章将这12个通道特征与相同大小的卷积特征连接起来。为了保持下一个卷积层的参数不变，文章从原始卷积特征中删除了12个通道。对LL1进行第二次Haar小波变换，得到大小为56×56的LL2、HL2、LH2和HH2。然后文章将这些小波特征与相同大小的卷积特征连接起来。类似地，执行第三个Haar小波变换。

B.用RPN生成Region Proposal（区域建议）

本阶段的目的是提出对象的可能位置，也称为边界框或锚。为了生成区域建议，更快的R-CNN将选择性搜索过程替换为RPN。RPN的结构如下图所示。

从小波CNN中提取的特征映射被输入到RPN模块，以同时学习对象的类别以及相关的边界框。输出是一组候选边界框，每个框都有一个对象性分数，表示对象属于某个类的概率。通过这种端到端的训练过程，整体计算复杂度显著降低，同时性能得到改善。提高计算效率仍然是一个有待解决的问题，后来开发了几种新的体系结构，如无锚和检测变压器，以实现更高效或更直接的目标检测，而无需此锚提议阶段。RPN为每个图像生成1000个建议，有些建议相互重叠。为了减少冗余，常用的方法是非最大抑制（NMS）算法。将提案1000框列表表示为B，并将过滤后的提案列表表示为D（最初为空）。NMS的过程如下。首先，选择置信度最高的方案框，将其从B中删除并添加到D中。然后，计算该方案与其他所有方案的IOU（联合交叉）。如果IOU大于阈值N，则从B中删除该提案。再次从B中的剩余提案中获取具有最高可信度的提案，并将其从B中删除，然后将其添加到D中。再次使用B中的所有提案计算该提案的IOU，并删除IOU高于阈值的框。重复这个过程，直到B中没有更多的方案。

C. 基于ROI-Head的分类与回归

通过RPN中的ROI池层，文章可以获得每个候选方案的特征向量，它代表了对象属于某一类的概率。然而，该地区提案的具体类别和准确位置仍不得而知。为了解决这个问题，这些特征向量被输入到ROI头部，在ROI头部执行完全连接的层和softmax层，以确定提案所属的类别并计算其对象性得分。同时，利用包围盒回归得到每个区域方案相对于地面真值盒的偏移量的预测值，利用该预测值可以修改区域方案并微调其位置。

5. 实验结果与讨论

本节中，文章进行了详细的实验，以评估和比较文章的方法与其他先进方法的性能。首先，详细描述了用于实验的数据集。然后，为了证明文章提出的方法提高了火灾探测效果，文章将单个CNN的识别率与小波变换和不同结构CNN的组合模型进行了比较。为了证明该方法的优越性，文章还将结果与最近在基准数据集中发布的相关方法进行了比较。最后，针对监控视频场景，增加了视频帧的多数投票机制，并用火灾和非火灾视频对其进行了测试。

A. 数据集描述

在实验中，文章使用了两个图像数据集（ImgDS1和ImgDS2）和一个视频数据集（VDS3）。ImgDS1用于培训和测试。它包含来自科西嘉火灾数据库（CFDB）的1135幅火灾图像（图卢兹等，2017年），从Foggia和Sharma的数据集（Foggia等，2015年）采样和增强的一些火灾和非火灾图像，以及来自互联网的一些火灾和非火灾图像（谷歌和百度）。此类非火灾图像包含一些难以与火灾图像区分的图像，如高照度的鲜红色房间、日落、红色房屋和车辆、不同黄色和红色阴影的明亮灯光等。ImgDS2包括119幅火灾图像和107幅火灾图像。这里使用ImgDS2作为基准数据集，用于测试并与其他已发布的方法进行比较。文章使用80%的ImgDS1图像进行训练，其余图像用于测试。在这种设置下，文章的模型接受了2190幅火灾图像和2215幅非火灾图像的训练。培训和测试数据统计见下表。

ImgDS1和ImgDS2的一些代表性图像如下图所示。

视频数据集VDS3也用于测试。VDS3由8个火灾视频和12个非火灾视频组成，这些火灾视频包含来自大型空间工厂和仓库等室内设施以及高速公路、公园和加油站等室外场所的火灾。它们还包括房屋火灾、电气火灾、泄漏火灾，以及从点火、发展、繁荣到熄灭的不同火灾发展阶段。该数据集中的样本图像如下图所示。

视频细节如下表所示。

B. 图像实验

首先，文章使用ImgDS1来比较文章提出的模型与传统CNN的性能。文章使用ImageNet对原始CNN和小波CNN模型进行预训练，并通过将其与FPN相结合，使用文章的数据集对其进行微调。在实践中，使用大规模公共可用数据集（如ImageNet）进行适当的预训练，可以帮助训练数据有限的特定任务的训练。文章使用V100 GUP随机梯度下降（SGD）对所有模型进行训练，批量大小为8，学习率为0.01。采用翻转、旋转和裁剪等标准数据增强方法，使输入图像的大小达到224×224。

文章比较了有小波层和没有小波层的CNN模型如下图对比。

可以看出，无论是ResNet50还是MV2，小波变换都使假阳性率和假阴性率降低，而准确度、精密度、召回率和Fmeasure增加。对于MV2，图像的假阳性率降低了8.9%，准确性提高了4.7%，精确度提高了6.3%，这是一个显著的改进。用盒子测量的性能有点低，这可能是由于火焰边界模糊导致图像标签的一致性差造成的。尽管如此，值得注意的是，使用小波变换的模型的性能得到了改善。这些结果证明了该方法的有效性文章提出的方法的一部分。也就是说，拼接小波层可以提高CNN模型尤其是轻量级CNN模型的纹理识别能力，从而提高火灾探测的性能。在实际应用中，信噪比影响图像质量。文章添加高斯噪声来模拟受干扰的图像，其中平均值设置为零，标准偏差设置为0、10、20、30、40和50，代表不同的噪声水平。检测结果如下图所示。

可以看到，随着噪声的增加，所有模型的性能都会变差。与原始模型相比，小波模型对高噪声具有更强的鲁棒性。

将文章提出的方法与参考文献中使用ImgDS2的现有火灾探测方法的性能进行了比较。虽然ImgDS2不是很大，但它非常多样化，并且有很多令人困惑的图像。文章将文章的方法与10种有代表性的方法进行了比较，包括4种基于CNN模型的方法和5种基于火的颜色、运动和形状特征等手工特征的方法。文章不与通用探测方法进行比较，因为探测火灾与COCO或其他通用数据集中的探测非常不同。使用精度、召回率和F-measure的评估指标，比较结果如下表所示。

其中最后四个是手工制作的特征模型。首先，需要注意的是，ImgDS2并没有用于所有基于CNN的模型的训练过程，包括文章提出的方法和四个基本CNN模型。然而，尽管手工制作的功能模型在训练中使用ImgDS2，但它们在测试中表现最差。基于CNN的模型在性能上有了全面的质量改进。将文章的方法与其他CNN模型进行比较，可以看出，在精确度和召回率方面，这些方法具有不同的特点。但就F-度量而言，文章可以看到文章的方法总体上更好。此外，文章的方法的召回率达到1，这意味着没有遗漏任何火灾图像。这对实际应用非常重要。文章还检查了文章方法的假阳性图像，其中小波-ResNet50产生15个假阳性图像，小波-MV2产生21个假阳性图像。一些典型的假阳性图像如图13所示。文章可以看到橙红色灯光是假警报的主要来源。在后一项研究中，可以向训练集中添加更多的负光照样本来解决这个问题。

对于真实的监控场景，火灾探测系统对攻击的鲁棒性非常重要。文章测试了方法对不同攻击（如噪声、阻塞和旋转）的性能的影响。文章考虑两个测试图像，一个是火灾图像，另一个是非火灾图像。

原始火灾图像如上图（a）所示，所有模型均能正确检测到。在上图（b）中，图像中的火灾区域受到噪声干扰，模型仍能检测到噪声。小波自适应CNN的检测置信度高于相应的CNN。在上图（c）中，火灾区域被旋转并部分遮挡，文章的方法成功地检测到火灾物体。在上图（d）中，火灾区域完全被遮挡，文章的方法将其预测为无火灾。为了显示对像火焰的性能的影响，文章考虑上图（E）中的图像，通过文章的方法预测为无火。上图（f）和（g）给出了带有噪声和红色图案的火焰状图像。文章发现，小波自适应模型仍然能够正确预测火灾。为了确认文章的方法可以检测到小尺寸的火灾，文章在上图（h）上放置了一个小火灾图像。小波模型以更高的置信度正确地检测它们。这些测试表明，即使视频帧受到噪声的影响或火灾的大小很小，文章的检测方法也可以检测到火灾，这验证了其更好的性能。

C. 视频实验

在本节中，文章使用VDS3演示了文章提出的从真实监控视频中检测火灾的方法的有效性。文章从视频中每秒随机抽取五帧，并将其输入到文章提出的模型中。然后进行多数机制，即如果每秒五帧中的三帧或更多帧被检测为火灾图像，则会发出火灾警报；否则，没有警报。计算效率仍然可以用FPS表示。为了更直观，文章以视频1为例进行进一步阐述。视频1的持续时间为6分钟和20秒。MV2处理视频需要6分钟和21秒，小波-MV2处理视频需要6分钟和20秒，ResNet50处理视频需要10分钟和56秒，小波-ResNet50处理视频需要10分钟和27秒。一般来说，在本文的测试环境下，小波MV2和MV2可以实现实时处理。为了测量性能，文章计算了混淆矩阵、精确度、召回率和每秒F-测量值，如下表所示。

一般来说，小波自适应模型的性能高于相应的原始模型，尤其是FPR为0，这意味着没有虚警。这对于火灾探测尤为重要。传统的感烟火灾探测器由于粉尘和水蒸气的干扰，常有较高的虚警率，可能导致报警瀑布和火灾报警系统瘫痪。降低误报率可以提高效率，这对于基于物联网的智能城市建设至关重要。ResNet50和MV2的假警报出现在video11和video13中，这是由橙色红灯引起的，如下图所示。

6. 结论

本文提出了一种CNN和光谱分析相结合的早期火灾探测方法。文章应用2D Haar变换提取图像的光谱特征，然后在不同的层次将其输入CNN。两个经典的骨干网络被用来测试文章的方法，高精度和重型ResNet50和轻型MV2。结果表明，无论采用何种网络，小波层的引入都可以降低误报率、误报率和计算复杂度，提高准确度、精确度、召回率和F-测度。对于轻量级MV2来说，上述指标的性能提升更为明显。也就是说，小波变换的结合可以提高CNN的火灾识别能力，尤其是轻质CNN。通过对真实监控视频的测试进一步证明，该模型在精度和速度上都能满足实时火灾探测的要求。文章提出的方法可用于化工厂和其他高火灾风险行业。该方法的精度和速度能够满足实时火灾探测的要求。其工业部署将有助于在早期阶段探测火灾，促进应急管理，从而有助于预防损失。本研究仍存在一些不足之处，有待改进。首先，文章的模型不能消除所有的误报。可以将更多橙红色照明图像、一些电气火灾图像和黑白模式下的火灾图像添加到训练集中，以解决此问题。其次，为了验证小波分析和CNN火灾探测模型相结合的普遍性，可以测试更多类型的CNN网络，比如视觉变压器。此外，当应用于视频流分析时，该模型应与推理理论相结合，以提高检测精度。

Attention

欢迎关注微信公众号《当交通遇上机器学习》！如果你和我一样是轨道交通、道路交通、城市规划相关领域的，也可以加微信：Dr_JinleiZhang，备注“进群”，加入交通大数据交流群！希望我们共同进步！

高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
基于Python的智能决策支持系统：实现智能化决策的关键要素 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法4.数学模型和公式详细讲解举例说明线性回归模型最小二乘法5.项目实践：代码实例和详细解释说明6.实际应用场景金融领域医疗领域供应链管理智能制造7.工具和资源推荐编程语言和开发
人工智能之数学基础：矩阵的范数每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能矩阵算法线性代数范数
本文重点在前面课程中，我们学习了向量的范数，在矩阵中也有范数，本文来学习一下。矩阵的范数对于分析线性映射函数的特性有重要的作用。矩阵范数的本质矩阵范数是一种映射，它将一个矩阵映射到一个非负实数。矩阵的范数前面我们学习了向量的范数，只有当满足几个条件的时候，此时才可以，那么矩阵也是一样的，当满足下面的条件的时候，才可以定义||A||为矩阵A的范数矩阵范数的性质连续性矩阵范数是连续的函数。即如果矩阵序
AI 大模型应用数据中心的数据清洗工具 SuperAGI2025 计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
1.背景介绍在人工智能大模型应用的浪潮中，数据清洗作为数据预处理的重要环节，对于提升模型性能和可靠性具有至关重要的作用。数据中心作为人工智能模型的运行环境，面临着海量数据流和多样化的数据类型，如何高效、准确地进行数据清洗，成为应用大模型的关键问题之一。本文将详细介绍AI大模型应用数据中心的数据清洗工具，包括核心概念、算法原理、具体操作步骤、应用场景等，旨在为AI大模型的实际应用提供参考。2.核心概
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
使用LangChain与Amazon Bedrock构建JCVD风格的Chatbot scaFHIO langchain python
技术背景介绍在人工智能时代，构建一个智能化的聊天机器人不仅是一个趋势，更是提升与用户互动体验的关键之一。本文将向你展示如何使用LangChain和AmazonBedrock构建一个仿效让·克劳德·范·达美（JCVD）风格的聊天机器人。我们将借助于Anthropic提供的Claude模型，通过AmazonBedrock强大的基础设施来实现这一目标。核心原理解析LangChain作为一个强大的框架，简
DeepLabv3+改进18:在主干网络中添加REP_BLOCK AICurator 深度学习 python 机器学习 deeplabv3+语义分割
【DeepLabv3+改进专栏！探索语义分割新高度】你是否在为图像分割的精度与效率发愁？本专栏重磅推出：✅独家改进策略：融合注意力机制、轻量化设计与多尺度优化✅即插即用模块：ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介我们提出了一种通用的卷积神经网络（ConvNet）构建模块，可在不增加推理时间成本的情况下提升性能。该模块名为多样化分支块（DBB），通过结合不同尺度和复杂度的多样化分支
Cursor 终极使用指南：从零开始走向AI编程芯作者 DD：日记人工智能机器学习深度学习 AI编程
在数字化浪潮席卷全球的今天，人工智能（AI）已不再是遥不可及的概念，而是逐渐融入我们日常生活的方方面面。作为未来技术的核心驱动力，AI编程成为了众多开发者和技术爱好者争相探索的领域。而在这场技术革命中，Cursor——这一看似简单却功能强大的编程工具，正悄然成为连接初学者与AI编程高手的桥梁。本文将带你从零开始，逐步解锁Cursor的终极使用指南，让你在AI编程的道路上越走越远。一、初识Curso
知识管理系统：构建企业智慧大脑 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
第一部分：知识管理概述与重要性第1章：知识管理的定义与基本概念1.1.1知识管理的起源与发展知识管理（KnowledgeManagement，KM）起源于20世纪80年代，当时企业在市场竞争中逐渐意识到知识作为一种战略资源的重要性。早期的知识管理实践主要集中在知识的收集、存储和传播上。随着信息技术的发展，知识管理逐渐融入了更先进的技术手段，如数据挖掘、人工智能和大数据分析，使其成为一个跨学科、多领
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
Postman高级功能深度解析：Mock Server与自动化监控——构建高效API测试与监控体系测试渣测试工具 postman
引言：Postman在API开发中的核心价值在数字化时代，API（应用程序编程接口）已成为系统间交互的“神经网络”，其质量直接影响用户体验与业务连续性。然而，传统API测试面临两大挑战：开发阶段依赖：前端与后端团队需同步开发，导致进度延迟；测试环境复杂：生产数据敏感、测试场景覆盖不全、性能压力模拟困难。Postman作为全球领先的API开发与测试工具，通过其MockServer与自动化监控两大核心
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
人工智能知识架构详解 CodeJourney. 数据库人工智能算法架构
人工智能（ArtificialIntelligence，简称AI）作为当今最具影响力和发展潜力的技术领域之一，正深刻地改变着我们的生活、工作和社会。从智能家居到自动驾驶，从医疗诊断到金融投资，人工智能的应用无处不在。要全面深入地理解和掌握人工智能，构建一个清晰、系统的知识架构至关重要。二、基础数学（一）线性代数线性代数是人工智能的重要数学基础之一。矩阵运算在数据表示和变换中起着核心作用。例如，在图
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
AI推动地理信息系统（GIS）软件的创新发展与应用拓展酥脆可口 facebook
摘要地理信息系统（GIS）软件作为空间数据处理与分析的核心工具，在城市规划、资源管理、环境监测等领域发挥着关键作用。本文深入探讨人工智能（AI）如何推动GIS软件的创新发展，分析AI技术在提升空间数据分析能力、优化地图制图、拓展应用场景等方面的重要作用，剖析面临的挑战，并对未来发展趋势进行展望，旨在为GIS行业借助AI实现升级提供理论与实践参考。一、引言传统GIS软件主要依赖基于规则的分析方法和人
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
AI驱动软件开发流程的智能化转型与效能提升我有些不开心开发语言
摘要在数字化快速发展的时代，软件开发行业面临着提升效率、保证质量与满足多变需求的挑战。本文聚焦人工智能（AI）如何驱动软件开发流程的智能化转型，探讨其在需求分析、代码编写、测试调试、项目管理等环节对效能的提升，分析转型中面临的挑战，并对未来发展趋势展开展望，为软件行业借助AI实现升级提供理论与实践参考。一、引言传统软件开发流程依赖大量人工操作，各环节易出现沟通不畅、效率低下、错误频发等问题。随着软
详解离线安装Python库爱编程的喵喵 Python基础课程 python 离线安装 requirements
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了详解离线安装Python库，希望能对
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
基于协同过滤推荐算法的景点票务数据系统（python-计算机毕设）计算机程序设计(接毕设) 推荐算法机器学习毕业设计 python 人工智能
摘要IABSTRACTII第1章引言1研究背景及意义1研究背景1研究意义1国内外研究现状2智慧旅游3旅游大数据3研究内容4本章小结4第2章相关技术概述5基于内容的推荐算法5基于内容的推荐算法原理5基于内容的推荐算法实现5协同过滤推荐算法6协同过滤算法原理6协同过滤算法实现7SpringBoot框架9SpringBoot简介9SpringBoot特性10SpringBoot工作原理10Vue.js框
ESG证书：AI预测未来十年职场人的黄金入场券 ESG学习圈 pandas python django
当ChatGPT开始撰写ESG报告，当机器学习模型精准预测企业碳排放轨迹，一场由AI驱动的ESG革命正在颠覆传统可持续发展领域。根据彭博新能源财经预测，到2030年全球ESG资产管理规模将突破50万亿美元，而AI技术将成为撬动这个万亿级市场的核心杠杆。一、AI透视下的ESG黄金时代在微软开发的AI模型ESG-NOW系统中，通过分析全球4300家上市公司近十年的环境数据，成功预测2025年新能源行业
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练 Donvink 大模型 #AIGC stable diffusion AIGC 人工智能机器学习深度学习
目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3
Java IDEA中Gutter Icons图标的含义路宇 java笔记 java intellij-idea 开发语言 gutter-icons 图标 Java开发工具
前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂，风趣幽默"，感觉非常有意思,忍不住分享一下给大家。点击跳转到教程前言：很多人刚开始用IDEA来学习编程，会发现下面这些图标。但是我们有时候并不知道它的含义和设置显示与隐藏，下面给大家讲解一下装订线图标位于左侧编辑器中。它们调用一些基本操作以及其他特定于框架和技术的功能。设置步骤File->Setting进到idea的设置页面。接
【科研必备】EI/Scopus收录！2025年3-4月智能制造、自动化、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！努力毕业的小土博^_^ 学术会议推荐制造自动化人工智能深度学习神经网络算法
【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等前沿领域国际会议邀您参与~与全球学者交流，让学术之光在国际舞台上闪耀！文章目录【科研必备】EI/Scopus收录！2025年3-4月智能制造、无人驾驶、人工智能等
Elasticsearch 介绍：分布式搜索与分析引擎吱屋猪_ elasticsearch
在如今大数据时代，企业和开发者面临着前所未有的数据量和实时性要求。为了能够高效地处理、存储和查询这些数据，Elasticsearch作为一种强大的分布式搜索引擎，已经成为了很多组织和开发者的首选解决方案。1.什么是Elasticsearch？Elasticsearch是一个开源的、基于ApacheLucene构建的全文搜索引擎。它提供了高效的搜索功能，并且非常适合处理大量数据，尤其是在需要快速搜索
知识库在意图识别中扮演着**数据支撑**和**语义理解辅助**的双重角色 PersistDZ 大数据与AI 人工智能
知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。以下是详细解析：一、知识库在意图识别中的作用1.提供标注数据意图标签定义：知识库中存储了预先定义的意图分类体系（如“订单查询”“退换货”“投诉”等），为模型提供明确的训练目标。标注样本：知识库包含大量用户对话历史及其对应的意图标签，是训练监督学习模型的核心数据源。2
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

基于卷积神经网络和小波变换的视频监控中的火灾探测

你可能感兴趣的:(大数据,计算机视觉,神经网络,机器学习,人工智能)