六个核桃Lu

异常检测 | 基于Siamese网络学习距离函数来定位视频中的异常

关于论文学习

这篇文献中作者通过训练一个 Siamese 神经网络，将手工制作的表示和距离函数替换为学习的表示和距离函数，建立了简单的最近邻方案．Siamese 网络通过训练将视频块对分类为相似或不同，并用来找到与所有训练视频块不同的测试视频块，因此判定是异常的．从目标数据集的训练数据中学习一个样本模型（包含所有唯一的正常视频块）．最后，使用经过训练的 Siamese 网络中的测试视频块和样本之间的最近邻居评分来为每个测试视频块分配异常评分．

特性：即插即用的方法（学到的距离函数可以在目标数据集上即用即得），以及可扩展和抗环境变化的特性（exemplar集的更新非常容易）。

论文地址：Learning a distance function with a Siamese network to localize anomalies in videos | IEEE Conference Publication | IEEE Xplore

一、介绍

训练提供只提供普通视频，这样问题就变成了从正常的训练视频中建立正常活动的模型，然后在同一场景的测试视频中检测出与模型有较大偏差的异常。

大多数以前的方法都有局限性，这可以归结为以下一个或多个原因，这也是作者研究方法的动机：

(1)许多方法中使用的特性都是手工制作的。例如spatiotemporal gradients , dynamic textures, histogram of gradients , histogram of flows , flow fields 和 foreground masks。

(2)几乎每一种方法都需要一个昂贵的计算模型建立阶段，需要专家知识，这可能不适合实际应用。

(3)许多以前的工作重点是只检测特定的偏离异常。

为了克服这些限制，作者提出了一种基于exemplars的最近邻方法来检测视频异常，该方法使用一个由Siamese CNN学习的距离函数来测量测试视频中与正常活动的相似程度。作者的方法建立在这篇论文的工作之上，在中，使用普通视频创建一个普通活动的模型，该模型由视频的每个空间区域的一组范例组成。范例是表示视频patch的特征向量，即固定大小H × W × T的视频时空块，其中H、W、T分别为视频patch的高度、宽度和时间深度。视频空间区域的范例代表了在该区域内正常视频中出现的所有独特的视频补丁。范例是特定于区域的，因为异常是特定于区域的简单事实。为了检测异常，将测试视频中某个特定空间区域的视频补丁与该区域的样本进行比较，异常分数即为到最近的样本的距离。如果一个测试视频补丁和每个范例视频补丁不一样，那么它就是异常的。在中，使用手工制作的特征(前景蒙版或流场)来表示视频补丁，并使用预定义的距离函数(L2或归一化L1)来计算特征向量之间的距离。作者提出学习一个更好的特征向量和距离函数，通过训练一个Siamese CNN来测量对视频补丁之间的距离。作者的CNN不是特定于特定的场景，而是从几个不同的源视频异常检测数据集的视频补丁中训练出来的。这个想法在精神上类似于学习CNN匹配补丁的工作，只是扩展到了视频。实验表明，在UCSD Ped1、Ped2和中大Avenue测试集上，作者的方法或优于或与目前的技术水平相当。

图1 场景说明：UCSD Ped2、ShanghaiTech和CUHK Avenue被用作源数据集来学习距离函数

        综上所述，作者的主要贡献是:
        1. 作者的方法将训练CNN将视频斑块分类为正常或异常的问题（因为没有异常的训练例子，所以无法做到）转化为训练CNN计算两个视频斑块之间的距离的问题（可以为这个问题产生大量的例子）。无论目标数据集如何，都使用相同的参数来训练来自源数据集的CNN。
        2. 这种方法允许特定任务的特征学习，允许从正常视频中有效地建立典范模型，并将各种偏离常态的情况检测为异常情况。
        3. 通过将问题的复杂性转移到距离函数学习任务上，简单的1-NN distance-toexemplar异常检测变得高度可解释。据作者所知，作者的论文是第一个采取这种方法进行异常检测的。

二、相关工作

2.1 基于距离的方法

基于距离的方法包括从训练分区创建一个模型，并测量与该模型的偏差，以确定测试分区的异常分数。

图2 使用学习到的距离函数对UCSD Ped1目标数据集进行样本提取和异常评分的说明

2.2 基于概率的方法

概率方法与基于距离的方法类似，只是该模型有一个概率解释，例如，作为一个概率图形模型或一个高维概率分布。

2.3 基于重构的方法

重构方法的目的是将输入分解为其共同的构成部分，并将它们重新组合起来，以重建输入，使 "重建误差 "最小化。

这部分详细内容可以参考：异常检测 | 监控视频的异常检测与建模_六个核桃Lu的博客-CSDN博客

三、方法

通过构建的基于exemplars的最近邻方法，作者的主要问题是学习一个距离函数，用于比较测试视频中的video patches和代表正常视频中所有唯一的video patch的样本video patches。为此，作者使用了一个类似于Bromley和LeCun首次引入的Siamese网络(见图1)。

（关于Siamese网络训练，我这篇文章内有介绍：Meta Learning（元学习）_六个核桃Lu的博客-CSDN博客）

本质上，通过将异常检测任务本身变成一个相当简单的最近邻距离计算(见图2)，作者试图将建模这个问题复杂性的负担转移到学习距离函数的任务上。这个学习问题可以离线完成，并且可以从源数据集中获得大量的训练数据。理想情况下，这可以一次完成，并产生的特征表示和距离函数用于各种不同的目标数据集。

3.1 生成训练视频补丁对（Generating training video patch pairs）

在训练Siamese网络来估计两个视频patch之间的距离时，主要的困难在于如何生成相似和不同video patch对的训练集。一个训练示例由一对video patch和一个二进制标签组成，表示这两个video patch是相似还是不同(见图1第1部分)。选择video patch对，正确对应它们的ground truth标签“相似”或“不同”。还应该选择对，这样在测试时间对CNN输入的可能域的覆盖是高的。这是为了确保在测试时不要求CNN对域外输入进行操作。

作者使用现有的视频异常检测数据集来做到这一点。使用一个源集标记的视频异常检测数据集来生成相似和不同的video patch对。用于生成训练示例的标记数据集当然应该与最终将进行测试的目标视频异常检测数据集分离。

基本观点如下:对于每个源数据集，

(1) 测试区的非异常video patch与训练区中同一空间区域的至少一个video patch相似。如果它与任何正常的video patch不同，那么它就是异常的。

(2) 测试分区的异常video patch与训练分区中同一空间区域的所有可能的video patch不同。此外，它甚至与最相似的video patch也不同。

第一条规则为测试视频中的每个正常video patch生成一对，尽管由于任何测试视频中都有许多正常的video patch，该规则可以生成许多相似的对。第二个规则为测试视频中的每个异常video patch生成许多不一样的不同的对。第一个规则需要一个距离函数来找到与测试video patch最相似的训练video patch。对训练最有用的在第二条规则中，由一个距离函数很难知道哪些是不同的(即相似的)，这也是很有用的。我们使用一个简单的归一化L1距离作为我们的距离函数，以及3.2节中描述的video patches的表示。

对于使用预定义的距离函数来帮助选择训练实例，不必担心是Siamese网络可能只是学习这个距离函数，原因是：每个example pair的标签不是L1距离，而是一个0或1，分别表示这对exemplar是相似还是不同。其次，两个相似对之间的L1距离有可能比两个不同对之间的L1距离大。

需要注意的是，标准化的L1距离并不能很好地测量video patches之间的距离。例如，这个距离没有考虑到自然图像中的许多变化，如比例、照明和物体的姿势。因为这些变化主要存在于摄像机场景的不同区域，所以在归一化L1距离上确定了一个自适应阈值来执行这些配对。考虑上述规则，结合检查给定区域内最近邻距离的分布，确定区域的阈值。具体地说，相机帧中给定区域的自适应阈值被简单地确定为µ + α * σ，其中µ是测试video patch和训练video patch之间的最近邻居距离的平均值，σ为对应的标准差，α通过识别最近邻距离分布中的弯头来确定(实验中作者一致将其设为0.2)。自适应阈值在源数据集中是常见的，但在相似和不相似的对中是不同的。

注意，在Siamese网络中，距离较大的不同配对更容易被区分;另一方面，尽管有这种特性，我们仍然需要一些这样的配对来实现高域收敛。因此，作者包含了概率与它们之间的距离成反比的候选对，实现了高域覆盖，但也有足够数量的示例接近决策边界。我们还将随机video patch与它们的轻微增强(随机平移和/或中央缩放)版本配对。最后的video patch对数据集由相同数量的相似和不同的patch对组成。

3.2 学习距离函数（Learning a distance function）

表示方式的选择:此时选择video patch的表示方式是很重要的，这样学习到的距离函数才能很好地用于异常检测任务。作者选择的表示法包括一个 H × W × C 的长方体。鉴于所有异常都是基于外观或运动，作者采用多模态表示。在接下来的所有实验中，第一个通道是灰度图像patch，接下来的12个通道是6对图像patch之间密集光流场x和y方向梯度绝对值的图像patch。设C = 13，所有实验设H = 20, W = 20。参见图1(第2部分)进行说明。

预处理:训练过程中对每个video patch pairs 的 x1, x2 进行随机量的数据增强，以提高学习到的距离函数对这些变化的稳定性。数据增强包括随机从左到右翻转，在[0.7,1]中集中缩放和在[-0.2,0.2]中第一个通道的亮度抖动。预处理还涉及到每个视频patch从[0,255]到[- 1,1]的线性缩放强度值。

网络架构和培训:图3概述了作者的网络架构。

每对视频中的每一个patch首先使用2 × 2 max-pooling的conv-relu-batchnorm操作独立处理，在每一个卷积之后，称之为卷积孪生“尾巴”。尾巴之间的权重绑定保证了两个极其相似的视频片段不可能有非常不同的中间表示，因为每个尾巴计算的是相同的函数。最后，从两个双尾(conv5, conv5_5)中提取扁平特征向量，然后在一个典型的分类流水线中进行处理，从而最大限度地减少交叉熵损失。所有的卷积都使用3 × 3滤波器，步幅为1。作者发现在conv5处减去特征映射比拼接产生更快的优化。作者认为这是因为element-wise减法在网络架构上诱导了更强的结构优先。让B代表minibatch大小，索引minibatch和y（ $x_{1}^{^{(i)}},x_{2}^{^{(i)}}$ ）是一个B mini-batch向量包含标签，作者假设y ( $x_{1}^{^{(i)}},x_{2}^{^{(i)}}$ ) = 0 ，x1和x2每当相似video patch和y ( $x_{1}^{^{(i)}},x_{2}^{^{(i)}}$ ) = 1。

互视性损失的形式为:

其中p( $x_{1}^{^{(i)}},x_{2}^{^{(i)}}$ )是softmax函数输出的不同patch的概率。

注意，在损失中，我们为不相似的类 $\gamma$ 设置类权重为0.2，以对错误分类的不相似对的惩罚小于错误分类的相似对。这进一步满足了作者在异常检测阶段的目标，即在高真阳性率下有低的假阳性率(其中异常被表示为阳性类别)。对于训练，目标与标准反向传播算法和Adam优化器相结合，通过定期测试验证集(一组拒绝训练示例)来节省最佳网络权值。由于权重系结，梯度在双尾上是相加的。作者使用的批大小为128，初始学习率为0.001，最多训练500次。Xavier-Glorot权重初始化采样来自一个正态分布，与所有层的ReLU激活一起使用。需要注意的重要一点是，作者并没有保存能够最大化验证准确性或最小化验证损失的网络权值，而是保存了能够最大化假阳性率高达0.3的接受者工作特征曲线(AUC)下的验证面积的权值。这条ROC曲线是通过绘制真阳性率作为假阳性率的函数得到的，其中不同的类别表示为阳性。通过最大化这个AUC，以一种在低误报率下实现高真报率的方式排列距离的网络是首选的，这是在异常检测阶段希望看到的行为。作者使用标签平滑正则化设置为0.1来辅助泛化。

发现添加标签平滑正则化有助于两个原因：首先，视频补丁配对过程在某种意义上必须猜测未来学习的函数应该调用哪些相似和不同，以便在异常检测方面取得良好的性能，因此它产生了一个带有噪声标签的数据集。第二种来自于这样的观察，即最小化交叉熵等同于最大化正确标签的对数似然，这使得网络试图增加正确标签对应的logit，使其比其他logit大得多，导致它对训练数据过度拟合，对自己的预测过于自信。标签平滑通过降低网络对其预测的信心来帮助解决这两个问题。我们还在第二个到最后一个全连接层（fc1）的激活时使用dropout为0.3。

3.3 目标数据集的exemplar学习与异常检测（Exemplar learning and anomaly detection on target dataset）

检测目标数据集上的异常涉及两个阶段：使用数据集的train分区构建exemplars模型和检测分区上的异常检测。这两个阶段都使用之前训练过的Siamese网络来测量视频补丁之间的距离。这是通过简单地将对应于不同视频补丁的logit值的softmax作为补丁之间距离的度量来实现的。因为softmax输出也可以被解释为概率，所以测量的距离也可以被解释为patch不同的概率。作者强调Siamese网络的训练是独立于exemplars模型建立和异常检测阶段。Siamese网络在与目标视频异常检测数据集不同的源数据集上训练。

目标数据集训练划分的范例学习:由于视频包含大量的时间冗余，作者使用的exemplar学习方法在目标数据集中建立一个正常活动的模型。样本模型由一组区域特定的样本视频片段组成，这些片段来自列车分区，使用空间步长(H/2, W/2)和时间步长为1的滑动时空窗口。exemplar学习的要点是用一个更小的唯一的、有代表性的video path集来表示序列划分中的所有video path集。Siamese网络学习到的特征向量用来表示一个video path, Siamese网络学习到的距离函数用来度量两个特征向量之间的距离。一个视频补丁被添加到一个特定空间区域的样本集，如果它与该区域最近的样本的距离超过一个阈值，作者为所有的实验设置为0.3。图2展示了作者的CNN从UCSD Ped1数据集中相机视场的一个区域提取的样本video path的子集。exemplar学习方法的一大优点是可以基于流的方式更新exemplar集。这使得该方法可以随时间的变化而扩展和适应环境的变化。

对目标数据集的测试分区进行异常检测：在测试时，从测试分区中提取空间跨度（H/2，W/2）和时间跨度为1的重叠path，与最近的exemplars的距离产生异常得分（见图2）。在exemplar学习和异常评分阶段，作者通过忽略几乎不包含运动的video path来实现额外的速度提升。具体来说，如果一个视频补丁在通道维度上有20%以下的像素不满足流量大小的阈值或当前和前一帧之间的原始像素值差异的阈值，那么这个video path就会被忽略。此外，实验中使用的粗暴的近邻搜索可以被快速的近似近邻算法取代，以进一步提高速度。异常得分被存储并聚集在一个像素图中，一个像素的最终异常得分只是它作为它所参与的path的一部分收到的所有异常得分的平均值（由于斑块在空间和时间上的重叠）。异常检测是针对特定区域的，因此一个补丁只与从同一区域提取的exemplar进行比较。

四、实验

4.1 数据集

监控视频异常检测数据集下载：监控视频异常检测数据集整理_wzg2016的博客-CSDN博客_监控视频数据集

作者使用中提出的两个新标准来报告性能，这两个标准更能代表文章中提到的实际性能。在这篇文章中我有详细介绍：异常检测 | Street Scene_六个核桃Lu的博客-CSDN博客

4.2 与技术水平的比较

基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
AI 生成 PPT 网站介绍与优缺点分析 KL_lililli 人工智能 powerpoint
随着人工智能技术不断发展，利用AI自动生成PPT已成为提高演示文稿制作效率的热门方式。本文将介绍几款主流的AIPPT工具，重点列出免费使用机会较多的网站，并对各平台的优缺点进行详细分析，帮助用户根据自身需求选择合适的工具。1.免费及免费试用机会较多的网站1.1Tome网址：Tome–TheAIassistantforsales简介：Tome是一款专注于AI助力讲故事与演示制作的工具，用户只需输入简
机器学习驱动的智能化电池管理技术与应用满木悦电池化学机器人化学电池机器学习人工智能硕博研究生
在人工智能与电池管理技术融合的背景下，电池科技的研究和应用正迅速发展，创新解决方案层出不穷。从电池性能的精确评估到复杂电池系统的智能监控，从数据驱动的故障诊断到电池寿命的预测优化，人工智能技术正以其强大的数据处理能力和模式识别优势，推动电池管理领域的技术进步。据最新研究动态，目前在电池管理领域的人工智能应用主要集中在以下几个方面：1.状态估计：包括电池的荷电状态（SOC）和健康状态（SOH）的实时
目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究（中）林聪木目标检测 YOLO 深度学习
目录基于改进YOLOv5的无人机图像实时目标检测4.1引言4.2基于改进YOLOv5的目标检测模型结构4.3消融实验及结果分析4.4算法迁移验证实验基于Jetson-Xavier的模型优化部署5.1引言5.2基于人在回路的目标检测模型裁剪5.3嵌入式实时目标检测交互软件基于深度学习的无人机目标检测算法轻量化研究知识拓展基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的无人机目标检测1.数
OpenCV 基础模块 Python 版 ice_junjun OpenCV opencv python 计算机视觉
OpenCV基础模块权威指南（Python版）一、模块全景图plaintextOpenCV架构(v4.x+)├─核心层│├─core：基础数据结构与操作（Mat/Scalar/Point）│└─imgproc：图像处理流水线（滤波→变换→检测）├─交互层│├─highgui：GUI与媒体I/O（显示/捕获/交互）│└─video：视频分析（运动检测/目标跟踪）├─3D视觉层│└─calib3d：相
AI算力要变天了？一文搞懂ASIC和GPU asicgpuai芯片
近期，全球股市的动荡中，ASIC和GPU这两个科技股概念突然变得火热，引起了市场的高度关注。博通作为ASIC的代表，股价一路猛涨，而英伟达作为GPU的代表，股价却一路下跌。这是否意味着AI算力市场即将变天？随着人工智能技术的飞速发展，AI算力的重要性日益凸显。从早期的简单模型训练到如今的大规模语言模型如ChatGPT等的出现，对算力的需求呈爆发式增长。01那什么是ASIC和GPU？ASIC：定制化
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案算法工程gpu
引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。当全球AI企业陷入“算力饥渴症”时，一种名为算力租赁的创新模式正以每年37%的增速（MarketsandMarkets数据）重塑行业格局。本文将深度解析这一革命性服务，并聚焦搭载NVIDIARTX4
梯度下降法理论理解伶星37 机器学习人工智能
梯度下降法：看似原始却透露着机器学习的本质前提：在研究梯度下降方法之前，你要理解矩阵运算（解析解）的方法矩阵运算目前的缺点只能进行对线性函数经行分析，无法对复杂的函数经行分析什么是梯度，以及梯度向量梯度下降的形象例子以及基本思想有三个兄弟被困在山上，得要死，他们目标是看谁尽快找到山谷中的水源老大比较后选择最陡的方向随便探索一下，就朝较低处走去探测几下就走陡峭的方向梯度下降算法的核心思想就是沿着负梯
C++开发内存监控工具推荐点云SLAM 开发工具开发环境 c++开发语言 AddProperty gperftools Address 内存监控访问越界
在C++开发中，内存管理是至关重要的，尤其是当程序处理大数据或长时间运行时，内存泄漏或不当使用可能导致性能下降或崩溃。以下是几种常见且有效的内存监控工具，它们可以帮助开发者实时分析、诊断和优化程序的内存使用。1.ValgrindValgrind是一个广泛使用的内存调试和性能分析工具，它的Memcheck工具可以帮助你检查程序中的内存泄漏、内存越界、未初始化内存使用等问题。特点：检测内存泄漏。检查内
AI大模型产品经理学习路线，2025最新，从AI产品经理零基础入门到精通，非常详细收藏我这一篇够了！ AGI-杠哥人工智能产品经理学习语言模型 agi 自然语言处理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
Java 大视界 -- 基于 Java 的大数据机器学习模型的多模态融合技术与应用（143）青云交大数据新视界 Java 大视界 java 大数据机器学习多模态融合智能安防智能客服数据处理
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
2025年第二届机器学习与神经网络国际学术会议(MLNN 2025) 分享学术科研与论文的禁小默机器学习神经网络人工智能
重要信息官网：www.icmlnn.org时间：2025年4月22-24日地点：中国-重庆简介2025年第二届机器学习与神经网络国际学术会议（MLNN2025）围绕学习系统与神经网络的核心理论、关键技术和应用展开讨论，涵盖深度学习、计算机视觉、自然语言处理、强化学习等多个子领域，通过特邀报告、主题演讲、海报展示等形式，展示相关领域的最新研究成果和技术创新。征稿主题神经网络机器学习深度学习算法及应用
别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！鸡腿爱学习人工智能学习自然语言处理服务器数据库
大家好，我是JackBytes，一个专注于将人工智能应用于日常生活的半吊子程序猿，平时主要分享AI、NAS、Docker、搞机技巧、开源项目等。在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余，你是否知道这些大模型背后的技术原理是什么？假如让你从头开始学习大模型，你知道应该遵循什么样的路线嘛？今天给大家介绍一下Ai大模型的学习路线，顺序千万不要搞反了！，大家可以按照这个路线进
redis过期删除、内存淘汰、双写一致性---java 皮卡兔子屋 #redis redis java mybatis
过期删除Redis的缓存失效不会立即删除，Redis的过期删除策略是选择「惰性删除+定期删除」这两种策略配和使用。惰性删除策略的做法是，不主动删除过期键，每次从数据库访问key时，都检测key是否过期，如果过期则删除该key。定期删除策略的做法是，每隔一段时间「随机」从数据库中取出一定数量的key进行检查，并删除其中的过期key。内存淘汰Redis提供了8种不同的数据淘汰策略，默认是noevict
国内外的网络安全成难题，IPLOOK 2022年用产品筑起“护城墙” 爱浦路 IPLOOK 网络安全安全架构
《爱尔兰时报》和爱尔兰国家广播电台（RTE）于12月31日对2021年爱尔兰科技行业的赢家和弱点进行了年终盘点。双方纷纷表示，2021年爱尔兰科技行业最大的弱点是爱尔兰的网络安全，这一年是一场前所未有的灾难。随着人工智能、大数据、5G等新兴技术的发展，企业面临的威胁日益增加，信息安全的重要性变得越来越突显。现在我们把视线从爱尔兰的网络安全问题拉回到国内的网络安全现状。我国对网络安全问题保持时刻警惕
目前常用的机器视觉工具库总结，选一个适合自己的机器视觉库才是最好的。 yuanpan 计算机视觉图像处理 ai AI编程
以下是常用机器视觉工具的总结，包括它们的特点、优点、缺点和是否付费：1.Halcon特点：由MVTec公司开发，专注于工业机器视觉。提供强大的图像处理、模式匹配、OCR和3D视觉功能。优点：高性能，适合复杂的工业应用。提供图形化编程界面（HDevelop），用户友好。支持多种硬件设备（如相机、采集卡）。缺点：付费：价格较高，适合企业级用户。开放性较低，定制化能力有限。学习曲线较高，文档复杂。是否付
YOLOv8 改进：添加 AKConv（任意采样形状和任意数目参数的卷积）鱼弦人工智能时代 YOLO
YOLOv8改进：添加AKConv（任意采样形状和任意数目参数的卷积）引言在目标检测领域中，YOLO（YouOnlyLookOnce）系列因其速度和效率而受到广泛关注。为了进一步优化模型性能，可以引入创新的卷积操作，例如AKConv，即“任意采样形状和任意数目参数的卷积”。这种卷积能够灵活地调整采样策略，以更好地适应输入特征。技术背景传统卷积运算在采样位置和参数数量上具有固定性，这限制了其对复杂几
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
UI/UX设计服务行业分析 LPiling ui ux
行业现状UI（用户界面）设计关注用户与产品交互的界面设计，包括软件、应用程序、网站或任何数字产品的视觉和操作元素的集合，旨在提供用户友好的界面，使用户能够轻松地使用产品并实现他们的目标。UX（用户体验）设计则更为宏观，关注用户与产品交互过程中的全部体验，包括使用前、使用中和使用后的感受，目标是优化产品的功能性、可用性、易用性，确保用户在使用产品的过程中有良好的体验。近年来，随着技术的不断进步和用户
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
194.HarmonyOS NEXT系列教程之图案锁交互反馈系统详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁交互反馈系统详解效果预览1.交互反馈系统概述1.1反馈类型//反馈类型定义interfaceFeedbackTypes{visual:boolean;//视觉反馈haptic:boolean;//触觉反馈message:
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现） @M_J_Y@ 目标检测 YOLO 计算机视觉目标检测 python
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现）各位读者麻烦给个star或者fork，求求了。YOLOV8双分支模型架构图YOLOV8多模态目标检测前言：环境配置要求1.数据集DroneVehicle数据集(可见光+热红外)2.数据集文件格式(labeles:YOLO格式)3.权重文件下载4.配置模型yaml文件和数据集yaml文件5.训练6.测试7.打印模型信息8.o
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
【星闪开发连载】WS63E模块的雷达功能浅析神一样的老师星闪技术 OpenHarmony 物联网
目录引言功能简介程序分析操作步骤简单测试结语引言WS63E星闪模块有个特色功能就是雷达运动感知，检测物体是否有运动，作用距离不超过6米。hi3863芯片本身不带雷达功能，是模块提供的相关功能。海思还有个WS63星闪模块，没有雷达感知能力。功能简介从开发板的图片上可以看到，右下角有个安装雷达天线的地方，使用使用1代IPEX接口。润和的套件里面没有带天线，从我的测试看没有天线，其实雷达功能是不正常的。
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本