因吉

论文阅读 (64)：Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning

文章目录

1 引入
- 1.1 题目
- 1.2 代码
- 1.3 摘要
- 1.4 Bib
2 RTFM
- 2.1 理论动机
- 2.2 多尺度时间特征学习
- 2.3 特征量级学习
- 2.4 RTFM帧级分类器
3 实验
- 3.1 数据集和度量标准
- 3.2 实现细节

1 引入

1.1 题目

2021CVPR：用于弱监督视频异常检测的健壮性时间特征量级学习 (Weakly-supervised video anomaly detection with robust temporal feature magnitude learning)

1.2 代码

Torch：https://github.com/tianyu0207/RTFM

1.3 摘要

弱监督视频级别异常检测是一个典型的多示例学习 (Multi-instance learning, MIL) 问题，每一个视频看作是一个包含多个帧的包，目的是判断包中是否包含异常片段。目前的检测方法性能优异，但它们对正实例，即异常视频中罕见的异常片段的识别，在很大程度上受到了支配性负实例的影响，特别是当异常事件是与正常事件相比时只有很小差异的细微异常时。在许多忽略重要视频时间依赖性的方法中，这个问题更加严重。
为了解决这个问题，提出了健壮性时间特征量级学习：
1）训练了一个特征量级学习函数来有效地识别正实例，大大提高了MIL方法对异常视频负实例的鲁棒性；
2）采用空洞卷积 (Dilated convolutions) 和自注意力机制来捕获长距离和短距离的时间依赖性，从而更可靠地学习特征量级。

1.4 Bib

@inproceedings{Tian:2021:49754986,
author		=	{Yu Tian and Guan Song Pang and Yuan Hong Chen and Rajvinder Singh and Johan W Verjans and Gustavo Carneiro},
title		=	{Weakly-supervised video anomaly detection with robust temporal feature magnitude learning},
booktitle	=	{{IEEE/CVF} International Conference on Computer Vision},
pages		=	{4975--4986},
year		=	{2021},
url			=	{https://openaccess.thecvf.com/content/ICCV2021/html/Tian_Weakly-Supervised_Video_Anomaly_Detection_With_Robust_Temporal_Feature_Magnitude_Learning_ICCV_2021_paper.html}
}

2 RTFM

RTFM的目的是基于弱标记视频来最大程度地区分异常视频和正常视频。给定训练视频的集合 $\mathcal{D}=\{(\mathbf{F}_i,y_i)\}_{i=1}^{|\mathcal{D}|}$ ，其中 $\mathbf{F}\in\mathcal{F}\subset\mathbb{R}^{T\times D}$ 是 $T$ 个视频帧的 $D$ 维预计算特征，例如I3D和C3D； $y\in\mathcal{Y}=\{0,1\}，1$ 表示异常， $0$ 反之。令 $r_{\theta,\phi}(\mathbf{F})=f_{\phi}(s_\theta(\mathbf{F}))$ 表示RTFM模型，其将返回一个 $T$ 维特征 $0,1]^T$ 以表示视频帧是否异常。
模型的训练包括包括端到端多尺度时间特征学习、特征量级学习，以及MIL 分类器。损失函数如下：
$\min_{\theta,\phi}\sum_{i,j=1}^{|\mathcal{D}|}\ell_s(s_\theta(\mathbf{F}_i),s_\theta(\mathbf{F}_j),y_i,y_j)+\ell_f(f_\phi(s_\theta(\mathbf{F}_i)),y_i),$ 其中 $s_\theta: \mathcal{F}\rightarrow\mathcal{X}\subset\mathbb{R}^{T\times D}$ 是时间特征提取器、 $f_\phi: \mathcal{X}\rightarrow[0,1]^T$ 是一个帧级分类器、 $\ell_s(\cdot)$ 表示最大化正常与异常视频top- $k$ 个帧特征之间的差异性的损失函数，以及 $f_\phi(\cdot)$ 是一个使用以上top- $k$ 个特征的训练损失。

2.1 理论动机

Top- $k$ 中的基本假设为，正包中包含最少数量的正实例，负包也包含正实例只是数量更少，它进一步假设分类器可以分离正实例和负实例。我们的问题与其不同，因此负包中并不包含正实例，当然也没有其分类器假设。
遵循先前的命名规则，令 $\mathbf{X}=s_\theta(\mathbf{F})$ 表示提取的视频时间特征，其中每一个帧特征 $\mathbf{x}_t$ 对应 $\mathbf{X}$ 的每一行。令 $\mathbf{x}^+\sim P_x^+(\mathbf{x})$ 和 $\mathbf{x}^-\sim P_x^-(\mathbf{x})$ 分别表示异常帧和正常帧。一个异常视频 $\mathbf{X}^+$ 包含 $\mu$ 个来自 $P_x^+(\mathbf{x})$ 的帧，余下 $(T-\mu)$ 来自 $P_x^-(\mathbf{x})$ ，正常视频中的所有帧则均来自 $P_x^-(\mathbf{x})$ 。
为了学习一个能够区分视频和帧是否异常的函数，定义了一个使用帧的特征量级进行分类的函数，对此定义一个更加温和的假设如下：
$\mathbb{E}[\|\mathbf{x}^+\|_2]\geq\mathbb{E[}\|\mathbf{x}^-\|_2].$ 这意味着通过学习来自 $\mathbf{X}$ 的帧级别特征，正常帧的应当有相较于异常帧更小的特征量级。基于以上假设和视频中的top- $k$ 特征的平均特征量级的优化定义如下：
$\tag{2} g_{\theta,k}(\mathbf{X})=\max_{\Omega_k(\mathbf{X})\subseteq\{\mathbf{x}_t\}_{t=1}^T}\frac{1}{k}\sum_{\mathbf{x}_t\in\Omega_k(\mathbf{X})}\|\mathbf{x}_t\|_2,$ 其中 $g_{\theta,k}(\cdot)$ 是由 $\theta$ 参数化的函数、 $\Omega_k(\mathbf{X})$ 是 $\{\mathbf{x}_t\}$ 的大小为 $k$ 的子集。异常视频与正常视频的可分离性 (separability) 定义为：
$\tag{3} d_{\theta,k}(\mathbf{X}^+,\mathbf{X}^-)=g_{\theta,k}(\mathbf{X}^+)-g_{\theta,k}(\mathbf{X}^-).$ 定义来自 $\Omega_k(\mathbf{X}^+)$ 帧的异常概率为：
$p_k^+(\mathbf{X}^+)=\frac{\min(\mu,k)}{k+\epsilon},$ 其中 $\epsilon>0$ ，而对于所有来自 $\Omega_k(\mathbf{X}^-)$ 的帧，有 $p_k^+(\mathbf{X}^-)=0$ 。这意味着在 $k\leq\mu$ 时，将于 $\Omega_k(\mathbf{X}^+)$ 的top- $k$ 个帧中找到异常帧。

定理3.1：异常与正常视频的预期可分离性 假设 $\mathbb{E}[\|\mathbf{x}^+\|_2]\geq\mathbb{E[}\|\mathbf{x}^-\|_2]$ ，其中 $\mathbf{X}^+$ 包含 $\mu\in[1,T]$ 个异常实例和 $(T-\mu)$ 个正常实例，以及 $\mathbf{X}^-$ 包含 $T$ 个正常实例。令 $D_{\theta,k}(\cdot)$ 表示 $d_{\theta,k}(\cdot)$ 的随机变量：
1）如果 $0 < k < μ 0，则 0 ≤ E [ D θ , k ( X + , X − ) ] ≤ E [ D θ , k + 1 ( X + , X − ) ] 0\leq\mathbb{E}[D_{\theta,k}(\mathbf{X}^+,\mathbf{X}^-)]\leq\mathbb{E}[D_{\theta,k+1}(\mathbf{X}^+,\mathbf{X}^-)] 2）对于一个有限的 μ \mu ，有 lim ⁡ k → ∞ E [ D θ , k ( X + , X − ) ] = 0. \lim_{k\rightarrow\infty}\mathbb{E}[D_{\theta,k}(\mathbf{X}^+,\mathbf{X}^-)]=0. 该定理的第一部分意味着在 k ≤ μ k\leq\mu 时，随着 k k 的增加，异常视频和正常视频之间的可分离性趋于增加，即使它包含一些正常样本。定理的第二部分意味着，当包含多个top实例时，由于正负包中的负实例数量过多，异常和正常视频的分数将变得无法区分。一个示意如图1，其中 score ( X ) = g θ , k ( X ) \text{score}(\mathbf{X})=g_{\theta,k}(\mathbf{X}) 、 Δ score ( X + , X − ) = d θ , k ( X + , X − ) \Delta\text{score}(\mathbf{X}^+,\mathbf{X}^-)=d_{\theta,k}(\mathbf{X}^+,\mathbf{X}^-) ，以及 ϵ = 0.4 \epsilon=0.4 。该定理指明： 1）当 k ≤ μ k\leq\mu 时，通过最大化正常视频与异常视频top- k k 个帧之间的可分离性，能够加速异常视频与帧的分类过程； 2）使用top- k k 个特征可以更有效地训练帧分类器，因为异常视频中的top- k k 个实例大部分都是异常的，并且将使用top- k k 个正常片段。此外，仅使用top- k k 的另一个原因是所设计的方法可以在相当少的训练样本下进行。$

图1：RTFM训练一个特征量级学习函数来高效地检测异常帧并提升MIL方法对异常视频中正常帧的健壮性。左图：异常视频与正常视频的时间特征量级。假设 $\mu=3$ 表示异常视频中异常帧的数量，将最大化异常视频与正常视频的分数差异 $\Delta\text{score}(\mathbf{X}^+,\mathbf{X}^-)$ 。参与计算的帧为 $k\leq\mu$ 个具有最大时间特征量级帧。右图： $\Delta\text{score}(\mathbf{X}^+,\mathbf{X}^-)$ 在 $k\leq\mu$ 时逐渐增大，而将 $k>\mu$ 时逐渐降低。这表明 $k\approx\mu$ 时RTFM在正负视频之间提供了一个很好的差异，即使一些正常帧也具有较大的特征量级

2.2 多尺度时间特征学习

受视频理解注意力机制的启发，所提出的多尺度时间网络 (multi-scale temporal network, MTN) 可以捕捉视频帧之间的多来源局部时间依赖和全局时间依赖。MTN使用时域上的空洞卷积金字塔来学习视频帧的多尺度表示。空洞卷积通常应用于空间域，目的是在不损失分辨率的情况下扩展感受野。在这里，空洞卷积被用于时间维度，因为捕获相邻视频帧的多尺度时间依赖性以进行异常检测很重要。
MTN从预计算特征 $\mathbf{F}=[\mathbf{f}_d]_{d=1}^D$ 上学习多尺度时间特征。对于给定特征 $\mathbf{f}_d\in\mathbb{R}^T$ ，1D空洞卷积定义如下：
$\tag{4} \mathbf{f}_k^{(l)}=\sum_{d=1}^D\mathbf{W}_{k,d}^{(l)}*^{(l)}\mathbf{f}_d,$ 其中 $\mathbf{W}_{k,d}^{(l)}\in\mathbb{R}^W$ 表示卷积核、 $k\in\{1,\dots,D/4\}$ 、 $l\in\{\text{PDC}_1,\text{PDC}_2,\text{PDC}_3\}$ 、 $W$ 表示卷积核大小、 $^{(l)}$ 基于索引 $l$ 的卷积操作，以及 $\mathbf{f}_k^{(l)}$ 表示应用于时间维度的空间卷积的输出特征。空洞因子 $\{\text{PDC}_1,\text{PDC}_2,\text{PDC}_3\}$ 设置为 ${1,2,4\}$ 。
自注意力机制用于补充视频帧之间的全局时间依赖，其已在视频理解中的长期时间依赖、图像分类，以及对象检测展现出优异性能。受到GCN中对全局时间信息的建模，空间自注意力被重写以适应时间维度并捕捉全局时间上下文，即生成一个用于评估帧之间关系的注意力图 $\mathbf{M}\in\mathbb{R}^{T\times T}$ 。
时间注意力模型 (Temporal self-attention, TSA) ：
1）首先使用 $1\times1$ 卷积减小空间维度，即 $\mathbf{F}\in\mathbf{R}^{T\times D}\to\mathbf{F}^{(c)}=Conv_{1\times1}(\mathbf{F})\in\mathbb{R}^{T\times D/4}$ ；
2）应用3个独立的 $1\times1$ 卷积层，将 $\mathbf{F}^{(c)}$ 转换为 $\mathbf{F}^{(ci)}=Conv_{1\times1}(\mathbf{F^{(c)}})$ ，其中 $i\in\{1,2,3\}$ ；
3）构建注意力图：
$\mathbf{M}=(\mathbf{F}^{c1})(F^{(c2)})^T,$ 其用于获取
$\mathbf{F}^{(c4)}=Conv_{1\times1}(\mathbf{MF}^{c3})$ 4）计算：
$\tag{5} \mathbf{F}^{TSA}=\mathbf{F}^{c4}+\mathbf{F}^{c3}.$ 5）MTN的输出由PDC和MTN模块的输出串联构成：
$\overline{\mathbf{F}}=[\mathbf{F}^{(l)}]_{l\in\mathcal{L}}\in\mathbf{T\times D},$ 其中 $\mathcal{L}=\{\text{PDC}_1,\text{PDC}_2,\text{PDC}_3,\text{TSA}\}$ ；
6）跳跃连接以获取包含原始特征与事件特征的表示：
$\mathbf{X}=s_\theta(\mathbf{F})=\overline{\mathbf{F}}+\mathbf{F}.$

2.3 特征量级学习

首先提出一个关联 $s_\theta(\mathbf{F})$ 的损失函数 $\ell_s$ ，其中来自正常视频的最大 $k$ 个特征量级被最小化，而来自异常视频的该特征被最大化：
$\tag{6} \ell_s(s_\theta(\mathbf{F}_i),s_\theta(\mathbf{F}_j),y_i,y_j)= \left\{ \begin{array}{ll} \max\left(0,m-d_{\theta,k}(\mathbf{X}_i,\mathbf{X}_j)\right)&,y_i=1,y_j=0\\ 0&,otherwise, \end{array} \right.$ 其中 $m$ 是预定义间隔、 $\mathbf{X}_i=s_\theta(\mathbf{F}_i),\mathbf{X}_j$ 分别表示异常和正常视频，以及 $d_{\theta,k}(\cdot)$ 表示可分离性函数。

2.4 RTFM帧级分类器

二元交叉熵损失函数基于 $\Omega_k(\mathbf{X})$ 来学习一个帧级分类器：
$\ell_f(f_\phi(s_\theta(\mathbf{F}),y))=\sum_{\mathbf{x}\in\Omega_k(\mathbf{X})}-(y\log(f_\phi(\mathbf{x}))+(1-y)\log(1-f_\phi(\mathbf{x}))),$ 其中 $\mathbf{x}=s_\theta(\mathbf{f})$ 。注意 $\ell_f(\cdot)$ 通过时间平滑 (强制向量帧的异常得分相似)
$(f_\phi(s_\theta(\mathbf{f_t}))-f_\phi(s_\theta(\mathbf{f_{t-1}})))$ 和稀疏正则 (强加一个先验，表明异常事件在每个异常视频中都很少见)
$\sum_{t=1}^T|f_\phi(s_\theta(\mathbf{f_t}))|$ 来实现。

3 实验

3.1 数据集和度量标准

四个多场景基准数据集被使用：
1）UCF-Crime是一个大规模异常检测数据集，包含来自真实街道和室内监控摄像头的1900个未修剪视频，总时长为128小时。与ShanghaiTech中的静态背景不同，UCF-Crime的背景更为复杂多样。训练集和测试集包含同样数量的异常和正常视频，其中训练集包含视频级标注，共1610，异常事件共13类；测试集包含帧级标注，共290。
2）XD-Violence是一个近期提出的大规模多场景数据集，收集了现实生活电影、在线视频、体育视频流、监控摄像机，以及CCTV。数据集的总时长为217小时，包含4754 个未修剪视频，训练集具有视频级标签，测试集具有帧级标签。它是目前最大的公开视频异常检测数据集。
3）ShanghaiTech是一个来自固定角度视频监控的中型数据集，包含307个正常视频和130个异常视频。原始数据集是异常检测任务的常用基准，其假设正常训练数据的可用性。Zhong等人通过选择异常测试视频的子集到训练数据中，以重组数据集并构建弱监督训练集，使训练集和测试集覆盖所有13个背景场景。
4）UCSD-Peds是一个包含两个子数据集的小型数据集。Ped1和Ped2分别包含70和28个视频。通过随机选择6个异常视频和4个正常视频到训练集中，重新制定用于弱监督异常检测的数据集，其余的作为测试集。最终展示该过程10 次以上的平均结果。
度量标准：帧级AUC作为所有数据集的衡量标准。XD-Violence额外使用平均精度 (Average precision, AP)。

3.2 实现细节

1）每个视频被划分为32个帧；
2）对于所有的数据集，设置公示6中的 $m = 100$ ， $k = 3$ ；
3）三个全连接层FC的节点分别设置为512、128，以及1，其后接ReLU函数，且设置丢弃率为0.7；
4）预训练I3D和C3D的mix_5c和fc_6层分别提取2048维与4096维特征；
5）空洞卷积的空洞率分别设置维1、2，以及4；
6）每个空洞卷积分支使用 $3\times1$ Conv1D；
7）自注意力快使用 $1\times1$ Conv1D；
8）优化方法使用Adam，权重衰减设置为0.0005，批次大小64 (32异常32正常)，训练轮次50；
9）ShanghaiTech和UCF-Crime学习率设置为0.001，XD-Violence设置为0.0001；
10）使用Pytorch实现；
11）对比方法的结果使用其与本方法网络骨架一致的发表结果。

爆改RAG检索力：三大Query变形术，助你玩转AI知识检索！许泽宇的技术分享大模型 AIGC 搜索引擎人工智能 RAG
你以为RAG（Retrieval-AugmentedGeneration）就是“检索+生成”那么简单？那你可太低估AI界的“内卷”了！今天，咱们就来聊聊如何用三大Query变形术，把RAG的检索力拉满，助你在AI知识海洋里捞到最肥的鱼！一、RAG的“灵魂拷问”：你真的会提问吗？在AI时代，信息检索的效率和质量，80%取决于你“怎么问”。RAG系统的本质，就是“你问得好，我答得妙”。但现实往往是——
微信小程序 / UNIAPP --- 阻止小程序返回（顶部导航栏返回、左 / 右滑手势、安卓物理返回键和调用 navigateBack 接口）前端贾公子 java 前端 javascript
目录理解page-container的原理设置禁止点击遮盖层关闭？阻止左滑返回理解page-container的原理page-container组件的所有属性，最重要的是show值。在页面上引入这个组件后，若show值为true，页面上所有各种方式触发的返回操作都会被这个组件所拦截，然后自动将值置为false。当值为false后，这个组件就没有作用了，但是我们可以重新赋值，就能让它重新恢复拦截。在
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
MySQL之MVCC实现原理深度解析 AA-代码批发V哥 MySQL mysql 数据库
MySQL之MVCC实现原理深度解析一、MVCC基础：为什么需要多版本控制？1.1并发访问的痛点1.2MVCC的核心目标二、MVCC核心组件：构建多版本世界的基石2.1隐藏字段：数据版本的"身份证"2.2Undo日志：版本回溯的"时间机器"2.2.1Undo日志类型2.2.2Undo日志的生命周期2.3版本链：数据演变的"历史轨迹"2.4ReadView：版本可见性的"过滤器"三、MVCC核心逻辑
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
specpu2017安装/编译/运行测试总结 So_shine linux调试工具和性能量化 linux
目录前言一、源码镜像获取二、安装三、配置修改四、编译五、运行测试六、结果查看七、遇到的问题前言SPEC是标准性能评估公司（StandardPerformanceEvaluationCorporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。SPECCPU测试中，测试系统的处理器、内存子
hmc7044时钟芯片调试笔记 So_shine Linux驱动总结分享 linux内核驱动时钟芯片
目录前言一、依赖文档、工具二、运行linux内核驱动的平台1、代码、文件列表2、适配、编译3、调试三、无os的mcu平台1、代码、文件列表2、适配、编译3、调试前言本笔记基于运行linux操作系统的SOC芯片平台、linux内核版本linux5.10.xxx和无操作系统的mcu平台记录调试；一、依赖文档、工具文档名说明获取方式hmc7044.pdf数据手册adi官网或者国内采芯网GUI配置工具通过
linux应用:linux下用户空间操作GPIO的几种方式
目录一、sys文件系统二、devmem工具三、libgpiod库四、操作/dev/gpiochipN设备节点五、自己实现的一种方式六、其它方式本文基于linux5.10版本说明一、sys文件系统1、使用步骤export引脚号/sys/class/gpio/export，会生成/syc/class/gpio/gpio引脚号目录；echoout或者in>/syc/class/gpio/gpio引脚号/
specpu2017在arm64环境下的部署/测试 So_shine specpu 性能测试 arm64 环境部署
目录前言一、源码镜像获取二、安装三、配置修改四、编译五、运行测试六、结果查看七、遇到的问题前言SPEC是标准性能评估公司（StandardPerformanceEvaluationCorporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。SPECCPU测试中，测试系统的处理器、内存子
直播分享|TinyVue 组件库主题适配原理与实战 OpenTiny社区 Vue.js 前端开源 OpenTiny Vue
在前端开发过程中，不同的项目可能需要不同的设计风格。而了解组件库的主题适配功能，也可以帮助开发者轻松定制独特的主题风格，从而满足各种设计需求。因此6月27日晚19点，体验技术团队TinyVue项目成员岑灌铭老师将为大家带来以《TinyVue组件库主题适配原理与实战》为主题的分享，届时将与大家共同探讨主题适配的内容概述及方案详解。直播详情直播主题TinyVue组件库主题适配原理与实战直播亮点一、主题
vue的侦听器及怎么侦听数组--笔记小番茄炒鸡蛋 vue.js javascript 前端
作用侦听属性响应数据的变化，当数据发生改变的时候会立即执行对应的函数letvm=newVue({el:"#test",data:{entry:""},watch:{entry(){console.log("侦听到了");}}})这里我同过侦听器和v-model指令一起用可以更直观的体现他的作用（这也是常用搭配）。原理：当input输入内容后，因为v-model指令的绑定，此时entry属性值会随之
Feign和Dubbo的技术选型对比分析 Amarantine、沐风倩✨ dubbo spring boot 后端
现在公司项目要做SpringBoot升级2.7.18—>3.4.1。因此我们需要参考芋道的项目和公司当前项目做一个依赖、技术选型、项目结构差异对比分析。我们公司当前用的Dubbo，而芋道最新的一版却用了Feign来代替Dubbo。所以该文章进行一下对比分析。一、Dubbo与Feign简介特性维度Dubbo(3.x)OpenFeign(SpringCloud)通信协议多协议（默认Dubbo、支持gR
设计一个监控摄像头物联网IOT（webRTC、音视频、文件存储） Amarantine、沐风倩✨ 物联网IOT 物联网 java html5 webrtc 音视频视频编解码七牛云存储
前言：设计一个完整的监控摄像头物联网IoT平台涉及视频直播和点播、WebRTC和文件存储模块，可以分为以下几个主要部分：摄像头设备、服务端处理、Web前端、视频流存储和回放。以下是结合这些技术的一个具体完整流程设计，涵盖了各个组件的相互关系、数据流动及关键技术点。1.系统组成监控摄像头：摄像头设备负责采集实时视频流并进行编码（如H.264或VP8）。Java服务端：服务端基于SpringBoot等
Jackson控制多态的注解--JsonTypeInfo,JsonSubTypes,JsonTypeName Amarantine、沐风倩✨ java spring boot spring cloud
JsonTypeInfo.As.EXISTING_PROPERTY：当使用EXISTING_PROPERTY时，类型信息被包含在一个已有的属性中，而不是创建一个新的属性来存储类型信息。在JSON对象中，已有的属性将用于存储类型信息。例如，如果您的数据结构已经包含了一个属性，您可以使用这个属性来存储类型信息。在反序列化时，Jackson会查找已有的属性并将其用作类型信息。JsonTypeInfo.A
Golang 结合 WebSocket 实现双向通信 Golang编程笔记 golang websocket 开发语言 ai
Golang结合WebSocket实现双向通信关键词：Golang、WebSocket、双向通信、实时通信、网络编程、Go语言、HTTP升级摘要：本文将深入探讨如何使用Golang实现WebSocket双向通信。我们将从WebSocket的基本概念讲起，逐步深入到Golang中的具体实现，包括连接建立、消息处理、并发控制等核心内容。通过本文，读者将掌握使用Golang构建实时双向通信系统的完整知识
Golang微服务配置管理：Nacos整合实战指南 Golang编程笔记 golang 微服务开发语言 ai
Golang微服务配置管理：Nacos整合实战指南关键词：Golang、微服务、配置管理、Nacos、服务发现、动态配置、云原生摘要：本文将深入探讨如何在Golang微服务架构中使用Nacos进行高效的配置管理。我们将从基础概念入手，逐步讲解Nacos的核心功能，并通过完整的实战示例展示如何将Nacos集成到Golang微服务中。文章涵盖配置管理、服务发现、动态更新等关键场景，帮助开发者构建更灵活
GORM深度解析：模型定义与数据库迁移最佳实践 Golang编程笔记数据库 oracle ai
GORM深度解析：模型定义与数据库迁移最佳实践关键词：GORM、模型定义、数据库迁移、最佳实践、Go语言摘要：本文深入探讨了GORM这一强大的Go语言ORM库，详细介绍了模型定义的方法和技巧，以及数据库迁移的最佳实践。通过通俗易懂的语言和丰富的实例，帮助读者理解GORM的核心概念，掌握如何利用GORM高效地进行数据库操作。背景介绍目的和范围在Go语言开发中，与数据库进行交互是一项常见的任务。GOR
Golang数据结构与算法：实现经典算法的Go版本 Golang编程笔记 golang 算法开发语言 ai
Golang数据结构与算法：实现经典算法的Go版本关键词：Golang、数据结构、算法、经典算法、Go实现摘要：本文将带领大家深入探索在Golang中实现经典算法。我们会先介绍一些基础的数据结构和算法概念，然后用生动的故事和例子来解释这些概念，接着给出核心概念之间的关系。通过详细的代码示例，展示如何在Go语言里实现这些经典算法，还会介绍它们的实际应用场景、相关工具和资源，探讨未来的发展趋势与挑战。
基于均值偏移算法的动态目标跟踪研究 Zoiny_楠算法均值算法目标跟踪
摘要：目标跟踪技术是计算机视觉领域中重要研究课题之一,在人类生活、军事侦察、工业生产、医疗诊断、交通管理等多方面,都有广泛的应用,研究目标跟踪对人类生活、工程应用等具有现实的指导意义。在基于视觉的目标跟踪算法中,经典的Mean-Shift算法以其理论科学有效、操作简单易实现,跟踪性能较好等优势,一直是众多学者研究的热点。可算法也存在着许多缺陷。例如目标模型中混有背景信息的干扰,给目标定位带来了偏差
集群聊天服务器---muduo库使用（2） power 雀儿集群聊天服务器学习服务器 java 前端
书接上回聊天服务器，这个类主要是用于处理网络连接和消息。public:ChatServer(EventLoop*loop,//事件循环constInetAddress&listenAddr,//IP+Portconststring&nameArg)//服务器的名字:_server(loop,listenAddr,nameArg),_loop(loop){//给服务器注册用户连接的创建和断开回调_s
目标跟踪存在问题以及解决方案选与握 #目标跟踪目标跟踪人工智能计算机视觉
3D跟踪一、数据特性引发的跟踪挑战1.点云稀疏性与远距离特征缺失问题表现：激光雷达点云密度随距离平方衰减（如100米外车辆点云数不足近距离的1/10），导致远距离目标几何特征（如车轮、车顶轮廓）不完整，跟踪时易因特征匹配失败导致ID丢失。典型案例：在高速公路场景中，200米外的卡车因点云稀疏（仅约50个点），跟踪算法难以区分其与大型货车的形状差异，导致轨迹跳跃或ID切换。技术方案：稀疏点云增强与特
《Vuejs设计与实现》第 12 章（组件实现原理上）前端贾公子 vue.js 前端 javascript
目录12.1组件的渲染12.2组件状态与自更新12.3组件实例与生命周期2.4Props与组件被动更新在上一章节，我们详细探讨了渲染器的基本概念和实现方式，它的主要作用是将虚拟DOM渲染为真实DOM。然而，当我们处理复杂页面时，虚拟DOM描述页面结构的代码量可能会剧增，导致页面模板臃肿。为此，我们引入了组件化的概念，通过组件，我们可以将大型页面划分为多个模块，每个模块都独立为一个组件，最终组成完整
软件版本发布-教程 Amarantine、沐风倩✨ java 开发语言
前言：软件发布一个版本，通常指将开发完成、测试通过的系统打包并正式交付使用。这一过程既可以是内部交付，也可以是对外发布。下面分为“版本定义”→“流程步骤”→“工具与规范”三个部分。一、版本发布的基本概念版本号（Version）：如v1.0.0，遵循语义化版本（SemVer）：主版本号.次版本号.修订号（例如2.1.4）主版本号：大变更，不兼容老版本（如重构接口）次版本号：功能增强，兼容老版本修订号
05 大项目把握关键点，谋定而后动周壮成为团队技术牛人 java 后端面试架构
对技术Leader来讲，团队的开发模式多以项目制或敏捷迭代为主，不论哪种方式，项目管理都是最主要的工作之一。在互联网公司中，日常迭代和重点项目的同步进行几乎成了常态，你也会遇到一些特殊的项目，比如“一号工程（老板项目）”“技改项目（核心系统重写）”“倒排期的重大业务（11.11和618的大促、新业务新产品研发）”。这些项目我统称为“大项目”。大项目因为时间投入大、人员规模大、系统更大，和日常迭代项
[M数学] lc2829. k-avoiding 数组的最小总和(推公式+贪心模拟+好题) Ypuyu LeetCode 算法
文章目录1.题目来源2.题目解析1.题目来源链接：2829.k-avoiding数组的最小总和参考：灵神题解前置题：xxx题单：待补充2.题目解析2025年03月27日00:01:32方法一：贪心模拟依据两数之和的思想，从i=1开始填，总共需要填n个数。如果当前的i不可用，那就一直i++，找到一个可用的i如果k0{form[i]{i++}ifk>i{m[k-i]=true}res+=ii++n--
【Python从零到壹】Python中的标识符和保留字互联网老辛 #Python从零到壹 Python
保留字，也叫关键字，这些关键字是python直接提供给我们使用的，因此，我们在定义标识符的时候，不能用这些保留字。比如教育局就属于官方用的，你开个公司起名就不能叫教育局怎么查看关键字？importkeywordprint(keyword.kwlist)输出结果：E:\Python_demo\vippython\venv\Scripts\python.exeE:/Python_demo/vippyt
创客匠人老蒋六力模型：创始人 IP 打造的底层逻辑与实践路径创小匠 tcp/ip 网络协议网络
创始人IP如何从0到1破局？创客匠人CEO老蒋提出的“六力模型”，为知识变现领域提供了系统化方法论。该模型将IP打造拆解为六个递进阶段，揭示了从“个人品牌”到“商业资产”的进化逻辑。一、定义力：构建IP的认知锚点IP的本质是“用户共识的塑造”。老蒋以神话故事为例，盘古开天辟地通过定义“宇宙起源”形成集体认知，这与现代创始人IP的“品类定义”逻辑一致。美特斯邦威周成建在直播中强调“国货转型”定位，正
创客匠人老蒋：创始人 IP 打造的五大核心命题与破局之道创小匠 tcp/ip 网络协议网络
在知识付费行业进入深水区的当下，创始人IP如何从“流量符号”进化为“商业引擎”？创客匠人CEO老蒋在“全球创始人IP领袖高峰论坛”中，围绕“IP、趋势、战略、创新、增长”五大关键词，揭示了IP打造的系统性方法论。一、认知破局：IP是商业战略而非营销手段老蒋以美特斯邦威周成建直播为例，指出创始人IP的本质是“企业战略的人格化表达”。数据显示，IP化创始人的企业估值平均比非IP化企业高30%-50%，
创客匠人联盟生态：重构家庭教育知识变现的底层逻辑创小匠重构人工智能大数据
在《家庭教育促进法》推动行业刚需化的背景下，单一个体IP的增长天花板日益明显。创客匠人提出的“联盟生态思维”，正推动家庭教育行业从“单打独斗”转向“矩阵作战”，其核心在于通过工具整合资源，将“同行竞争”转化为“生态共赢”。一、行业趋势：从个体IP到联盟矩阵的必然跃迁数据显示，2024年家庭教育新增服务超10万项，同质化竞争导致获客成本上涨40%。创客匠人联盟模型的破局点在于：当30位区域IP组成联
创客匠人视角下的知识变现革新：从付费到服务的底层逻辑重构创小匠重构
一、知识付费的本质：被误读的“信息”与被低估的“服务”当“知识付费已死”的论调甚嚣尘上时，创客匠人深耕行业11年的实践揭示了一个本质：知识本身是免费的，互联网时代信息唾手可得，但“让用户懂”的能力才是核心价值。正如牛顿三大定律从未收费，收费的是教师将知识转化为可理解体系的服务——这正是创客匠人所定义的“知识服务”内核。创始人IP打造的本质，正是将碎片化知识转化为体系化认知路径的能力，而知识变现的关
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象