小钊_

Multiframe-to-Multiframe Network for Video Denoising

摘要

现存方法：多相邻帧恢复一个干净帧，效果好但是由于按顺序去噪考虑可能造成视频闪烁；

本文：提出一个多帧对多帧的去噪模型，从连续噪声帧中恢复多个干净帧。本文基于训练策略，从时间和空间优化去噪视频，从而保持时间一致性。

MMNet架构：采用时空卷积机构，同时考虑帧间相似性和单帧特性。受益于并行机制

INTRODUCTION

1、去噪应用很广泛、基本的噪声退化模型为：z=r+α ，在视频中，区别于静态图像，视频中包含 possess spatial information和 rich temporal redundancy

由于视频特性，因此面临两个挑战：（1）the volume of video data 大，（2）the content in each frame varies continuously in the temporal dimension;（单帧的内容在时间维度上不断变化）

2、解决问题的传统方法——handcrafted priors to model clean videos，其中，经典的是patch-based methods （文中分析了实现的三步策略），目前CNN-Based的方法，通过中间的参考帧及其相邻辅助帧作为输入，输出与参考帧对应的去噪帧，但是存在缺点：（1）不能直接从时间维度上优化质量，因为它们以逐帧的方式恢复干净的序列，可能会导致视觉闪烁。（2）它们效率不够高，因为它们必须处理多个帧才能仅恢复一帧。

Multiframe-to-Multiframe Network for Video Denoising_第1张图片

4、比较MM和SS/MS的不同和优势

比较SS：充分利用了序列的时间冗余信息，提高空间质量

比较MS：MS广泛用于video denoising和brust image denoising，但是本文提出可以输出多个连续帧而不是单帧，能够优化时间维度信息，

由于并行机制的做作，MM更有效，此外，与其他视频处理工作 [39]-[41] 采用以多帧作为输入并输出多帧的训练方案不同，所提出的方法侧重于在训练和测试阶段重建多帧.

5、MMNet模块及其作用

the proposed MMNet consists of an interframe denoising module, intraframe denoising module, and merging module

帧间去噪The interframe denoising module 通过从空间和时间维度提取特征来探索帧间相似性，这有助于利用连续帧内的时间冗余。

帧内去噪the intraframe denoising module 侧重于通过提取空间特征来细化单帧特征，这有助于提高每个单独帧的空间表示

Subsequently, the merging module 聚合两组特征并估计干净的序列。

原文：帧间去噪模块explores the interframe similarity by extracting the features from both the spatial and temporal dimensions, which helps to capitalize on the temporal redundancy within consecutive frames. 相比之下，帧内去噪模块 focuses on refining the single-frame characteristics by extracting spatial features, which helps to improve the spatial representation of each individual frame. 随后，合并模块ggregates both sets of features and estimates the clean sequence. MMNet recovers video in parallel and does not need to calculate the flow in the reference stage, which considerably improves the denoising efficiency.

RELATED WORK

（1）图像去噪

类似于SS方法，近几年比较火热，其中基于CNN的方法特别火，简单介绍两个人提出来的模型。这些基于CNN虽然扩展到图像去噪，但是由于特征提取过程中使用简单网络的局限性，因此性能有限

为了提取更具代表性的时空特征，大部分工作致力于CNN架构开发；简单介绍DnCNN和基于其改进的模型；通过编码器-解码器架构；通过建立噪声模型等等；但是这些没有考虑连续帧之间的时间冗余，性能并不好。

（2）视频去噪

相邻视频帧之间的高相关性提供了丰富的时间冗余，有助于提高去噪质量。为了充分利用时间冗余，现有的视频去噪方法倾向于采用MS去噪方案。例如，[12] 通过使用归纳过程在视频序列的数据自适应时空子域中搜索相似块，将 BM3D 提出的想法扩展到视频去噪 (VBM3D)。基于这种方法，VBM4D [15] 使用运动补偿的 3D 补丁来克服 VBM3D 无法区分分组相似补丁的时间和空间相似性的主要问题。在 [13] 中，VBM4D 的更新版本，称为 BM4D，通过将相互相似的矩形 3D 补丁堆叠成 4D 阵列，然后时在变换域中去除噪声来实现视频去噪。此外，为了减轻运动伪影，Buades 等人。[16] 提出了一种去噪算法，它将基于补丁的去噪方法与运动估计方法相结合。这些方法大大提高了最终的视频质量；然而，它们中的大多数依赖于手工制作的先验，并且在处理视频数据方面效率低下，在去噪质量和效率方面为进一步提高性能留下了相当大的空间。

最近，随着深度学习的进步，相关技术已应用于许多视频处理任务，例如语义分割[51]、事件摘要[52]-[54]和手语识别[55]。为了提高去噪性能，已经提出了许多基于深度学习的视频去噪方法。 [33] 中最早的尝试设计了一种用于视频去噪的循环架构。然而，这种方法不能有效地利用自相似性，导致去噪性能无法与基于补丁的方法竞争。为了解决这个问题，更多的研究倾向于采用 CNN 模型来学习从输入到输出的直接映射。特别是，[23]-[25] 中提出的方法使用级联 2D-CNN 分别执行空间和时间去噪，这使它们能够实现最先进的去噪性能。此外，在 [26]、[27] 中提出了一种将基于非局部补丁的方法与 CNN 模型相结合的视频非局部去噪网络。在[29]中，薛等人。将运动估计和图像处理步骤集成到视频处理模型中，以自我监督的方式利用面向任务的流程。在[31]中，徐等人开发了用于视频去噪的 3D 可变形内核，并提出了一种时空像素聚合网络，以有效地对时空空间中的像素进行采样。与基于补丁的方法相比，基于 CNN 的方法在去噪质量方面取得了巨大的进步。然而，他们逐帧恢复干净的序列，这使得他们无法在时间维度上优化去噪结果。此外，为了恢复干净的序列，他们必须多次处理每个有噪声的帧，这限制了他们的去噪效率。与上述方法相比，本文提出的方法采用了直接恢复短序列的MM去噪方案，使去噪模型能够在空间和时间维度上优化去噪结果，实现更具竞争力的去噪效率。

METHODOLOGY

MM Denoising Scheme

$X \times T \rightarrow R $ 被定义为 $t)+\eta(x, y, t) \quad x, y \in X, t \in T$

r代表干净视频，η表示增加噪声，(x,y,t)表示3D时空坐标，其中X为空间坐标，T为时间域

观察到的视频序列z(X,T)，根据去噪模型D(.) 通过网络模型参数θ恢复得到去噪序列$ \overline r $

对于SS来说模型： $\tilde{r}(X, t)=\mathrm{D}(z(X, t) ; \Theta)$

对于MS来说模型： $\tilde{r}(X, t)=\mathrm{D}\left(z\left(X, t_{\{-n, n\}}\right) ; \Theta\right)$

其中，z(X,t)表示从序列中Z(X,T)中的一个噪声帧，n表示相邻帧数量，$ \overline r $(X,t)表示t时刻恢复的干净帧，

显然，SS 或 MS 去噪模型的去噪结果的时间一致性无法在时间维度上进行优化，因为这些模型以逐帧方式恢复序列。此外，SS去噪模型根本无法利用时间冗余来提高去噪结果的空间质量。

本文模型： $\tilde{r}\left(X, t_{\{-\hat{n}, \hat{n}\}}\right)=\mathrm{D}\left(z\left(X, t_{\{-n, n\}}\right) ; \Theta\right)$

$\tilde{r}\left(X, t_{\{-\hat{n}, \hat{n}\}}\right)$ 为去噪的序列，去噪模型的恢复总帧数2 $\overline n$ +1（ $\overline n$

The Architecture of MMNet

1）Interframe Denoising Module

As shown in Fig. 3, in this module, the down sampling or upsampling operations are implemented using [56], which conducts a transformation between the spatial and channel dimensions for the extracted features. Moreover, a spatiotemporal convolution operation [57] is used to extract the spatiotemporal features from both the spatial and temporal dimensions by convolving a 3D kernel to the 3D ectangular patches of the consecutive input frames. Specifically, convolution kernels with sizes of 1 × 3 × 3,3 × 1 × 1, and 3 × 3 × 3 are used to extract the spatial features and the temporal features and aggregate the spatiotemporal information, respectively. The output feature maps are set to 64.

为了充分利用视频中的时间冗余，通过编码器-解码器架构实现的帧间去噪模块。如图 3 所示，在该模块中，下采样或上采样操作是使用the pixel-shuffle strategy像素混洗策略 [56] 实现，该策略对提取的特征进行空间和通道维度之间的转换。此外，时空卷积操作 [57] 用于通过将 3D 内核卷积到连续输入帧的 3D 矩形块上来从空间和时间维度中提取时空特征。具体来说，分别使用大小为 1×3×3、3×1×1 和 3×3×3 的卷积核来提取空间特征和时间特征并聚合时空信息。输出特征图设置为 64。此外，LeakyReLU 非线性[58]和批量归一化[59]用于促进模型训练。通过这种方式，所提出的模块有效地利用了输入的连续帧内的帧间相似性

2）Intraframe Denoising Module

原因：方法在时空特征的帮助下利用了连续帧内的时间冗余。然而，当去噪模型仅使用时空特征来表示每个帧时，**每个单独帧的空间表示可能会受到对象运动的影响。结果，去噪结果可能会受到运动伪影的影响。**因此，必须细化每个单独帧的特征以改善它们的空间表示。

在这项工作中，我们提出了一个帧内去噪模块来探索单帧特征。帧内去噪模块的主干类似于帧间去噪模块；然而，帧内去噪模块通过将2D内核卷积到输入帧的矩形块独立地提取每个输入帧的空间特征。因此，帧内去噪模型只关注每个输入帧的空间维度，有助于避免物体运动对每个帧的空间表示的影响。本质上，单帧特征是对时空特征的补充，有助于为每个单独的帧生成更准确的空间表示。

3）Merging Module

The merging module is used to recover consecutive frames by aggregating the extracted spatiotemporal and spatial features.

(1)connect the spatiotemporal and spatial features. 连接前面两个模块的特征

(2)**spatial convolution operation **时空卷积操作对提取的特征进行整合，生成残余噪声映射

(3)adopt the residual learning strategy [60]恢复去噪结果

此模块我们使用一个简单的架构合并模块，因为特征已经完全提取了帧间和帧内去噪模块。

MM Training

To optimize the denoising model, we propose a hybrid loss(混合损失) for network training.因为混合损失函数包括时间损失，因为时间一致性是视频的重要perceptual factor感知因素

混合损失函数： $\ell_{h y b r i d}=\ell_{\text {spatial }}(r, \tilde{r})+\lambda \ell_{\text {temporal }}(r, \tilde{r})$

三个分别代表空间、时间和混合损失，参数λ用来平衡时间和空间损失，其中空间损失类似于MS和SS中的损失函数；时间损失强制去噪序列中的对象运动和光照变化在时间上与原始序列的一致。

spatial loss 利用空间损失来确保每个去噪帧的内容尽可能接近地面真实值。一般来说，MS或SS去噪方法中常用的损失函数可以作为空间损失函数;其中包括均方损失[25]、总变异损失[61]和知觉损失[62]。本文为了简化采用mean-squared loss 均方差损失
$\begin{aligned} \ell_{\text {spatial }} &(r, \tilde{r})=\frac{1}{2 B} \sum_{i=1}^{B} \sum_{t=-\hat{n}}^{\hat{n}}\left\|\tilde{r}_{i}(X, t)-r_{i}(X, t)\right\|^{2} \\ =\frac{1}{2 B} \sum_{i=1}^{B} \sum_{t=-n}^{n}\left\|\mathrm{D}\left(z_{i}(X, t) ; \Theta\right)-r_{i}(X, t)\right\|^{2} \end{aligned}$
B表示训练对的batch，ˆn表示参考帧的相邻帧。该去噪模型利用空间损失去除输入序列中的大部分噪声。然而，空间损失独立评估每个去噪帧，这导致无法从时间维度优化去噪序列。

Temporal Loss为了使去噪视频获得更好的时间一致性，我们提出了一个时间损失，通过强制去噪视频的运动和强度变化在时间上保持与原始视频的一致来优化恢复的连续帧。具体来说，我们首先计算帧r(X,t)和它的前帧r(X,t−1)之间的前向光流 $t)=\mathrm{F}(r(X, t), r(X, t-1))$ （F为光流估计函数），

然后，将去噪后的帧和gt帧按照以下计算流程进行变形: $r_{w}^{\prime}(X, t)=\mathrm{W}\left(r^{\prime}(X, t-1), f o(X, t)\right)$ 其中， $r^{\prime}(X, t-1)$ 表示gt的序列帧或者去噪的序列帧，W即为计算从t-1帧到t帧补偿光流的函数[40]

$r_w$ 表示变形后的gt帧， $\tilde{r}_{w}$ 表示变形后的去噪帧，由于我们只注重当前帧和变形帧的感知质量，由于在序列运动中， $r^{\prime}$ 的一些像素可能不在 $r_{w}^{\prime}$ 中，因此通过mask掩码m计算这些时间上的损失，
$\begin{array}{r} \ell_{\text {temporal }}(r, \tilde{r})=\frac{1}{B} \sum_{i=1}^{B} \sum_{t=-\hat{n}+1}^{\hat{n}} \| m_{i}(X, t) \odot\left(\left(\tilde{r}_{i}(X, t)-\right.\right. \\ \left.\left.\tilde{r}_{w i}(X, t)\right)-\left(r_{i}(X, t)-r_{w i}(X, t)\right)\right) \|, \end{array}$
其中m (X, t)∈[0,1]是利用光流计算的掩模，在遮挡边界和运动边界区域为0，在其他区域为1.圆圈表示乘法，虽然光流计算占用了大量的时间，但只需要在训练阶段进行计算;在参考阶段，不需要光流信息，这有助于提高模型的竞争性去噪效率。

EXPERIMENTAL RESULTS

Experimental Settings

(1)权值的初始化：采用Kaiming uniform initialization[64]Kaiming均匀初始化

(2)ADAM优化器，epoch=35,batch=10,lr init=0.0004，每6个epoch后lr降低2倍，patch=128，input_frame=7,loss的超参数为0.02（该参数设定参考第五节）

(3)训练数据集：(合成）向Vimeo-90K dataset添加参数为δ∈[0,55]的AWGN

(4)测试数据集：(真实) the Captured Raw Video Denoising (CRVD)2 dataset [30]

注意，所提出的方法适用于标准 RGB (sRGB) 视频去噪；但是，CRVD 数据集包含 RAW 格式的视频。因此，我们遵循 [30] 中使用的技术，并使用预训练的图像信号处理器 (ISP) 模型 [66] 生成真实的 sRGB 视频数据集。

(5)评估标准：PSNR和SSIM，还有一个：此外，在 FastDVDnet [25] 之后，the spatiotemporal reduced reference entropic differences (ST-RRED) [67] 指数来测量时间失真并评估时间一致性。

Comparison Results for Gaussian Noise

主要是于SS和MS方法的进行比较

相比较于DnCNN，MMNet的成绩归功于其帧内去噪模块可以充分探索连续帧之间的空间和时间冗余信息

相比较于MS去噪，MMNet的成绩归功于其架构设计和提出的MM训练模式：充分考虑到帧间相似性和单帧特征，减少了时间冗余，减少伪影

另外，表中可以看出时间损失函数的设计可以优化结果，执行效果有提升（最后两个的区别加不加temporal losses）

原图的图4 ：注意绿色框中显示的面部和背景的清晰度。所提出的方法可以恢复更清晰的人脸并在背景中产生更少的伪影。

Comparison Results for Real-World Noise

这些值不同的原因：对真实噪声和高斯噪声进行去噪的不同方法的性能是不同的。这些差异可能是因为 CRVD 测试数据集的数据分布与 Vimeo-90K 测试数据集的数据分布不同，并且真实噪声比高斯噪声更复杂。此外，真实噪声和高斯噪声的去噪模型的学习能力和通用性是不同的。原图6显示这些方法的一些图片比较结果。

Generality Evaluation Using Other Types of Noise

与含有其他噪声的方法进行对比 Poisson noise and speckle noise （泊松噪声和散斑噪声）【其模型都采用相应的噪声进行重新训练】

Multiframe-to-Multiframe Network for Video Denoising_第4张图片

Temporal Consistency

Temporal consistency is an important factor for visual quality. 本文通过ST-RRED作为非主观的指标进行测评，结果见表1，ST-REDD值越小越好，

MS去噪方法的时间质量主要依赖于从连续输入帧中学习残差，但由于缺乏明确的监督，学习到的残差可能不准确。相比之下，所提出的 MMNet 不仅从输入中学习残差，而且从时间维度优化输出。此外，所提出的 MMNet 使用帧内去噪模块来细化每个单独帧的特征，以改善它们的空间表示，因此，其值更明显。

图8，DnCNN 无法利用时间冗余来恢复纹理细节，导致恢复草的过度平滑和草纹理的不一致。

最先进的方法 DVDnet和FastDVDnet能够恢复草地区域的一些细节，但它们会产生运动伪影，导致细节纹理的时间不一致。相比之下，在时间损失的帮助下，所提出的MMNet恢复了精细的细节并保持了高时间一致性。

Runtime

这种显着的改进可以归因于底层的并行机制和 MMNet 隐式处理运动的能力。

DISCUSSION AND ANALYSIS 细节问题讨论

Ablation Study

删除其中一个模块的结果

去掉帧间模块：使其无法利用时空冗余来恢复精细细节

去掉帧内模块：仅使用时空特征来表示每一帧时，每一帧的空间表示可能会受到对象运动的影响，从而导致运动伪影。因此，帧间和帧内去噪模块都有助于提高去噪质量。

Discussion of the Number of Frames

设计：训练集仍采用Vimeo-90K dataset. 考虑GPU内存的问题，主要讨论帧数为：1，3，5，7

从两方面进行考虑，输出帧和输出帧的数量的问题

2）Discussion of the Number of Input Frames

2） Discussion of the Number of Output Frames

同时恢复多个帧使所提出的方法能够优化空间和时间维度的去噪结果，然而，它也导致不对称的时间信息利用，因为一些恢复的帧将不是输入序列的中心帧。

一个使用 7 帧作为输入并恢复 3 帧（以蓝色、绿色和红色框表示）的示例。绿色框对称地利用了前三帧和后三帧，而蓝色框不对称地利用了前两帧和后四帧；同样，红色框不对称地利用了前四帧和随后的两帧。

为了分析输出帧数的影响，我们进行了实验，其中输入帧数固定为 7，恢复输出帧数变化。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CcQtArwM-1689334219366)(https://data-1306794892.cos.ap-beijing.myqcloud.com/typora_imgs/typora_imgs/20220315-1248-332.png)]

当输出帧数大于1时，没有出现实质性的改善或下降，这表明非对称时间信息利用的影响非常有限。此外，与仅恢复一帧的方法相比，恢复多帧（即 3、5 和 7）的方法获得了更具竞争力的性能，这证明了从空间和时间维度优化去噪结果的有效

根据分析，结合10（b）我们发现在输出帧为7时，运行时间也会更小，决定选7

Analysis of the Hyperparameter λ

损失函数中参数设定

超参数 λ 对于优化去噪结果很重要。通过在 Vimeo-90K 测试集上进行实验来对λ进行敏感性分析，不同的λ值范围从0到1。噪声水平设置为25和45。如图12所示，总体而言，提出的MMNet当λ取值在 0.01到0.1之间时，去噪质量显着提高，当λ设置为0.02时，去噪效果最好。因此，在这项工作中，我们将λ设置为 0.02 来训练提出的MMNet

CONCLUSIONS

MMNet 实现了最先进的去噪质量。此外，它并行恢复视频帧，不需要在参考阶段计算流量，从而具有极具竞争力的去噪效率。对合成数据集和真实数据集的广泛比较证明了所提出方法的有效性和优越性。

问题：

（1）MMNet 需要成对的训练数据，因此当应用程序无法有效获取成对数据时，模型无法轻松微调

（2）MMNet 隐式处理对象运动，因此在某种程度上，它处理运动的能力依赖于训练数据。这些方面是所提出方法的主要限制。

（3）在未来的工作中，我们计划以自我监督的方式实施 MM 去噪方案，并提高 MMNet 对不同运动水平的鲁棒性。

外，它并行恢复视频帧，不需要在参考阶段计算流量，从而具有极具竞争力的去噪效率。对合成数据集和真实数据集的广泛比较证明了所提出方法的有效性和优越性。

问题：

（1）MMNet 需要成对的训练数据，因此当应用程序无法有效获取成对数据时，模型无法轻松微调

（2）MMNet 隐式处理对象运动，因此在某种程度上，它处理运动的能力依赖于训练数据。这些方面是所提出方法的主要限制。

（3）在未来的工作中，我们计划以自我监督的方式实施 MM 去噪方案，并提高 MMNet 对不同运动水平的鲁棒性。

你可能感兴趣的:(文献阅读,图像处理,视频去噪)

AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
【入门初级篇】布局类组件的使用（4）：模板布局组件 #六脉神剑低代码 myBuilder 产品运营
【入门初级篇】布局类组件的使用（4）：模板布局组件视频要点（1）模板布局组件的使用介绍：定义静态数据源，定义模板，预览效果点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder交流请加微信：MyBuilder88
【入门初级篇】报表基础操作与功能介绍 #六脉神剑低代码 myBuilder 产品运营
【入门初级篇】报表的基本操作与功能介绍视频要点（1）报表组件的创建（2）指标组件的使用：一级、二级指标操作演示（3）表格属性设置介绍（4）图表属性设置介绍（5）报表预览：绑定静态数据（6）介绍myBuilder内部模块：用报表低代码开发的示例介绍点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder交流请加微信：MyBuilder88
【入门初级篇】布局类组件的使用（3）：单据详情布局 #六脉神剑低代码产品运营 myBuilder
【入门初级篇】布局类组件的使用（3）：单据详情布局视频要点（1）表单详情布局结束：行容器+表格增加布局边距（2）页签布局的使用点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder交流请加微信：MyBuilder88
知汇云创myBuilder产品发布 #六脉神剑低代码
【入门初级篇】产品介绍v2·前言Hello，大家好，今天给大家介绍一下myBuilder渐进式低代码IDE软件。·产品定位与版本规划myBuilder是一款面向B端数字化领域的低代码开发工具、集成开发环境，具备高效、灵活的使用特点，设计的初心是让B端数字化变得更简单。myBuilder的主要开发套件以及基础功能，我们有专门的培训课程详细讲解，这里先不展开介绍，相信通过我们的教学视频讲解您会逐一发现
【入门初级篇】窗体的基本操作与功能介绍 #六脉神剑低代码
【入门初级篇】窗体的基本操作与功能介绍视频要点（1）窗体的使用场景介绍：模式对话框（2）窗体的创建与设计（3）窗体动态标题设置（4）向窗体添加组件以及相关操作介绍（5）窗体属性编辑介绍（6）窗体数据的使用：组件数据的绑定（7）窗体中3种预览效果介绍点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder交流请加微信：MyBuilder88
便民服务一体化的智慧园区开源了 AI服务老曹音视频人工智能自动化运维能源开源
智慧园区场景视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。充分利用现有的摄像头设备，无需大规模更换，降低成本同时提升系统的实施效率。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。项目搭建地址基础项目搭建地址：yihecode
实现物流行业数字化、智能化管理的新型模式的智慧物流开源了 AI服务老曹开源能源人工智能云计算安全
智慧物流视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。构建基于Ai技术的安全监管平台，可逐步实现智能化巡检，针对安全事故隐患进行有效监控预警，降低安全违规行为发生率，节省人工监管成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及
全流程数字化管理的智慧物流开源了 AI服务老曹开源科技生活人工智能自动化
智慧物流视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。构建基于Ai技术的安全监管平台，可逐步实现智能化巡检，针对安全事故隐患进行有效监控预警，降低安全违规行为发生率，节省人工监管成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及
降低成本、提高效率的智慧能源开源了。 ai产品老杨 vue.js 前端 javascript 人工智能安全
一、简介AI视频监控平台,是一款功能强大且简单易用的实时算法视频监控系统。愿景在最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，减少企业级应用约95%的开发成本，在强大视频算法加持下的AR使得远程培训和远程操作指导不仅仅能够实现前后场的简单互动，而且能够实现人机结合，最终实现整个巡检流程的标准化。用户仅需在界面上简单操作，即可实现全视频的接入及布控。通
视频剪辑行业的现状与进阶之路：一个双视角分析程序员
视频剪辑行业的现状与进阶之路：一个双视角分析一、现状解析商业角度分析成本控制培训需要投入时间和人力成本快节奏的市场环境要求快速产出人员流动性大，培训投入可能无法获得长期回报市场需求大量内容需要快速产出标准化的剪辑模板更容易管理追求效率大于创新风险规避现成模板降低出错风险统一风格便于品控减少个人风格带来的不确定性剪辑师角度分析职业发展受限难以系统学习完整工作流程创意空间被压缩技能提升遇到瓶颈技能断层
04.文本标签龙哥带你学编程 #html 前端
一、文本简介1、页面组成元素1）以淘宝购物官网为例，分析网页：在淘宝购物官网的首页上，我们可以看到它是由超链接，文字，图片等元素构成。2）页面组成元素①一个静态页面绝大部分由以下四种元素组成：文本图片超链接音频和视频②思考：符合以下特点的网页是静态还是动态页面？带有音频和视频带有flash动画带有css动画带有JavaScript特效不是。动态页面和静态页面区别在于：是否用到了后端技术，以及是否与
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
30天搭建消防安全培训小程序 mon_star° 小程序微信小程序微信公众平台
一、功能需求搭建一款消防安全培训答题小程序，大体上实现功能如下：1.重要消防相关信息发布提醒；2.培训课程库播放，文档的，加视频的；3.题库、考试单选、多选、判断三类题；4.考试成绩查询、输出表单；5.单次培训：限时内完成，签到（手签名），限时内完成考试；二、项目结构使用微信开发者工具创建一个新的小程序项目，项目结构大致如下：pages├──index//首页，显示重要信息提醒├──course/
视频管理平台：应急安全生产的坚实护盾智联视频超融合平台音视频安全人工智能视频编解码网络协议
在应急安全生产中，视频管理平台作为现代科技的重要组成部分，发挥着不可替代的作用。它不仅能够实时监测生产环境，还能在事故发生时提供关键信息，帮助企业快速响应、降低损失。以下是视频管理平台在应急安全生产中的具体作用：一、实时监控与风险预警1、全方位监控：通过部署高清摄像头，覆盖生产车间、仓库、设备区等关键区域，实现无死角监控，确保安全隐患无处遁形。2、智能分析：结合AI算法，自动识别异常行为（如人员违
50个常见的python毕业设计/课程设计（源码+文档）冷琴1996 Python系统设计 python 课程设计开发语言
计算机课程设计/毕业设计指南，为计算机相关专业毕业生提供源码、数据库安装、远程调试等相关服务，提供功能讲解视频。下面是50个基于python/django/vue的毕业设计/课程设计。1.网上商城系统这是一个基于python+vue开发的商城网站，平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。整个平台包括前台和后台两个部分。前台功能包括：首页、商品
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
C/C++学习路线概述 DustWind丶 C/C++c++
根据如下视频和文章总结：想做C语言/C++开发?这些才是你该学的东西！C语言/C++直通企业级开发的详细学习路线节选：肝了半个月，我整理出了这篇嵌入式开发学习学习路线+知识点梳理目录1C/C++学习概述1.1C语言的基础知识1.2C++的基础知识2C/C++编程学习四大件2.1数据结构和算法2.2操作系统2.3计算机网络2.3.1计算机网络分层2.3.2典型协议（以TCP/IP四层模型举例）2.4
211 本硕研三，已拿 C++ 桌面应用研发 offer，计划转音视频或嵌入式如何规划学习路线？程序员yt c++音视频学习
今天给大家分享的是一位粉丝的提问，211本硕研三，已拿C++桌面应用研发offer，计划转音视频或嵌入式如何规划学习路线？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：前辈您好，我是211本硕，目前研三，秋招拿到C++桌面应用研发的offer，但计划的这个岗位最多干3-4年左右，后续企业规划上想往音视频开发或嵌入式上转；个人感觉C++八股，算法
3090显卡Ktransformer本地部署deepseek R1:70B SIATdog ai
这里写自定义目录标题效果完成视频：配置参考依赖安装安装cuda配置环境下载deepseekR170B下载ktransoformer开始安装运行Web启动常见问题runtimeerrordon'tmatch更新cudaERROR:Failedtobuildinstallablewheelsforsomepyproject.tomlbasedprojects(ktransformers)效果完成视频：
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
火山云未来能冲击国内第一梯队吗苹果企业签名分发服务器火山引擎
首先，得了解火山云目前的市场地位。火山云是字节跳动旗下的云服务，虽然字节在互联网领域很强，但云服务市场已经有阿里云、腾讯云、华为云这些巨头，还有百度云等。所以火山云现在可能还在第二梯队或者更后面。接下来要考虑市场竞争情况。国内云市场增长快，但竞争激烈。第一梯队的玩家有先发优势，技术积累和客户基础都很深厚。火山云作为后来者，可能需要通过差异化竞争来突破，比如结合字节的短视频、AI等技术优势，提供独特
全网最详细！vue中使用flv.js 播放直播监控视频流抄一下你代码在vue中使用flv.js 播放监控摄像头/直播 vue.js
老规矩，先安装flv.js插件npminstallflv.js在组件中的使用**注意事项放后面我怕你们不看呐！！！！1.必须在dom加载完成后再执行直播视频流的填充方法！2.在一个网页中最多同时容纳6个监控视频播放！第七个绝对加载不出来！3.在离开这个页面的时候必须销毁播放容器，不然会占用TCP个数，导致其他页面的监控也播放不了**importflvjsfrom"flv.js";//页面代码//1
集睿致远CS5518 Mipi转lvds点屏方案芯片，pin to pin替代国腾GM8775C方案单片机芯片嵌入式
GM8775C型DSI转双通道LVDS发送器产品主要实现将MIPIDSI转单/双通道LVDS功能，MIPI支持1/2/3/4通道可选，最大支持4Gbps速率。LVDS时钟频率最高154MHz，最大支持视频格式为FULLHD（1920x1200）。产品特征MIPI输入：支持MIPI®D-PHY版本1.00.00和MIPI®DSI版本1.02.00；支持1~4个数据通道，1个时钟通道；支持ULPS(超
Java使用FFmpegFrameGrabber进行视频拆帧，结合Thumbnails压缩图片保存到文件夹 Acmen-zym Java Java IO java 音视频开发语言
引入依赖net.coobirdthumbnailator0.4.17org.bytedecojavacv1.5.7org.bytedecojavacv-platform1.5.7视频拆帧处理publicstaticvoidmain(String[]args){Filefile=newFile("C:\\Users\\EDY\\Desktop\\frame");File[]files=file.li
【赵渝强老师】达梦数据库MPP集群的架构数据库信创
为了支持海量数据存储和处理等方面的需求，为高端数据仓库提供解决方案，达梦数据库提供了大规模并行处理MPP架构，以极低的成本代价，提供高性能的并行计算。通过使用MPP可以解决以下问题：需要较高的系统性能支持以支持大量的复杂查询操作硬件束缚对数据库响应能力的影响降低数据库成本视频讲解如下：https://www.bilibili.com/video/BV1dBftYoEkk/?aid=11386961
springboot基于java的企业档案管理信息系统 QQ80213251 java spring boot 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言详细视频演示一、项目介绍二、功能介绍三、核心代码数据库参考四、效果图五、文章目录六、源码获取前言企业档案管理信息系统是一种旨在提高文件资料归档、检索和利用效率的信息化解决方案。该系统通过电子化手段对企业的各类文档和档案进行归
TK矩阵系统：高效管理与智能化操作平台 m0_74891046 矩阵
随着TikTok等社交媒体平台的快速发展，短视频创作和内容运营逐渐成为互联网行业的重要组成部分。为了帮助内容创作者、品牌运营商以及数据分析人员更高效地管理多个TikTok账号并优化运营策略，TK矩阵系统提供了一种全新的解决方案，结合了先进的软件技术与硬件设施，旨在简化操作流程，提高工作效率。TK矩阵系统概述TK矩阵系统是一款集成软件与硬件的综合平台，专为TikTok内容管理和数据采集设计。系统使用
兵器室门禁管理系统/智慧库室管控系统立控信息控制系统门禁安全入侵报警环境控制
智慧营区库室联管联控系统对营区库室安全管理意义重大，它集成指纹、人脸、动态密码等多元身份识别技术，实现严谨门禁管控，非法开门即报警，断网也能保安全；整合多种报警设备，自动布防，全方位监测入侵；具备视频交互与监控功能，方便沟通和监督；还能依据预设温湿度自动调控环境，从多维度构建起全面、智能、高效的安全管理体系，为营区库室安全稳定运行提供坚实保障。
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C