PaperWeekly

从ICCV 2021看夜间场景自监督深度估计最新进展

©作者 | 青青韶华

单位 | 中科院自动化所博士生

研究方向 | 计算机视觉

单目深度估计虽然在数学和几何上是一个不适定问题（ill-posed），但是随着卷积神经网络的发展，依靠数据驱动的单目深度估计获得了蓬勃的发展。根据场景的不同可以分为室内场景深度估计（如 NYUv2 数据集）和室外场景深度估计（如 KITTI 数据集）。另一方面，根据数据是否具有深度标签又可以分为有监督学习和自监督学习两种范式。

对于室外场景，深度估计主要应用于自动驾驶领域，经典的评估数据集包括 KITTI 和 CityScapes 数据集。由于室外场景中深度范围的跨度较大，现有的 3D 激光扫描仪难以覆盖较大的深度值，即使采用激光雷达等设备也只能得到稀疏的深度标签，难以作为深度模型训练的标签。因此，自监督单目深度估计已经成为室外场景深度估计的主流。

以往的研究更多关注在网络结构的设计、如何添加语义信息，或者设计更好的损失函数和辅助监督等，但是它们都采用白天图像作为训练和评测对象。鲜有研究关注夜间场景下的自监督单目深度估计，因为夜间场景存在更大的挑战，例如低对比度、变化的光照条件、噪声以及时常出现的耀斑和眩光。

本文主要梳理了夜间场景下自监督深度估计方法的发展历程，以及在 ICCV 2021 上的最新进展。

初步探索

在已有工作中，最先关注夜间场景下深度估计的下面这篇 AAAI 2018 的方法 MTN。

论文标题：

Multispectral Transfer Network Unsupervised Depth Estimation for All-Day Vision

论文地址：

https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/viewFile/16771/16286

论文来源：

AAAI 2018

项目地址：

http://multispectral.kaist.ac.kr/

作者认为要想理解真实世界，应当让模型能够在全天的条件下进行深度感知。现有机制采用 RGB 传感器采集图像，这会导致白天和夜间的图像差异很大，因此夜间场景具有很大的挑战性。作者从源头出发，认为实现全天深度感知的解决方法是采用热传感器取代 RGB 传感器来搜集高光谱图像，高光谱图像的一大优势是不受强光和黑暗环境下灯光变化的影响。为此，作者首先采集了一个高光谱双目数据集。

1.1 高光谱双目数据集

上图展示了作者采集的高光谱双目数据集，一组数据样本包括一对经过校正的 RGB 双目图像，一张根据 RGB 左图对齐的高光谱图像，以及 3D 标注信息。为了确保数据集具有多样性，作者采集了 4 种驾驶场景的数据，分别是第 1 行的校园（campus），第 2 行的住宅区（residential），第 3 行的城市（urban）和第 4 行的郊区（suburbs）。时间横跨白天（7am~2pm）和夜间（10pm~2am）。

1.2 多光谱迁移网络MTN

为了从单张高光谱图像中估计出深度图，作者设计了基于编解码网络的多光谱迁移网络 MTN。假设一对 RGB 双目图像为，对应的高光谱图像为，那么对于估计的视差，可以采用基于光度重构的损失来进行自监督的学习，即：

本文的另一大创新点是引入多任务学习机制，即从 Encoder 的浅层特征中来重建原始 RGB 图像的色度信息。为此，作者在 Encoder 和 Decoder 之间设计了一个 Interleaver，通过将浅层的特征经过池化和门控机制，与高层特征进行融合来提取色度特征，之后与原始 RGB 图像在 YCbCr 空间计算损失，即：

其中和分别是 CbCr 通道的真值和预测值。对于得到的深度图还可以采用深度平滑损失进行平滑性约束：

整体网络训练的损失函数为：

1.3 讨论

这篇工作虽然首次提出了夜间条件下的自监督深度估计问题，但是它是建立在高光谱图像上的，这种热传感器的普及度要远低于 RGB 传感器。后续研究工作更多围绕 RGB 图像来开展，因此这篇工作的后续的影响力有限，但仍是探索夜间场景深度估计的一次尝试。

开篇之作

真正开启夜间环境下，基于 RGB 图像的自监督单目深度估计的工作是下面这篇 ECCV 2020 的工作。

论文标题：

Unsupervised Monocular Depth Estimation for Night-time Images using Adversarial Domain Feature Adaptation

论文地址：

https://arxiv.org/abs/2010.01402

论文来源：

ECCV 2020

项目地址：

https://github.com/madhubabuv/NightDepthADFA

这篇论文的思想简洁明了，即将白天和夜间图像看成两个数据域，通过采用 Patch-GAN 等生成对抗模型来判别白天和夜间图像，从而转换成一个对抗式的域特征自适应（ADFA）问题。在介绍 ADFA 方法前，先介绍自监督单目深度估计的学习范式，这种统一的学习框架适用于后续工作。

2.1 自监督单目深度估计学习范式

自监督单目深度估计可看做是一个视角合成问题。对于每一张参考图像，我们可以通过深度图和相对相机位姿来重构目标图像。在训练过程中，模型分为深度估计网络和位姿估计网络，利用目标图像来估计深度图，而利用参考图和目标图来估计相机位姿。

在已知相机内参的情况下，我们得到目标图中的像素点和参考图中的像素点的逐像素对应关系，即：

之后可通过可导的双线性差值操作从中重构得到，也即。

在自监督训练阶段，主要采用基于重构的损失和之前介绍的深度平滑损失。重构损失采用和 SSIM 来计算和之间的光度误差，其中取 0.85：

2.2 对抗域特征自适应ADFA

上图展示了 ADFA 的整体框架图，整个流程分为三步：第一步是采用已有的单目深度估计模型（例如 MonoDepthv2）在白天图像上进行自监督训练；第二步是引入基于 Patch-GAN 的判别器训练用于夜间图像特征提取的 Encoder（）；第三步是将夜间图像特征编码器和白天图像深度解码器组合起来用于夜间图像的深度估计。下面具体介绍前两步。

白天模型：如上图（a），用于白天图像训练的模型包括深度估计编解码器和相机位姿估计编解码器，采用自监督学习的范式进行训练，梯度回传路径如红线所示。
ADFA 训练：如上图（b），由于白天和夜间图像不是成对的（unpaired），即不是同时或同地拍摄的，因此作者考虑采用对抗学习的方式。引入用于夜间图像特征提取的编码器，它可看做是生成器，目的是使得夜间图像特征与白天图像特征相似；而判别器的目的是来鉴别特征来源于白天还是夜间图像。这里作者对每个特征层都采用了一个判别器，实验表明这种多阶段判别器的方式对域自适应的性能提升很有效。

2.3 实验结果

实验采用的数据集是 Oxford RobotCar，这是一个常用的室外驾驶场景数据集，涵盖不同季节、天气、白天和夜间的图像，很适合进行夜间场景深度估计性能的评测。几种模型在该数据集上的定性结果如下表，其中上面一层是以 60 米作为最大深度值，而下面一层是以 40 米作为最大深度值。

第 1 行：采用 Monodepthv2 在白天图像上训练，之后再在夜间图像上测试，性能较差，这表明在白天图像上训练的模型在夜间场景泛化性较差。
第 2 行：采用 Monodepthv2在白天图像上训练后，用部分夜间图像进行自监督微调，虽然性能有显著提升，但是仅靠重构损失在夜间图像上仍然无法取得较好的效果。
第 3 行：采用 Cycle-GAN 将夜间图像迁移成白天图像，再利用白天图像训练的模型进行深度估计，但是这种方法的效果较差，因为 GAN 的风格迁移不足以弥补白天和夜间图像的差异，同时采用 GAN 训练也耗时耗力。
第 4 行：先在 KITTI 的白天图像上预训练，再在 Oxford 的夜间图像上采用 ADFA 训练，性能有显著提升，这验证了所提出的 ADFA 方法的优势。
第 5 行：均在 Oxford 数据集的白天图像上预训练和夜间图像上采用 ADFA，在 Oxford 测试集上取得了最佳的性能。通过第 4 和第 5 行也表明了不仅白天和夜间图像上存在偏差，相同场景的不同数据集下也存在偏差。

如上图，作者还进行了一些可视化定性比较，可见基于重构损失的夜间场景深度估计几乎失败了，而采用 GAN 将夜间图像迁移成白天图像也会造成很多失真的现象，不利于后续的深度估计。本文所提的 ADFA 方法能够较好的估计出夜间图像的深度图。

2.4 讨论

ADFA 作为夜间场景自监督单目深度估计的开创工作，主要为后续研究工作提供了几点贡献：

提出了基于 RGB 图像的夜间场景自监督单目深度估计的任务，这不同于以往采用高光谱图像的 MTN 方法，成为后续工作的起点；
定义了夜间场景深度估计是采用不成对的白天和夜间图像，这种不成对的问题也成为后续工作的出发点；
将夜间场景深度估计任务转换成域自适应问题，并提出了一种行之有效的方法 ADFA，成为后续工作的 baseline 方法。

在 ADFA 同一时期，还有在双目领域的探索工作，下面简单介绍一下。

双目领域的探索

论文标题：

Nighttime Stereo Depth Estimation using Joint Translation-Stereo Learning: Light Effects and Uninformative Regions

论文地址：

https://arxiv.org/abs/1909.13701

论文来源：

3DV 2020 Oral

这篇论文考虑的是夜间场景下的自监督双目深度估计，总体思想和 ADFA 类似，也是通过引入 GAN 来对白天和夜间图像进行转换，并通过两种场景下的一致性约束进行训练。本文拿到了 3DV 的 Oral，其亮点在于还处理了夜间图像中的两个细节性的挑战，一是夜间图像的眩光部分（Light Effects）转换成白天图像时会丢失结构信息；二是在低光照等无信息区域（Uninformative Regions）会产生错误的结构信息。

3.1 方法

上图展示了本文的整体框架图，分为两个并行的循环结构：

白天到夜间：输入白天图像，通过迁移网络转换成夜间图像，再通过迁移网络转回白天图像。分别利用白天图像深度估计网络和夜间图像深度估计网络得到一对图像在两个场景的视差图。这两个视差图应当具有一致性。
夜间到白天：输入夜间图像，先通过迁移网络转成白天图像，再通过迁移网络转回夜间图像。其他保持一致。

上图仅仅展示了整体框架和双目一致性约束，因此判别器和其他损失函数并没有展示，例如判别损失，基于 Cycle-GAN 的循环一致性损失。尽管上述框架已经能够实现在夜间场景下的深度估计，但是在将夜间图像转换成白天图像时，仍然会存在生成错误区域的现象。本文专门针对两种问题提出了解决方案。

如上图，第一种是针对夜间图像中的眩光，在转换成白天图像时会丢失原有的结构，如图（b）中出现未知的树结构导致深度估计出错。为此，作者提出在训练阶段加入结构保留的约束。具体地，采用在 ImageNet 上预训练的 VGG-16 模型在夜间图像数据集 ExDark 上 finetune，从而使得微调后的 VGG-16 模型保持更好的结构性特征。

对于一对夜间图像，及其生成的对应白天图像，对于从夜间到白天图像转换的循环有结构保留损失如下：

其中选自 finetune 后的 VGG-16 模型的“Conv4_2”层。

如上图，第二种是针对夜间图像中的低光照等无信息区域，这些区域在转换成白天图像时容易出错，生成一些不相符的结构，从而导致深度估计出错。为此，作者提出仅在测试阶段施加加权平滑性约束。同样以一对夜间图像及其生成的对应白天图像为例，加权平滑性约束如下：

其中和分别计算的是水平和竖直方向的梯度，是输入图像的权重图，其计算方式为

通过这种方式，这些无信息区域在测试阶段可以得到更平滑的深度图。值得注意的是，本文提出的两种技巧对于单目深度估计同样可以适用。

ICCV 2021最新进展

ICCV 2021 的论文近日陆续开放在 Arxiv 上，这里介绍两篇最新的工作。

4.1 ADFA加强版——RNW

论文标题：

Regularizing Nighttime Weirdness: Efficient Self-supervised Monocular Depth Estimation in the Dark

论文地址：

https://arxiv.org/abs/2108.03830

论文来源：

ICCV 2021

项目地址：

https://github.com/w2kun/RNW

上面这篇论文可以看做是 ADFA 方法的加强版，整体上仍然延续 ADFA 以自监督单目深度估计+对抗学习的框架。作者认为夜间图像的挑战性在于低可见度和变化的光照条件，从而导致弱纹理区域和光照的不一致性。为此提出了三点增强措施，一是基于先验的正则化，用来学习白天和夜间图像的深度分布先验信息；二是映射一致性的图像增强模块来增强夜间图像的可见度和对比度；三是基于数据的掩码策略，用来动态调整无纹理区域的消除像素点个数。

上图展示了论文的整体框架图，其中的三个改进点分别：

Priors-Based Regularization（PBR）：在对抗学习中加入深度值对应的坐标信息；
Mapping-Consistent Image Enhancement（MCIE）：在计算光度一致性损失时增强夜间图像的质量；
Statistics-Based Mask（SBM）：常用的 Auto-Mask（AM）方法的改进版；

PBR

PBR 的作用是利用对抗学习和参考深度图来约束邻域范围内的夜间图像的预测深度图。深度估计网络可以看做是生成器，而基于 Patch-GAN 的判别器用来判别白天图像的深度参考图和夜间图像的深度图。

作者观察发现在驾驶场景中，像素点的深度与它的位置具有紧密的联系，因此提出将像素点的位置坐标融合进对抗学习中。具体地，可以对 x 和 y 两个方向的坐标归一化到，从而得到一张位置图像。对于深度图和也进行归一化，即，其中是在空间上计算平均值。最后将与归一化后的和分别 concat，再作为判别器的输入。对抗损失与 ADFA 中的类似。

MCIE

MICE 来自 Contrast Limited Histogram Equalization（CLHE），作用是增强夜间图像的可见度和细节纹理，以满足光度一致性。其核心是一个亮度映射函数，分别对参考图像和目标图像进行亮度变换，以映射到同一个特定的输出。

上图展示了 MCIE 的计算过程，曲线分布是不同亮度层级频率分布。MCIE 的计算过程分为三步：

裁剪掉频率在给定参数以上的部分，以限制增强同时避免放大噪声；
将裁剪掉的频率均匀地填充在每一个亮度层级；
使用累计分布来计算映射函数，即，其中是亮度层级的个数，通常为 256。

MCIE 仅在计算光度重构损失时才使用，对于输入网络的图像仍然是原始的 RGB 夜间图像。

SBM

动态掩码（AM）技术是自监督单目深度估计中常用的技巧，用来剔除估计不准确的野点和外点，可通过计算重构图像的光度误差与参考图和目标图的光度误差的大小来得到掩码，即：

AM 并不能调整被剔除的像素点个数，SBM 在此基础上更进一步，希望动态地调整剔除像素点的个数。具体地，在训练阶段计算目标帧和每张参考帧的光度差异，之后利用指数加权移动平均来更新当前帧的误差，即：

其中 i 是当前时间点，是动量参数（设为 0.98）。之后引入参数用来表示剔除的百分比，这样可以得到新的掩码，即。最终的掩码由和采用逐点相乘得到，也即。

上图表明采用 SBM 能够去除黑色像素点在最终损失中的计算。

实验结果

作者也在 Oxford 数据集上进行了实验，相比于现有的 SOTA 方法，所提出的方法在夜间图像上具有更好的性能。相应的消融实验也表明了所提出的模块的有效性。

上表说明所提方法超越了自监督单目深度估计在白天图像上的 SOTA 方法，例如 SfMLearner，PackNet，FM 等。

上表的消融实验说明所提出的 PBR，MCIE 和 SBM 对于性能提升都是有帮助的，其中 PBR 其实是整个算法的核心增长点，MCIE 和 SBM 是锦上添花的改进。

作者也和 ADFA 进行了可视化比较，可见所提出的方法在饱和和模糊区域具有更好的效果，这可能更多得益于 PBR 的提升。

4.2 基于域分离的全天图像深度估计

以上方法侧重于单独解决夜间图像的深度估计，但是夜间图像的模型仍然无法较好的估计白天图像。自 AAAI 18 的论文后，今年 ICCV 2021 的工作又重新关注通过一个模型同时估计白天和夜间图像的深度信息。

论文标题：

Self-supervised Monocular Depth Estimation for All Day Images using Domain Separation

论文地址：

https://arxiv.org/abs/2108.07628

论文来源：

ICCV 2021

项目地址：

https://github.com/LINA-lln/ADDS-DepthNet

这篇论文的动机也较为直观，和 ADFA 类似，白天和夜间图像可以看做是两个域，这两个域在光照等扰动条件下具有很大的差异，但是在纹理等共享属性上具有不变性。因此，作者提出将两个域的学习分为私有域（private）和不变域（ invariant）。私有域用于专门学习白天和夜间图像的特征，而不变域用于学习白天和夜间图像中共享的特征。

上图展示了本文的整体框架图。输入是夜间图像序列和通过 GAN 生成的对应的白天图像序列。整个框架分为三个模块：

白天私有域特征提取模块（黄色）：包括白天图像特征提取器和用于白天图像重构的解码器。这个设计和 AAAI 18 的 MTN 中的 Interleaver 有点类似，都是在特征提取后增加了光度重构。
夜间私有域特征提取模块（绿色）：包括夜间图像特征提取器和用于夜间图像重构的解码器。
共享深度估计模块（橙色）：包括权重共享的不变域特征提取模块和深度估计解码器。

各个模块之间的联系可以用下述形式来描述：

白天和夜间图像分别通过各自的私有域特征提取模块来提取特征，即。
同时，不变域的共享编码器分别提取白天和夜间图像的不变特征，即。
之后利用不变特征和私有特征的 concat 分别重构白天和夜间图像，即。
最后以共享特征作为输入，利用共享深度估计解码器得到白天和夜间的深度图，即。

论文的另一大核心内容是驱动整个框架训练的损失函数的设计，包括以下 4 种损失函数：

重构损失（Reconstruction Loss）

重构损失是白天和夜间图像经过和重构的 RGB 图像与原始图像的光度误差，也即：

相似性损失（Similarity Loss）

由于输入的白天图像是夜间图像通过 GAN 生成的，因此二者是成对的。那么在经过深度估计网络后得到的深度图也应当具有一致性约束，由此得到相似性损失如下：

正交损失（Orthogonality Loss）

对于白天和夜间图像，二者既有对应的私有特征提取器来提取各自域的私有特征，又有共享的不变特征提取器来提取共享特征，因此私有特征和共享特征应当是完全不同的。为此，作者设计了两种正交损失来保证两种特征的不同。

一种是直接特征正交损失：对于私有特征和不变特征，分别通过卷积降维再平铺成 1 维向量，采用向量内积的方式（操作）来做损失，记为如下：

其中

均表示卷积操作。另一种是 Gram 矩阵正交损失：Gram 矩阵在风格迁移中广泛用于表征特征的不同风格，为此，作者先对两种特征计算 Gram 矩阵，再平铺成 1 维向量来计算向量内积，记为如下：

光度损失（Photometric Loss）

光度损失是自监督单目深度估计学习范式中的光度一致性损失，这里不再赘述。

实验

作者同样在 Oxford 数据集上进行了评估，分别和 SOTA 方法进行了定性和定量比较，同时进行了消融实验表明了几种损失函数的有效性。

上表展示了在白天和夜间两种场景下的深度估计性能，可见所提方法在两种场景， 40m/60m 两种评估标准下都要超越现有的方法，特别是和 ADFA 比较也有更进一步的提升，但是本文的另一个优势还能同时估计白天图像的深度。

上图展示了和现有方法在夜间图像的深度图可视化结果，重点关注与 ADFA 的比较，可见 ADFA 对目标边界的建模效果较差，而本文的方法能够取得更好的效果。

最后在消融实验上验证了重构损失，两种正交损失和相似度损失的有效性。

小结

从上述几篇工作来看，夜间场景下的自监督深度估计离不开基于 GAN 的对抗学习，研究重心在于设计更有效的网络训练框架，设计新颖的损失函数，以及解决夜间图像转换到白天图像后的细节性挑战，这三个方面可能也是后续工作的跟进点和改进点。另一方面，未来工作能否打破基于 GAN 的学习模式，或者引入外部辅助信息等也是值得探索的领域。

你可能感兴趣的:(大数据,计算机视觉,机器学习,人工智能,深度学习)

学生行为习惯画像可视分析平台 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
学生行为习惯，画像分析，可视化，机器学习，数据挖掘，教育科技1.背景介绍随着教育信息化进程的不断加速，海量教育数据正在被生成和积累。这些数据蕴含着丰富的学生行为信息，例如学习时间、学习内容、学习方式、学习效果等。有效挖掘和分析这些数据，能够帮助教育工作者深入了解学生的学习习惯和行为模式，从而为个性化教学、精准指导和学习效果提升提供重要支撑。然而，传统的教育数据分析方法往往局限于简单的统计描述，难以
RK3568与掌静脉模块：解锁安防新未来计算机学长瑞星微芯片 Android RK3568 Android
引言在当今数字化时代，随着人工智能和物联网技术的飞速发展，各类智能设备如雨后春笋般涌现，为我们的生活和工作带来了极大的便利。在这些智能设备的背后，高性能的处理器和先进的生物识别技术起着关键作用。RK3568处理器作为一款中高端的芯片，以其出色的性能和丰富的接口，在物联网、安防监控、智能家居等众多领域得到了广泛应用。而掌静脉模块作为一种高精度、高安全性的生物识别技术，正逐渐成为身份验证和安全控制领域
蚂蚁集团可转正实习算法岗内推-自然语言飞300 业界资讯自然语言处理
具备极佳的工程实现能力，精通C/C++、Java、Pvthon、Perl等至少一门语言:对目前主流的深度学习平台:tensorflow、pytorch、mxnet等，至少对其中一个有上手经验;熟悉深度学习以及常见机器学习算法的原理与算法，能熟练运用聚类、分类、回归、排序等模型解决有挑战性的问题，有大数据处理的实战经验;有强烈求知欲，对人工智能领域相关技术有热情，内推链接：https://u.ali
深圳传音控股AI算法岗内推飞300 人工智能 python java 业界资讯
1扎实的数学基础，熟练掌握机器学习相关的数学知识。2熟悉常用的机器学习算法，掌握常用的深度学习模型与编程实践。3熟悉Pytorch或TensorFlow等深度学习框架，有一定项目经验。4良好的沟通协调能力，执着的专业精神。5参与部门AI创新项目，包括自动化测试平台、BPM流程管理等项目开发登录链接：transsion.zhiye.com/campus/jobs填写我的推荐码：EVHPB3投递，简历
【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet 系列网络发展与高效性分析（附代码）（二）努力毕业的小土博^_^ AI算法题库人工智能算法深度学习卷积神经网络
【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）文章目录【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet系列网络发展与高效性分析（附代码）（二）MobileNet系列网络发展与高效性分析（附代码）4.MobileNetV2（2
Docker中GPU的使用指南俞兆鹏云原生实践 docker 容器运维
在当今的计算领域，GPU（图形处理单元）已经成为了加速各种计算密集型任务的关键硬件，特别是在深度学习、科学模拟和高性能计算等领域。Docker作为流行的容器化平台，允许开发者将应用程序及其依赖打包成一个可移植的容器，在不同的环境中运行。当需要在Docker容器中利用GPU的计算能力时，我们需要进行一些特定的配置和设置。本文将详细介绍如何在Docker中使用GPU，从环境准备到实际应用，帮助你充分利
基于TableStore的海量气象格点数据解决方案实战阿里云云栖号数据存储与数据库 exception Java核心技术
前言气象数据是一类典型的大数据，具有数据量大、时效性高、数据种类丰富等特点。气象数据中大量的数据是时空数据，记录了时间和空间范围内各个点的各个物理量的观测量或者模拟量，每天产生的数据量常在几十TB到上百TB的规模，且在爆发性增长。如何存储和高效的查询这些气象数据越来越成为一个难题。传统的方案常常采用关系型数据库加文件系统的方式实现这类气象数据的存储和实时查询，这种方案在可扩展性、可维护性和性能上都
大数据与物联网（IoT）的完美融合：驱动智能新时代 Echo_Wish 大数据高阶实战秘籍大数据物联网 python 人工智能
大数据与物联网（IoT）的完美融合：驱动智能新时代大家好，我是你们的大数据探索者Echo_Wish。今天，我们将深入探讨大数据与物联网（IoT）整合的重要性及其在现代科技中的应用。物联网通过连接大量智能设备，生成海量数据；而大数据技术则赋予我们从这些数据中提取有价值信息的能力。当两者结合在一起时，能够为各行各业带来革命性的变化，推动智能时代的到来。一、大数据与物联网的基本概念1.物联网（IoT）物
基于NLP的客户意见分析：从数据到洞察 Echo_Wish Python 算法 Python 笔记自然语言处理人工智能
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
（视频演示）基于OpenCV的实时视频跟踪火焰识别软件V1.0源码及exe下载是刃小木啦~ opencv 人工智能计算机视觉
本文介绍了基于OpenCV的实时视频跟踪火焰识别软件，该软件通过先进的图像处理技术实现对实时视频中火焰的检测与跟踪，同时支持导入图片进行火焰识别。主要功能包括相机选择、实时跟踪和图片模式。软件适用于多种场合，用于保障人民生命财产安全。源码及exe文件可通过蓝奏云网盘下载。软件简介《基于OpenCV的实时视频跟踪火焰识别软件》是一款创新的计算机视觉应用软件，旨在通过先进的图像处理技术实现对实时视频中
具身智能行业 [shenhonglei] 具身觉醒：智能进化的未来之路人工智能机器人
具身智能行业综合分析资源下载-具身智能导图.xmind资源下载-具身智能导图.xmind一、行业概况定义与核心特征具身智能（EmbodiedAI）指通过物理实体（如机器人、自动驾驶设备等）与环境的动态交互，实现感知、认知和行动控制的智能系统。其核心特征是“知行合一”，强调通过实际交互提升智能水平，而非仅依赖数据训练。技术融合：结合人工智能（AI）、机器人技术、多模态大模型
【AGI】中国大模型扛把子：通义家族 LeeZhao@ AIGC重塑生活神器 agi 人工智能 AIGC 面试自然语言处理语言模型
中国大模型扛把子：通义家族引言一、通义千问的技术架构与模型谱系二、技术突破与性能优势三、开源生态与行业影响四、未来展望：从“千问时代”到通用智能五、通义家族大模型列表（1）多模态大模型（2）大语言模型结语引言在人工智能大模型领域，中国科技企业正以惊人的速度突破技术边界。阿里云推出的**通义千问（Qwen）**系列大模型，凭借其多层次的技术架构、多样化的模型生态及开源战略，已成为全球AI领域的重要标
OpenCV 100道面试题及参考答案（7万字长文）大模型大数据攻城狮大厂面试大厂面经 android面试计算机视觉 opencv 实时互动 webrtc
OpenCV简介OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉库，它提供了丰富的函数和工具，用于处理图像和视频。OpenCV最初由英特尔公司开发，现在由一个开源社区维护和发展。主要功能和用途OpenCV的主要功能包括图像和视频处理、特征提取、目标检测、人脸识别、物体跟踪等。它可以用于各种领域，如机器人技术、医学影像、安全监控、自动驾驶等。在图像
R语言机器学习系列-随机森林回归代码解读 Mrrunsen R语言大学作业机器学习回归 r语言
回归问题指的是因变量或者被预测变量是连续性变量的情形，比如预测身高体重的具体数值是多少的情形。整个代码大致可以分为包、数据、模型、预测评估4个部分，接下来逐一解读。1、包部分，也就是加载各类包，包括随机森林包randomForest，数据相关包tidyverse、skimr、DataExplorer，模型评估包caret。2、数据部分，主要是读取数据，处理缺失值，转换变量类型。3、模型部分。为了对
探索数据仓库自动化：ETL流程设计与实践 Echo_Wish 大数据高阶实战秘籍数据仓库自动化 etl
探索数据仓库自动化：ETL流程设计与实践在大数据时代，数据仓库已成为企业数据管理和决策支持的核心工具。如何高效地提取、转换和加载数据（ETL），是数据仓库建设中的重要环节。本文将围绕数据仓库自动化的ETL流程设计展开，结合实际代码示例，探讨如何构建高效、稳定和可扩展的ETL解决方案。什么是ETL？ETL（Extract,Transform,Load）是指数据抽取、转换和加载，是数据仓库建设的重要步
【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
大语言模型对程序员行业的影响及未来发展走势分析 Hello kele 人工智能 java 人工智能 AI编程
随着人工智能技术的快速发展，特别是大语言模型（如DeepSeek、OpenAI、Grok等）的出现，对程序员这个行业产生了深远的影响。在这篇文章中，我们将探讨这些变化，分析影响，并展望未来的发展趋势。一、当前影响1.自动化代码生成大语言模型的一个直接影响是代码自动化的能力。这些模型可以理解代码上下文，并生成功能性代码。例如，GitHubCopilot已经成为许多开发者的辅助工具，能够根据注释或部分
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
企业信息查询系统的技术实现路径探析——以某大数据平台为例探熵科技大数据
引言在数字化转型加速的背景下，企业信息服务领域正经历着从传统工商查询向智能决策支持的演进。本文将以某企业信息查询系统为研究样本，解析其技术架构与实现路径，探讨大数据技术在企业服务场景中的落地应用。一、行业技术现状分析当前企业信息服务面临三大技术挑战：多源异构数据整合：需聚合工商数据（结构化）、招投标公告（半结构化）、企业新闻（非结构化）等差异化数据源数据实时性要求：企业经营状态变更、联系方式更新等
使用OpenCV和Python将图像读取为RGB UixnContext opencv python 人工智能 OpenCV
在计算机视觉和图像处理中，OpenCV是一个广泛使用的开源库，提供了许多功能强大的图像处理工具。其中一个常见的任务是将图像读取为RGB格式，以便进一步处理和分析。在本文中，我将向您展示如何使用OpenCV和Python来实现这个任务。首先，确保您已经安装了OpenCV库。您可以使用以下命令在Python中安装OpenCV：pipinstallopencv-python一旦安装完成，我们可以开始写代
大数据面试系列之——Hadoop 潜心_守道大数据面经面试大数据 Hadoop
Hadoop的三个核心：HDFS（分布式存储系统）MapReduce（分布式计算系统）YARN(分布式资源调度)1.Hadoop集群的几种搭建模式1.单机模式：直接解压安装，不存在分布式存储系统2.伪分布式：NameNode和DataNode安装于同一个节点，无法体现分布式处理的优势。3.完全分布式：一个主节点，多个从节点，存在如果主节点宕机，集群就无法使用的缺点。4.高可用模式：多个主节点，多个
人工智能开发趋势光影少年人工智能
人工智能开发趋势：未来技术的演进与创新引言人工智能（AI）正在以惊人的速度发展，并在各行各业中发挥越来越重要的作用。从自然语言处理到计算机视觉，从自动化决策到自主学习，AI的发展方向正变得更加智能化、自动化和人性化。本文将探讨当前AI开发的最新趋势，并展望未来的发展方向。1.生成式AI的崛起近年来，生成式AI（如ChatGPT、StableDiffusion、DALL·E）展现出强大的内容创作能力
大模型驱动的智能代码生成系统 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型驱动的智能代码生成系统关键词大模型智能代码生成自然语言处理计算机视觉系统设计与实现摘要本文深入探讨了基于大模型的智能代码生成系统的构建与实现。首先，我们分析了智能代码生成的背景与意义，随后介绍了大模型的基本原理及其在代码生成中的潜力。接着，我们详细阐述了智能代码生成系统的设计与实现过程，包括系统需求分析、架构设计、模型集成与优化等方面。随后，本文通过自然语言处理、计算机视觉和代码生成应用，展
LLM辅助编程：代码自动生成与优化 AI智能涌现深度研究计算机软件编程原理与应用实践 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
LLM,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化，程序员面临着越来越高的开发压力和效率要求。传统的编程方式依赖于手动编写代码，这不仅耗时费力，而且容易出现错误。近年来，随着深度学习技术的快速发展，基于大型语言模型（LLM）的代码生成和优化技术逐渐成为软件开发领域的新兴热点。LLM是一种强大的人工智能模型，能够理解和生成人类语言。通过训练大量
国内开源深度学习框架 we19a0sen 深度学习人工智能
目录一、国内开源深度学习框架1、PaddlePaddle（百度飞浆）2、MindSpore（华为昇思）3、MegEngine（旷视天元）4、OneFlow（一流科技）5、Jittor（清华计图）二、快速入手1、PaddlePaddle（百度飞浆）2、MindSpore（华为昇思）3、MegEngine（旷视天元）4、OneFlow（一流科技）5、Jittor（清华计图）三、基础教程1、Paddle
Python图片识别脚本：从零开始实现图像识别！ Python_trys python 开发语言编程 Python入门 Python基础 Python识别 Python学习
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】图像识别是计算机视觉领域的一个重要应用，Python凭借其丰富的库和工具，成为了实现图像识别的首选语言之一。本文将带你从零开始，使用Python编写一个简单的图片识别脚本。我们将使用OpenCV和TensorFlow来实现这个功能。1.环境准备在开始之前，我们需要安装一些必要的Python库。你可以使用pip来安装这些库：pipinsta
python和java的优缺点-java有哪些python没有的优点? weixin_37988176
Java和Python都是目前最火的后台语言。Java的使用时间更久，更成熟，Python语言更年轻，更便捷。两者各有各的优势：Python的优势：1.学起来简单，开发效率高，同样的功能用Java开发可能需要写200条代码，但是用Python只需要30~50条;2.在大数据挖掘方面有突出优势，是大数据分析首选的编程语言，Python可以让开发人员轻松表达概念，程序员维护和更新代码库更容易;3.Py
Oumi ：AI开发的未来？人工智能开源
Oumi：AI开发的未来？前言在人工智能领域，开源技术正以前所未有的速度推动着创新和变革。今天，我们将聚焦一个备受瞩目的开源AI平台——Oumi。它不仅以其强大的功能和灵活的架构吸引了全球开发者和企业的目光，还通过简化AI开发的整个生命周期，为用户提供了前所未有的便利。github地址：https://github.com/oumi-ai/oumi官网地址：https://oumi.ai/什么是O
关于采用源始经为底层框架开发中文编程系统的可能性太翌修仙笔录 deepseek 超算法认知架构第三代人工智能算法人工智能
用中文写代码和Python哪个有前景在编程语言选择方面，**Python的发展前景明显优于中文编程语言**。以下是具体分析：---###一、核心结论**优先选择Python**，因为：1.**全球通用性**：Python是国际主流编程语言，适用于跨国协作和开源项目2.**就业市场需求**：Python在人工智能/大数据/Web开发等领域的岗位需求持续增长3.**技术生态优势**：拥有超过30万个第
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p