ScarLeTzzz

【论文笔记】2022-CVPR-深度估计

2022-CVPR-深度估计

文章目录

2022-CVPR-深度估计
- 0. 摘要
- 1. 介绍
- 2. 相关工作
- 3. 系统
- - 3.1 硬件
  - 3.2 深度估计流程
  - 3.3 单目结构光
  - 3.4 立体匹配网络与融合策略
- 4. 实验
- - 4.1 原型
  - 4.2 数据集与评估指标
  - 4.3 定量估计
  - 4.4 定性分析
  - 4.5 限制
- 5. 结论

题目：Depth Estimation by Combining Binocular Stereo and Monocular Structured-Light
地址：https://arxiv.org/pdf/2203.10493.pdf

0. 摘要

被动立体系统不能很好地适应弱纹理物体，而弱纹理目标在室内环境很常见
本文提出了一种新型立体成像系统，它由两台摄像机（一台RGB摄像机和一台红外摄像机）和一台红外散斑投影仪组成。
- RGB摄像机用于深度估计和纹理获取
- 红外相机和散斑投影仪可以组成单片结构光(Monocular Structured-Light ，MSL)子系统
- 两个摄像头可以组成双目立体子系统
MSL子系统生成的深度图可以为立体匹配网络提供外部依据，显著提高匹配精度（这里使用了GSM方法，即Guided stereo matching）。
为了验证该系统的有效性，建立了一个原型，并在室内场景中收集了测试数据集。
评估结果表明，采用网络RAFT时，该系统的Bad2.0误差为被动立体系统的28.2%。
数据集和训练模型地址：https://github.com/yuhuaxu/monostereofusion

1. 介绍

一些深度获取方法：
- 单目结构光：Kinect、iPhone X，缺点，无法获得远处物体或者强光下的室外场景的深度测量，无法获得某一特定尺度的深度图；
- 双目立体视觉：测量距离比较远，可以在阳光强烈的室外环境工作，缺点，易受到物体表面纹理的影响；
- 双目结构光：Intel D435，依靠两个红外摄像机和一个红外投影仪进行深度估计，在室内和室外都有很好的适应性。要获取纹理，需要第三个摄像头（即RGB摄像头）。缺点，由于在RGB相机和IR相机之间存在基线，因此需要进行系统转换以使深度图像与RGB图像对齐。由于深度图的噪声和标定参数的误差，使得RGB图像与深度图的精确对齐变得困难。硬件方面，需要三个摄像头和一个投影仪，并不紧凑。
- TOF：对低反射率物体和远距离物体的适应能力较差，还受到多径干扰（multipath interference）的影响
贡献：整合单目结构光和双目立体视觉优点，提出一种结构紧凑的深度传感方案
1. 提出了一种由RGB摄像机、IR摄像机和IR散斑投影仪组成的立体视觉系统。
- IR相机没有附加滤光片。同时接收红外光和环境光
- 单目主动结构光系统：IR摄像机+IR投影仪
- 双目立体系统：IR摄像机+RGB摄像机
- 优势互补：主动结构光系统对被动双目立体系统难以处理的弱纹理物体（如白墙）具有鲁棒性。通过在立体匹配网络的代价体中融合单目结构光系统获得的初始深度图，得到得到一个鲁棒的立体系统
1. 搭建了原型硬件系统，并收集了一个新的立体数据集，用于将单目结构光和双目立体视觉（MonoBinoStereo）结合起来，以验证所提方法的有效性。该数据集将开放供进一步研究。
2. 发现DNN可以准确地估计一对非对称立体图像的散斑图，其中一幅是被动的，另一幅是主动的（带有散斑）。
所提系统的特点：
1. 与经典的双目立体视觉相比，在室内环境下，它对弱纹理目标和富纹理目标都具有较强的鲁棒性。
2. 与现有的单目结构光系统（如Kinect）相比，它具有更大的测量距离范围和更好的室外环境性能。
3. 与现有的主动式深度传感系统（如Kinect和Intel D435)相比，其输出的深度图具有更好的完整性。此外，深度图与RGB图像逐像素自然对齐。
4. 在室外环境中，由于受到强烈阳光的干扰，它将退化为一种普通的被动双目立体系统。

2. 相关工作

Zbontar等人[Computing the stereo matching cost with a convolutional neural network]首先使用卷积神经网络(CNN)比较两个图像块（如9×9或11×11）并计算它们的匹配代价。如代价聚合、视差计算和dis-parity细化，仍然是传统的方法。MC-CNN显著提高了视觉效果，但仍然难以在无纹理、反射和遮挡区域产生准确的视差结果，而且耗时较长。
DispNetC[A large dataset to train convolutional networks for disparity, optical flow, and scene flow estimation]是第一个端到端立体匹配网络，它的效率更高，几乎是MC-CNN-Acrt的1000倍。在DispNetC中，有一个显式的相关层。在传统的立体匹配方法中，通常有一个视差细化模块。受此启发，利用残差细化层进一步提高预测精度。另外，将分割信息和边缘信息结合到立体匹配网络中，提高了匹配性能。
Wang等人[Parallax attention for unsupervised stereo correspondence learning；Learning parallax attention for stereo image super-resolution]提出了一种通用的视差-注意机制，以捕获立体匹配相似性，而不管视差的变化。光流和校正立体匹配是密切相关的问题
RAFT使用基于门控循环单元(GRU)的算子，使用从相关体中检索的特征迭代更新流场，RAFT具有很好的泛化能力。
GC-Net[End-to-end learning of geometry and context for deep stereo regression]首先在4D成本体中使用三维卷积进行成本累积，并利用平滑argmin对视差进行回归。
Duggal等人[Deeppruner: Learning efficient stereo matching via differentiable patchmatch]采用PatchMatch Stereo[Patchmatch stereo-stereo matching with slanted support windows]的思想，构建一个薄代价体来加快预测过程。基于方差的不确定性估计用于自适应调整薄代价体的视差搜索空间。
最近的工作[Pyramid stereo matching network, Deeppruner: Learning efficient stereo matching via differentiable patchmatch]表明，三维集合可以提高特定数据集的匹配精度。然而，三维卷积比二维卷积更耗时，难以在实时应用中应用。为了追求实时性能。
StereoNet[Stereonet: Guided hierarchical refinement for edge-aware depth prediction]在低分辨率（例如，1/8分辨率）下执行3D卷积，然后分层地细化差异。由此产生的网络可以以60 fps的速度实时运行。然而，这种简化降低了网络的准确性。
Xu等人[Bilateral grid learning for stereo matching networks]设计了一个基于双边网格的边缘保持代价体积上采样模块。利用上采样模块，可以从低分辨率版本中获得高分辨率的高质量代价体。上采样模块可以嵌入到现有的许多立体匹配网络中，如GCNet、PSMNet和GANet[Ga-net: Guided aggregation net for endto-end stereo matching]。所得到的网络可以在保持相当精度的情况下加快数倍。
HITNet[Hitnet: Hierarchical iterative tile refinement network for real-time stereo matching]没有显式地建立一个体积，而是依靠快速的多分辨率初始化步骤、可微的二维几何传播和扭曲机制来推断视差假设。为了获得较高的精度，该方法推导出倾斜平面假设，从而可以准确地进行几何变换和上采样操作。
为了减轻计算负担，Yao等人[A decomposition model for stereo matching]提出了一种分解模型，该模型在很低的分辨率下执行密集匹配（例如20×36）并在不同的高分辨率下使用稀疏匹配来逐级恢复丢失细节的差异。
ActiveStereoNet[Activestereonet: End-to-end self-supervised learning for active stereo systems]是第一个用于主动立体系统的深度学习解决方案。由于缺乏地真值，网络被设计成完全自我监督。
Riegler等人[Connecting the dots: Learning representations for active monocular depth estimation]没有通过对应搜索问题来制定深度估计。他们证明了在单目结构光系统中，一个简单的卷积结构就足以得到高质量的分布估计。
我们的工作还涉及到图像引导的深度计算，其任务是从稀疏的深度测量中估计出稠密的深度图。
Ma等人[Sparse-to-dense: Depth prediction from sparse depth samples and a single image]提出将稀疏深度和彩色图像的级联馈入编码器-解码器深度网络。
Jaritz等人[Sparse and dense data with cnns: Depth completion and semantic segmentation]结合语义分割提高深度完成度。
Cheng等人[Depth estimation via affinity learned with convolutional spatial propagation network]提出了一个卷积空间传播网络（CSPN）对深度补全结果与相邻深度值进行后处理。但是，CSPN依赖于固定局部邻域，这些邻域可能来自不相关的对象。
Park等人[Non-local spatial propagation network for depth completion]提出了一种用于深度完成的非局部空间传播网络。该方法可以有效地避免不相关的局部噪声，并集中于相关的非局部邻居的传播。
Qiu等人[Deeplidar: Deep surface normal guided depth prediction for outdoor scene from sparse lidar data and single color image]学习到曲面法线作为中间表示。
Xu等人[Depth completion from sparse lidar data with depth-normal constraints] 在扩散模块中模拟了深度和表面法线之间的几何约束，并预测了稀疏激光雷达测量的置信度，以减轻噪声的影响。
为了解决深度涂抹问题，Imran等人[Depth completion with twin surface extrapolation at occlusion boundaries]提出了一种多假设的深度表示方法，该方法在困难的遮挡边界区域同时模拟前景和背景深度。
与深度补全方法相比，我们的方法可以利用单目结构光子系统的立体对和深度导引进行视差估计。当深度引导不可用时，立体对仍可用来估计目标的深度。立体图像比单幅图像能形成更强的约束。

3. 系统

3.1 硬件

如上图，提出的立体系统由两个子系统组成。

首先，红外摄像机和红外投影仪构成一个主动式单目结构光子系统。
第二，IR摄像机和RGB摄像机组成双目立体子系统。
单目结构光子系统对弱纹理目标具有较强的鲁棒性，而双目结构光子系统对远距离目标具有良好的重建能力，可以在室外环境下工作。
因此，这两个子系统具有互补的优势。

3.2 深度估计流程

如上图所示，输入包括RGB图像、IR图像和参考散斑图像。其中参考散斑图像预先存储并固定在单目结构光子系统中。

首先对目标当前红外图像和参考散斑图像进行匹配，生成视差图 $d_{m}$ ;
利用单目结构光子系统的定标参数，可以获得深度图 $Z_{m}$ ，并将其重新投影到RGB相机坐标系统中；
$Z^{'}_{m}$ 表示与RGB图像对齐的深度图，用 $d^{'}_{m}$ 表示对应的视差图；
然后将RGB图像、IR图像和视差图 $d^{'}_{m}$ 送入立体匹配网络估计最终的视差图。

3.3 单目结构光

由图可知，深度的变化会带来散斑在水平方向上的移动

单目结构光深度估计原理（空间编码）
- 目标当前散斑图像与参考散斑图像匹配，参考散斑图像是当照相机的光轴垂直于平面目标在已知距离 $Z_{ref}$ 处时捕获的散斑图像。
- 为了消除两幅图像亮度不同的影响，我们遵循**[Depth estimation for speckle projection system using progressive reliable points growing matching]**中的方法将这些图像转换为二值图像。
- 然后，利用一种有效的块匹配算法计算两幅图像之间的对应关系，得到视差图 $d_{m}$ 。匹配窗口大小设置为21×21。
- 利用视差图，我们可以通过以下公式得到深度图 $Z_{m}$
  - 其中 $B_{m}$ 是基线， $f_{m}$ 是焦距， $Z_{ref}$ 已知距离
- 根据单目结构光系统的表单参数，可以将深度图 $Z_{m}$ 转换到RGB相机的像面上，得到与RGB图像对齐的深度图 $Z^{'}_{m}$
- 然后通过以下公式在双目立体视差系统中获得相应的视差图：
  - $B$ 是双目系统的基线， $f$ 是双目系统的焦距

3.4 立体匹配网络与融合策略

红外相机可以接收红外散斑光和环境光。因此，在室内环境中，两台摄像机的图像在外观上有很大的不同，如上图所示。似乎很难匹配这类图像。幸运的是，我们发现深度神经网络(DNN)可以获得准确的匹配结果。

验证DNN对这类具有非对称纹理的双目图像的适应性
- 首先修改Flyingthings3D训练数据集和测试数据集，修改后，左图像保持不变，而右图像中添加了数万个随机斑点，如下图。
- 改进后的数据集中的立体图像具有不对称的特征
- 散斑的亮度随着这些点到摄像机的距离而减小，从而模拟光能的能量衰减（这样更符合实际物理规律）
- 然后，我们使用原始训练数据集和修改后的训练数据集训练了两个现有的立体匹配网络，包括PSMNet[Pyramid stereo matching network]和RAFT[Raft: Recurrent all-pairs field transforms for optical flow]
- RAFT在光流估计任务中具有很好的泛化能力，光流估计需要同时估计X和Y方向的位移。这里，我们做了一个小的修改，只估计X方向的位移
下图表明这些网络对这种不对称的立体图像有很好的适应能力（更多细节见4.3小节）

使用后缀O、M和OM分别表示用原始Flyingthings3D数据集、修改后的Flyingthings3D数据集以及这两个数据集的混合训练的模型。后缀G表示引导在网络中使用。

下图显示各网络定性结果
尽管在有源结构光系统的深度图中通常有许多无效值（如下图，黑色部分位无效值），但深度值是相对可靠的。因此，有效的深度值可以作为立体匹配网络的指导。

立体匹配网络中的代价体由几何和上下文信息组成，允许后续卷积回归视差概率。为了集成单目结构光系统的优点，我们根据单目结构光系统转换得到的视差图 $d^{'}_{m}$ 对代价体进行了修正，如在引导立体匹配(GSM)[Guided stereo matching]中所做的。

在GSM中，稀疏提示信息产生的假设，其相关性分数和特征激活达到峰值，同时会抑制与提示信息相关低的部分

部分假设与相关数学公式
- $g$ ：转换MSL视差图的w×h矩阵， $v$ ：二值掩膜，指出 $g$ 矩阵中有效的像素；
- 代价体，其中 $D_{max}$ 是最大是视差， $F$ 是特征数
- 令像素坐标为 $(x, y)$ ，由外部是视差转换而来的视差值为 $g (x, y)$ ，GSM应用高斯函数：
  - [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GSZwHDjy-1649041294716)(D:\研一文件\笔记\Markdown\论文笔记\2022-CVPR-深度估计\image-20220403165010685.png)]
  - $\sigma$ 决定高斯分布的宽， $\lambda(\lambda>=1)$ 表示最大幅值
- GSM将上述高斯函数作用在代价体的特征 $\mathcal{C}(x,y,z)$ 上，从而获得一个新的代价体。
对于RAFT来说，为了避免收敛到负相关值，代价体的相关值（correlation values）会进行归一化处理，用下面公式实现：
- - 其中 $F_{l}$ 和 $F_{r}$ 是从左右图提取的特征， $d$ 表示视差， $\epsilon$ 表示一个小常数
  - 由单目系统视差转换到RGB像面的视差图 $d_{m}^{'}$ ，作为立体匹配网络的外部指导。

4. 实验

4.1 原型

硬件参数：同步cmos相机×2 + IR投影仪×1
相机参数：焦距4mm，分辨率1280×960，最大帧率30fpsRGB相机带有红外滤除滤镜，IR相机没有滤镜
投影仪参数：带有DOE（diffractive optical element ,衍射光学元件）的散斑投射器
单目子系统：基线距离63mm，参考平面距离80cm，白墙11000个散斑点
双目子系统：基线距离94.14mm

4.2 数据集与评估指标

合成数据集：SceneFlow[A large dataset to train convolutional networks for disparity, optical flow, and scene flow estimation. ]包括,Flyingthings3D, Driving和Monkaa。
- 35454幅训练图像和4370幅测试图
- 分辨率960×540
- 有精确的视差真值
- 本文使用Flyingthings3D作为训练数据集，使用EPE作为评价指标。
EPE(Endpoint Error)，是光流估计中标准的误差度量，
是预测光流向量与真实光流向量的欧氏距离在所有像素
上的均值。
实景数据集：收集了一个室内环境的数据集，包括办公室、起居室和卧室等不同的室内场景。
- 选择使用时空立体方法[Spacetime stereo: A unifying framework for depth from triangulation，Spacetime stereo: Shape recovery for dynamic scenes]来获得视差真值，参考[Probabilistic tof and stereo data fusion based on mixed pixels measurement models]中的做法；
- 每个场景捕获200对立体图像；
- 视差真值是通过融合所有200对立体对估计得到的；
- 应用了亚像素细化和左-右一致性检查(LRC)；
- MonoBinoStereo数据集总共包括15个场景。每个场景收集两个立体声对，其中左边的图像总是被动的RGB图像，而右边相机的一个图像是被动的（关闭投影仪），另一个是主动的（打开投影仪）。下图是投影仪打开的一些立体对。

在图像获取过程中，同时投影成千上万的运动散斑，使得每个帧的散斑分布是不同的

缺乏真实的室内场景大型训练数据集：使用IRS数据集作为训练数据集对Monobinostereo数据集进行评估。
- 合成的IRS数据集[Irs: A large synthetic indoor robotics stereo dataset for disparity and surface normal estimation.]与真实场景相当接近。它包含超过10万对960×540分辨率立体图像（84,946个用于训练，15079个用于测试）在室内场景；
- 在补充材料中详细介绍了网络培训。

4.3 定量估计

首先在SceneFlow数据集上对所提出的方法进行了评估：
- 分别用原始Flyingthings3D数据集和修改后的Flyingthings3D数据集训练PSMNet和RAFT
- PSMNet-O，原始Flyingthings3D数据集；PSMNet-M，修正Flyingthings3D数据集；PSMNet-OM，原始+修正。
- + 当用原始数据集训练模型时，修改后的测试数据集上的EPE较大； + 当使用修改后的训练数据集时，得到的模型（PSMNet-M）的EPE降低到0.955。然而，原始测试数据集的EPE从0.895增加到1.212； + 使用两个训练数据集时，生成的模型（PSMNet-OM）可以平衡两个测试数据集； + 使用**GSM**中的策略来进一步改善结果，PSMNet-OM-G。以真实深度图5%的像素作为外部指导，修正后的测试数据集的EPE由0.984降低到0.686。

上面的规律说明对称的立体对和不对称的立体对存在明显差异，但是通过综合训练两种立体对，能取得互补的效果，然后在再增加指导信息，效果之前更优。

在采集的实景数据集上对模型进行了评估：
- 混合**Flyingthings3D（合成数据集）和IRS数据集（接近真实场景的合成数据集）**对模型进行训练。
- - 以RAFT为例，在DOE投影仪打开的情况下，仅使用原始数据集（Flyingthings3D和IRS）进行训练的情况下，RAFT-O的BAD2.0误差高达21.88%，添加了修改数据集后RAFT-OM模型的Bad2.0误差降低到了14.60%。
  - 单目结构光子系统的深度图可以作为立体匹配网络的外部指导。我们使用 $d^{'}_{m}$ 中10%的像素作为指导。当使用此指导时，RAFT-OM-G模型的Bad2.0误差降低到3.59%。
  - 上图还显示了不同模型对纯被动立体（投影仪关闭）数据集的定量结果。

由于代价体是在RAFT的1/8分辨率下建立的，实际上在 $d^{'}_{m}$ 中只有1/640的像素用于指导。被动立体视觉的引导信息不可用。

被动测试数据集上运行模型RAFT-O。BAD2.0误差为12.71%，是RAFT-OM-G的3.5倍。结果表明，该方法能显著提高立体匹配精度。在无源数据集上，RAFT-OM-G的BAD2.0误差为10.51%（不使用外部指导），表明RAFT-OM-G可以很好地推广到无源场景中。
上图还显示在MonoBinoStereo数据集中，RAFT的整体性能方面优于PSMNet。
还在 $d^{'}_{m}$ 中以1%的像素点作为指导，在MonoBinoStereo数据集上与一种深度补全方法**MSG[A multi-scale guided cascade hourglass network for depth completion]**进行了比较。结果如上图所示。MSG的Bad2.0误差为18.57%，比RAFT-OM-G大得多。
下面是定性分析的一些结果

第一行显示左边的图像（在网络预测之前将RGB图像转换为灰度图像），

第二行显示了带有斑点的右图像（无源右图像未显示），

第三行是用时空立体方法生成的视差图真值，

第四行显示了用MSL子系统生成的深度图像，

第五行显示了用于无源立体图像的RAFT-O视差图，

最后一行显示了RAFT-OM-G视差图，其中左图像是无源的，右图像是带有斑点的。

在第五行和第六行中，每个视差图都显示了BAD2.0误差。相应的误差图显示在补充材料中

4.4 定性分析

在有人的动态场景和难以获得地面真实感视差图的室外场景中对所提出的系统进行了测试。对于这些场景，给出了定性比较结果。

所提出的系统与Kinect V1在室内和室外场景中进行了比较：
- Kinect在室内场景可以生成密集深度估计，而在室外场景中，由于投射的红外散斑受到太阳光的干扰，深度图中的空洞较多。
- 所提出的系统，在室外场景它将退化为一个被动的双目立体系统，在该系统中，立体对仍然可以用来估计场景的密集深度图
与Intel RealSense D435进行了比较：

D435使用两个摄像头获取深度图，第三个摄像头获取纹理，不可避免的会产生遮挡。相比之下，我们的系统只需两个摄像头就可以输出与RGB图像自然对齐的深度图。

4.5 限制

限制一：在单目结构光系统中，需要一个已知深度 $Z_{ref}$ 的平面目标的参考图像。在获取参考图像时，我们假设摄像机的操作轴垂直于平面目标，这在实际中是很难保证的。
限制二：相对于双目立体系统，单目结构光系统的标定难度更大。标定误差会导致RGB图像与 $Z_{m}$ 深度的对准误差，从而导致导引立体匹配网络中的导引错误。
限制三：在实验中，我们发现增加外部指导点的数量并不能提高精度（详见补充材料）。此外，在相同的外部指导点数下，对RAFT-OM-G的Bad0.5，Bad1.0和Bad2.0误差分别为12.94，4.94和2.00。
因此，在未来的研究中，将致力于单目结构光系统的精确标定方法，以进一步提高单目结构光系统的性能。

5. 结论

本文提出了一种新颖的立体系统。
该系统包括一个单目结构光子系统和一个双目立体子系统。将这两个子系统结合起来以获得鲁棒的深度估计。
系统是独一无二的，因为它只有两个摄像头，一个RGB摄像头和一个IR摄像头。RGB相机用于深度测量和纹理获取。得到的深度图与RGB图像逐像素自然对齐。
在室内场景中收集了一个真实的测试数据集。
定量结果表明，该系统的Bad2.0误差是经典无源立体系统的28.2%。
在室外强光下，所提出的系统将退化为被动立体系统。

Vision Transformer（ViT）：用 Transformer 颠覆图像识别金外飞176 论文精读 transformer 深度学习人工智能
VisionTransformer（ViT）：用Transformer颠覆图像识别在计算机视觉领域，卷积神经网络（CNN）长期以来一直是图像识别任务的主流架构。然而，近年来，自然语言处理（NLP）领域中大放异彩的Transformer架构也开始在图像识别中崭露头角。今天，我们将深入探讨一种创新的架构——VisionTransformer（ViT），它将Transformer的强大能力直接应用于图像
YOLOv8到YOLOv11：深度解析目标检测架构的演进金外飞176 技术前沿目标跟踪人工智能计算机视觉目标检测 YOLO 神经网络深度学习
YOLOv8到YOLOv11：深度解析目标检测架构的演进在计算机视觉领域，YOLO（YouOnlyLookOnce）系列模型一直是实时目标检测领域的佼佼者。从2015年的YOLOv1到2024年的YOLOv11，这一系列模型经历了快速的迭代和发展，不断刷新着目标检测的性能和效率。然而，由于部分YOLO版本缺乏详细的学术论文和架构图，研究人员和开发者在理解这些模型的工作原理时往往面临挑战。最近，一篇
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系时光旅人01号深度学习 pytorch opencv
想象一下，你正在建造一座深度学习工厂，这座工厂专门用于高效处理深度学习任务（如训练神经网络）和计算机视觉任务（如图像处理）。为了让工厂顺利运转，你需要搭建基础设施、安装设备、设置生产线，并配备控制台来管理整个生产过程。以下是这座工厂的详细构建过程：1.工厂的基础设施：Ubuntu比喻：Ubuntu是工厂所在的土地和建筑，提供了基础设施和运行环境。作用：提供操作系统环境，支持安装和运行各种工具和框架
在瑞芯微RK3588平台上使用RKNN部署YOLOv8Pose模型的C++实战指南机＿长 YOLO系列模型有效涨点改进深度学习落地实战 YOLO c++开发语言
在人工智能和计算机视觉领域，人体姿态估计是一项极具挑战性的任务，它对于理解人类行为、增强人机交互等方面具有重要意义。YOLOv8Pose作为YOLO系列中的新成员，以其高效和准确性在人体姿态估计任务中脱颖而出。本文将详细介绍如何在瑞芯微RK3588平台上，使用RKNN（RockchipNeuralNetworkToolkit）框架部署YOLOv8Pose模型，并进行C++代码的编译和运行。注本文全
使用BLIP模型生成图像描述的可查询索引 dgay_hua python 计算机视觉开发语言
在本篇文章中，我们将介绍如何使用预训练的SalesforceBLIP图像描述模型，生成一个可查询的图像描述索引。我们将使用ImageCaptionLoader来加载图像，并通过一系列步骤生成查询索引。使用示例代码进行演示，帮助读者理解和实践。技术背景介绍随着计算机视觉技术的发展，图像描述生成成为了重要的研究领域。通过对图像内容自动生成文字描述，可以大大提高对图像信息的检索和管理效率。Salesfo
深度学习模型中的知识蒸馏是如何工作的? c++服务器开发深度学习人工智能
深度学习模型在多个领域，特别是计算机视觉和自然语言处理中，已经取得了革命性的进展。然而，随着模型复杂性和资源需求的不断攀升，如何将这些庞大模型的知识浓缩为更紧凑、更高效的形式，成为了当前研究的热点。知识蒸馏，作为一种将知识从复杂模型转移到更简单模型的策略，已经成为实现这一目标的有效工具。在本文中，我们将深入探究深度学习模型中知识蒸馏的概念、原理及其在各领域的应用，以期为读者提供一个全面而严谨的视角
Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python从0到100（三十五）：beautifulsoup的学习是Dream呀 Dream的茶话会 python beautifulsoup 学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
OpenCV的卡尔曼滤波器：实现和应用雪域Code opencv 人工智能计算机视觉 C/C++
OpenCV的卡尔曼滤波器：实现和应用卡尔曼滤波器（Kalmanfilter）是一种最优估计的算法，在众多领域有着广泛的应用，如控制系统、通信系统、机器人等。OpenCV作为一个计算机视觉库，也提供了对卡尔曼滤波器的支持。本文将介绍OpenCV中卡尔曼滤波器的基本原理、实现方法以及在图像处理中的应用。一、卡尔曼滤波器简介卡尔曼滤波器是一种用于状态估计和信号滤波的算法，主要针对线性、高斯分布的系统。
生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命 ProgramHan 人工智能计算机视觉学习
生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命引言：从“数据饥渴”到“智能涌现”传统计算机视觉高度依赖海量标注数据，但现实场景中标注成本高昂且覆盖范围有限。例如，医疗影像标注需专业医生耗时数月，工业缺陷检测需针对特定产线定制数据集。生成式AI（如Diffusion模型、自监督学习）的崛起，正在打破这一瓶颈——通过更高效的训练范式与计算架构，让机器学会“从无标注数据中看见世界”。（示意图：
【深度学习】计算机视觉（CV）-目标检测-DETR（DEtection TRansformer）—— 基于 Transformer 的端到端目标检测 IT古董深度学习人工智能深度学习计算机视觉目标检测
1.什么是DETR？DETR（DEtectionTRansformer）是FacebookAI（FAIR）于2020年提出的端到端目标检测算法，它基于Transformer架构，消除了FasterR-CNN、YOLO等方法中的候选框（AnchorBoxes）和非极大值抑制（NMS）机制，使目标检测变得更简单、高效。论文：End-to-EndObjectDetectionwithTransforme
机器学习:支持向量机小源学AI 人工智能支持向量机机器学习算法
基本概念1.什么是支持向量机支持向量机是一种二分类模型,在机器学习、计算机视觉、数据挖掘中广泛应用,主要用于解决数据分类问题,它的目的是寻找一个超平面对样本进行分割,分割的原则是间隔最大化(也就是数据集的边缘点到分界点的距离d最大)最终转化成一个凸二次规划问题来求解。通常的SVM用于二元分类问题,对于多元分类问题可将其分解为多个二元分类问题,在进行分类。2.最优分类边界什么才是最优分类边界?什么条
基于图像处理的裂缝检测与特征提取机器懒得学习图像处理计算机视觉人工智能
一、引言裂缝检测是基础设施监测中至关重要的一项任务，尤其是在土木工程和建筑工程领域。随着自动化技术的发展，传统的人工巡检方法逐渐被基于图像分析的自动化检测系统所取代。通过计算机视觉和图像处理技术，能够高效、精确地提取裂缝的几何特征，如长度、宽度、方向、面积等，从而为工程质量评估提供数据支持。本文将详细介绍一段用于裂缝检测与特征提取的Python代码，重点讲解其实现的核心算法与关键步骤，分析其应用场
利用 OpenCV 进行棋盘检测与透视变换萧鼎 python基础到进阶教程 opencv 人工智能计算机视觉
利用OpenCV进行棋盘检测与透视变换1.引言在计算机视觉领域，棋盘检测与透视变换是一个常见的任务，广泛应用于摄像机标定、文档扫描、增强现实（AR）等场景。本篇文章将详细介绍如何使用OpenCV进行棋盘检测，并通过透视变换将棋盘区域转换为一个标准的矩形图像。我们将基于一段Python代码进行分析，代码的主要任务包括：读取图像并进行预处理（灰度转换、自适应直方图均衡化、去噪）检测边缘并提取棋盘区域计
CVPR2023 Highlight | ECON：最新单图穿衣人三维重建SOTA算法 3Ｄ视觉工坊 3D视觉从入门到精通算法 SLAM 自动驾驶 3D视觉
作者：宁了个宁|来源：计算机视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf。添加微信：dddvisiona，备注：三维重建，拉你入群。文末附行业细分群。图1所示。从彩色图像进行人体数字化。ECON结合了自由形式隐式表示的最佳方面，以及明确的拟人化正则化，以推断高保真度的3D人类，即使是宽松的衣服或具有挑战性的姿势。0.笔者个人体会这篇文章讨论了单图像的穿着人类重建问题。隐式方
商汤绝影端到端自动驾驶的迭代优化 AGI大模型与大数据研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型训练,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展，自动驾驶汽车从科幻走进了现实。商汤科技推出的绝影端到端自动驾驶系统，就是其中的佼佼者。本文将深入剖析商汤绝影端到端自动驾驶系统的迭代优化过程，帮助读者理解其背后的技术原理和架构设计。2.核心概念与联系商汤绝影端到端自动驾驶系统的核心架构如下：graphLRA[感知
使用OpenCV在Visual Studio上编译x86或x64平台的应用程序程序世界航海 opencv visual studio 人工智能编程
OpenCV是一个广泛使用的计算机视觉库，它提供了丰富的图像处理和计算机视觉算法。如果你想在VisualStudio上编译一个使用OpenCV的应用程序，并且需要针对特定的x86或x64平台进行优化，那么本文将为你提供一些指导。以下是在VisualStudio中编译x86或x64平台上的OpenCV应用程序的步骤：步骤1：安装VisualStudio和OpenCV首先，确保你已经安装了最新版本的V
用realsense d435i传感器在实际环境中跑ORB_SLAM3，顺带解决一部分编译问题睫力上爬 SLAM 日常折腾传感器 ORB_SLAM3
是的ORB_SLAM3来了，时隔五年，它来带的惊喜到底是啥呢？一个完全依赖于最大后验估计（MAP）的单/双目惯导融合系统高回召的地点识别功能（High-recallplacerecognition）第一个完整的多地图系统（multi-map）一个抽象的相机模型表示论文地址论文细节今天不说，今天主要先拿到代码，并且用自己的传感器试试实际效果编译终端拉代码记得提前安装好OpenCV，Eigen，和Pa
探秘 DeepSeek R1 模型：跨越多领域的科技奇迹，引领智能应用新浪潮羑悻的小杀马特. AI学习科技 deepseek AI大模型
DeepSeekR1模型功能强大，应用广泛。在自然语言处理、计算机视觉、推荐系统和医疗等领域都能发挥作用。本文介绍了其在各领域的应用场景和代码示例，助你深入了解它。目录编辑一、本篇背景：二、DeepSeekR1模型概述：2.1模型特点：2.2技术原理：三、自然语言处理领域的应用：3.1文本分类：3.1.1应用场景：3.1.2代码演示：3.2情感分析：3.2.1应用场景：3.2.2代码演示：3.3机
OpenCV 简介奇点创客 OpenCV
OpenCV（OpenSourceComputerVisionLibrary，开源计算机视觉库：http://opencv.org）是一个开放源代码库，其中包含数百种计算机视觉算法。本文档介绍所谓的OpenCV2.xAPI，与基于C的OpenCV1.xAPI相比，该API本质上是一套C++API（自OpenCV2.4发行以来，不推荐再使用CAPI，并且不使用“C”编译器进行测试）。OpenCV具有
本地部署DeepSeek模型技术指南 Evaporator Core apache Doris 人工智能 deepseek
DeepSeek模型是一种先进的深度学习模型，广泛应用于自然语言处理、计算机视觉等领域。为了充分利用DeepSeek模型的强大功能，许多开发者和研究人员选择在本地环境中部署该模型。本文将详细介绍如何在本地环境中部署DeepSeek模型，包括环境准备、模型下载、配置、优化以及代码实现等内容。通过本文的指导，您将能够在本地成功部署并运行DeepSeek模型。1.环境准备在部署DeepSeek模型之前，
什么是3D视觉无序抓取？视觉人机器视觉机器视觉3D 3d 人工智能视觉检测计算机视觉 c#
3D视觉无序抓取是一种结合三维视觉技术、机器人控制与智能算法的工业自动化解决方案，旨在实现机器人对散乱、无序堆放的物体进行自主识别、定位和抓取的操作。其核心是通过3D视觉系统获取物体的三维空间信息，结合路径规划与避障算法，引导机械臂完成高精度抓取任务，无需依赖预先设定的固定程序或工装夹具。以下是其关键要点：核心组成与技术原理三维视觉感知：采用3D相机（如结构光、双目视觉、ToF技术）扫描物体表面，
计算机视觉如何快速入门? Frunze软件开发日常问题回答开发语言计算机视觉工业异常检测论文
目录1.明确研究方向2.学习基础知识3.掌握核心算法4.实践项目5.阅读文献6.复现经典论文7.改进与创新总结计算机视觉（ComputerVision）是一个复杂且广泛的领域，尤其是工业异常检测这种特定方向，需要结合理论知识和实践技能。以下是一些具体的、可操作的建议，也是个人实际路径的一个总结，希望可以帮助到你快速入门并完成一篇论文。1.明确研究方向-工业异常检测的核心是识别图像或视频中的异常区域
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进金外飞176 技术前沿目标跟踪人工智能计算机视觉
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进YOLO（YouOnlyLookOnce）系列目标检测算法自2016年首次发布以来，凭借其高效的实时检测能力，迅速成为计算机视觉领域的热门研究方向之一。本文将详细回顾YOLO系列从v1到v11的版本迭代过程，分析每个版本的技术改进、性能提升以及应用场景。1.YOLOv1：开创性的单阶段检测算法YOLOv1是目标检测领域的一个重要里程碑，
双目立体视觉（3.1）立体标定 2501_90596733 双目立体视觉计算机视觉 python 人工智能
在双目测距系统中，立体标定是至关重要的一步。其主要目的是求解双目相机的所有内外参数，这些参数的准确性直接关系到后续的效果，进而影响双目测距的精度。一、立体标定的重要性立体标定的核心目标是获取相机的内外参数。内参数包括焦距、主点坐标和畸变参数等，这些参数在相机制造完成后基本固定，无需频繁标定。外参数则包括旋转矩阵R和平移向量T，用于描述相机与场景之间的相对位置关系。通过标定，我们可以消除相机的畸变，
推荐学习图像处理的入门书：《Python图像处理实战》天飓学习感悟学习图像处理 python
《Python图像处理实战》是一本全面介绍Python图像处理技术的实用指南，是由人民邮电出版社于2020年12月出版。这本书的作者桑迪潘·戴伊是一位兴趣广泛的数据科学家，主要研究机器学习、深度学习、图像处理和计算机视觉。在《Python图像处理实战》一书中，作者主要介绍了如何用Python图像处理库（如PIL、python-opencv、Scipy等），机器学习库（scikit-learn）和深
RK3588+昇腾AI｜40TOPS算力AI盒子设计方案 ARM+FPGA+AI工业主板定制专家 AI盒子瑞芯微人工智能
综合视频智能AI分析系统介绍以计算机视觉技术为基础，AI赋能千行百业，依托人工智能视觉分析技术以及强大的“端+边”算力支撑，实时分析烟火，入侵等事件，同时结合云上预警业务平台，实现事件发现、预警、处置全流程闭环。设计架构系统架构视频智能识别系统自下而上分为“感知层、网络层、支撑层、应用层”四层，系统逻辑架构如下图所示：感知层对接前端感知设备，如视频监控、NVR、和其他物联感知设备，对重要通道和场所
3D机器视觉的类型、应用和未来趋势视觉人机器视觉机器视觉3D 3d 人工智能计算机视觉 c#前端
3D机器视觉的类型、应用和未来趋势类型3D机器视觉技术主要分为以下几类：立体视觉（StereoVision）通过两个或多个摄像头从不同角度捕捉图像，利用视差计算深度信息，生成3D模型。结构光（StructuredLight）使用投影仪将特定光图案投射到物体表面，通过摄像头捕捉变形图案，计算物体形状和深度。飞行时间（TimeofFlight,ToF）通过测量光脉冲从发射到反射回传感器的时间，计算物体
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s