读书健身敲代码

【深蓝学院】手写VIO第3章--基于优化的 IMU 与视觉信息融合--笔记

0. 内容

1. 基于BA的VIO融合

优化的方法学会之后，滤波的方法也就会了。

具体的求解BA问题参考的是SBA的论文，使用的是LM算法（里面有个关于权重μ的计算方法，不同人的实现可能不一样，这些都是实现细节）

camera两个观测之间的相对位置（pq的变化）可以通过两次观测知道，但是IMU在两个时刻的观测量需要进行积分才能知道，而且IMU数据频率一般比Camera频率高，所以需要逐步地积分才能得到运动情况。

2. 最小二乘问题的求解

牛顿法，将loss function直接Taylor二阶展开，高斯牛顿法是将原函数f(x)一阶展开，再进行求解。

解法分为直接解和迭代解：

马鞍面复习：

2.1 一阶法

下降法（如果方向选择为梯度反方向则就为DL中的梯度下降法，此处叫最速下降法）：

最速下降法：不易收敛；牛顿法：H计算量大。

阻尼法，在牛顿法基础上增加一个 $\Delta x$ 的正则项 $\bm{\frac{1}{2}\mu\Delta x^{T}\Delta x}$ ，使其不会太大（此处仍是一阶法，不是LM法）：

阻尼法的阻尼是加在H上的 $\mu$

为方便起见，可将残差stack起来成向量（也可以写成sum of的形式，但向量可供讨论具体小f的一些性质，相应地，雅克比J和海塞H也要相应地写为向量形式）

F(x)是cost function，最简单的例子： $minF(x)=\frac{1}{2}||f(x)||_2^2$

2.2 二阶法

2.2.1 Gauss-Newton

损失函数F(x)对 $\Delta x$ 的一阶导数可记作b，也可直接写F(x) $^\prime$

2.2.2 LM

2.2.2.1 LM阻尼因子 $\mu$ 初值的选取方法

$\tau$ 的设定是根据经验值而来，当前x距离 $x^*$ 较近时，取二阶近似，初值 $\mu_0$ 就设的小一些,乘较小的 $\tau$ ，距离 $x^*$ 较远时，初值就设的应该较大，保证下降的较快，取一阶近似，乘接近于1的 $\tau$

这里高翔补充了一点，：广义的韦达定理保证所有的特征值 $\lambda_i$ 之和跟矩阵的trace是一样的。

所以这里取 $max{J^TJ_{ii}}$ 矩阵的对角线的最大元素是有道理的，即可以有这样的先验： $J^TJ_{ii}$ 的对角线最大元素跟 $J^TJ_{ii}$ 特征值的最大值是在同一个数量级，所以可取对角线最大元素来近似最大特征值。

2.2.2.2 LM阻尼因子 $\mu$ 的更新策略

定性分析，看上面的 $\Delta x$ 的解析形式，

$\mu$ 处于分母上，增大阻尼 $\mu$ 会减小步长，也符合“阻尼”的直观感受：当某次 $\Delta x$ 使得cost function增大，则应该增大阻尼使 $\Delta x$ 变小，减小步长；反之，如果cost function在下降则应该减小阻尼 $\mu$ ，增大步长，加快收敛速度。

上述推导说明分母一定是>0的，因为寻找的 $\Delta x$ 会使L每次都使得L下降，但是cost function F不一定会下降（因为L是对F的二次近似，理论保证是L每次都会下降，但是实际F不一定下降），所以当 $\rho<0$ 时表示F上升了。
当 $\rho$ >1时代表此时方向是正确的，则应减小 $\mu$ 加快下降速度；如果0< $\rho$ <1则代表则代表实际下降比较小，可能已经到最优值附近，应增大 $\mu$ 减慢下降速度。

$\Delta x$ 越小说明近似的越好，越接近最优值。

发现了14讲关于这个 $\mu$ 更新策略的一个错误， $\rho>\frac{3}{4}$ 时应该减小阻尼 $\mu$ ， $\rho<\frac{1}{4}$ 时应该增大阻尼 $\mu$

Nielsen采用了新的 $\rho$ 的计算策略，分母直接为L，判断 $\rho$ 的符号，当F下降时逐渐减小 $\rho$ ，当增大时， $\rho$ 下降的也很快。

2.3 鲁棒核函数（或叫M-Estimation）

outlier会使得F变得很大，为了处理outlier，在 $f^2$ 外面增加一层 $\rho$ 对f进行处理 $\rho(f^2)$ ，也有 $\rho(f)^2$

给x微小扰动 $\Delta x$ 计算 $\Delta s$ ，带入(14)可得加上鲁棒核函数之后的展开式


鲁棒核函数本质上是对每项误差的重加权（Reweighted），State Estimation中有对Iterated Reweighted Least Square（IRLS）和鲁棒核函数等价的证明。

95%有效原则，带上outlier和不带时的协方差之比接近95%，原文较接近数理统计方面的东西。

对正态分布，若鲁棒核是Huber，则控制参数设为1.345可满足95%原则，Cauchy应为2.3849
若非正态分布，则需统计残差协方差，在进行归一化处理（SVO,DVO,PTAM都是如此）变成正态分布，然后在使用正态分布的参数处理方法。
（但是在实际可能这个参数不会影响很大，可能直接设置为1，大多数情况Cauchy更好，可以证明Cauchy核函数等价于IRLS，但是Huber是线性的，更简单，Cauchy对每个残差要多算个log）

g2o里面残差的一二阶导数应该可以和前面的对应起来了

2.4 小结：

3. VIO残差函数的构建

3.1 IMU预积分

从归一化残差的角度来考虑信息矩阵 $\Sigma^{-1}$ ，为了把不同传感器的误差进行归一化，然后叠加使用，中间用信息矩阵进行了重加权。
从优化的角度来理解信息矩阵，残差f(x)小，协方差小，逆就大，所以应该占的权重更大，更关注这些准确的点。

基于滑动窗口的VIO残差的构建。

上述
第一项prior代表之前时刻的先验，
第二项代表当前窗口内数据的残差，因为之前窗口外时刻的观测数据可能还有用，所以当做先验加入优化项中进行优化，
第三项是我们熟悉的相机的误差（如重投影误差）

关于IMU需要优化的状态量：

其中 $\lambda$ 是逆深度（不知道为什么要在这里加入到残差中进行优化）

逆深度实际上是另一种参数化方式，类似于(x,y,z)，xyz具有相关性，体现在协方差矩阵上，非对角线元素不为0，而u，v，d，可以近似独立，所以协方差矩阵可为对角阵。实际上d不为正态分布，但是1/d可近似为正态分布。（具体描述见SLAM14讲建图的P326）

误差的构建：
基于逆深度的rpj误差

加速度积分，速度积分，旋转四元数积分：

每次前面的数据如果变化的话，后面的所有的值都要跟着积分变化，计算量很大。
把100个积分变成一个就好了，于是出现了IMU预积分：
预积分思想是：把相对于世界坐标系的单领出来，IMU各个时刻之间的相对位置不变（这部分就叫做IMU预积分）

3个预计分量分别是：i~j时刻的IMU的相对（即在body系下的）位移，速度，姿态变化量

将（32）式中的右边移项得到 $\alpha(位移)，\beta*(速度)$ 的预测值，和观测值作差即得IMU预积分的误差，bias直接两时刻的测量相减即可，四元数旋转需要按照下面的推导来计算，其中旋转部分左乘四元数的逆即可。（为啥这里误差是15维？）

回顾第一讲中关于四元数的求导

虚部取出来 $\frac{\theta}{2}$ ，乘以2就得到了旋转的角度 $\theta$

3.2 预积分的离散形式

这里计算 $\omega,a$ 时，假设k和k+1时刻测量的 $\omega,a$ 的bias是不变的，而且这里没有考虑加计和陀螺的白噪声，理论来说是应该考虑的。而最后两行真正计算K+1时刻的bias时，就要考虑噪声noise了。

3.3 预积分的方差传递（有线性函数协方差传播结论）

一个IMU数据的协方差和不确定度可以标定出来，但是如何传递呢？
协方差阵的定义：
选自这里本博客3.3.1节有摘选。
搞清楚协方差阵和互协方差阵的区别，协方差描述的是一组观测中的各个观测值之间的相关性，是方阵；而互协方差阵指两组观测之间的相关性，不一定是方阵，因为两组观测量的数量不一定相同。

协方差阵的计算：

可用的结论：

k时刻的状态误差来自于k-1时刻的状态误差和测量噪声传递而来，用前面的协方差传递结论传递结论：

3.3.1方差传递补充（不想看可直接跳到3.4）

3.4 状态误差线性递推公式的推导

两种方法：
从状态量和使用误差的导数来更新误差的方式来求误差的递推

将系统的状态方程进行一阶泰勒展开，
求出误差的一阶导数，进行传递

KF假设马尔科夫性，k时刻的数据只和k-1有关，KF只能用于线性系统，若想拓展到非线性系统，则可以将运动和观测方程在某点一阶泰勒展开，只考虑线性部分，就得到了EKF（见SLAM14讲后端1部分）。下面状态量=真值+误差。公式(38)在 $(\hat{x}_{k-1},\hat{u}_{k-1})$ 一阶泰勒展开，两边消去真值就得到了状态误差的传递

因为已知速度和状态量之间的关系（速度导数是world系下加速度+g），所以求其误差之间的关系也是可以的，所以会有第二种基于误差的一阶导数的方法，常见于MSCKF这类优化的论文中。

而基于优化的方法（VISN-mono，预积分等）中大多数使用的是第一种基于一阶泰勒展开的方法。

3.5 预积分误差的雅克比推导

总体思想是：位置，速度，角度，加速度，角速度都会受到各种测量噪声的影响，比如角度测量可能会受到一个旋转的影响，所以加上一个小的旋转的扰动就能求角度的雅克比。

分别是角速度，旋转四元数，加速度，预计分量： $\alpha,\beta$ ，以及加计和陀螺的bias

对各状态量求导：

3.5.1 对速度预计分量的雅克比（反对称矩阵的伴随性质）

上面的(49)是(48)两边 $\beta$ 一阶泰勒展开，然后右边对 $\beta_{b_k}$ 求偏导，即得对上一时刻速度预计分量( $\beta_{b_k}$ )的雅克比。

3.5.2 对角度预计分量的雅克比

k时刻旋转会受到一个微小的旋转扰动（可写成se(3)形式），

对exp进行一阶泰勒展开，再利用反对称矩阵的性质: $a^{\wedge}b=-b^{\wedge}a$ 即可约掉分母，得part1的雅克比。

所以可得对角度预积分量的雅克比 $f_{32}$

part2这部分化简用到了反对称矩阵的伴随性质：

参考以下博客：
反对称矩阵的性质

看到伴随之后想到之前SLAM14讲的时候做过一个证明题：

这里的exp ([ωδt]×就是一个旋转矩阵 $R$ ，exp ([−ωδt]×)是 $R^{-1}$ (之前问GPT-4的时候它告诉我的，后来一想，旋转矩阵正交，所以 $R^{-1}=R^{T}$ 这不就对上了嘛)，所以就有了part2最后的化简部分。

3.5.3 速度预计分量对角速度bias的雅克比

为什么前面的一项跟分母没关系，直接扔掉了？

3.5.4 旋转预积分的递推公式

只考虑旋转误差，不考虑角速度测量的bias等误差，而且四元数有如下性质：
对一个向量进行旋转R相当于对应的四元数左右四元数相乘

这里把 $q_{b_ib_{k+1}}$ 左乘个逆移到右边，计算旋转的测量值的误差传递，倒数第二行就是运用上面的四元数的公式，R就是 $\begin{bmatrix} 1 \\ -\frac{1}{2} \omega\delta t \\ \end{bmatrix}$ 对应的旋转矩阵，于是就可以看出，从k到k+1时刻的姿态角的不确定度是通过R矩阵传递的。（还是有些不太明白）

3.6 小结

IMU预积分就是body下各个时刻的IMU状态量的预先积分，不用每次都从头开始
预积分的离散形式通过mid_point进行计算
IMU的误差传递
误差由k时刻的状态误差（系数F）和测量噪声（系数G）传递到k+1时刻：
要明白这里推导的IMU预积分的Jocabian是为整个系统构建Jocabian做准备的，整个系统Jocabian包括视觉和IMU的部分。后面再详细学习。

4. 系统Jacobian的推导(有R的就右乘一个exp然后再换出来，剩下的逆深度等就是链式求导法则)

预计分量对bias求导较为麻烦，预积分假设bias不动，但是实际上bias是动的，所以求他的bias就是比较麻烦的（我理解就是因为预积分有bias不动的先验，然后再去推对bias的导数就有些冲突），所以这里就使用了一阶泰勒展开来近似，丢掉高阶项，

4.1 举个例子

姿态对角度求导，IMU预积分得一个 $q_{ji}$ ，world系下得两个时刻的q，之间可以求出一个 $q_{ji}$ ，求这两个 $q_{ji}$ 四元数之间的四元数乘法可得相对位姿，取虚部对角度求导即得Jacobian。方法是对 $q_wb_i$ 取一个小扰动，使用公式变换到右边去，跟分母消掉（下面*都代表取逆），下面还有关于四元数左乘和右乘的算子，看Joan sola的四元数手册。
（高翔说还能用李代数？四元数连乘会麻烦一些，用李代数会简单点？）

这个下面需要自己推导。

TODO：
预积分误差传递的推导，
整体系统的Jocabian的推导。

5. 作业

详见：我的作业博客。

5. 待读文献

5.1 SBA论文

5.2 LM改进阻尼因子 $\rho$ 论文

$\mu$ 反复震荡（由于F反复增大和减小，导致要不断调整 $\mu$ ）导致浪费了很多计算次数。
最后Nielsen在此文中改进了 $\rho$ 的更新策略。

5.3 关于鲁邦核函数的论文

3是综述，对4种方法进行了讨论

5.4 鲁棒核函数

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
tcpdump交叉编译 weixin_45673259 tcpdump 测试工具网络
1.下载路径官网：https://www.tcpdump.org/2.编译解压：tar-xflibpcap-1.10.4.tar.xztar-xftcpdump-4.99.4.tar.xz编译libpcap./configure--host=mips-v720s229-linux--target=mips-v720s229-linuxCC=/opt/A1/mips-gcc720-uclibc229
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
【Linux内核模块】Linux内核模块程序结构 byte轻骑兵 #嵌入式Linux驱动开发实战 linux 运维服务器
如果你已经写过第一个"HelloWorld"内核模块，可能会好奇：为什么那个几行代码的程序能被内核识别？那些module_init、MODULE_LICENSE到底是什么意思？今天咱们就来扒一扒内核模块的程序结构，搞清楚一个合格的内核模块到底由哪些部分组成，每个部分又承担着什么角色。目录一、内核模块的"骨架"：最简化结构解析二、头文件：内核模块的"说明书"2.1最常用的三个头文件2.2按需添加的其
LVM逻辑卷扩容
目录1.逻辑卷的简介2.逻辑卷的概念3.相关命令4.建立逻辑卷1.逻辑卷的简介1.LVM是逻辑卷管理(LogicalVolumeManager)的简称,它是Linux环境下对磁盘分区进行管理的一种机制,LVM是建立在硬盘和分区之上的一个逻辑层,来提高磁盘分区管理的灵活性。2.LVM最大的特点就是可以对磁盘进行动态管理。使用了LVM管理分区,动态的调整分区的大小,标准分区是做不到的。2.逻辑卷的概念
Rocky Linux 8.5/CentOS 8 安装Wine chen_teacher linux 运维服务器
RockyLinux8.5/CentOS8安装Wine首先配置EPEL镜像配置方法安装Wine首先配置EPEL镜像EPEL(ExtraPackagesforEnterpriseLinux),是由FedoraSpecialInterestGroup维护的EnterpriseLinux（RHEL、CentOS）中经常用到的包。下载地址：https://mirrors.aliyun.com/epel/相
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
系统迁移从CentOS7.9到Rocky8.9
我有两台阿里云上的服务器是CentOS7.9，由于CentOS7已经停止支持，后续使用的话会有安全漏洞，所以需要尽快迁移，个人使用的话目前兼容性好的还是RockyLinux8，很多脚本改改就能用了。一、盘点系统和迁移应用查看当前系统发行版版本cat/etc/os-release盘点迁移清单服务器应用部署方式docker镜像来源v1wordpressdockerdockerhubv1zdirdock
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【Linux内核模块】Linux内核模块简介 byte轻骑兵 #嵌入式Linux驱动开发实战 linux arm开发运维
你是否好奇过，为什么Linux系统可以在不重启的情况下支持新硬件？为什么修改一个驱动程序不需要重新编译整个内核？这一切都离不开Linux的"模块化魔法"——内核模块（KernelModule）。作为Linux内核最灵活的特性之一，内核模块让开发者可以动态扩展内核功能，今天就来揭开这个神秘组件的面纱。目录一、什么是内核模块？1.1先打个比方：给内核装"插件"1.2技术定义：动态加载的内核代码段1.3
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本