快乐得小萝卜

svo1论文

SVO: Fast Semi-Direct Monocular Visual Odometry

摘要

我们提出了一种半直接单目视觉测距算法，该算法精确、鲁棒且比当前算法更快最先进的方法。半直接方法为运动估计技术消除了需要高成本的特征提取和鲁棒匹配。我们的算法可直接在像素强度上处理，以较高速率获得亚像素精度。一种概率映射方法显式建模异常值测量用于估计3D点，这导致更少的异常值和更可靠的点。精确和高帧率的运动估计带来了在少量、重复和高频场景中的稳健性纹理该算法应用于GPS拒绝环境下的微型飞行器状态估计，并在55帧下运行在板载嵌入式计算机上每秒及更多在消费型笔记本电脑上每秒超过300帧。我们称之为SVO（半直接视觉里程计）并进行开源。

开源链接

介绍

分类：

特征点法
直接法

贡献

提出的半直接视觉里程计（SVO）算法使用特征相关；然而，特征相关是直接运动估计的隐含结果，而不是显式特征提取和匹配的结果。因此，只有当帧被选择为关键帧时才会初始化新的3D点（见图1）。优点是由于避免对每帧进行特征提取而提高了速度，并且通过亚像素特征相关增加精度。与之前的直接方法相比，我们使用许多（数百）个小patch而不是几个（几十个）大的平面patch[18]-[21]。使许多小的patch增加鲁棒性并允许忽略patch法线。所提出的基于稀疏模型的用于运动估计的图像对准算法与基于模型的密集图像对齐[8]-[10]，[24]。然而我们证明了稀疏的深度信息是足够的获得运动的粗略估计并找到特征对应关系。一旦特征关联和建立了初始位姿估计，算法后续会仅使用点特征；因此名称“半直接”。这种切换使我们能够保持快速和进行BA过程（例如，[25]）。使用显式地对异常值测量进行建模的贝叶斯滤波器来估计特征位置处的深度。一个3d点只有当对应的深度滤波器进行多次测量收敛后，才会被插入地图中。得到一张几乎没有异常值和点的地图从而可以可靠地跟踪。

本文贡献

用于无人机的达到先进水平的半直接vo算法
建图的方法对外点非常鲁棒

系统概述

图1提供了SVO的概述。算法使用两个并行线程（如[16]所示），其中一个用于估计相机运动，以及第二个用于建图为环境正在被探索。这种分离允许快速和一个线程中的恒定时间跟踪，而第二个线程建图线程硬实时限制解耦。运动估计线程实现了所提出的相对姿态估计的半直接方法。第一个步骤是通过基于稀疏模型的图像进行姿态初始化对齐：摄影机相对于上一帧的姿势是通过最小化与相同的投影位置相对应的像素三维点（见图2）。对应的二维坐标到在下一步中通过对齐相应的特征补丁（见图3）。运动估计通过使用特征对齐的像素块的细化姿态和最小化重投影误差的结构。

在mapping线程中，为每个2D特征初始化概率深度滤波器，其中对应的需要估计三维点。新的深度过滤器已初始化每当在图像区域中选择新的关键帧时其中很少发现3D-2D对应关系。深度滤器在深度上初始化一个很大的不确定度。每在随后的帧中，深度估计在贝叶斯中被更新时尚（见图5）。当深度滤波器的不确定性变得足够小时，会把点插入到地图中，并立即用于运动估计。

记号

在详细介绍算法之前，我们简要定义通篇论文中使用的符号。在时间步长 $k$ 处收集的强度图像表示为 $I_k$ , $\Omega \subset \mathbb{R}^{2} \mapsto \mathbb{R}$ 这里的 $\Omega$ 是图像坐标系。任意的3d点 $\Omega \subset \mathbb{R}^{2} \mapsto \mathbb{R} ,\mathbf{p}=(x, y, z)^{\top} \in \mathcal{S}$ 在可见场景表面上通过相机投影模型
$\mathbf{u}=\pi\left({ }_k \mathbf{p}\right)$
其中下标k表示点坐标在参考k的相机帧中表示。投影π由标定已知的本征相机参数决定。给定逆投影函数π−1和深度Du∈R，可以恢复对应于图像坐标u的3D点：
$}_k \mathbf{p}=\pi^{-1}\left(\mathbf{u}, d_{\mathbf{u}}\right)$
其中 R ⊆ Ω 是深度已知的域。时间步 k 处的相机位置和方向用刚体变换 $T_{k,w} ∈ SE(3)$ 表示。它允许我们将世界坐标帧中的 3D 点映射到参考的相机帧： $kp = T_{k,w} w_p$ 。两个连续帧之间的相对变换可以用 $T_{k,k−1} = T_{k,w}T^{-1}_{k−1,w}$ 计算。在优化过程中，我们需要变换的最小表示，因此，使用对应于身份SE(3)切线空间的李代数se(3)。我们表示代数元素——也称为扭曲坐标——ξ = (ω, ν)T ∈ R6，其中 ω 称为角速度，ν 表示线性速度。扭转坐标ξ通过指数映射[26]映射到SE(3): $T (ξ) = e x p (ξ)$ 。

运动估计

SVO 使用直接方法计算相对相机运动和特征对应的初步猜测，并以基于特征的非线性重投影误差细化结束。以下各节详细介绍了每个步骤，如图 2 至 4 所示。

图2:改变当前帧和前一帧之间的相对姿态 $T_{k,k−1}$ 隐式地移动重投影点在新图像u 'i中的位置。稀疏图像对齐试图找到 $T_{k,k−1}$ ，以最小化对应于相同3D点(蓝色方块)的图像补丁之间的光度差异。请注意，在所有图中，要优化的参数以红色绘制，优化成本以蓝色突出显示。

图 3：由于 3D 点和相机位姿估计的不准确性，可以通过单独优化每个补丁的 2D 位置来进一步最小化当前帧和先前关键帧 $r_i$ 中相应补丁（蓝色方块）之间的光度误差。

图4:在最后的运动估计步骤中，对相机姿态和结构(3D点)进行优化，以最小化在之前的特征对齐步骤中建立的重投影误差。

基于稀疏模型的图像对齐

两个连续相机姿态之间刚体变换 $T_{k,k−1}$ 的最大似然估计使强度残差的负对数似然最小化:
$\mathbf{T}_{k, k-1}=\arg \min _{\mathbf{T}} \iint_{\overline{\mathcal{R}}} \rho[\delta I(\mathbf{T}, \mathbf{u})] d \mathbf{u} .$

强度残差 $δ I$ 由观察相同3D点的像素之间的光度差定义。它可以通过从前一个图像 $I_{k−1}$ 反向投影2D点 $u$ ，然后将其投影到当前相机视图中来计算:
$\delta I(\mathbf{T}, \mathbf{u})=I_k\left(\pi\left(\mathbf{T} \cdot \pi^{-1}\left(\mathbf{u}, d_{\mathbf{u}}\right)\right)\right)-I_{k-1}(\mathbf{u}) \quad \forall \mathbf{u} \in \overline{\mathcal{R}}$
其中 ̄R这个条件是深度 $d_u$ 在时间 k-1 已知的图像区域，并且反向投影点在当前图像域可见：
$\overline{\mathcal{R}}=\left\{\mathbf{u} \mid \mathbf{u} \in \mathcal{R}_{k-1} \wedge \pi\left(\mathbf{T} \cdot \pi^{-1}\left(\mathbf{u}, d_{\mathbf{u}}\right)\right) \in \Omega_k\right\}$
为简单起见，我们假设强度残差服从单位方差的正态分布。然后负对数似然最小化器对应于最小二乘问题： $\rho[.] \hat{=} \frac{1}{2}\|.\|^2$ 。在实践中，由于遮挡，分布具有较重的尾部，因此必须应用稳健的成本函数[10]。与之前的工作相比，对于图像[8]-[10]，[24]中的大区域，我们只知道稀疏特征位置 $u_i$ 的深度 $d_{ui}$ 。我们用向量 $I(u_i)$ 表示特征点周围 4 × 4 像素的小块。我们寻求找到最小化的相机姿势所有补丁的光度误差(见图2):
$\mathbf{T}_{k, k-1}=\arg \min _{\mathbf{T}_{k, k-1}} \frac{1}{2} \sum_{i \in \mathcal{\mathcal { R }}}\left\|\delta \mathbf{I}\left(\mathbf{T}_{k, k-1}, \mathbf{u}_i\right)\right\|^2$

由于等式 (7) 在 $T_{k,k−1}$ 中是非线性的，我们在迭代高斯-牛顿过程中对其进行了求解。给定相对变换 $T_{k,k−1}$ 的估计，估计的增量更新T(ξ)可以用ξ∈se(3)参数化。我们使用强度残差的逆组合公式[27]，它在k−1时刻计算参考图像的更新步骤T(ξ)：
$\delta \mathbf{I}\left(\xi, \mathbf{u}_i\right)=\mathbf{I}_k\left(\pi\left(\hat{\mathbf{T}}_{k, k-1} \cdot \mathbf{p}_i\right)\right)-\mathbf{I}_{k-1}\left(\pi\left(\mathbf{T}(\xi) \cdot \mathbf{p}_i\right)\right)$
其中 $p_i = \pi^{-1}(u_i, d_{u_i})$ .然后使用等式 (3) 将更新步骤的逆应用于当前估计：
$\hat{\mathbf{T}}_{k, k-1} \longleftarrow \hat{\mathbf{T}}_{k, k-1} \cdot \mathbf{T}(\boldsymbol{\xi})^{-1}$
请注意，我们不会扭曲补丁以计算速度原因。对于小帧到帧的运动和小补丁大小，这个假设是有效的。为了找到最优更新步骤 $T (ξ)$ ，我们计算 (7) 的导数并将其设置为零：
$\sum_{i \in \overline{\mathcal{R}}} \nabla \delta \mathbf{I}\left(\xi, \mathbf{u}_i\right)^{\top} \delta \mathbf{I}\left(\xi, \mathbf{u}_i\right)=0$
为了解决这个问题，我们围绕当前状态线性化：
$\delta \mathbf{I}\left(\xi, \mathbf{u}_i\right) \approx \delta \mathbf{I}\left(0, \mathbf{u}_i\right)+\nabla \delta \mathbf{I}\left(0, \mathbf{u}_i\right) \cdot \xi$
雅可比 Ji := ∇δ I(0, ui) 的维度为 16 × 6，因为 4 × 4 补丁大小，并使用链式法则计算：
$\frac{\partial \delta \mathbf{I}\left(\xi, \mathbf{u}_i\right)}{\partial \xi}=\left.\left.\left.\frac{\partial \mathbf{I}_{k-1}(\mathbf{a})}{\partial \mathbf{a}}\right|_{\mathbf{a}=\mathbf{u}_i} \cdot \frac{\partial \pi(\mathbf{b})}{\partial \mathbf{b}}\right|_{\mathbf{b}=\mathbf{p}_i} \cdot \frac{\partial \mathbf{T}(\xi)}{\partial \xi}\right|_{\xi=0} \cdot \mathbf{p}_i$
通过将 (11) 插入 (10) 并通过在矩阵 $J$ 中堆叠雅可比矩阵，我们得到以下等式：

它可以求解更新扭转ξ值。请注意，通过使用逆组合方法，雅可比可以预先计算，因为它在所有迭代（参考补丁 $I_{k−1}(ui)$ 和点 $p_i$ 没有变化）上保持不变，这导致了显着的加速 [27]。

通过特征对齐松弛

在上一步将相机与之前的帧对齐。通过投影，找到的相对姿态 $T_{k,k-1}$ 隐含地定义了对新图像中所有可见 3D 点的特征位置的初步猜测。由于 3D 点位置不准确，以及相机位姿，这些初始猜测可以被提高。为了减少漂移，相机姿态应该与地图对齐，而不是与以前的帧对齐。

从估计的相机姿态可见的地图的所有 3D 点被投影到图像中，从而得到相应 2D 特征位置 $u′_i$ 的估计（见图 3）。对于每个重投影点，关键帧 r 确定了观测角度最接近的点。然后，特征对齐步骤通过最小化当前图像中patch相对于关键帧 r 中的参考patch的光度误差来单独优化新图像中的所有 2D 特征位置 $u_i$ ：
$\mathbf{u}_i^{\prime}=\arg \min _{\mathbf{u}_i^{\prime}} \frac{1}{2}\left\|\mathbf{I}_k\left(\mathbf{u}_i^{\prime}\right)-\mathbf{A}_i \cdot \mathbf{I}_r\left(\mathbf{u}_i\right)\right\|^2, \quad \forall i$
这种对齐是使用逆组合Lucas-Kanade算法[27]来解决的。与之前的步骤相反，我们将仿射扭曲Ai应用于参考补丁，因为使用了更大的补丁大小(8 × 8像素)，并且最近的关键帧通常比以前的图像更远。这一步可以理解为违反极线约束的松弛步骤，以实现特征补丁之间的更高相关性。

姿态和结构细化

在上一步中，我们以违反极线约束为代价，建立了亚像素精度的特征对应关系。特别是，我们生成了重投影残差 $u_i|| = ||u_i − π(T_{k,w} w_{p_i})|| \not= 0$ ，平均约为 0.3 像素（见图 11）。在最后一步中，我们再次优化相机位姿 T_{k,w} 以最小化重投影残差（见图 4）：
$\mathbf{T}_{k, w}=\arg \min _{\mathbf{T}_{k, w}} \frac{1}{2} \sum_i\left\|\mathbf{u}_i-\pi\left(\mathbf{T}_{k, w}{ }_w \mathbf{p}_i\right)\right\|^2 .$
众所周知这是仅运动 BA [17] 问题，并且可以使用高斯牛顿等迭代非线性最小二乘最小化算法有效地解决。随后，我们通过重投影误差最小化（仅结构 BA）优化观察到的 3D 点的位置。最后，可以应用局部BA，其中联合优化所有近关键帧的姿态以及观察到的3D点。BA 步骤在算法的快速参数设置中省略（第 VII 节）。

讨论

该算法的第一个（第 IV-A 节）和最后一个（第 IV-C 节）优化似乎是多余的，因为两者都优化了相机的 6 个自由度姿势。事实上，我们可以直接从第二步开始，并通过所有特征块的Lucas-Kanade跟踪[27]建立特征对应关系，然后进行非线性姿态细化(第IV-C节)。虽然这将起作用，但处理时间将更高。在大距离（例如 30 像素）上跟踪所有特征需要更大的patch和金字塔实现。此外，一些特征可能会不准确跟踪，这需要异常值检测。然而，在 SVO 中，特征对齐是通过在稀疏图像对齐步骤中仅优化六个参数（相机姿势）来有效地初始化的。稀疏图像对齐步骤隐含地满足极线约束，并确保不存在异常值。

事实上，这是最近为 RGB-D 相机开发的算法所做的 [10]，但是，通过对齐完整的深度图而不是稀疏补丁。我们凭经验发现，与同时使用所有三个步骤相比，使用第一步仅会导致明显更多的漂移。提高准确性是由于新图像与关键帧和地图的对齐，而稀疏图像对齐仅相对于前一帧对齐新帧。

建图过程

给定一个图像及其姿势 ${I_k, T_{k,w}}$ ，映射线程估计尚未知道相应 3D 点的 2D 特征的深度。特征的深度估计用概率分布建模。每个后续观察 ${I_k, T_{k,w}}$ 用于更新贝叶斯框架中的分布（见图 5），如 [28] 所示。当分布的方差足够小时，使用 (2) 将深度估计转换为 3D 点，将点插入地图中并立即用于运动估计（见图 1）。在下文中，我们报告了对 [28] 中的原始实现的基本结果和修改。

每个深度过滤器都与一个参考关键帧 r 相关联。该滤波器以深度的高度不确定性初始化，均值设置为参考帧中的平均场景深度。对于每个后续的观察 ${I_k, T_{k,w}}$ ，我们在新图像Ik中搜索与参考patch相关性最高的极线上的patch。极线可以从帧 $T_{r,k}$ 与通过ui的光射线之间的相对姿态来计算。相关性最高的点 $u'_i$ 对应于三角剖分可以找到的深度 $d^k_i$ (见图5)。

测量 ̃dk i 使用高斯 + 均匀混合模型分布 [28] 建模：一个好的测量通常在真实深度 di 周围分布，而异常值测量来自区间 $d_{min_i} , d_{max_i}]$ 中的均匀分布：
$p\left(\tilde{d}_i^k \mid d_i, \rho_i\right)=\rho_i \mathcal{N}\left(\tilde{d}_i^k \mid d_i, \tau_i^2\right)+\left(1-\rho_i\right) \mathcal{U}\left(\tilde{d}_i^k \mid d_i^{\min }, d_i^{\max }\right),$
其中 $ρ_i$ 是内点概率， $τ_i^2$ 是可以通过假设图像平面中一个像素的光度视差方差来几何计算的良好测量的方差 [29]。

该模型的递归贝叶斯更新步骤在[28]中有详细描述。与[28]相比，我们使用逆深度坐标来处理大场景深度。当搜索极线上当前深度估计周围的一个小范围时，所提出的深度估计是非常有效的;在我们的例子中，范围对应于当前深度估计的标准差的两倍。图 6 展示了需要多少运动来显着减少深度的不确定性。所提出的方法在两个视图三角剖分点的标准方法上的主要优点是我们观察到的异常值要少得多，因为每个过滤器经历许多测量直到收敛。此外，显式建模错误的测量，这允许深度即使在高度相似的环境中也能收敛。在[29]中，我们演示了如何将相同的方法用于密集映射。

图5：参考帧r中特征i的概率深度估计ˆdi。真实深度的点投影到两幅图像中的相似图像区域(蓝色方块)。因此，深度估计使用三角深度 $d_{k_i}$ 进行更新，该深度 $d_{k_i}$ 从与参考补丁相关性最高的点 $u_i$ 计算。相关性最高的点总是位于新图像中的极线上。

图6:对于深度滤波器(如紧急线所示)的不确定性收敛，MAV(从顶部的侧面看)需要更少的运动。

实施细节

该算法被引导得到前两个关键帧和初始地图的姿态。与[16]一样，我们假设局部平面场景并估计单应性。初始地图是从前两个视图三角化的。为了处理大的运动，我们在粗到细的方案中应用稀疏图像对齐算法。对图像进行半采样以创建五个级别的图像金字塔。然后，在最粗的水平上优化强度残差，直到收敛。随后，优化在下一个更精细的级别进行初始化。为了节省处理时间，我们在第三层收敛后停止，在这个阶段，估计足够准确来初始化特征对齐。该算法由于效率原因，地图中固定数量的关键帧，这些关键帧被用作特征对齐和结构细化的参考。如果新帧相对于所有关键帧的欧几里得距离超过平均场景深度的 12%，则选择关键帧。当在地图中插入一个新的关键帧时，去除距离相机当前位置最远的关键帧。

在映射线程中，我们将图像划分为固定大小的单元格（例如，30 × 30 像素）。一个新的深度过滤器在 FAST 角 [30] 进行初始化，该角 [30] 中具有最高的 Shi-Tomasi 分数，除非已经存在 2D 到 3D 对应关系。这导致图像中均匀分布的特征。相同的网格也用于在特征对齐之前重新投影地图。请注意，我们在图像金字塔的每一层提取 FAST 角，以找到与尺度无关的最佳角。

总结

在本文中，我们提出了半直接 VO 管道“SVO”，它比当前最先进的管道精确且更快。速度的增益是由于运动估计不需要特征提取和匹配。相反，使用了直接的方法，该方法直接基于图像强度。该算法对于机载MAVs的状态估计特别有用，因为它在当前嵌入式计算机上以每秒50帧的速度运行。高帧率运动估计，结合异常值抵抗概率映射方法，在很少、重复和高频纹理的场景中提供了更高的鲁棒性。

2023-11-15 自然科学学术论文=记叙文+说明文+议论文写作不停的追梦人
一篇自然科学的实验性的原创论文，包含了前言、材料方法、结果、讨论结论，这四块主要内容。而前言部分，就是记叙文，介绍所有研究问题的由来；而材料方法和结果部分，就是说明文部分，介绍材料方法具体过程和结果部分，主要描述结果的情况详细具体情况；而讨论结论，就是议论文部分，以实验结果为论据，来证明你的分论点，而结论就是你的一篇文章总论点。
深入解析Hadoop：大数据处理的基石学习的锅 hadoop 大数据分布式
随着信息技术的快速发展和互联网的普及，数据的产生速度极具增加。面对如此海量的数据，传统的数据处理工具显得力不从心。在这种背景下，诞生了一系列用于处理大数据的框架与工具，而ApacheHadoop便是其中最为知名和应用最广泛的一个。本文将深入解析Hadoop的基本原理、架构及其在大数据处理中的重要性。1.Hadoop的起源与发展Hadoop起源于Google公司的三篇奠基性论文：GoogleFile
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
股票模拟交易训练日志(427) 黄鸿昊
目标:100万1.12883.1650000股2.93>2.962.9988203300股110>1143.11867.3630000股5.42>5.444.16680.75200000股0.64>0.625.3904.1297000股4.73>4.8剩下:26250今天港股开半天，但已买进两只股票。因为本身就持有相同的，但仍看之后的走势。现在还是集中精力在写毕业论文上，股票的话，希望也能更进一步
LiteCoT：难度感知的推理链压缩与高效蒸馏框架大千AI助手人工智能 #Prompt #OTHER 深度学习人工智能机器学习自然语言处理提示词 LiteCoT 思维链
“以智能裁剪对抗冗余，让推理效率与精度兼得”LiteCoT是由香港科技大学（广州）联合独立研究者团队提出的创新方法，旨在解决大模型知识蒸馏中推理链过度冗长和缺乏难度适应性的核心问题。该方法通过难度感知提示（DAP）动态生成精简的推理链，显著提升小模型推理效率与准确性。相关论文发表于arXiv预印本平台（2025年），为当前大模型轻量化部署的前沿方案。本文由「大千AI助手」原创发布，专注用真话讲AI
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
rpg_trajectory_evaluation工具评估SLAM/VIO系统
rpg_trajectory_evaluation工具评估SLAM/VIO系统1、安装系统环境：ubuntu18.04+ROSmelodic代码：https://github.com/uzh-rpg/rpg_trajectory_evaluationtutorial:http://rpg.ifi.uzh.ch/docs/IROS18_Zhang.pdf1.1首先安装依赖的python库pipins
【AI论文】EmbRACE-3K: 复杂环境中的具身推理与行为研究
摘要：近期先进的视觉语言模型（Vision-LanguageModels，VLMs）在被动、离线的图像和视频理解任务中展现出了卓越的性能。然而，在具身场景中，这些模型的有效性仍较为有限。具身场景要求在线交互和主动的场景理解，在此类场景中，智能体以第一人称视角感知环境，且每一次动作都会动态地影响后续的观察结果。即便是像GPT-4o、Claude3.5Sonnet和Gemini2.5Pro这样的先进模
2022年度数据统计水亦宽
水亦宽，你的2022互动总结如下：点赞文章：14982篇评论文章：25843次发布文章：168篇点赞评论：837条关注用户：179人关注专题：24个关注文集：2个你互动量最多的一天是2022-07-22，这一天你在社区进行了212次互动。你最喜欢给念薇薇的文章点赞，这一年你为TA送上了324个赞。你最喜欢评论云展云舒的文章，这一年你在TA的文章下评论了486次。2022年中，你写的文章曾25次登上
阿里巴巴推出ThinkSound：让AI像音效师一样“思考“创造声音至顶头条人工智能机器学习
这项由阿里巴巴通义实验室的刘华戴博士领导，联合香港科技大学和浙江大学共同完成的突破性研究，于2025年6月26日发表在arXiv预印本平台。有兴趣深入了解的读者可以通过论文编号arXiv:2506.21448v1访问完整论文，演示页面也可在https://ThinkSound-Demo.github.io查看。当你看电影时，是否想过那些逼真的音效是如何产生的？当汽车在银幕上疾驰而过，你听到的引擎轰
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
我过了把论文答辩的瘾珍惜心理
我于八十年代末大专毕业，此后通过函授拿到本科文凭，没有过论文答辩关，所以对这高大上的论文答辩一无所知。2019年9月进入韦志中心理学网校学习，得知要取得中级证书，需提交一篇3000—5000字的论文，并要通过论文答辩。我教中学语文三十年，为了评职称，也曾写过几十篇教学论文，并获各种奖项，也在不同刊物发了几篇，但那些论文不过一二千字，浅尝辄止，从没经过论文答辩，心里还是有点怯怯的。2020年初突如其
AI驱动型论文搜索工具司南锤 AI 工具
✅一、AI驱动型论文搜索工具（强烈推荐）1.Consensus官网：consensus.app特点：输入自然语言问题（如“Doesgreenspacereduceurbanheatislandeffect?”），系统会自动返回论文中直接回答该问题的句子，标明支持/不支持的证据。适合人群：科研人员、政策制定者、想快速得到文献共识的人。2.ScispaceCopilot（原SemanticSchola
【计算机毕业设计】基于SSM+Vue的游戏攻略网站系统【源码+lw+部署文档+讲解】
目录1绪论1.1研究背景1.2目的和意义1.3论文结构安排2相关技术2.1SSM框架介绍2.2B/S结构介绍2.3Mysql数据库介绍3系统分析3.1系统可行性分析3.1.1技术可行性分析3.1.2经济可行性分析3.1.3运行可行性分析3.2系统性能分析3.2.1易用性指标3.2.2可扩展性指标3.2.3健壮性指标3.2.4安全性指标3.3系统流程分析3.3.1操作流程分析3.3.2登录流程分析3
【乳腺超声、乳腺钼靶、宫颈癌、CT骨折】等项目数据调研，及相关参考内容整理汇总钱多多先森人工智能（AI）医学影像深度学习乳腺钼靶乳腺超声宫颈癌
文章目录一、乳腺超声内容整理1.1、数据集1.2、可以参考的论文1.3、可以参考的GitHub代码1.4、可以参考的博客1.5、简单任务需求二、宫颈癌风险智能诊断2.1、数据集2.2、KFB读取文件显示三、乳腺钼靶3.1、数据集3.2、拍摄方式：3.3、拍摄和观察视图3.4、DDSM标注文件解析四、CT骨折4.1、数据集五、总结本博客是一个笔记类的记录文档，主要是记录了在调研各个项目的过程中，遇到
基于STM32的智能花盆浇水系统毕业设计看，是大狗 stm32 课程设计嵌入式硬件
目录单片机毕业设计论文前言单片机毕业设计功能介绍设计视频演示单片机毕业设计论文前言随着城市化进程的加快和人们生活水平的提高，越来越多的人开始在家中种植植物，以美化环境、净化空气和陶冶情操。然而，由于工作繁忙或缺乏种植经验，许多人难以对植物进行及时、适量的浇水，导致植物生长不良甚至死亡。传统的花盆浇水方式依赖人工操作，存在效率低下、难以精准控制水量等问题，无法满足现代家庭对植物养护的智能化需求。近年
基于STM32的语音播报小项目课程设计程序开源看，是大狗 stm32 开源嵌入式硬件
目录单片机毕业设计论文前言单片机毕业设计功能介绍设计视频演示单片机课程设计设计论文前言随着科技的飞速发展和智能化时代的到来，人们对环境监测的需求日益增加，尤其是在温度监测方面，精准、实时的温度数据对于工业生产、农业生产以及日常生活都具有重要意义。传统的温度监测系统往往功能单一，缺乏实时反馈和智能化处理能力，难以满足现代应用场景的需求。近年来，嵌入式系统、传感器技术和语音交互技术的快速发展，为温度监
甘肃省天水市13家亲子鉴定中心大全(附2024年9月汇总鉴定) 鼎律基因刘主任
宗旨：在提高亲子鉴定咨询结果的准确性和真实性，为每一位受检客户得到一个公平、公证、真实、可靠的咨询结果，长期关注国内亲子鉴定师编写论文，从而确保提供实时亲子鉴定解答，是我们作为一家有责任心企业的标准的原则。实验室实力：配备了多套高端实验设备，包括美国AB公司3500XL遗传分析仪、9700金座PCR扩增仪、普洛麦格公司超精确检测系统PP21+PPY23，准确度高达99.9999%超高精确试剂盒等，
法学本科毕业论文什么选题方向好写？专科、本科都能看
加文末微信，获取论文服务：专科、本科、专升本；自考、函授、成教、国开、网教、成人专升本；全学科1对1咨询，承接各种论文辅导帮助；扫描文末，专业老师1v1论文服务。法学本科毕业论文什么选题方向好写？专科、本科都能看法学专业的本科毕业论文写作中，选题是一个关键步骤，它直接影响到论文的质量和研究的深度。如果你还在为选题而苦恼，不妨参考一下师哥师姐的经验，他们的研究方向往往能为你提供有价值的参考和启示。本
OpenCV中常用特征提取算法（SURF、ORB、SIFT和AKAZE）用法示例（C++和Python）点云SLAM 图形图像处理 opencv 算法 ORB算法 SIFT算法 SURF算法 AKAZE算法计算机视觉
OpenCV中提供了多种常用的特征提取算法，广泛应用于图像匹配、拼接、SLAM、物体识别等任务。以下是OpenCV中几个主流特征提取算法的用法总结与代码示例，涵盖C++和Python两个版本。常用特征提取算法列表算法特点是否需额外模块SIFT（尺度不变特征）稳定性强、可旋转缩放xfeatures2d模块SURF（加速稳健特征）快速但专利保护xfeatures2d模块ORB（OrientedFAST
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制王莽v2 机器人神经网络神经网络算法控制器
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制摘要本文研究了在水平面内运动的全驱动自主水下机器人的轨迹跟踪问题。在我们的控制设计中考虑了外部干扰、控制输入非线性和模型不确定性。基于离散时间域的动力学模型，两个神经网络(包括一个临界神经网络和一个作用神经网络)被集成到我们的自适应控制设计中。引入临界神经网络来评价设计的控制器在当前时间步长内的长期性能，并利用作用神经网络来补偿未知动
三篇AAAI顶级论文带你一键搞懂多模态！
关注gongzhonghao【计算机sci论文精选】！拿捏更多顶会顶刊发文资讯随着人工智能技术的飞速发展，多模态学习逐渐成为研究热点。多模态技术能够整合文本、图像、语音等多种模态的信息，为人工智能的应用带来了更丰富的语义理解和更强大的交互能力。此外，多模态技术在视频和语言任务中的应用也取得了显著进展。这些技术不仅提升了模型的性能，还为人工智能在更多领域的应用提供了新的可能性。今天小图给大家精选3篇
ros2 server 可以设置命令同时获取位置
一个自定义服务SetCommandGetPose.srv：请求字段float32command响应字段geometry_msgs/Posepose服务端收到请求后，把command缓存下来，再把当前位姿填进响应返回。为了便于演示，位置用一个简单计数器模拟；你可以把它替换成TF、里程计或SLAM输出。一、创建功能包bash复制ros2pkgcreate--build-typeament_cmakep
短文完结版☞【重生后，我打脸渣男狗女】唐秋苏渺渺☞【重生后，我打脸渣男狗女】一口气读完！妞妞爱读书1
前世，我苦心研究了三年的科研成果却被男友的学妹举报抄袭。只因我们的sci论文完全相同，但她却比我还要提早发表。铁板钉钉的证据面前，我无力反驳，被网络暴力。甚至有极端网友破坏了我家的电线导致短路失火，让我父母葬身火海。我因此患上了抑郁症，割喉自杀。再睁眼，我回到了发表论文的前一天。我睁开眼睛，映入眼帘的是电脑屏幕上即将完成的sci论文。“唐秋你实在是太棒了!"“你居然真的研究出了常温下的超导材料，这
「感恩日语」2021-303篇，吸渣体质能学多少学多少
学习感悟，避免成为“吸渣”体质很重要，“环境”能改变人，学会甄别那些“书籍”、那些“文章”（论文）对自己成长有利，而非“奶头乐”系统算法之类推送的让自己无法自拔的内容，个人每天、每周、每月、每年、一生总时间是有限的，缩小到每天，计算一下每天浪费有多少，真正发挥价值时间效力有多少，简单做个记录，会发现很可怕。同时找到了为什么每天进步一点点的重要性，只跟昨天的自己，前天的自己比较一下，很重要，多做对自
Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction zzfive 生成模型论文阅读 kotlin 开发语言 android
论文链接：VisualAutoregressiveModeling:ScalableImageGenerationviaNext-ScalePrediction文章目录简介预测下一个token自回归模型范式分析VAR详解分词实现细节幂律缩放定律零样本泛化能力结论简介本文提出的视觉自回归建模/VAR这种新范式，其将图像的自回归学习重新定义为从粗到细的“下一个尺度预测”或“下一个分辨率预测”，与常规的
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地