UESTC_Chenlin

通过可见性增强螺旋制导的三维纯方位目标跟踪

原文：Three-Dimensional Bearing-Only Target Following via Observability-Enhanced Helical Guidance

作者：赵世钰

单位：西湖大学

摘要：

本文研究了微型飞行器 (MAV) 的空对空目标跟踪问题，其动机是针对恶意 MAV 的防御应用。当跟踪器 MAV 的机载视觉传感器测量了目标 MAV 的方位时，问题变成了三维 (3-D) 仅方位目标跟踪，这在文献中很少被研究并且面临一些独特的挑战。为了解决这个问题，我们提出了以下新颖的结果。首先，为了从 3-D 方位测量估计目标 MAV 的运动，我们提出了一种新的伪线性卡尔曼滤波器，与扩展卡尔曼滤波器和修正极坐标等经典滤波器相比，它具有简洁的表达和优越的稳定性筛选。其次，我们提出了一种新方法来分析仅方位信息可用时状态估计的可观察性。虽然现有方法适用于 2-D 和单步时间范围情况，但我们的方法可以处理更一般的 3-D 和多步时间范围情况。第三，基于我们的可观察性分析的理论结论，我们设计了一种新的 3-D 螺旋制导律，可以更好地利用 3D 中的额外自由度。制导律适应四轴飞行器的动力学，并设计了基于几何控制的低级飞行控制器。与最先进的算法相比，数值仿真结果验证了所提出算法的优越性能。在实际四旋翼平台上的飞行实验进一步证明了所提算法在实践中的有效性和鲁棒性。

1.引言

近年来，微型飞行器（MAVs）在学术和工业领域得到广泛应用，滥用和恶意使用微型飞行器已经造成了各种问题，例如扰乱机场和威胁公共安全。受这些问题的启发，我们研究了空对空目标跟随任务，其中追击者 MAV 应跟随并与另一个飞行目标 MAV 保持所需距离。对这项任务的研究可能会在未来应用于防御恶意 MAV。

在目标跟踪问题中，大多数现有工作考虑地对地 [1] 和空对地情况 [2]，[3]。少数考虑 3-D 空对空情况 [4 ], [5]，这在技术上更具挑战性，我们稍后会讨论。在 [4] 中，作者研究了协同定位问题，但假设飞行器安装了能够测量目标距离和角度的测距仪，而在我们的工作中，只有方位信息可用。 [4] 中的工作提出了一个控制框架，用于在 3-D 中包围目标。至少需要一个机器人知道目标位置和速度信息，这与我们在两者都不知道的情况下的工作相比是一个主要区别。在作者之前的工作 [6] 中，我们考虑了多智能体编队控制背景下的空对空目标跟随。与 [6] 相比，这项工作考虑了一个更具挑战性的场景，其中目标大小事先未知，因此距离无法直接测量。

实现目标跟随的第一步是通过机载传感器检测目标MAV。由于追踪者微型飞行器的有效载荷限制，视觉是最适合机载传感的解决方案之一。近年来，基于视觉的 MAV 检测受到越来越多的关注，这主要是由于其在 MAV 防御系统中的潜在应用 [7]。在我们最近的工作 [8] 中，我们评估了一些最先进的 MAV 检测深度学习算法，并指出到目前为止，在复杂环境中检测未知 MAV的鲁棒性仍然是一个悬而未决的问题。我们将在未来的工作中专门解决 MAV 的视觉检测，并且仅关注本文中的估计和引导策略。

值得注意的是，当在机载图像中检测到目标MAV时，可以根据相机的固有参数轻松获得相对方位 [9]。但是，由于目标MAV的大小未知，因此无法直接恢复相对距离。这与 [6] 和 [10] 中的场景不同，后者的目标大小是已知的。尽管立体视觉可以估计目标深度，但其实际感应范围通常较短 [11]。

给定目标 MAV 的方位测量，随之而来的任务变成了仅方位的目标跟随问题，这是本文的重点。这样的问题面临一些独特的挑战，如下所述。

第一个挑战是开发稳定的算法，以根据方位测量来估计目标在3-D空间中的运动。尽管到目前为止，许多工作已经研究了目标的仅方位运动分析 (有关详细的文献综述，请参见第II-A节)，但大多数工作仅关注目标和追踪者在二维情况下移动相同的平面。部分原因是，仅方位目标运动分析最初是由军舰在海面上进行跟踪而引起的 [12]。截至目前，3-D空对空案例尚未引起足够的关注。在现有的有关3-D情况的少数研究中，目标方位由两个角度表示: 方位角和仰角。这种表示的缺点是，当高程等于90°时，它具有数学奇异性。更重要的是，双角表示导致卡尔曼滤波器中的高度非线性测量方程，导致目标状态估计的不稳定性或性能退化。
第二个挑战是了解如何利用3-D中的附加自由度 (DoF) 来增强目标的仅方位状态估计的可观察性。可观测性是从方位测量中恢复目标运动的基本要求。除了满足必要和充分的二进制条件，以便系统是可观察的 [13]，追赶者还应充分移动以增强可观察程度，以便可以更准确地估计目标的运动 [14]。尽管已有关于可观察性增强的研究 (有关详细的文献综述，请参见ii-b节)，但3-D案例中的一些基本问题仍然存在。特别地，可观测性增强通常依赖于Fisher信息矩阵 (FIM) [15]。某些指标，如FIM的行列式，可以被视为从方位测量中检索到的目标信息量，通常被最大化以实现最优控制策略 [14]，[16]，[17]，[18]。一个众所周知的基本结论是，后续步骤中追赶者的控制应使目标方位的变化率最大化 (例如，[14]，[16]，[18]，[19]，[20])。这是许多现有最优控制策略的理论基础 [18]，[20]。然而，这样的理论结论仅在一个时间步骤的范围内有效。虽然这不是二维运动的严重问题，但它很好地利用了3-D 情况下的额外 DoF。因此，重要的是在多个时间步长的较长范围内研究最优控制策略。然而，这个问题仍然知之甚少，分析起来也具有挑战性，因为 FIM 的许多指标在 3-D 中不再易于分析处理。通过扩展 FIM 的行列式的表达式可以很容易地验证它，如（7）所示。
第三个挑战是如何为追逐者MAV设计制导和控制策略，以达到预期的控制目标，同时提高可观测性。由于耦合动力学，同时完成这两项任务并非易事。在我们的工作中，控制目标是在追踪者和目标之间保持所需的恒定距离。与这个问题密切相关的是方位目标拦截 [18]、[21]、[22]。然而，现有的目标拦截可观察性增强制导策略无法应用于我们的工作。这是因为目标拦截旨在仅最小化最终未命中距离，而最终拦截速度不受限制。此外，现有的制导律是为非完整模型而不是四旋翼 MAV 模型设计的 [18]、[21]、[22]。在这些非完整模型中，假设速度大小不变，控制目标是设计横向加速度来调整速度方向。另一方面，基于四旋翼 MAV 的可观测性增强目标跟踪尚未在文献中得到解决（参见第 II-C 节的文献综述）。

本文旨在克服上述未解决的挑战。具体来说，本文的贡献和创新点总结如下。

为了估计目标在3-D空间中的运动，我们将3-D目标方位表示为具有测量噪声的单位矢量。通过引入正交投影算子，我们将方位测量从目标位置的非线性函数转换为伪线性函数，因此，线性卡尔曼滤波是适用的。这样，正如我们的仿真结果所验证的那样，方位表示不会遭受任何奇异性，同时，与两角非线性版本相比，估计稳定性更好。
对于 3-D 空间中的可观察性分析，我们引入了一种基于 FIM 的新优化指标。该指标等同于基于 FIM 行列式的流行指标，并且在分析上更易于处理，这意味着我们可以获得其显式表达式，然后计算其梯度以进行优化。通过使用基于行为的方法，我们在受运动约束约束的多个未来步骤的时间范围内对新指标进行了数值优化。据揭露，追击者的最佳策略是在多步视界内沿着嵌入在以目标为中心的 3-D 球体上的椭圆移动。这一新发现概括了先前针对单步视界情况的结果，加深了我们对 3-D 可观测性增强的理论理解，并为我们新的可观测性增强制导律奠定了理论基础。
对于追踪者四旋翼的制导和控制，我们首先设计了一种由横向和纵向命令组成的新的3-D制导律。这里，纵向命令是为了控制到目标 MAV 的相对距离。横向是一种新颖的 3-D 螺旋制导律，旨在提高可观察性。该制导律是根据我们的 3-D 可观测性分析设计的。它驱动 MAV 沿 3-D 螺旋轨迹飞行，从而更好地利用 3-D 空间中的附加自由度，如图 1 所示。为了跟踪高层制导命令，我们最终设计了一个低层飞行基于几何控制方法的控制律，并结合了 MAV 的航向应始终与目标无人机对齐的约束。

给出了广泛的数值模拟结果，以验证该方法的有效性。与最新方法的详细比较证明了所提出方法的卓越性能。此外，已经在实际的四旋翼平台上进行了实验，以验证所提出方法在实践中的有效性和鲁棒性。

2.相关工作：

仅方位目标状态估计Review

卡尔曼滤波作为一种通用的估计框架，广泛应用于纯方位目标估计。在仅方位估计中应用卡尔曼滤波器的一个挑战是测量和要估计的状态之间的非线性。如果使用传统的基于笛卡尔坐标的扩展卡尔曼滤波器 (EKF)，这种非线性将导致估计容易产生偏差甚至发散。已经提出了几种改进的方法来缓解该问题。

第一类有效方法使用修改后的极坐标或球坐标。改进的极坐标 EKF 首次在 [12] 中提出，其中状态变量被仔细选择为方位、方位率、范围的倒数和范围率除以范围。它将三个可观察量与不可观察量（范围的倒数）分开，从而防止误差协方差矩阵病态并确保稳定性。 [23] 中的工作将极坐标方法扩展到球面坐标方法，以通过以其速率增加高程状态来适应 3-D 场景。后来，[24] 中的工作考虑了加速度估计。

第二类是伪线性卡尔曼滤波器 (pseudolinear Kalman filter，PLKF)，最早于 [25] 提出。它通过将非线性测量方程转换为伪线性方程来解决不稳定性问题; 因此，它在计算上是有效的，并且适用于实时系统。但是，这种重铸使噪声变得非高斯，并且与测量矩阵高度相关，从而导致估计偏差。尽管如此，速度估计没有偏差，并且当范围相对较小时，位置偏差小于1% [26]。后来通过引入修正增益方法来缓解偏差问题，其中卡尔曼增益仅作为先验估计的函数计算 [27]。

最近，已经提出了其他基于高级但更复杂的过滤器的方法，例如粒子过滤器 [28]。这些方法计算量大，不适合实时实施，而实时实施对于飞行器的高速运动至关重要。最近的工作是 [29]，其中提出了偏差补偿PLKF。然而，与 [23] 类似，所提出的滤波器中涉及大量非线性三角函数，使得整体表达式相当复杂，从而计算协方差矩阵。

综上所述，现有文献大多考虑二维场景下的方位估计，当涉及到3D时，方位通常用两个角度表示，这会导致潜在的奇异性并使滤波器设计复杂化。

可观测性分析Review

可观测性是纯方位目标运动分析中的一个基本问题。早期的工作主要解决二进制可观察性，即确定系统是否可观察。例如，[25]中的工作构建了一个由状态转移和观察矩阵的时间序列组成的矩阵，并使用其秩来确定二进制可观察性。但是，观察者运动被限制为直线运动。 [13] 中的工作建立了严格的可观察性要求。它表明，当且仅当加速的本船满足指定约束时，可以获得唯一的跟踪解决方案，其中约束是平面上加速度和观察角度的函数。它后来在 [30] 中扩展到 3-D 场景。 [31] 中的工作进一步将 [13] 中的可观察性标准推广到 N 阶目标动力学。

除了确定它是否可观察之外，其他研究人员还专注于量化可观察性。 [16] 中的工作首次将 FIM 引入可观察性分析。从那时起，FIM 的行列式就成为一种流行的衡量标准。例如，最近在 [17] 和 [18] 中的工作分别使用 Cramer-Rao 下界的特征值和 FIM 的行列式的对数来构建性能指标以最大化可观察性。几何方法利用目标和追赶者在两个连续时刻的几何关系，也被用于推导可观察性的度量，例如[19]和[20]，结果与使用推导的结果一致调频模块。

总之，量化可观察性的一种流行方法是使用 FIM。然而，大多数现有作品只考虑二维场景。尽管 [32] 中的工作考虑了 3-D 情况，但它仅给出了分析可观察性条件。最相关的工作是 [33]，它量化了 3-D 中的可观察性。然而，假设传感器是自由分布的，而在我们的例子中，必须添加一定的空间约束。

可观测性增强机动策略Review

当方位是归位制导的唯一信息源时，通常采用的制导法则，如纯追踪制导 (PPG) 和比例导航制导 (PNG) [34]，通常无法估计目标的状态，从而增加了缺失率。性能恶化的主要原因是由于 [35] 中指出的缺乏距离测量而缺乏可观察性。为了增强可观察性，追赶者必须采取某些机动策略，我们将其分为四类。

第一类包括基于启发式的方法，例如 [35] 和 [36] 中描述的方法，其中将额外的加速命令添加到经典PNG中。可以通过调整机动项的系数来控制机动频率。这种额外的加速度通常是由初始偏航或俯仰角引起的。

第二类包括虚拟状态方法 [21]、[37]。附加虚拟状态通常被选择为横向相对于追击者向下距离的积分。通过将虚拟状态设为零，将轨迹调制为编织模式。通过改变初始值或虚拟状态的数量，可以调制编织模式 [37]。该方法的优点在于结构简单，易于在实际系统中实现。

第三类是间歇策略，首先在[38]中提出。该方案有意关闭常规制导命令以引入制导误差并增加视线（LOS）率，从而增强可观察性。然后在终端归位阶段重新激活制导命令。 [39]、[40]、[41] 中提出了几个具有自适应性的改进版本，其中在决定是否增加或减少承载率之前首先评估可观察性。优点是可以提供足够的轨迹调制以增强可观察性，而不会浪费过多的控制能量，并且可以实时实现。

第四类是基于最优控制的方法，其中目标函数通常是FIM的行列式 [14]，[16]，[42]，[43]。[44] 中的工作提出了一种线性二次制导律，其中在其最优解中考虑了可观测性Gramian。但是，最佳路径具有一个共轭点，该共轭点需要通过调整加权参数来调整其前进时间大于导弹前进时间。否则，共轭点可能导致算法发散。[43] 中的作者提出了 [44] 的改进版本，其中相对速度和与时间平方成比例的变化的可观察性惩罚被认为可以实现更好的可观察性。然而，它们都需要额外的信息，例如时间，这反过来又对估计精度提出了更苛刻的要求。[18] 中的最新工作考虑了合作目标的参与任务，其中假设目标速度的方向是准确已知的，而在我们的跟踪任务中，我们必须对其进行估计。[45] 中的工作提出了针对未知目标的最佳机动策略。但是，他们的目标只是估计目标的状态，而在我们的情况下，我们需要进一步保持期望的范围。

3.问题陈述和系统概述

考虑目标MAV在3-D空间中以恒定速度飞行。假设一个四旋翼平台的追赶者MAV可以使用机载视觉来检测目标，从而获得其相对方位。令pT，vT ∈ R3为目标MAV的位置和速度，p，v ∈ R3为追逐者MAV的位置和速度，均以惯性坐标系表示。追赶者MAV的目标是从任何初始距离的位置接近目标，然后保持所需的相对距离rd>0。

为了实现这一目标，我们设计了一个包括目标估计、制导和飞行控制的复合系统。总体系统架构如图 2 所示。可以看出，视觉系统的输出是带有噪声的方位测量值λ。第一步是设计一个方位观测器来估计目标的位置和速度（见第四节）。然后，有必要分析目标的可观测性并揭示最佳机动策略以增强可观测性（见第五节）。下一步是为追逐者 MAV 设计制导法则以接近目标，同时增强可观察性（参见第 VI 节），从中可以得出追逐者无人机所需的加速度。最后一步是设计低层飞行控制律，包括追逐者 MAV 的所需推力 Td 和扭矩 τd，以跟踪制导命令 ad（参见第 VII 节）。

4.3D纯方位目标估计

本节介绍一种新颖的仅方位 PLKF，用于根据 3-D 中的噪声方位测量来估计目标的位置和速度。

A.状态转换方程

B.测量方程

在 (4) 中注意到 ~λ 是 pT 的非线性函数。为了获得线性测量方程，我们引入了一个受我们之前工作启发的正交投影算子 [46]。对于任何非零向量 g ∈ R3，定义正交投影算子

对Pg的解释是,对任何向量z，它在垂直于 g 的平面上的正交投影是 Pgz

请注意，在 (6) 中，假定 ν 服从正态分布，并且可以将项 rP~λ 视为随时间变化的噪声转移矩阵。通过检查，我们可以得出结论，此转换取决于真实范围 r 和向量 λ 的方向。估计噪声转换矩阵的一个问题是真实范围 r 在实践中是未知的，因此在滤波器中，我们替换(6) 中的 r 与预测值。这种替换已在[29]中使用，并在我们的模拟和实验结果中得到验证是有效的。

3D仅方位PLKF

下面总结了卡尔曼滤波器框架下提出的 3-D 方位观测器的步骤。预测步骤是：

其中 ^x− k 和 P−k 分别是先验状态估计和误差协方差。修正步骤是：

其中 Hk = [Pλk 03×3] , Kk 是观测器增益，Vk = r−k Pλk 并且 rk− 只是 x^− k 的前三个分量的范数，^xk 和 Pk 是后验状态估计和误差协方差，符号†表示伪逆。使用伪逆矩阵的原因是矩阵 (HkP− k HT k +VkΣVT k ) 是秩亏的，因为Hk中的 P~λk 是秩亏的。当逆不存在时，在卡尔曼滤波器中使用伪逆是一种常见的做法，如 [47]、[48]、[49] 所示。

将zk表示为经典卡尔曼滤波器中的测量值。根据 (6)，值得注意的是在我们的模型中zk实际上是 03×1。随着 zk =03×1，更新后验估计 ^xk 的标准步骤因此减少如下：

实际上，度量信息已隐含地包含在矩阵Hk中，这也是伪线性名称的来源，因为Hk是变化的。此外，在二维和三维情况下，观测矩阵Hk具有相同的数学表达式。特别地，Hk可以写为Hk = p〜 λk 0d × d，其中〜 λ ∈ Rd和d是可以为2或3的空间维度。相比之下，当维数从2提升到3时，常用EKF方法的观察矩阵具有更复杂的表达式。这就是统一PLKF或u-PLKF这个名字的创造方式。

5.3D可观性增强

本节介绍了一种在多步范围内增强3-D中仅方位可观测性的新方法。该方法的优点在于，它可以统一二维和三维情况下的可观测性分析，更重要的是，它将现有的可观测性分析从单步视界扩展到多步视界，以便更好地利用3-D中的附加自由度。

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

通过可见性增强螺旋制导的三维纯方位目标跟踪

摘要：

1.引言

你可能感兴趣的:(论文笔记,目标跟踪,人工智能,计算机视觉)