UESTC_Chenlin

【论文笔记】ego_planner_swarm

文章名：EGO-Swarm: A Fully Autonomous and Decentralized Quadrotor Swarm System in Cluttered Environments

【单位】浙大fastlab

【期刊】ICRA2021

摘要：本文提出了一种基于机载资源的多机器人自主导航的分布式异步系统解决方案。在基于梯度的局部规划框架下建立规划系统，通过将碰撞风险确定为非线性优化问题的惩罚项来实现碰撞避免。为了提高鲁棒性和避开局部极小值，引入了一种轻量级拓扑轨迹生成方法。然后，agent使用不可靠的轨迹共享网络在几毫秒内生成安全、平滑和动态可行的轨迹。利用深度图像中的agent检测校正agent之间的相对定位漂移。通过仿真和实际实验验证了该方法的有效性。源代码已发布以供社区参考。

1.引言：

四旋翼的敏捷性使该机器能够在未知环境中进行单智能体自主导航，在开放或已知领域进行多智能体精确编队控制。然而，很少有工作将它们两者结合起来展示任何能够导航共享相同未知空间的四旋翼集群的真实世界系统，尤其是仅在机载处理的情况下。在未知环境中部署多个四旋翼飞行器的困难包括但不限于障碍物参数化的重要性、感知范围有限、通信不可靠和带宽受限以及定位不一致导致的定位漂移。一些相关的工作，例如 [1, 2]，将能够避障的现实世界四旋翼群推动得更远。然而，对于大多数先前的工作，在运动捕捉系统或纯仿真中，上述困难总是被忽略，限制了其算法在实践中的应用。

本文提出了一种系统化的解决方案，可以在存在上述困难的情况下，为四旋翼机群在杂乱的环境中实现高性能飞行。此外，它不需要外部定位和计算或预先构建的地图。所提出的EGO-Swarm系统是我们先前工作的一个扩展，它是基于无ESDF梯度的LOcal规划器（EGO-Planner）的扩展，它为未知环境下单个四旋翼的机载局部规划奠定了坚实的基础。扩展包括拓扑规划和机间避碰两部分。如图3所示，非凸配置空间可能导致不期望的行为，例如动力学不可行或拥挤的导航。因此，像拓扑规划这样的策略来避开局部极小值是有益的。基于EGO Planner中的碰撞代价公式，前端拓扑路径搜索是隐式进行的，因此几乎不需要计算。通过在目标函数中加入群碰撞的加权惩罚，实现了分布式机间避碰。通过比较未来某一时刻的agent分布和正在优化的轨迹来评估这个惩罚函数。为了尽量减少数据传输并允许不可靠的通信，使用广播网络来共享轨迹。为了纠正相对定位漂移，可以将其增加精度到半米，我们比较了目标agent的观测结果和轨迹评估的预测结果。

提出了真实世界的实验来验证我们提出的群系统。据我们所知，这是在未知杂乱环境中完全自主分散的四旋翼集群的第一个系统解决方案，这意味着感知、规划和控制集成到机载系统中。与几种 SOTA 方法的比较显示了计算效率和鲁棒性。本文的贡献总结如下：

（1）我们扩展了以前的工作EGO - Planner，提出了一种新的、鲁棒的拓扑规划方法，几乎不需要额外的计算。

（2）我们提出了分布式和异步的无人机集群框架，它对不可靠的通信和定位漂移不敏感。

（3）将该方法集成到一个全自动的四旋翼系统中，并发布了硬件和软件，供社区参考

2.相关工作

A.单个无人机的局部规划

基于梯度的运动规划是四旋翼局部规划的主流。在将局部规划问题描述为无约束非线性优化的开创性工作[4,5]的基础上，提出了一系列工作[6]–[10]。他们使用各种参数化方法，包括多项式和B样条，考虑轨迹的平滑性、可行性和安全性。最近，我们提出了一个名为EGO_Planner[3]的单四旋翼导航系统，它使用更紧凑的环境表示法进一步减少了计算时间。这就是本文所基于的工作。

B.拓扑规划

拓扑规划用于避开局部最小值。基于源自复分析 [11] 的二维表面中的homology等价关系，Rosmann 等人 [12] 提出了一种使用 Voronoi 图和基于采样的前端以及 TEB 本地规划器 [13] 作为后端的独特拓扑轨迹规划方法。然而，3-D 中的homology等价关系要简单得多。为了捕捉独特的有用路径，Jaillet 等人 [14] 构建可见性变形路图，其编码比homotogy类的代表性路径更丰富、更相关的信息。基于 [14],Zhou 等人 [15]通过提出有效的拓扑等效检查来实现实时拓扑规划。我们扩展了 EGO-Planner 以进一步加速拓扑规划的前端。

C.分布式无人机集群

例如，[16]-[20] 中提出了去中心化方法。利用速度障碍来保证质点机器人 [16]、完整agent [17] 和非完整agent [18] 的无碰撞轨迹。刘等人[21] 提出了一种分散和异步的无人机规划策略，以避免静态/动态障碍物和机间碰撞。虽然这些算法是通过仿真验证的，但没有集成传感、测绘、规划能力。实验结果已在 [19, 20] 中显示。 [19] 可以在没有外部障碍的情况下实现多机点对点过渡，并且 [20] 依赖于临时规划优先级。然而，它们都没有在外场环境中实现完全自主。

3.基于梯度的局部规划隐式拓扑轨迹生成

在这一部分中，我们首先介绍了我们之前在EGOPlanner[3]上的工作，提出的swarm系统就是基于这一工作。然后对提出的拓扑规划策略进行了说明。

A.无ESDF图的梯度局部规划器

作为基于梯度的局部规划器，EGO-Planner 将轨迹生成公式化为一个非线性优化问题，该问题在平滑度 Js、碰撞 Jc、动态可行性 Jd 和终端进度 Jt 之间进行权衡。优化问题，决策变量来自用于参数化轨迹的均匀 B 样条 Φ 的控制点 Q ，由下式给出

其中 $r=\left \{ s,c,d,t \right \}$ ,下标 λ 表示相应的权重。J项可分为两类：最小误差和软单边约束。最小误差项Js和Jt,将决策变量L (Q) 的线性变换与期望值D之间的总误差最小化，由下式给出：

软单边约束项Jc和Jd, 惩罚超过特定阈值的决策变量 $\tau$ ，表示为如下。

其中参数S、n和 $\epsilon$ 影响 [13] 中所述的单侧约束近似精度。根据惩罚类型选择变换 $L\left ( \cdot \right )$ 和参数。

在 EGO-Planner 中，我们根据每个 Q 独立拥有的环境信息提出了一种新的障碍物距离估计方法。由几个 {p, v} 对参数化的信息是从周围的障碍物中高度抽象出来的，其中 p 表示障碍物表面的锚点，v 表示从障碍物内部到外部的安全方向，如图 4a 所示。则第 i 个控制点 Qi 到第 j 个障碍物的障碍物距离 dij 定义为

{p, v} 对生成和轨迹优化过程如图 4a 和 4b 所示。首先，给出一个简单的初始轨迹Φ，不管碰撞。然后搜索连接Φ的碰撞段两端的安全路径Γ。之后，从 $\Phi$ 到 $\Gamma$ 产生向量,以及p定义在障碍物表面。利用产生的 $\left \{ p ,v \right \}$ 对，规划器最大化 $d_{ij}$ 并且返回优化后的轨迹。由于文章篇幅有限，这里我们只对EGO-Planner的基本思想做一个简单的描述。详细解释见[3]。

图4:关于EGO-Planner和拓扑轨迹生成的阐述。(a)安全path已经搜索到，然后 $\left \{ p ,v \right \}$ 对已经生成。(b)优化器已找到一条安全轨迹，满足 $d=(Q_i - p)\cdot v$ 大于一个常值。(c)产生新的 $\left \{ p ,v \right \}$ 对，其中新的v是原来v的负方向。(d)另一条不同的轨迹生成。

（B）隐式拓扑轨迹生成

[14, 15] 中的分析表明，广泛使用的homotopy概念不足以捕获 3D空间中的候选轨迹，如图 5 所示。因此，Jaillet 等人[14] 在 3D 空间中提出了一种更有用的关系，称为可见性变形 (visibility deformation)，以及 Zhou 等人[15] 进一步提取了称为统一可见性变形 (UVD) 的 VD 子集，它可以实现实时操作。然而，我们在本文中仍然使用术语拓扑规划，因为之前的工作没有歧义。满足 UVD 的轨迹被认为是同胚的homeomorphic。 [15]中定义的UVD是：

定义1：两条轨迹τ1(s)，τ2(s)，

传统的拓扑规划方法[12]-[15],]由拓扑不同的路径搜索和后端优化组成，主要关注于在不同的homotopy中找到多个初始路径。与这些方法不同，该方法通过将v反转为 $v_{new}:=-v$ 来构造不同方向的距离场。然后是搜索过程

4.飞机集群导航

A.机间避碰

agent-k考虑其他agents的存在，如图6所示。不同于文献[22]，在这里我们忽略了障碍物和动力学限制（这部分已经在第三节A部分讨论过）。类似于避障和动力学可行性的惩罚函数，我们将第k个agent的集群机间避碰的惩罚函数 $J_{w,k}$ 定义为软单边约束，如下式：

图6：自身无人机通过接收到的周围无人机在同一时刻的轨迹，进行对比来产生自身的轨迹。

把权重项 $J_{w,k}$ 加到方程1中去，形成1个总优化问题：

任何轨迹参数化方法包含一个从决策变量映射到轨迹上点的过程。本文用阶均匀B样条参数化轨迹，

B. 定位漂移补偿

由于在未知环境中的个体定位（没有可靠的高频闭环），漂移在飞行期间累积。Xu等人 [23] 提出了一种具有额外UWB距离测量的无人机群状态估计方法，实现了精确的协同定位。然而，我们更关注于穿越障碍环境，并且必须为其他应用程序预留计算和通信资源。因此，在文献 [23] 的启发下，提出了一种简化且轻量的相对漂移估计方法，该方法通过比较从接收其他agent的轨迹评估的预测位置和从观测者的深度图像测量的位置来实现。当轨迹跟踪误差可忽略不计，并且任何两个可能发生碰撞的agent中至少有一个agent看到另一个agent时，此策略有效。因此，我们使用来自 [24] 的控制器进行精确跟踪，并使用广角相机来减少丢失agent的可能性。

漂移消除程序如下。在评估agent-i的当前位置 $\Phi_i\left ( t_{now} \right )$ 后，确定以 $\Phi_i\left ( t_{now} \right )$ 为中心、半径为 R 的球形信任区域 $S\subset \mathbb{R}^3$ ，其中 R 是一个经验参数，指示从实验估计的典型漂移的上限。然后将S映射到当前捕获的深度图像上，即满足的区域S  ⊂ R2

其中s  ∈ S ，s ∈ s，K和Tc w是相机本征和外在矩阵，z是S沿主光轴与光学中心的偏差。S  是椭圆圆锥曲线，需要复杂的计算才能获得。因此，我们采用近似轴对齐的椭圆s ¯ 而不是精确的s 。没有必要精确定义信任区域，因为它只是一个经验区域。

然后我们将 $\overline{s}{}'$ 内的每个点投影到世界框架中，并收集属于 S 的点，从而得到一个点簇 P ⊂ S。然后将智能体观察 P 的位置视为 P 的中心（第一个原始矩），即

如果 P 仅包含相应agent的观察而没有任何不相关的对象，则等式 9 成立，这是不能保证的。然而，由于每个智能体都规划了与附近物体有间隙的轨迹，因此 Equ.9 大部分时间都成立。添加了其他标准以提高agent检测的鲁棒性，例如像素数、P 的第二个中心矩、当前测量值与先前测量值的偏差等。更严格的标准会增加假阴性率，但由于定位是无害的漂移变化缓慢。最后，将 $\Phi_i\left ( t_{now} \right )$ 和 P 之间的误差馈送到滤波器，然后从中获取估计的漂移。

C.agent从深度图中移动

我们使用占用网格图来存储静态障碍物，并使用深度图像进行地图融合。移动agent在第四节-A 中得到处理。因此，记录移动的agents并把它们在建图过程中视为障碍物是不必要的，甚至是有害的。为了消除移动物体的影响，我们从深度图像中屏蔽并去除在第四节-B中检测到的agent的像素，如图 7 所示。除此之外，覆盖大部分视野的移动物体会对 VIO 造成干扰。因此，灰度图像上的agent也被移除，对相应的深度图像使用相同的掩码。这里使用的agent检测标准不那么严格，因为错误的正值比错误的负值更有害。

图7：左：VIO漂移被估计在从接收轨迹评估的预测位置和信任区域内的深度图像中的观察位置之间。右：将观察到的agent掩蔽以避免影响建图。

5.系统架构

系统架构如图 8 所示，其中包含单个agent和多agent通信系统的详细架构。

A.单agent导航系统

单个agent系统，包括硬件和软件设置，基于我们之前的工作 EGO-Planner [3]，带有一个额外的模块，可以补偿 VIO 漂移并移除图像上的被看到的agent。所有组件都集成到一个自组装的 250 毫米轴距四旋翼飞机中。对于未知环境中的轨迹生成，使用局部地规划器。当当前轨迹与新发现的障碍物发生碰撞，或者agent接近当前轨迹的末端时，就会激活规划。

B.通信框架

两个网络用于连接系统，一个是广播网络用于共享轨迹，另一个链网络，用于同步时间戳和管理启动序列。

1）广播网络：一旦一个agent生成一个新的无碰撞轨迹，它就会立即广播给所有agent。然后其他agent接收并存储此轨迹，用于在必要时为自己生成安全轨迹。这种闭环策略在连接稳定且延迟可忽略不计的理想情况下正常工作。但是，这在实践中并不能保证。因此，我们提出了两种方法来减少碰撞的可能性。

首先，在网络负载下以给定频率广播一个轨迹。这不会造成计算负担，因为包含三维航路点和其他参数的典型轨迹的大小小于0.5kb。相比之下，Bluetooth等现代无线网络可以达到1 Mbps以上的速度。其次，每个agent在从广播网络接收到轨迹时立即检查碰撞，并且如果检测到潜在碰撞，则生成新的无冲突轨迹。该策略可以解决，当多个agent在非常接近的时刻生成轨迹时由于延迟或数据包丢失没接收到其他agent的轨迹。此外，还考虑了计算复杂度随agent数量的增加而增加的问题。在规划之前，每个agent将其当前位置与接收到的周围agent的轨迹进行比较，其中任何超出规划范围的轨迹都将被忽略。

2)链网络：连接稳定的链式网络用于时间戳同步和系统启动管理。在系统启动时,agents以一个预定义的顺序生成轨迹。每个agent生成自身最初的轨迹在收到通过更高的优先级的链式网络发来的其他agents的轨迹之后。这种策略避免了在系统启动时由于同步轨迹生成造成的混乱，因为此时agent没有来自其他agent的轨迹信息。

6.benchmark

我们在英特尔酷睿 i7-9700KF CPU 上进行了关于拓扑规划、在空阔和杂乱空间中的集群规划的广泛基准比较。

A.拓扑规划

我们在候选轨迹数和前端拓扑路径搜索的计算时间两方面比较了所提出的 EGO-Swarm 与 Fast-Planner [15] 的拓扑规划性能。如图 9 所示，EGOSwarm 找到的候选轨迹较少，这意味着找到全局最优的概率较低，但比 [15] 快两个数量级。由于 Fast-Planner 通过 PRM [25] 图搜索、路径缩短和路径修剪找到拓扑不同的路径，与所提出的隐式拓扑路径搜索方法相比，这些方法耗时但具有更高的自由度。

图9：拓扑路径搜索的比较。与 Fast-Planner 相比，本文提出的规划器发现的候选拓扑不同的轨迹更少，但消耗的计算更少。请注意，显示的时间仅用于前端局部最小值发现，而显示的轨迹经过优化以获得更好的可视化。

B.集群规划

1)在空旷空间中：我们将所提出的方法与DMPC [19] 、ORCA [16] 和RBP [20] 进行了比较，从飞行距离、飞行时间、每个agent的碰撞次数和计算时间几个方面进行了比较。除最大速度和加速度外，每种比较方法都使用默认参数。如图10所示，八个agent在一个圆上执行交换变换。表I中的结果是所有agent的平均值。tcal用“*”标记，因为我们记录的计算时间是规划所有agent的整个轨迹的总时间(对DMPC和RBP而言)，而对于ORCA和EGO -Swarm，它是每个agent的局部重新规划时间。

表I 和图10 表明 RBP 倾向于生成安全但保守的轨迹，因为构建凸的相对安全飞行走廊 [20] 显著压缩了解空间。 DMPC 专为分布式部署而设计。然而，它需要准确和高频的姿态通信，这在现实应用中无法保证。高效的规则使 ORCA 更新更快。但是，使用速度作为控制命令使其与四旋翼等三阶系统不兼容。碰撞的风险也限制了它的应用。相比之下，所提出的方法生成最短的无碰撞、非保守轨迹，计算速度快。因此，它可以实现四旋翼的实时应用。

2）在充满障碍物的空间中：我们仿真了从地图一侧到另一侧的10架无人机，速度限值为2米/秒，四旋翼半径为0.2米。图2是0.42个障碍物每平方米的仿真环境。每个Agent独立感知环境，构建的局部地图以不同的颜色显示。结果总结在表II中，其中 $d_{fly}$ 是平均飞行距离， $d_{safe}$ 是飞行试验期间最接近障碍物的距离。设计了一种逆点对点转换，使围绕地图中心的机间碰撞避免项不可避免。在这种情况下，属于群的每个agent都可以规划平滑和安全的轨迹。

3）可测性分析：我们在以直线排列的agents飞到 50 米外的随机目标点的情况下评估计算性能。如图 11 所示，由于第五节-B1中的按需碰撞检查策略，时间复杂度随着agent数量的增加而逐渐趋于平稳。

7.真机实验

A.室内

我们在 1.5m/s 的速度限制下展示了几个室内实验，如图 12 所示。路径的颜色表示每个四旋翼的大致飞行时间。顶部显示了三个四旋翼在空阔空间中执行循环交换，因此需要相互避免碰撞。在中间，四旋翼飞机在飞行过程中避开障碍物，一个接一个地通过狭窄的门。在下图中，我们设置了一个由一些垂直和水平障碍物组成的更杂乱的环境。三个四旋翼飞机设法在这个环境中导航。

B.室外

如图1所示，在树木相隔约2米的森林中，三个四旋翼开始在森林中，并设法到达外部森林的目标位置。速度限制设置为 1.5m/s。为了进一步强调相互避碰，我们颠倒了目标位置相对于起始位置的顺序，使得相互回避不可避免，就像我们在第六节-B2中所做的那样。有关实验的更多信息，请参阅代码并在 github上观看我们附加的视频。

8.总结和未来工作

在本文中，提出了一种仅使用机载资源在未知杂乱环境中进行多机器人导航的系统解决方案。基准比较表明其计算时间短，轨迹质量高。真实世界的实验验证了它的稳健性和效率。未来，我们将致力于实现精准共定位和现实世界动态避障。主要挑战在于对其他无人机的不精确观察以及不可靠的运动物体检测和预测。最后，我们希望为机器人社区提供一个完整的四旋翼群在复杂环境中的自主导航解决方案。

AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj