秋日的动物园

5.开放空间规划算法解析及实现

星火计划2.0基础课：https://apollo.baidu.com/community/online-course/2
星火计划2.0专项课：https://apollo.baidu.com/community/online-course/12

apollo的planning中处理的绝大多数场景都是在城市结构化道路的路径规划。需要从高精地图的车道线中产生一条参考线，然后基于参考线再进行规划，但是对于一些没有参考线的非结构化场景，比如载客泊车，就需要在开放空间进行路径规划。开放空间算法主要应用在一些泊车场景或靠边停车场景，对于泊车场景的开放空间算法，其任务主要集中在下面的配置文件中：

泊车场景如上，一共有四个任务：

确定可行驶区域：

可行驶区域主要是根据道路的边界和泊车位的边界来确定。

另外如果可行驶区域中存在障碍物，则需要把障碍物的边界考虑进来。

规划无碰撞轨迹：

该任务主要分为两步：第一步是通过混合A*算法和RS曲线规划出一条粗糙的轨迹，主要是求出一条没有碰撞的参考解，因为混合A*和RS曲线规划的路径会存在一些曲率的突变，即不满足车辆的运动学约束要求的，所以第二步还要采用IAPS和OABC算法，对轨迹进行进一步的平滑，使得轨迹满足控制的需求。

接下来是：

该任务是根据轨迹是前进的轨迹还是倒车的轨迹将轨迹进行一个分割，根据自车的位置判断发送哪一条轨迹，以及是否需要切换轨迹。

最后的任务是检查规划的轨迹是否会和障碍物发生碰撞，如果碰撞了就会进入一个fallback状态，规划一条在碰撞位置停车的轨迹，然后再重新进行路径规划。

下面讲解混合A*算法：

对于开放空间的路径规划，实际上是一个复杂度比较高的非凸问题，通过搜索算法实际上是一个效率比较高的方案，A*是在机器人领域应用比较多的一个基于搜索的路径规划算法。A*算法首先将可行驶空间进行一个栅格化，按固定距离间隔采样节点，从当前节点遍历前后左右，以及左前右前左后右后八个方向。通过迭代搜索的方法找到一条从起点到终点避开障碍物的一条路径。

A*算法的具体实现过程：

首先从起点开始遍历所有相邻的节点，由于设置了两个集合，一个是开放集合open_set,一个是闭集合close_set,开集合保存了所有等待遍历的节点，闭集合保存了所有已经遍历过的节点，每次首先是把当前节点(起始节点)放入闭集合中，在下次搜索中从开集合中选择cost最小的节点作为遍历节点，ccost的计算包含两部分:g(n)表示从节点到当前节点的一个代价，h(n)是一个启发函数，表示从当前节点n到终点的一个预估的cost。

可以用到达终点的直线距离作为一种启发函数，设计一个比较精准的启发函数也可以加快搜索的速度。

可以看出来A*算法产生的路径都是折线的，对于车辆来说，是没有办法走出这样的路径的，这样的路径也不满足车辆的运动学约束，根据车辆的运动学模型，实际车辆航向是和后轴中心的速度方向是一致的，所以可以把车辆的运动路径等效为后轴中心点的一段段不同转弯半径的弧线组成。通过前轮转角可以计算出后轴中心的转弯半径，可以考虑对前轮转角进行采样，不同的前轮转角会有不同的转弯半径，每次行驶一个固定的弧长，此时搜索出的路径如下图右侧所示，其是由不同半径的弧组成的：

这样的路径相对A*算法路径平滑了很多。

但是这样优化后带来的问题就是原来栅格点作为节点也就不再适用了，可以看到从弧线拓展的节点位置可能会坐落在棋盘格的各个位置，它们的方向(航向角)也是各不相同的，在A*算法中，通过x和y的坐标来判断节点是否遍历过的方法在这里也就不再适用了，即算法搜索状态空间从二维的x，y拓展到三维的x，y，θ，θ即当前处在该点车辆的航向角，所以节点除了定义x，y还要定义航向角θ的精度,以下是apollo中定义节点的数据格式：

其中x_grid,y_grid和phi_grid分别是节点x，y和phi的索引，即x，y方向的长度除以精度。通过三个索引组成的字符串是否相同，来确定其是否为同一节点，是否遍历过该节点。

因为搜索拓展路径节点动作是离散的，比如以固定的长度，不同的转弯半径进行节点的拓展，而状态空间其实是连续的，因此有可能永远也搜索不到终点的状态：

所以还需要进行节点的解析拓展——RS曲线:

提出了一种从起点到终点可以通过固定半径的圆弧和直线连接起来的方法，圆弧和直线的组合一共总结了48种(上图表格),而且证明了这样的最短路径一定是在这48种线型之中的，并且给出了每一种线型解析解的求解方法。

上表中，C代表圆弧，S代表直线，竖线代表前后有一次方向的变换。但该种方法是没有办法考虑障碍物的，所以应用到混合A*算法中，还要加上最后的一个碰撞检测，把和障碍物发生碰撞的所有路径过滤掉。

接下来以APOLLO中混合A*的代码为例，介绍混合A*算法的求解过程：

第一步：基于动态规划算法求解每个二维节点的代价值作为混合A*算法的启发函数(GenerateDpMap)，然后定义了两个集合，open_set和close_set以及优先队列open_pq_，保存开放集的节点。首先将起点放入开放集中，然后定义一个while循环，每次从优先队列中会弹出代价最小的一个节点，然后判断从当前节点状态到终点状态是否有无碰撞的一个RS曲线(AnalyticExpansion函数)，求出解析解，如果找不到解析解就可以直接退出循环了。然后将该节点加入闭合集，然后再从当前节点向外拓展搜索节点(Next_node_generator函数)，如果拓展的节点之前没有遍历过，也没有和障碍物发生过碰撞，就可以加入到开放集中，并计算节点的代价值(CalaulateNodeCost函数)。

上图中黑色框表示可行驶区域中的障碍物，粉色点是通过混合A*搜索拓展得出的点，后半段没有通过混合A*的搜索，是通过RS曲线解析算出的一条路径，这样的路径虽然满足车辆运动学约束，但其中都是由弧和直线组成的，每个弧和直线衔接的位置都有一些曲率的突变，所以这样的路径还需要进一步进行平滑处理，来满足控制以及乘坐舒适性的要求。

接下来讲解第一个平滑算法:OBCA算法

OBCA算法不像混合A*那种基于搜索的规划算法，其是基于模型预测控制MPC建立的模型，然后用优化算法进行求解，OBCA算法可以加入一些障碍物的约束，不像求解解析解的RS曲线那样，虽然可以求出最优的解析解，但是没有办法考虑障碍物的碰撞约束。OBCA算法可以实现横纵向的联合规划，即可以同时考虑速度对路径的影响。且OBCA算法可以产生满足车辆运动学约束的轨迹，可以获取曲率连续变化的轨迹，而不像混合A*和RS曲线存在不同曲率的线段衔接到一起导致曲率突变的问题。

因为MPC也是最后转换成一个优化问题，所以它和其他的优化问题一样，首先要设计目标函数，设计约束函数，因为MPC涉及预测的问题，要对未来问题进行优化求解，所以还需要再设计一下MPC的预测模型，也就是状态空间方程的建立：

首先定义状态变量，包含x，y坐标(笛卡尔坐标系)，车速，航向角；以及输入u(k)，包括主车的前轮转角以及加速度。

预测控制模型就是车辆的一个二自由度的运动模型，最后可以简化成k+1时刻的状态可以由k时刻的状态推导出来，在控制算法中需要的是u的第一个分量，但是在轨迹规划算法中一般需要整个预测时域的所有状态，即把所有状态作为最后输出的一个轨迹,x(k+1)=f(x(k),u(k)).

OBCA算法在规划时考虑了障碍物的约束，利用超平面来构建障碍物约束.三维超平面就是把空间分为两部分的面，二维超平面就是把面分成两部分的线：

代入X的坐标可以判断该点是在线段上方还是线段下方，通过求解A和B的坐标来求解得到约束函数的系数Am和bm.

障碍物可以用四条边或者多个边的约束表示出来，Am，bm由四个状态联立得出。

自车所占用的空间同样可以用超平面来表示：

E表示自车在原点位置所占用的空间，如果自车在第k时间所占用的空间可以利用状态变量x(k)加旋转矩阵R()和平移矩阵t()得到。

如果要保证自车和障碍物不发生碰撞就需要满足主车占用的空间和障碍物占用空间的交集为空集：

这里定义一个主车和障碍物的距离函数dist，即主车沿着任意的方向向量t平移和障碍物发生重合的范数最小的向量函数。大于d_min等价于上面一系列不等式的成立，其中λm和μm是拉格朗日乘数。

原问题就是求解自车在E(x)位置和障碍物Om的一个距离，定义e为自车占用空间E(x)中任意的一个点,o为障碍物m占用空间Om的任意一点，因此两个障碍物之间的距离就是欧几里得距离最短的eo两个点，为一个e到o的二范数，如果让该距离大于dmin,则有上式成立。这里将E(x(k))变为了R(x(k))e't(x(k)),这个e'表示在原点的自车空间中的一个点，通过旋转矩阵和平移矩阵，就可以得到e的位置(实际自车空间中的一点)。

由于范数中包含了两个优化变量，一个e’一个o，不好计算，所以引入新的优化变量w和等式约束。

然后就得到了如上图所示的新问题，即使w的二范数最小时候的e'和o的取值。在凸优化问题里对于这种有约束条件的极值问题通常是不好研究的，所以通常将有条件的极值问题转换成无条件的极值问题进行研究。

一般把有条件的极值问题称为原问题，将其抽象为：

其有m个等式约束，p个不等式约束。

其拉格朗日函数为：

其中λ和μ都是每个约束函数的拉格朗日乘数。

通过拉格朗日函数可以把有约束的极值问题转换成无约束条件的对偶问题进行研究。

接下来把拉格朗日函数的λ和μ看作常量，在x定义域内对拉格朗日取极小值，就有拉格朗日对偶函数：

此时原问题化为拉克朗日对偶函数取极大值的问题：

其中有一个对拉个朗日乘子的约束λ>=0

求解原问题的最优解一般定义为p*,对偶问题的最优解定义为d*,那么在凸优化领域里，原问题的解p*一定大于等于对偶问题的解d*，所以原问题是一个凸问题，那么这个等式就是成立的,即一个强对偶问题:

拉格朗日对偶函数就是求解关于o，e'和w下确界的一个函数，其中前两项(第一条橙线)都是关于o和e'的线性函数，如果要使它们的下确界存在，其限定函数的系数就必须为0，因此有：

又因为范数的共轭函数的限制，则w的共轭函数根据凸优化理论，第二条橙线要么等于0要么为负无穷，所以要使其下确界存在，则这一项必须为0，那么z的二范数就小于等于1.

则最后该问题简化为：

对对偶函数求取极大值。

因为原问题的极小值为求取对偶问题的最大值，在该问题中，对偶问题的最优解即原问题的最优解，所以只要找到保证对偶函数的最大值(d*)大于dmin，那么原问题也一定是大于dmin的

当满足对偶函数取最大值时得λ得μ的取值时，得到d*=dmin。

如果要使得主车和障碍物之间的距离大于dmin，只需要满足存在一组λm和μm满足下述不等式成立：

所以在MPC设计上，如果要保证规划的轨迹使主车和障碍物的距离大于dmin，就要有以下的不等式成立，这里作为MPC约束的碰撞约束。

另外还需要添加起点和终点的约束:

即规划的轨迹的起点是给定的起点x，y，θ；规划轨迹的终点是给定的终点x,y,θ；且每个点之间要保证车辆的运动学约束(x(k+1)和x(k)的关系)

此外状态量还要满足规划的极限，比如速度要在设定的范围内,x,y要在地图的可行驶范围之内，状态量最后一项的航向角是没有约束要求的：

输入量也要满足车辆的极限：

车辆横摆角速度的约束也要保证车辆横摆角速度的范围，主要是满足舒适性的要求。

MPC的目标函数就是对预测时域每个状态x(k)损失函数的一个求和，损失函数第一项要求车辆跟踪参考路径的变化，即车辆路径和A*算法路径越接近越好，另外为了提高舒适性，加速度要越小越好，为了满足连续性,MPC的第一个输入分量要和当前的输入状态尽可能接近，同时输入量的变化率越小越好，即加加速度和方向盘的转速越小越好。

最后就得到了cost函数(如上图)，用二范数表示每一个项。

最后OBCA规划问题就转化为如下的非线性优化问题：

apollo中通过IPOPT非线性规划求解器进行求解，之前在速度规划讲到的IPOPT求解器，其如果有一个好的初始解，可以加快其向最优解收敛的速度，所以这里用混合A*算法计算的轨迹作为OBCA算法的初始解。

这里还有对偶变量的初始解，通过对对偶变量初始化，即通过之前求解的有碰撞约束的对偶函数的优化求解。根据对偶函数的设计，把对偶问题的函数用负的dm(k)来表示。这样就把极大值问题转化为极小值问题进行求解，这样方便代入IPOPT的优化求解器：

对每个时间k的每个障碍物的距离求取最小值的和，即求和取最小值，求出的目标函数取最小值时的μ和λ就是对偶变量初始化的值。

但经过分析，约束有一个二次函数，这里就只能用非线性规划求解器进行求解：

为了提高求解效率，apollo对这里进行了一个优化，把二次约束放入到目标函数中，成为一个软约束，这样对偶变量初始化就成为了一个二次规划的问题，，就可以用OSQP求解器进行求解(dual_variable_warm_start_problem.cc)

所以整个OBCA算法就是DISTANCE_APPROACH_IPOPT_FIXED_TS算法

此外，apollo中还有几个OBCA算法的衍生算法：

第一个是采样时间可变，原来的采样时间是ts，所以如何优化都是在最后时间到达终点的，这里增加一个采样时间系数t(k),采样时间就从固定时间ts变成了ts.t(k),就可以缩短到达终点的时间。

约束函数变为：

另外目标函数也增加了对时间系数的惩罚，包括了对二次和一次的损失函数，期望时间系数越小越好，因为越小到达的终点时间越早。

之前算法的终点都是硬约束，硬约束会导致IPOPT求解速度变慢，甚至极端情况下会找不到可行的解，但在一些场景下，我们并不需要车辆严格到达正好的x，y和theta的状态，到达终点附近也是能满足我们的需求的，因此Apollo做了进一步优化，这里将硬约束转化成了软约束，即在目标函数里增加了到达终点状态的一个惩罚项，同时对终点进行了一个松弛，这样就得到了Apollo中的DISANCE_APPROACH_IPOPT_RELAX_END这个函数。

接下来讲解DL-IAPS规划算法：

虽然OBCA算法通过凸优化的强对偶性很好的解决了在开放空间和障碍物的一个无碰撞的约束，但是算法求解效率和鲁棒性是比较差的，这里单次求解时长可能达到一秒左右，而且随着障碍物的数量以及障碍物边数的增加，还会导致求解效率降低甚至求不出解的可能，所以APOLLO设计了一种横纵向解耦的开放空间路径规划算法。

DL-IAPS路径规划算法是一种分段的路径规划算法，其和OBCA算法不同，OBCA算法是将整条路径一起进行平滑，是首先将混合A*产生的一个完整的轨迹根据轨迹的前进或者后退分成不同的段，并在每段分段进行平滑，同时保证平滑后的路径不会和障碍物发生碰撞，以及平滑后的路径满足最大的曲率约束，对于这种算法的速度规划采用PJSO算法，其和上节课讲到的基于二次规划的速度规划算法是比较类似的，在DL-IAPS规划的路径上分别对位置、速度以及加速度进行采样，并通过二次优化进行求解。

DL-IAPS即双循环迭代锚点路径平滑算法，上图为该算法的伪代码，其主要包含了两层循环，外层循环是处理和障碍物碰撞约束的循环Collision Check，内层循环是路径平滑的一个循环，对于开放空间路径规划算法其难点主要在于障碍物的碰撞约束难以求解，在OBCA算法构架上有障碍物无碰撞约束，但是导致其求解效率非常低。Apollo设计了一种迭代的方法去求解障碍物约束。

之前讲到了参考线散点的平滑算法，对于每个散点构造一个x，y的矩形框作为每个散点位置的一个约束

在DL-IAPS算法也同样通过这种方法进行路径的平滑，但是在每个迭代平滑完成后，结果会和所有的障碍物进行一个碰撞检查，如果发生了碰撞，那么发生碰撞的参考点调小其矩形框的大小重新进行下一次的平滑，不断迭代直到满足碰撞约束为止。

在参考线算法中是通过三个点对两个向量求和来表示平滑度，同时推导出其曲率约束关系式

这里曲率约束的关系式是非线性的，如果考虑曲率约束的话只能采用非线性优化进行求解，在参考线平滑算法中，参考线一般来自地图的车道线，但是它曲率本身就是比较小的，另外应用于参考线平滑点的数量比较多，对实时性的要求比较高，所以参考线平滑算法采用了不考虑曲率约束的二次规划问题进行求解，但是对于开放空间算法，参考路径是来自于混合A*搜索的结果，参考路径本身的曲率就是比较高的，就必须把曲率约束考虑进来。Apollo中采用了一种SQP的二次规划算法来解决非线性的约束问题。

首先对约束函数进行线性化(泰勒展开，保留一次项，但是需要求解点附近的一个参考点X0的函数值和导数值)：

可以采用上次平滑的结果作为本次的参考点，同时对优化点增加一个可信区间约束：

避免上次规划点和这次约束过远。

以上为Sub-problem的过程。

在SQP外层为Penalty iteration，是一个曲率惩罚的循环，是对曲率的软约束，如果存在违背曲率约束的求解的话，就会调高曲率约束的松弛变量，对权重进行平滑，所以优化问题简化为如下的二次规划问题。这里优化函数包含两项，第一项为相邻两点的平滑度的代价，第二项是曲率约束的松弛变量，这里前两个约束分别是起点和终点，要和给定的起点和终点坐标相同，第三个约束是起始点航向角，方向要和给定的方向要相同，第四个约束是终点的航向角和给定的航向角相等，第五个和第六个约束是坐标要在给定的矩形框之内，矩形框大小主要是在外层的Collison Check循环当中进行更新，第七个和第八个约束是使坐标要在可信区间范围内，主要是保证在Sub-problem中每次迭代优化结果都不会偏离太远，即保证曲率线性化约束的准确性，第九个约束是曲率约束的线性化求解函数，就是之前泰勒展开的函数，其输入包括上次规划的结果作为当前规划的参考节点，最后一个约束是松弛变量约束，保证松弛变量大于等于0.

以下为DL-IAPS算法对OPEN SPACE PLANNER的整体架构：

首先是通过OPEN SPACE ROI decider确定一个可行驶的区域，然后通过混合A*算法搜索出一条粗糙的轨迹，然后通过DL-IAPS算法对粗糙轨迹的路径进行平滑得到一条满足曲率约束且无碰撞的路径，接下来对平滑后的路径进行一个速度规划，最后生成一条轨迹。上图中包含了对各算法计算时间的统计。

AI新纪元：2025年深度学习技术突破与行业应用全景像素笔记杂谈人工智能深度学习 ai 自动驾驶工业数字化转型未来趋势技术创新
2025年，人工智能技术迎来爆发式增长，大模型、生成式AI和多模态技术持续突破，人形机器人量产元年正式开启，自动驾驶商业化进程加速，工业数字化转型全面铺开。这些进展不仅重塑了技术边界，更在多个行业创造了实际价值，推动AI从实验室走向产业化。本文将深入剖析2025年深度学习与AI领域的核心技术突破、行业应用案例及未来发展趋势，为技术从业者提供全面视角。一、深度学习核心技术突破：大模型、生成式AI与多
雨天障碍物漏检？陌讯多模态算法实测 98% 准确率 2501_92474711 算法目标跟踪人工智能计算机视觉
开篇痛点：自动驾驶视觉系统的“暗礁”在自动驾驶感知层，路面障碍物识别堪称“生命线工程”。传统视觉算法在复杂场景下常面临三重困境：雨天水雾导致特征模糊时漏检率高达25%，逆光环境下小目标（如碎石、井盖）检出率不足60%，而追求高精度又会导致帧率跌破20FPS，难以满足实时性要求[1]。某车企实测数据显示，传统YOLOv8在城郊混合路况中，因障碍物识别延迟引发的决策偏差占测试事故的37%，这些问题成为
CAN总线模组选购指南：2025年全球CAN产品品牌与CAN-bus方案盘点
随着工业物联网（IIoT）、智能制造和自动驾驶技术的快速发展，CAN（ControllerAreaNetwork）总线已经成为工业控制、汽车电子和智能设备领域的重要通信协议之一。CAN总线模块作为实现设备间实时通信与高可靠性数据传输的核心组件，其选购对于系统稳定性和性能至关重要。本文基于权威市场数据平台的分析，盘点了2025年全球主流CAN总线模块品牌及其解决方案，帮助工程师和系统集成商选择最佳产
BEV+Transformer Monkey PilotX 自动驾驶 transformer 深度学习人工智能
在自动驾驶系统中，BEV（Bird’sEyeView）+Transformer主要应用于感知与环境建图（Perception&SceneUnderstanding）环节，尤其是在多传感器融合、目标检测、语义分割、轨迹预测等任务中。在自动驾驶中的关键应用场景应用环节BEV+Transformer的作用感知（Perception）多摄像头图像融合成BEV视角，进行目标检测、语义分割预测（Predict
自动驾驶激光3D点云处理系统性阐述及Open3D库函数应用一碗白开水一 DPL 自动驾驶 3d 人工智能
一、自动驾驶激光3D点云处理的核心挑战与流程自动驾驶系统依赖激光雷达（LiDAR）生成的高精度3D点云数据实现环境感知，其处理流程需解决以下核心问题：数据规模与实时性：现代LiDAR每秒生成数百万点，需在毫秒级完成处理以支持决策。动态环境适应性：需区分静态障碍物（如道路、建筑）与动态目标（如车辆、行人）。多传感器融合：与摄像头、雷达数据时空对齐，构建统一环境模型。典型处理流程分为四个阶段：原始点云
知识表示与推理：AI智能的核心技术 AIGC应用创新大全人工智能 easyui 前端 ai
知识表示与推理：AI智能的核心技术1.引入与连接：AI如何"思考"世界？想象一下，当你询问智能助手："我明天需要带伞吗？"它如何得出答案？它需要理解"带伞"与"天气"的关系，需要获取天气预报信息，需要推断明天的天气状况，最终综合这些"知识"给出建议。这一看似简单的过程，背后正是AI的核心能力：知识表示（如何"记住"信息）和推理（如何"思考"问题）。从Siri到AlphaGo，从推荐系统到自动驾驶，
迁移学习让深度学习更容易城市中迷途小书童
摘要：一文读懂迁移学习及其对深度学习发展的影响！深度学习在一些传统方法难以处理的领域有了很大的进展。这种成功是由于改变了传统机器学习的几个出发点，使其在应用于非结构化数据时性能很好。如今深度学习模型可以玩游戏，检测癌症，和人类交谈，自动驾驶。深度学习变得强大的同时也需要很大的代价。进行深度学习需要大量的数据、昂贵的硬件、甚至更昂贵的精英工程人才。在ClouderaFastForward实验室，我们
51c自动驾驶~合集10
#端到端任务说起端到端，每个从业者可能都觉得会是下一代自动驾驶量产方案绕不开的点！特斯拉率先吹响了方案更新的号角，无论是完全端到端，还是专注于planner的模型，各家公司基本都投入较大人力去研发，小鹏、蔚来、理想、华为都对外展示了其端到端自动驾驶方案，效果着实不错，非常有研究价值。为什么需要端到端？首先我们聊一下当前的主流自动驾驶方案，主要核心部分包括：感知模块、预测模块、规控模块。每个模块相对
51c自动驾驶~合集9 吃着火锅唱支歌自动驾驶人工智能机器学习
#端到端1说起端到端，每个从业者可能都觉得会是下一代自动驾驶量产方案绕不开的点！特斯拉率先吹响了方案更新的号角，无论是完全端到端，还是专注于planner的模型，各家公司基本都投入较大人力去研发，小鹏、蔚来、理想、华为都对外展示了其端到端自动驾驶方案，效果着实不错，非常有研究价值。为什么需要端到端？首先我们聊一下当前的主流自动驾驶方案，主要核心部分包括：感知模块、预测模块、规控模块。每个模块相对独
ONNX模型使用指南：从零开始掌握跨领域模型部署
ONNX模型使用指南：从零开始掌握跨领域模型部署ONNX模型作为一种开放式的神经网络交换格式，已成为AI模型部署的行业标准。当您获得一个没有使用说明的ONNX模型时，可以通过系统化的分析和部署流程，使其在不同领域发挥作用。本文将详细阐述如何分析模型结构、配置运行环境、准备特定领域输入数据、执行推理并处理结果，同时提供图像分类、自然语言处理、医疗影像分析、金融风控和自动驾驶等领域的具体应用示例，帮助
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例你喜欢喝可乐吗？ deep learning deploy 深度学习 YOLO 目标检测
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例深度学习模型从开发到部署的完整流程包含需求分析、数据准备、模型训练、模型优化、模型测试和部署运行六大核心环节。YOLOv11作为新一代目标检测模型，不仅延续了YOLO系列的高效实时性能，还在检测精度和泛化能力上取得显著突破，使其成为工业质检、安防监控、自动驾驶等领域的理想选择。本文将详细阐述这一完整流程，并结合YOLOv11的具体实现，提
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
铸造软件交付的“自动驾驶”系统——AI大模型如何引爆DevOps革命 LucianaiB 评测人工智能自动驾驶 devops
铸造软件交付的“自动驾驶”系统——AI大模型如何引爆DevOps革命嗨，我是LucianaiB！总有人间一两风，填我十万八千梦。路漫漫其修远兮，吾将上下而求索。摘要(Abstract)本文深入探讨了人工智能大模型（AILargeModels）如何驱动DevOps从“自动化”（Automation）向“自主化”（Autonomous）的革命性跃迁。文章指出，AI大模型正成为现代软件工厂的“中枢神经系
小型化与低功耗工业数据采集卡的在哪些行业有强劲需求？番茄老夫子数据采集卡
小型化与低功耗工业数据采集卡在汽车、医疗、能源等多个行业有着强劲需求，以下是具体介绍：汽车行业：在汽车电子系统中，如电池管理系统、电机控制和自动驾驶系统等，需要采集大量传感器数据。小型化低功耗的数据采集卡可轻松嵌入汽车内部紧凑空间，且能在车辆长时间运行中保持低能耗，例如用于实时监控车载网络信号，优化ECU性能，同时满足汽车对零部件小型化、轻量化以及节能的要求。医疗行业：医疗设备如呼吸机、心脏监测仪
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
BEV开山之作Lift-Splat-Shot (LSS) 深度详解 shuaishuaideyuzi 3D视觉入门人工智能 python pytorch 3d 计算机视觉
在自动驾驶感知系统中，将多视角图像转换为鸟瞰图（BEV）是一个关键步骤。Lift-Splat-Shot（LSS）是一种高效的视角转换方法，能够将透视视图特征转换为BEV空间，从而实现更准确的3D物体检测。本文将详细解析LSS的工作原理、技术细节及其应用场景。一、LSS概述LSS（Lift-Splat-Shot）是由PhilippHenzler等人于2021年提出的一种用于自动驾驶感知系统的视角转换
自动驾驶环境感知：天气数据采集与融合技术实战遥感研究森1024 实时天气气象智能驾驶
天气与我们日常各类生活场景密不可分，在驾驶场景里当车主发动汽车准备驶向目的地时，窗外的阴晴或许只是直观感受，而真正影响驾驶安全与行程效率的，可能是几公里外的突发暴雨、桥面的结冰预警，或是前方路段的强侧风等级。在智能出行成为趋势的今天，手机App与车机系统的无缝联动，正让天气数据从“泛泛的播报”升级为“贴身的指引”。要实现这一体验跃升，关键在于筛选出那些与驾驶场景深度绑定的天气信息——它们不仅需要精
【自动驾驶】经典LSS算法解析——深度估计 IRevers 个人学习笔记自动驾驶算法人工智能深度学习 python 机器学习
LSS-Lift.Splat,Shoot论文题目：Lift,Splat,Shoot:EncodingImagesFromArbitraryCameraRigsbyImplicitlyUnprojectingto3D代码：https://github.com/nv-tlabs/lift-splat-shoot概括：先做深度估计和特征融合，然后投影到BEV视图中，在BEV视图中做特征融合，在融合后的特
BEV感知算法：自动驾驶的“上帝视角“革命 fmvrj34202 算法
在自动驾驶技术快速发展的今天，BEV（Bird'sEyeView，鸟瞰图）感知算法正成为行业关注的焦点。这项突破性技术通过将多传感器数据统一映射到鸟瞰视角，为自动驾驶系统构建了前所未有的全局环境认知能力，堪称自动驾驶领域的"上帝视角"革命。BEV的核心技术原理BEV感知算法的核心在于将来自摄像头、激光雷达等不同传感器的异构数据，通过深度学习网络统一转换到俯视坐标系。这一过程主要依靠三大关键技术：多
AIGC与自动驾驶：文心一言的车载交互设计 AI天才研究院 ChatGPT 实战计算 Agentic AI 实战 AIGC 自动驾驶文心一言 ai
AIGC与自动驾驶：文心一言的车载交互设计关键词：AIGC、自动驾驶、车载交互、文心一言、自然语言处理、多模态交互、用户体验摘要：本文深入探讨人工智能生成内容（AIGC）技术在自动驾驶领域的创新应用，特别是百度文心一言如何重构车载交互体验。通过解析文心一言的核心技术架构、多模态融合算法、场景化交互模型，结合具体代码实现和数学模型，揭示其在语音交互、情境理解、个性化服务等场景中的技术优势。同时通过项
【论文笔记】GaussianFusion: Gaussian-Based Multi-Sensor Fusion for End-to-End Autonomous Driving
原文链接：https://arxiv.org/abs/2506.00034v1简介：现有的多传感器融合方法多使用基于注意力的拉直(flatten)融合或通过几何变换的BEV融合，但前者可解释性差，后者计算开销大（如下图(a)(b)所示）。本文提出GaussianFusion（下图(c)），一种基于高斯的多传感器融合框架，用于端到端自动驾驶。使用直观而紧凑的高斯表达，聚合不同传感器的信息。具体来说，
为什么选择ER-GNSS/MINS-07？——低成本高精度的组合导航解决方案
导航技术的痛点：单一系统难以应对复杂环境无论是自动驾驶汽车、无人机巡检，还是精准农业、飞行记录仪，高精度、高可靠的导航都是核心需求。然而，传统导航技术各有短板：卫星导航（GNSS）：信号易受遮挡（如城市峡谷、隧道），且易受干扰或欺骗。惯性导航（INS）：自主性强，但误差随时间累积，几分钟后定位漂移。多源融合：组合导航的“智慧大脑”组合导航系统（GNSS/INS）通过多源传感器融合，结合卫星导航的长
模型融合与人机协同：构建人机共生的智能未来 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍在科技日新月异的今天，人工智能（AI）已经成为了我们生活中不可或缺的一部分。从智能手机，到自动驾驶汽车，再到医疗诊断，AI的应用已经渗透到了我们生活的方方面面。然而，尽管AI的发展已经取得了显著的成就，但是我们仍然面临着一个重大的挑战：如何让AI系统更好地理解和适应人类的需求，以实现人机共生的智能未来。为了解决这个问题，越来越多的研究者开始探索模型融合和人机协同的方法。2.核心概念与联
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
人工智能怎么入门？零基础入门指南：从小白到AI实战者的第一步 OpenCV图像识别人工智能人工智能计算机视觉自然语言处理神经网络机器学习
人工智能（AI）是当今最具前景的科技领域之一。从聊天机器人到自动驾驶，从图像识别到语音翻译，AI正在以前所未有的速度改变世界。但对于初学者来说，一个最常见的问题是：“我没有基础，也不是学数学或计算机的，人工智能还能学吗？我该怎么入门？”答案是：可以学，而且你并不孤单。越来越多的人正在以“跨专业、转行、自学”的方式进入AI领域。关键是，你需要一个清晰的入门路径，理解应该先做什么、学什么、避开什么误区
自动驾驶感知系统三十度角阳光的问候自动驾驶人工智能机器学习
目录感知传感系统介绍定位技术介绍自动驾驶感知传感系统激光雷达原理激光雷达类型激光雷达测距原理知名供应商介绍毫米波雷达超声波雷达工作原理超声波雷达类型常见自动驾驶传感器品牌及产品感知传感系统介绍利用摄像头捕捉图像信息，如道路标志、交通信号、车辆、行人等，为自动驾驶系统提供决策依据。通过发射激光束并测量反射时间，计算周围物体的距离和位置，提供高精度信息和三维地图。利用毫米波电磁波检测短距离障碍物，测量
自动驾驶ROS2应用技术详解陈纬度啊 AutoCar 自动驾驶 unix 人工智能
自动驾驶ROS2应用技术详解目录自动驾驶ROS2节点工作流程自动驾驶感知融合技术详解多传感器数据同步技术详解ROS2多节点协作与自动驾驶系统最小节点集1.自动驾驶ROS2节点工作流程1.1感知输出Topic的后续处理在自动驾驶系统中，感知节点输出的各种Topic会被下游的不同模块消费和处理：安全监控模块控制执行模块规划决策模块感知融合模块感知输出TopicSafetyMonitor安全监控Emer
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

5.开放空间规划算法解析及实现

你可能感兴趣的:(自动驾驶)