动态窗口法(DWA)主要是在速度空间中采样多组速度,并模拟机器人在这些速度下一定时间内的轨迹。在得到多组轨迹以后,对这些轨迹进行评价,选取最优轨迹所对应的速度来驱动机器人运动。
动态窗口法将移动机器人的位置控制转换为速度控制。在利用速度模式对机器人运动轨迹进行预测时,首先需要对机器人的运动模型进行分析[1]。移动机器人采用的是两轮差速模型, v ( t ) 和 ω ( t ) v(t)和ω(t) v(t)和ω(t)分别代表机器人在世界坐标系下的平移速度与角速度,反映了机器人的运动轨迹。在机器人的编码器采样周期 Δ t Δt Δt内,位移较小,机器人作匀速直线运动,则机器人运动模型为:
x ( t ) = x ( t − 1 ) + v ( t ) Δ t cos ( θ ( t − 1 ) ) y ( t ) = y ( t − 1 ) + v ( t ) Δ t sin ( θ ( t − 1 ) ) θ ( t ) = θ ( t − 1 ) + ω ( t ) Δ t \begin{array}{l}x(t) = x(t - 1) + v(t)\Delta t\cos (\theta (t - 1))\\y(t) = y(t - 1) + v(t)\Delta t\sin (\theta (t - 1))\\\theta (t) = \theta (t - 1) + \omega (t)\Delta t\end{array} x(t)=x(t−1)+v(t)Δtcos(θ(t−1))y(t)=y(t−1)+v(t)Δtsin(θ(t−1))θ(t)=θ(t−1)+ω(t)Δt式中 x ( t ) 、 y ( t ) 、 θ ( t ) x(t)、y(t)、θ(t) x(t)、y(t)、θ(t)———t时刻机器人在世界坐标下的位姿。
动态窗口法将避障问题描述为速度空间中带约束的优化问题,其中约束主要包括差速机器人的非完整约束、环境障碍物的约束以及机器人结构的动力学约束。DWA算法的速度矢量空间示意图如图1-1所示,横坐标为机器人角速度 ω ω ω,纵坐标为机器人线速度 v v v,其中 v max {v_{\max }} vmax、 v min {v_{\min }} vmin为机器人最大、最小线速度, ω max {\omega _{\max }} ωmax、 ω min {\omega _{\min }} ωmin为机器人最大、最小角速度;整个区域为 v s {v_{s }} vs,所有白色区域 v a {v_{a }} va为机器人安全区域, v d {v_{d }} vd为考虑电机扭矩在控制周期内限制的机器人可达速度范围, v r {v_{r }} vr为上述3个集合的交集最终确定的动态窗口。
在速度矢量空间 V r {V_{r}} Vr中,根据线速度、角速度采样点数,将连续的速度矢量空间 V r {V_{r}} Vr离散化,得到离散的采样点 ( v , ω ) (v,ω) (v,ω)。对于每一个采样点,根据机器人运动学模型预测下一时刻机器人的多个运动轨迹生成,如图1-2所示。
在采样的速度组中,有若干组轨迹是可行的,因此采用评价函数的方式为每条轨迹进行评价,采用的评价函数如下: G ( v , ω ) = σ ( α H e a d i n g ( v , ω ) + β O b s t a c l e ( v , ω ) + γ V e l o c i t y ( v , ω ) ) G(v,\omega ) = \sigma (\alpha Heading(v,\omega ) + \beta Obstacle(v,\omega ) + \gamma Velocity(v,\omega )) G(v,ω)=σ(αHeading(v,ω)+βObstacle(v,ω)+γVelocity(v,ω))
方位角评价函数 H e a d i n g ( v , ω ) Heading(v,ω) Heading(v,ω)——方位角不断地朝向终点位置函数。 在移动过程中, H e a d i n g ( v , ω ) Heading(v,ω) Heading(v,ω)函数用于使机器人的朝向不断趋向终点方向, θ θ θ越小,说明与终点的方位角越小。
障碍物评价函数 O b s t a c l e ( v , ω ) Obstacle(v,ω) Obstacle(v,ω)——评价机器人轨迹到障碍物距离函数。体现了机器人的避障能力,如果机器人的轨迹到障碍物的距离大于机器人半径,则没有发生碰撞的危险;
反之,就说明碰撞风险大,舍弃这条轨迹。
速度评价函数 V e l o c i t y ( v , ω ) Velocity(v,ω) Velocity(v,ω)
最后对评价函数进行归一化处理(Why?):
譬如对于障碍物距离评价标准,机器人传感器检测到的最小障碍物距离在二维空间中是不连续的,这种评价标准将导致评价函数不连续,也会导致某个项在评价函数中太占优势,因此将它们进行平滑处理
。
归一化处理方法: 每一项除以每一项的总和
n o r m a l _ h e a d ( i ) = h e a d ( i ) ∑ i = 1 n h e a d ( i ) n o r m a l _ d i s t ( i ) = d i s t ( i ) ∑ i = 1 n d i s t ( i ) n o r m a l _ v o l o c i t y ( i ) = v o l o c i t y ( i ) ∑ i = 1 n v o l o c i t y ( i ) \begin{array}{c}normal\_head(i) = \frac{{head(i)}}{{\sum\limits_{i = 1}^n {head(i)} }}\\normal\_dist(i) = \frac{{dist(i)}}{{\sum\limits_{i = 1}^n {dist(i)} }}\\normal\_volocity(i) = \frac{{volocity(i)}}{{\sum\limits_{i = 1}^n {volocity(i)} }}\end{array} normal_head(i)=i=1∑nhead(i)head(i)normal_dist(i)=i=1∑ndist(i)dist(i)normal_volocity(i)=i=1∑nvolocity(i)volocity(i) 其中, n n n为采样的所有轨迹, i i i为待评价的当前轨迹。
三者构成的评价函数的物理意义是:在局部导航过程中,使得机器人避开障碍,朝着目标以较快速度行驶
。
Dieter Fox[2]在文章中给出了评价指标可视化的图像(图1-6)。
[1]劳彩莲,李鹏,冯宇.基于改进A*与DWA算法融合的温室机器人路径规划[J].农业机械学报,2021,52(01):14-22.
[2]Dieter Fox,Wolfram Burgard,Sebastian Thrun. The dynamic window approach to collision avoidance.[J]. IEEE Robot. Automat. Mag.,1997,4(1).