这篇论文主要介绍了三种算法,分别是
1. Dynamic Replanning Algorithms:就我们常说的动态规划算法,论文中主要以D* Lite为例进行了简单的介绍。
2. Anytime Algorithms:这一类算法不要求规划出最小代价路径,而要求在有限的时间内规划出一个epsilon-suboptimal solution,可以理解为一个次优解。
3. Anytime Dynamic A* (记作:AD*): 结合上面D* Lite算法和ARA*算法提出的一种新的算法。
D* Lite算法主张规划出一个从起点到终点的最小代价路径。为此,算法中提出了2个估计值,分别是:
g(s) --- > 表示 结点s到goal结点的代价估计值
rhs(s) --->表示 a one-step lookahead cost:
其中Succ(s)表示s的后向结点集合,c(s,s')表示从结点s到s'的代价,即我们常说的路权。
详细了解可以阅读论文
下面是D* Lite算法伪代码:
这里主要介绍的是一种与规划时间有关的A*-based算法。在很多情况下,最短路径不一定就是我们想要的,还需要考虑时间等因素。在有限的时间内得到好的、可行的结果才是我们想要的。ARA*算法就是解决这类问题的。
在学习A*算法时我们了解到: f(n)=g(n)+h(n)中关于h(n)的选取:
用d(n)表达状态n到目标状态的距离,那么h(n)的选取大致有如下三种情况:
1 如果h(n)< d(n)到目标状态的实际距离,这种情况下,搜索的点数多,搜索范围大,效率低。但能得到最优解。
2 如果h(n)=d(n),即距离估计h(n)等于最短距离,那么搜索将严格沿着最短路径进行, 此时的搜索效率是最高的。
3 如果 h(n)>d(n),搜索的点数少,搜索范围小,效率高,但不能保证得到最优解。
第三种情况说到,当h(n)>d(n)的时候,会搜索较少的点,快速的产生一个解。ARA*算法就是用到了这一点(至少我是这样理解,如有误,欢迎指出)
key(s)的计算中,它用到了epsilon*h(Sstart,S),且epsilon>1(比如后面的实验中用到的2.5,1.5).此时快速得到一个解,然后减小epsilon的值,继续规划新的更好的解(epsilon=1)。如果给出的限定时间到了,则输出当前的最新可行解(epsilon-suboptimal solution)。
论文中关于epsilon如何减小没有提到。
As shown in the previous sections, there exist efficient algorithmsfor coping with dynamic environments (e.g. D* andD* Lite), and complex planning problems (ARA*). However,what about when we are facing both complex planningproblems and dynamic environments at the same time?
AD*算法就是结合了上面两种情况提出的新算法,算法伪代码如下: