原文:A spatio-temporal constrained hierarchical scheduling strategy for multiple warehouse mobile robots under industrial cyber–physical system
发表于Advanced Engineering Informatics
工业信息物理系统(ICPS)框架可以减少计算量,提高任务效率。研究了多仓库移动机器人(multi-WMRs)基于icp的调度策略。首先,在拓扑地图建模中考虑可能存在的拥塞问题,将其转化为新的路径时间成本指标。其次,每个机器人独立执行路径规划算法,实现分布式路径计算,兼顾时间成本和目标距离;改进的任务分配策略包括任务评估和决策,它们被认为是规划的一部分,有助于提高任务效率。最后,将完整的调度过程应用到新的ICPS体系结构中,包括成本评估、路径规划、任务分配和碰撞避免。在数值实验中,该方法的任务效率较前作提高了24.8%,较前作提高了14.59%。平均拥堵时间比传统方法缩短了28.41%,规划时间比传统方法缩短了10.13%。
关键字:工业信息物理系统(ICPS);分层调度;仓库移动机器人(WMR);地图建模;任务分配;启发式路径规划
针对上述问题,我们提出了相应的基于ICPS层的解决方案:(1)多wmr(warehouse mobile robot,仓库移动机器人)系统的地图建模过程考虑了可能的时间成本。同时,最优概率解避免了复杂的建模。(2)改进的启发式路径规划考虑了一种新的层次策略,包括时间成本和距离的评估。目的是在一定程度上减少路径网络的拥塞,提高任务效率。(3)实现了改进的任务分配策略,包括任务入口的路径评价和任务优先级。(4)将主要算法以不同的结构部署在icp中,大大提高了计算效率和实时性。
其余部分的组织如下。第二部分阐述了相关研究。第3节描述了改进的调度策略,包括地图建模、路径规划、任务评估和决策以及icp框架。第四节对实验结果进行了详细分析。第五部分总结了本文的工作,并对未来的相关研究进行了展望。
移动机器人集群在仓储领域被广泛使用。亚马逊的Kiva机器人已经实现了成熟的机器人移动履行系统(RMFS)[13], [21]。多个移动机器人根据任务指令自主移动,实现了 "货到人 "的模式,具有高效、精准、快速、灵活的任务特点。Kiva系统是升降式集装箱存储的典型应用。Yang等人研究了多移动机器人在物流分拣中的应用,是一种 "货到付款 "的传输模式[15]。多移动机器人系统的灵活性和传输的灵活性大大提升了仓库的分拣效率。Guney等人实现了多AGV协作分拣系统的抽象和映射,其中包括AGV工作场景和计算机中的机器人本身模型[22]。充电区和停车区等区域被包含在拓扑图中以模拟实际场景。改进的动态运动规划器旨在减少或消除AGV的碰撞。Zhong等人进一步研究了多个AGV系统的调度问题,包括避免冲突和路径规划[23]。混合综合规划模型是基于纯运动路径,不包括AGV的充电、维护和停靠区域,旨在提高AGV任务过程的效率。此外,改进后的路径规划算法可以显著提高整个任务效率。Keung等人深入研究和探索了RMFS中改进的机器人调度和在线订单生成策略。具体来说,机器人流程自动化(RPA)和基于云的网络物理系统(CPS)的组合模式有效地提高了运行效率[24]。此外,改进的订单批处理方法进一步优化了电子商务系统的效率[25]。
此外,研究对CPS(ICPS)建模的可靠性、衍生技术及其应用做出了贡献。Hu等人提出了一个基于CPS的交通控制模型,结合行为树(BT)和强化学习(RL)来实现多代理(AGV)的联合操作[26]。AGV和交通指挥员被定义为特定的代理,他们相互之间自主合作。控制指令在CPS的不同CL中实现,以确保系统的效率、及时性和安全性。在[27]中,一个CPS方法被应用于一个制造车间系统。CPS和智能机器代理(SMA)相结合的方法可以实现智能模型和制造资源的紧密结合,促进大规模工业系统的灵活性和稳健性。Zhang等人设计了一个用于物料搬运的CPS-AGV智能控制模型[28]。物理层配置基于CPS的AGV,网络层处理信息,而系统层提供关键的实时应用。分层的传输结构明显提高了任务效率和道路利用率。在[20]中,Lian等人提出了一种适合多分类机器人系统的CPS建模方法。冲突避免和路径规划分别部署在控制层和物理层,以实现更灵活的控制策略。Lee等人基于网络物理系统的5C模型构建了RMFS和动态无冲突策略[10]。基于云的技术主要用于优化计算资源的分配。CPS的网络层被视为系统云,它包含控制和调度多个移动机器人的主要算法。在[29]中,提出了一个与数字孪生技术相结合的多AGV物料运输系统建模。在计算能力和任务效率的约束下,在关键环节(物理层中生产单元的机器决策时间)使用了数字孪生(全息映射),这可以看作是物理层到控制层的部分映射。Althobaiti等人提出了一种基于ICPS的工业数据安全的入侵检测方法[30]。该检测算法被部署在传感器和执行器网络集群的通信层,有效地进行数据监控,并确保网络系统的控制可靠性。Sinha等人证明了ICPS建模在复杂机器人系统中的有效性[31]。物理层的传感器数据全部传输到中央控制器,在这里实现集中调度操作。多执行器不具备计算功能,联合行动特性成为系统(控制层)的共享信息。在[32]中,一个分层的算法部署架构被应用于工业移动机器人。用于机器人定位的视觉解析算法被部署在物理层,由机器人独立执行。控制层负责精确定位后的轨迹生成和跟踪。
Riazi等人在改进现有Benders分解方法的基础上,提出了一种新的启发式算法,该算法可以在具有数百个节点和弧线[33]的真实布局中调度agv。Xin等人利用时空网络(TSN)模型[34]将路由规划转化为混合整数规划(MIP)问题。它可以提供高质量的调度解决方案,实现无冲突。Demesure等人将运动规划器与调度器相结合,为agv[35]规划路径。该策略分为两个步骤,即生成假定轨迹和计算无碰撞轨迹,结果证明了该方法的有效性。Liu等提出了分级结构[36]。多机器人系统的调度由路径规划层和运动协调层实现。仿真实验验证了分层结构的实用性。Wang等人提出了一种基于编队控制的规划方法[37]。该方法将多智能体集群转化为精确的数学控制模型,并在规划指标[38]约束下得到最优解。将机器人视为理想粒子,集中计算和规划过程更注重解决多主体之间的时变和非线性问题。Digani等人提出了一种基于层次结构[39],[40],[41]的启发式规划策略。具体而言,规划分为路径评估和路径生成,其中使用MPC和D*算法。预测控制方法提供了机器人的拥塞状态,有利于规划算法对新路径的快速评估。Lian等人进一步采用CPS建模,将分层规划算法的执行过程部署在系统的不同层[20]。具体来说,基于路径时间损失和拓扑图建模的基础,在每台AGV的物理层上部署启发式路径规划算法。在控制层实现了改进的冲突避免策略,基于时间队列的排队策略提高了交叉节点的顺序。系统效率的提高和计算负荷的减少表明了基于cps的规划系统的可靠性,也指导了这项工作。进一步研究分析了规划过程中的评价指标(评价函数)[42]。单一的时间指标可能导致AGV冲突后的无序运动,不利于系统的任务效率和安全。因此,改进后的模型增加了目标距离,有效地提高了任务效率,并在一定程度上减少了死锁。另一方面,系统中多个移动机器人的停车时间和死锁次数并没有得到明显改善,这也是本研究需要解决的问题之一。
在任务分配方面,Shriyam等人提出了一种适合多机器人团队的任务分配方法,有效地减少了机器人的任务周期[43]。该算法是启发式的,特别适用于存在潜在应急任务的情况。在处理突发任务时,主动式方法优于保守式和反应式方法。Zhang等人通过改进零星任务的可调度性分析和优先级分配,提高了固定优先级非抢先式调度(FPNS)的效率[44]。该方法考虑到了任务在时域中的优先级。Sun等人考虑到任务间的优先级约束,实现了一个支持移动边缘计算(MEC)的架构,以最小化响应时间。该方法基于工业物联网(IIoTs),有效降低了任务生成过程中的延迟[45]。Tan等人研究了垂直分拣系统中的分拣问题[46]。建立了一个混合整数线性编程模型来最小化总分拣时间,并确定了目的地、分拣站和AGV的分配。
最近的研究已经证实了启发式算法和分层规划的有效性。在本节中,首先实现了一种考虑到可能的时间成本的地图建模方法。时间成本评估的概率解决方案被进一步部署在路径规划和任务评估中。最后,详细讨论了基于ICPS的算法部署架构。
多WMR已被广泛用于工业生产中。图3显示了仓储和物流分拣等典型应用以及研究中相应的拓扑图。根据任务体系,移动机器人要实现吊装集装箱或包裹的传输,其运动空间是固定的。一个完整的传输应包括货物筛选、包装、存储、机器人充电、维护、待机等区域,通常分布在多WMR任务空间的边缘或其他独立区域[10],[13]。关于机器人传输(分拣)效率的研究主要集中在货物入口和出口,这可以反映出设计的调度、计划、避障和任务分配策略的性能[20], [23]。本工作中的建模和仿真是基于多WMR物流分拣,实验配置来自于目前的应用[13], [15]。
[39]、[40]、[41]中的方法有效地使用了层次结构。MPC用于估计路径网络中可能出现的拥塞,这是一个必要的步骤,直接作为下一步规划的基础。选择一个合理的评价基础是至关重要的。
在实际应用中,WMR的工作地点通常为固定的[33],包括固定的出入口和路径。不同的wmr各自独立执行任务,地层控制[37]、[38]策略可能降低系统灵活性,不适用。此外,机器人与环境之间的强非耦合性也非常突出。如果由于某种原因(如交通拥堵),WMR频繁启动和停止,则该机器人(WMR)似乎与环境中的拥堵状态强耦合。因此,使用精确的数学建模方法是复杂的。在这项工作中,建模和指标的选择是基于映射本身:路径弧的WMR占用的时间。如图4所示,拓扑图包括路径弧和转弯节点。节点用于WMR定位,圆弧是节点之间固定的双向路径。相应的,在节点或弧线的联合占用中,wmr之间可能会发生冲突。N,A,C(t)分别表示节点、弧和路径弧代价的集合,则图4所示的映射可抽象为:
其中,I和j是上限数。[to, te]为时间记录间隔。
由于WMR运动的不确定性,C(t)随时间变化。它反映了地图中的拥塞状态,描述了WMRs的运动轨迹特征,WMRs是机器人与环境之间的纽带。对于地图环境,指标值越大反映的交通拥堵越严重,类似于[39-41]中评估机器人的空间位置,将用于下一步的路径规划。由于任务启动和停止造成的WMR的不确定性也会体现在时间成本上,所以C(t)是一个随机的时间过程。虽然基于时间的指标可以连续反映地图的状态,但对于随机变量,精确的数学建模(概率分布函数或密度函数)复杂且计算量大,可能会影响实时评价(圆弧状态)。此外,C(t)的形成过程通常是非线性的、时变的或无规则的,这将在实验部分进行描述。
启发式规划算法对于机器人(无论是移动机器人还是机械手)的路径规划[40]是可靠的。路径规划的主要目的是根据预先设定的评价指标估计出最优路径,以保证机器人运动成本最低。启发式规划算法,如传统的A*算法[20],其评价函数为f(n) = g(n) +ℎ(n) (n为当前位置),可以根据已经生成的成本和未来路径可能的成本(如距离)来评估路径的价值。搜索过程通常以节点的方式进行步进。
本文对启发式A*算法进行了改进,主要增加了适用于多wmr的评价指标,即上述地图建模中的时间成本。同时,在前面工作[20]的基础上,引入了到目的地的距离指标。
需要注意的是,WMR路径必须是连续的,设置的评价指标必须是可实现的(通常是非负值)。因此,保持传统A*算法的启发式函数形式是合理的。改进的启发式评价函数为:
其中, 为路径时间代价统计区间中的时刻。
改进的启发式功能包括生成的路径成本和未来的成本评估。所有的评估过程都是在时域中进行的。因此,我们考虑起始节点和当前位置之间的曼哈顿距离(用WMR速度转换为时间值),弧线上的时间成本,以及可能的转弯时间成本。表示为:
其中, 和 ℎ 分别是过去路径中弧线和转弯节点的上限。
(4)是一种比较常见的情况,考虑到在WMR运动过程中经过的弧线和转弯节点。(5)是一种特殊情况,即任务入口和出口在同一条水平线上(例如,图4中入口1和出口A、B之间的关系)。也就是说,在转弯时没有时间成本。这两种情况都需要考虑,这符合启发式规划的要求。也就是说,计算出的成本应该在最大程度上与真实价值相匹配。
然后,进行成本评估
其中,是未来路径弧线在周期内的预期时间成本值是目标和当前位置之间的距离, 是未来路径中弧线的上限。
在[20]中,评估过程主要考虑未来路径的时间成本。它可以显著减少路径网络中多wmr的不必要拥塞,路径利用效率的提高可以直观地解释这一点。然而,与[39 - 41]类似,多wmr可能无序移动。仅依靠评估空间拥堵或时间成本可以避免拥堵,然后将机器人分配到空闲路径,不利于任务效率。另外,在之前的空闲路径上可能会同时聚集多个机器人,这无疑增加了安全隐患。在实验部分,我们将进行进一步的分析,特别是任务效率和死锁指标。
按照优先级[19]分配任务是合理的,在不同的应用场景中选择相应的评价指标[43-45]。无论是考虑任务生成时间最短,还是考虑到任务入口距离最短,都是从任务需要本身开始的。任务分配过程独立于其他调度部分,在一定程度上减少了内部调度的耦合。直观的负面影响是在任务入口[20]附近产生更多的拥塞,直接影响系统任务效率和机器人安全。基于地图建模和路径规划,本研究试图建立新的评价指标,以增加全局任务分配的积极影响。
如果 为任务入口到WMR的距离,路径代价(时间代价),任务优先级。最优任务分配策略应使总成本最小化。该评估策略包括时间、空间和任务优先级三个基本指标。我们在路径网络建模(1)中加入了路径时间成本的考虑,这也包含在路径规划评估(3)中。此外,改进启发式函数的估计值(6)中包含了到目标位置距离的评估。新的任务分配评价可描述为:
其中,是WMR收到任务集 中最早的任务的时间,是用于调整路径时间成本和距离成本的评估倾向的权重。这里是任务入口路径的时间估计,是任务入口到当前位置的距离。是一个可调的正整数权重,它会影响任务优先级的评估。是指路径中弧度的上限。
新的评价约束增加了一个类似于路径规划的过程,也是基于所设计的地图建模方法。路径时间成本可以进一步估计入口附近的拥堵程度,距离指标可以保证WMR到入口的方向。改进后的任务分配评价方法的可靠性将在实验中得到进一步验证。算法1描述了单个WMR的路径规划和任务评估的实现。
在多wmr系统中,调度策略的可靠性,即路径规划、任务分配、避碰等算法的协同工作,将直接影响系统的整体性能。路径规划和任务分配直接影响机器人和地图,这将在实验部分解释。学者们讨论了集中式[37,38]和分层规划方法[39-41]。集中式规划方法通常将WMR作为质量点,将其状态监控和指挥部署统一起来。在仓储、物流等实际应用中,多wmr对控制灵活性的要求高于对成型的要求。这种集中控制方法通常在CL中实现(见图2)。分层策略将WMRs之间的地层信息进一步划分为状态评估和规划,细化了调度过程的具体任务要求,提高了控制灵活性。然而,目前对层次规划的研究也主要集中在CL上
任务分配是CL的主要任务之一,任务分配取决于接收到的任务信息和WMR的空闲状态。避碰通常依赖于WMR的传感器信息。当冲突发生时,PL中的WMR将立即停止并将冲突信息发送给CL。要求管理员具有可靠的任务处理能力。在目前的应用中,CL中处理器的计算能力和NL的数据传输能力可以满足生产要求。然而,随着工业和制造业中智能化程度的提高(例如更大量的图形计算和传输),PL中物理实体的自主性和NL中传输可靠性的要求进一步提高。CL、PL和NL将不会独立存在和运行,需要更强的耦合。
ICPS可以有效地连接CL和PL中的信息,每个WMR分布式部署在整个系统的计算边缘,其计算过程是独立的。我们尝试将分层规划部署到icp的不同层,如图5所示。映射信息(时间成本更新)和任务决策(任务生成、优先级和最终分配)作为所有PL实体所需的全局信息部署在CL中。路径规划过程独立部署在各个WMR中,边缘计算和运动执行是分布式的。机器人本身也执行任务分配的任务评估过程,因为评估过程的初步计算依赖于路径状态,这与路径规划类似(如算法1)。可以看出,在PL中,路径规划和任务评估的信息流是相互的。
图2所示的模型具有集中的规划过程,而改进后的策略(图5)可以显著平衡整个系统的计算能力。原始CL中的调度计算任务大部分分配在边缘计算中。例如,在CL中计算一个WMR路径规划的复杂度从降低到。任务分配的复杂度取决于入口的数量,这与路径规划相比是非常小的。CL中的任务决策也是轻量级的。
路径规划的首要传输信息变成了地图状态(弧时间成本)和机器人状态。改进的任务作为评估和决策过程可以显著降低通信压力,有利于大规模的多wmr系统。