深度强化学习车辆重定向HMDRL: Hierarchical Mixed Deep Reinforcement Learning to Balance Vehicle Supply andDemand
HMDRL:HierarchicalMixedDeepReinforcementLearningtoBalanceVehicleSupplyandDemand摘要三层混合深度强化学习方法,对闲置的车辆进行重新定位管理者在顶层,其中动作抽象是从时间维度进行的,并适应于空间可伸缩和时变的系统。协调器位于中间层,设计了一种独立于决策顺序的并行协调机制,以提高重新定位的效率。底层由执行人员组成,对具有混合