最初基于现代控制理论的交通控制方法,统称为基于模型的控制(model based control, MBC)理论与方法。【2】
之后以智能体、神经网络、模糊逻辑、群体智能为代表的人工智能理论与方法逐渐成熟,将每一个交叉口看作是具有智能计算能力的智能体(Agent),并采用多智能体系统(MAS)协调优化来实现区域交通控制。【3】
从三方面系统跟踪交通信号自适应控制方法:
基于模型的控制MBC理论与方法
基于智能计算控制方法
基于数据驱动控制方法
基于 MBC 的控制方法遵循前馈控制理论,采用 自适应控制 和 最优控制,建立网络级交通信号的多目标配时模型,并采用在线优化模块计算最优的控制方案(周期、绿信比和相位差),及时更新交通信号机的控制参数,以响应路口到达交通需求的变化。
根据控制目标的不同,交通信号 MBC控制方法又可分为 基于综合性能指标协调控制方法(综合指标法) 和 基于绿波带的协调控制方法(绿波带法)。
综合指标法综合考虑延误、停车次数、排队长度或通过量,以获得网络整体效益的最优。 当前绝大多数的自适应交通信号控制都采用基于综合性能指标的集中式协调控制方法。
SCOOT、U-TOPIA 等主流的商业交通控制系统和 TRANSYT 等配时软件都是在 MBC 控制方法的基础上演变发展而来的,这些系统的基准协调方案的优化生成都采用与 TRANSYT 相似的控制逻辑,只是具体配时模型的形式和寻优的方法各不相同【5】。
根据交通控制模型中交通预测模块的地位和作用,典型的交通信号 MBC 控制方法:
数理统计模型控制:无交通流预测过程
存储-转发响应式控制:采用网络内实时监测的到达-离开的交通数据
预测模型控制:仅采用历史交通流数据模拟路段上车队运动过程
滑动时间窗控制:更精细地模拟未来控制段时间内的网络交通流的演化
绿波带法通过增加干线走廊上绿波带来减小协调方向上行驶车辆的延误,大幅提升主线的交通效益。
典型的基于绿波带的干线协调控制方法包括:
最大绿波带法 MAXBAND
变带宽多绿波带法 MULTIBAND 【6】
绿波带法在理论上没有直接将延误、停车次数或排队长度作为控制目标,通过最大化不停车连续通过时间带,有效地减少协调方向车辆的行程时间,使协调方向车延误均达最小。但绿波带法旨在寻找干线车队连续行驶时的最大绿波带,公共周期时长通常比较大,容易造成非关键交叉口大周期控制等问题【7】。
人工智能计算技术模拟人的推理和学习过程,在交通控制器与道路环境的交互过程中自主学习优化的控制策略,具有较强的学习能力。
近10年,采用多智能体建模技术,基于智能计算的交通控制方法无需精确的数学模型得到了众多学者的关注,其中,模糊逻辑、神经网络和群体智能算法占据着主导地位【8】。
模糊逻辑(fuzzy logic, FL)可将交通管理者或专家积累的信号控制经验用 if-else 的模糊规则表达出来,通过模糊推理,实现决策推理过程,是一种处理非线性和不确定性的有效工具。
城市交通信号模糊控制是解决城市交通问题有效的内涵式解决方案之一。
早在1977年,Pappis等【10】就将模糊控制运用在交通控制上,通过建立规则库或是专家系统对各种交通状况进行模糊控制,取得了很好的效果。
此后,为提升模糊控制器解决实际交通问题的水平,两级模糊【11】、三级模糊【12】等多级模糊结构模型先后被提出,并从单点向区域交通控制应用方向发展
除此之外,结合群体智能、神经网络等的混合智能控制方法被众多学者研究以提升模糊逻辑自身的学习能力。
研究表明:基于模糊逻辑交通信号控制可获得好的控制效果,但人工设置的模糊控制器结构及模糊控制器参数带有很强主观性,模糊控制器的结构、模糊控制器参数在线优化方法是目前模糊应用于城市交通信号控制的研究热点。
人工神经网络(ANN)是一种自学习系统,在理论上已被证明具有较强的自学习的功能,被广泛地应用于交通系统模式识别、自适应控制等领域。
Nakastuji【13】在前向动态规划算法中采用模糊神经网络,大幅提高了算法的计算速度,并将其应用于 PRODYN 区域实时控制系统中。
Choy 等【14】提出了一个三层分布式的多智能体交通信号控制架构,包括路口控制智能体、子区控制智能体和区域控制智能体,每层智能体的学习推理均采用基于神经网络的模糊逻辑并以控制效果的实时回馈为准则,采用强化学习在线学习控制规则,以响应动态变化的交通环境。
为降低系统复杂度,Srinivasan等【15】提出一个单层分布式的多智能体交通信号控制系统,每一智能体负责网络中每一路口的交通信号,且分属于各自的协调子区,协调子区可根据路网交通条件进行动态更新和划分,协调子区内的智能体采用集体协同决策的方式优化关联路口的控制方案。
研究表明:基于神经网络交通控制方法具有良好的映射能力和学习功能,但这种监督学习的方法要求有足够合适的控制策略样本。由于交通系统的强烈非线性,样本收集过程是非常困难和耗时的,系统收敛速度慢,且训练初始值的设定对训练时间和训练效果有很大影响。
进化遗传算法(GA)、蚁群算法(ACO)和粒子群算法(PSO)等群体智能算法模拟生物的社会行为,采用群体搜索策略和群体中个体之间的信息交换,开展全局随机搜索与并行优化,且搜索过程不依赖于对象的梯度信息,在交通控制中具有广泛应用。
根据智能配时方案中群体智能算法的作用,典型的群体智能算法应用包括:
配时方案启发式搜索【18】
结构模型参数学习【19】
配时模型的优化求解【20】
最新的 TRANSYT - T7FS.1 及以后的版本采用了遗传算法进行配时。
常云涛等【21】提出了基于遗传算法的交通信号配时优化方法,它整合了基于延误和基于带宽模型方法的优点,同时优化周期、绿信比、相位差和相序。但对于复杂的多目标最优化控制,传统群体智能算法面临违背约束条件或收敛到次最优解等问题。
在实际应用中常引入模拟退火、黄金分割局部寻优化算子或是多种算法组合应用,提出具有混合结构的群体智能算法【22】,以增加遗传算法等传统群体算法的局部寻优能力。但受限于优化效率,混合群体智能算法仅适用于离线最优的自适应控制。
候忠生在2009年给出了数据驱动控制(data driven control, DDC)的一般化定义【23】,由于 DDC 是直接使用被控对象的 I/O 量测数据进行控制器设计的控制理论与方法,无需环境的数学模型,也称为 Model-free Control。
根据控制器结构的不同, DDC 方法可分为两类:
控制器结构已知的 DDC 方法
控制器结构未知的 DDC 方法。
郝建根等【24】将结构已知的 DDC 方法应用于过饱和单交叉口、交通干线、快速路出入口的控制,提出了面向不同对象的排队长度均衡控制的方法。据作者认知,结构已知的 DDC 算法的理论分析和系统设计都采用 MBC 的方法和思路,其在本质上是将控制器的设计问题转化为控制器参数的辨识问题,隐式包含了系统的模型结构和动态信息,这是一种基于数据在线整定模型参数的 MBC 控制方法。
作为一种典型的无模型数据驱动控制方法,迭代学习控制(ILC)的思想已经在强化学习(RL)算法中获得了大量的应用,并成功应用于单点、干线和区域交通信号控制。
在不能完全获取交通系统状态信息、不能完全理解系统内部机理、不能建立被控对象精确动力学模型的条件下,数据驱动控制法自主寻找隐含的控制知识,具有无模型、自学习等特性,在理论上可解决 MBC 法需要精确数学模型以及智能计算法无自学习能力等固有不足,是区域交通闭环反馈控制理论与技术应用的重要方向。
这其中,多智能体强化学习(MARL) 采用无模型迭代学习控制思想,采用“扬好抑坏”机制倒逼受控对象的最优控制策略,具有很好的应用前景,但用于解释数据的好的算法和交通数据的质量将是决定数据驱动控制成功的关键。
因此,研究具有更好不确定性响应能力和更高智能决策水平的闭环反馈自适应控制方法将是下一代交通控制系统发展的必然选择,而这要求控制系统具有无模型、自学习、闭环反馈等特征。