基于智能卡数据的特殊事件地铁客流预测

文章信息

《Subway Passenger Flow Prediction for Special Events Using Smart Card Data》是2020年发表在期刊IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTA TION SYSTEMS上的一篇论文。

a26fdec3f7a50318c93cc5c4a2898e4e.png

摘要

为了减少乘客延误和防止地铁系统严重拥挤,需要准确预测特殊事件期间的短期客流。然而,很少有研究对这些条件下的地铁客流进行预测。传统方法,如自回归综合移动平均(ARIMA)模型,通常用于分析常规交通需求。这些方法通常忽略了受外部因素影响的客流波动性(异方差性)。因此,考虑到特殊事件期间客流的动态波动性和非线性,文章提出了一个分析短期客流的通用框架。基于南京奥林匹克体育中心附近两个车站的公交智能卡数据,使用四种不同的广义自回归条件异方差模型和ARIMA模型对客流的均值和波动性进行建模。应用多种统计方法来评估混合模型的性能。结果表明,在特殊事件期间,客流波动具有显著的非线性和非对称性特征。该框架能有效捕捉客流的均值和波动性,在准确性和可靠性方面优于传统方法。总体而言,此文章可以帮助公交机构更好地理解客流的确定性和随机性变化,并在特殊事件前后对地铁站内的大规模人群实施预防性对策。

937baa71092b9921765e79a76ae3d225.png

介绍

近年来,大型活动(如音乐会、体育比赛)举行得更频繁。由于地铁站的空间有限,如果地铁运营商不能提前估计到增加的需求,在短时间内聚集的大量站立乘客将导致过度拥挤和不定期的拥堵。对于这些特殊事件,需要准确及时地了解需求,以便为运营商设计适当的时间表,并指导乘客在模式选择、上车时间和换乘站选择方面做出决策。

一般认为,客流预测可以分为两种不同的形式(即长期预测和短期预测)。就长期预测而言,它用于指导规划运行而不是日常交通运行。由于交通运行对外部因素(如节日、特殊事件)非常敏感,因此很难准确捕捉地铁乘客量的长期确定性和随机性特征。因此,短期预测,揭示特定时间间隔的预测,是更可靠和必要的交通运营。现有文献通常研究基于人工智能和统计方法的短期预测方法,包括神经网络、遗传算法、支持向量机、模糊逻辑、k-最近邻(KNN)、卡尔曼滤波和自回归综合移动平均(ARIMA)模型。然而,这些研究仅集中于分析规律和稳定的交通状况。对于特殊情况(例如,音乐会、体育赛事),这些方法面临着解释极端客流波动的挑战。

地铁站周边的特殊事件,作为交通吸引物,对客流具有聚集效应。来地铁站的乘客数量主要受事件前后的影响;然而,非常规需求的趋势和波动性很难估计,尤其是在大都市。因此,特殊事件期间的地铁客流分析更值得关注。然而,与特殊事件客流预测相关的研究很少。Kuppam等人在问卷调查的基础上使用传统的四步模型研究特殊事件出行对轻轨交通乘客量的影响,但人工收集方法需要大量的人力和资源。随着技术的发展,研究人员可以访问高质量的空间和实时数据,包括智能卡数据、web数据和全球定位系统(GPS)数据,这为挖掘提供了扩展的潜在数据源。一些研究现在使用网络数据来预测公共交通到达和客流。然而,与人群活动相关的网络数据获取仍然是有问题的,因为在各种网站上可用的数据在语言和风格方面不同;因此,必须对多个站点进行爬网以满足样本大小。考虑到互联网上发布时间的不确定性,无法根据网络数据精确计算出准确的分钟上下车时间。与记录准确上下车时间的智能卡数据相比,web数据的使用仍然存在一些不足。

文章提出了一个分析地铁客流特征的通用框架,并通过建立合适的混合模型来改进对特殊事件的短期预测。本文的其余部分组织如下。在下一节中,基于均值和波动性模型为客流预测开发了一个通用框架。第三节介绍了研究领域和数据准备。在第四节中,综合测量了所提出方法的性能和特殊事件期间地铁客流的条件方差。最后,第五节提出结论和未来研究建议。

a6702fa29da04af25d7c212bd43194b5.png

方法

在文章中,作者提出了一个通用的框架来预测特殊事件的地铁站短期客流。由于外部因素(如音乐会和足球比赛)会显著影响某些时段的上下乘客量,因此对需求的波动性和不确定性进行建模可以给出准确可靠的预测结果。在提出的框架中,特殊事件的客流预测过程被分为四个步骤,以捕捉数据集的趋势和时变方差。

第一步。建立均值模型:建立ARIMA模型来估计数据集的均值。进行增强的Dickey-Fuller (ADF)检验来检查数据集中的单位根。设计了一种基于惩罚似然的逐步过程,通过遍历模型空间来估计最优ARIMA的阶数。

第二步。选择波动性模型:应用Ljung-Box检验来验证残差平方和之间的相关性。然后,选择GARCH模型的典型变体来分析客流的波动特征,根据不同的模型结构考虑数据集的非对称和非线性效应。

第三步。采用描述残差分布特征的不同密度函数,根据惩罚可能性确定特殊事件的适当分布。估计混合模型以比较模型性能,并使用新闻影响曲线分析行为模式对波动性的不对称影响。

第四步。应用k-折叠交叉验证技术评估模型预测:考虑到不同类型的特殊事件之间的互变性,k-折叠交叉验证用于最小化与训练和测试数据集相关的潜在偏差。根据交叉验证结果,计算预测误差和间隔,以衡量地铁客流预测的准确性和可靠性。

因此,该框架的基本方法是将平均函数与波动部分结合起来,以拟合客流的平均值。混合模型的一般形式如下所示:

ed798dccebf06c96f14599b64fc74f2f.png

式中,yt表示时间t的观测值,Ft表示yt的估计平均部分。εt关于平均过程的残差。

A.ARIMA模型的建立

ARIMA模型已被广泛应用于交通运输的许多领域,并取得了显著的成功。ARIMA(p,d,q)模型的具体形式如下:

基于智能卡数据的特殊事件地铁客流预测_第1张图片

其中φ(B)和θ(B)是具有实系数的多项式。B定义为后移运算符,wt被表示为分别具有零均值和方差σ2的周期t的扰动。p是指自回归(AR)模型的阶数(时滞数),d是指达到稳定状态所需的差分阶数,q是指移动平均(MA)模型的阶数。基于惩罚似然性,使用逐步程序自动识别适当ARIMA模型的p和q值。当d = 0时,ARIMA变换为自回归移动平均(ARMA ),其形式如下:

f779ddaba12dd9c801770697b7adc78f.png

其中μ是常数项。从上面的等式中可以清楚地看出,过去的客流状况通常会影响现在和未来的状况,这导致了在不同时间滞后处相关的客流状况。从理论上支持了ARIMA方法在客流预测中的应用。

B.GARCH族模型的典型变量

由于流量现象在其均值附近的波动在时间序列中很常见,Engle 引入了自回归条件异方差(ARCH)模型来模拟波动较大的变量。基于ARCH模型,Bollerslev 开发了一个GARCH模型,以解决对大规模孤立冲击的波动性的过度预测。与ARIMA模型相反,GARCH模型的本质特征是它反映了时变波动率的变化,并捕捉了方差部分εt的变化。εt表示为

7484ea630dc7a92748c37208bf5f8957.png

其中{zt}是一系列独立同分布的随机变量,每个变量的均值和单位方差为零,zt与εt 无关,i=1,2,....。σ是标准条件方差,σ2t可通过以下形式估算:

b3ee4fdc3c138555a5218103315e9f9e.png

有约束:

基于智能卡数据的特殊事件地铁客流预测_第2张图片

其中,δ是常数项。ht由方差部分的过去值决定,等式ht通常称为标准GARCH模型。

SGARCH模型改进了ARCH模型的原始规范,并且需要更少的参数来分析波动过程。然而,它假设与正负冲击相关的对波动性的影响是对称的,这忽略了冲击的经验符号和交通数据中重要的非对称影响。特殊事件前后客流波动特征可能不同。为了解决标准GARCH模型中无法捕捉的非对称和非线性效应,GARCH族模型的变体被提出来扩展研究领域的规模,包括EGARCH模型、非对称幂ARCH (APARCH)模型、GJRGARCH模型、TGARCH模型、绝对值GARCH (AVGARCH)模型、非线性GARCH (NGARCH)模型和NAGARCH模型。EGARCH模型可以通过采用对数变换放松对参数的非负约束,这在交通运输领域被广泛采用。通过指数变换和条件方差中的非对称项,它可以捕捉外部因素对波动性的非对称影响。GJRGARCH模型是对不对称性建模的另一种方式,它添加了一个1或0的指标函数,以区分正冲击和负冲击。与GJRGARCH模型类似,其他模型(如AVGARCH、APARCH和TGARCH)也使用非对称项1或0来捕捉不对称性。NGARCH模型通过直接表征条件方差中的非线性来扩展SGARCH模型,但忽略了数据集中的不对称性。为了解决这一问题,提出了NAGARCH模型来同时考虑条件方差的非对称和非线性特性。因此,从实证角度选择了SGARCH、EGARCH、GJRGARCH和NAGARCH模型。

Nelson 建立的EGARCH模型将条件方差ht视为滞后创新的显式乘法函数,以衡量数据的波动性。EGARCH (p,q)模型被定义为:

基于智能卡数据的特殊事件地铁客流预测_第3张图片

GJRGARCH模型类似于EGARNCH模型,最早由Glosten等人提出。它采用特定的参数形式来表示条件异方差。它通过采用一个指标函数,而不是在EGARCH中强加一个对数函数,来模拟对负面和正面冲击的非对称效应。GJRGARCH模型的一般形式由以下表达式表示:

基于智能卡数据的特殊事件地铁客流预测_第4张图片

Engle和Ng 提出了NAGARCH模型,该模型不仅处理了不对称性,还管理了数据的非线性。NAGARCH模型的数学形式如下:

ea372f11be432afd2687b03cfe44fac4.png

C.模型充分性的评价方法

Akaike的信息标准(AIC)是基于似然函数和估计参数数量的惩罚项的候选模型的相对质量的度量。AIC的具体数学形式是:

2cccf6fe864f7cd62696d2af06354cb9.png

其中Q和LL(θ)分别表示估计参数的数量和收敛时的对数似然。θ是使对数似然函数最大化的参数值。AIC越低,模型的拟合优度和复杂性之间的权衡就越好。

贝叶斯信息准则(BIC)也是基于似然函数和惩罚项来选择更适合的模型的准则。由于模型的复杂性,它的惩罚比AIC更重。BIC通常被定义为:

1ec11e1bd37be4919c2e2f1cf8fd1944.png

其中Q和n分别是估计参数的数量和样本大小。LL(θ)是对数似然函数。优选具有最低BIC值的模型。

为了检查稳定状态,可以进行ADF测试来检查时间序列数据中是否存在单位根。ADF测试的模型是:

d491be37b3ff590c240d773bdac90350.png

该检验的零假设是存在单位根,另一个假设是时间序列是平稳的。如果p值小于0.05,则可以在0.05的显著性上拒绝零假设,并且时间序列数据的差分阶数为零。

Q-test用于检查时间序列数据中残差平方的自相关性。它可以表示为GARCH族模型基于一个基本假设,即残差平方之间存在序列自相关。因此,有必要确定数据集是否符合这一假设。Ljung-Box测试,也称为Q检验,用于检查时间序列数据中残差平方的自相关性。它可以表示为:

79fb30025f5812f14e4a2ad04665da2a.png

其中n和m分别是样本量和测试中使用的自相关数。无效假设是数据是独立分布的,另一种假设是数据是连续相关的。如果残差部分的p值小于0.05,它可以在0.05的显著性水平上拒绝零假设,这表明在平方残差内存在强序列自相关,波动率模型是必要的。

D. k-fold交叉验证

鉴于不同类型的特殊事件之间的互变性,选择合适的训练和测试数据集是实证分析的一项重要任务,以最小化数据采样的潜在偏差。k-fold交叉验证最大化了训练数据集的样本大小,可用于测试模型的稳健性并检查模型预测的准确性和可靠性。在这种验证中,整个数据集被分成k个排他子集。k个子集之一被视为测试数据,而剩余的k-1个子集被训练。验证需要k次来测试每个子集。通过计算k时间预测的平均值,可以给出验证估计的全局预测有效性。交叉验证有效性(CVE)定义为:

d2500b4a14f1692731547c7b311eb8c7.png

bf8df28ae97b89af21104c59c3c85291.png

研究区域和数据描述

本研究的背景是中国南京这个拥有800万居住人口的大都市。这座城市拥有中国最便捷、最全面的公共交通系统之一。这座城市有各种各样的特别活动,比如音乐会和体育赛事。该研究扩展了对智能卡数据的成功利用,以预测地铁站的客流,在特殊事件前后,成群的乘客(观众)涌入站台。作为2014年夏季青年奥林匹克运动会的主会场,南京奥林匹克体育中心包括许多不同类型的体育场、体育馆(竞技场)和用于各种活动的休闲运动场。江苏省举办的大部分大型专项活动都在奥体中心举办。体育场和体育馆每年举办超过15场大型活动,分别提供61,443个座位和13,000个座位。因此,本文从邻近奥林匹克中心的不同线路中选择了两个地铁站,如图1所示。奥林匹克体育场东(OSE)站和奥林匹克体育中心(OSC)站分别属于2号线和10号线。它们是在奥体中心举办大型活动的主要交通枢纽。

基于智能卡数据的特殊事件地铁客流预测_第5张图片

对于2号线和10号线,地铁服务时间为6:00至23:00。开往2号线和10号线的末班车大约在23:30到达这两个车站。在奥林匹克体育中心举行的本地音乐会和体育赛事一般在周六和周日的19:30左右开始。为了清楚地显示受特殊事件场景影响的地铁乘客量的变化,这项研究选择了2017年5月1日至2018年1月31日,一线流行歌手举办演唱会的日期,以及中国足球超级联赛(CSL)举办比赛的日期。一线流行歌手通常比不太受欢迎的歌手吸引更多的人来听他们的演唱会,因此对地铁乘客有更大的影响力。CSL是中国最大的足球联赛,比赛在足球迷中很受欢迎。研究选取了5月13日、5月14日、5月20日、5月21日、7月18日、9月17日、9月23日、9月28日、12月24日(均为2017年)、2018年1月27日,以这些日期的特殊事件为研究对象。这几天天气也很好。前九个日期用于分析客流特征和估计均值和波动方程。然后,使用k倍交叉验证技术,将所有十个日期用于评估模型预测。五个样本大型活动的详情见表一。

基于智能卡数据的特殊事件地铁客流预测_第6张图片

为了直观地显示特殊事件期间地铁客流的波动特征,图2绘制了聚集成10分钟间隔的上下车流量的波动。5月21日、9月17日和9月23日,在南京奥体中心举行了特殊活动,如表一所示。9月9日和9月10日是正常的周末,奥体中心没有任何活动。这两个站都装有可伸缩的翻板闸门。根据中国地铁设计规范,每个闸门的容量为1500p/h 。OSE站的入口和出口分别有四个和五个。OSC站的入口门和出口门的数量分别为五个和四个。计算每个站点的入口容量和出口容量,汇总成10分钟的间隔。一天中的某个特殊事件前后出现了两个“爆发”点。“爆发”点被定义为偏离正常平均趋势两倍于标准偏差。在表演或足球比赛开始前,乘客从其他车站乘坐地铁,在OSE站和奥林匹克中心站下车参观奥林匹克中心。活动结束后,人们涌入车站赶末班车,导致需求激增。

基于智能卡数据的特殊事件地铁客流预测_第7张图片

如图2(a)所示,由于OSE站“爆发点”附近的下车容量与出口容量之比超过0.6,服务水平为D级,表明通过能力和步行速度在队列中受到严重限制,在这种密度下向前移动令人不安[43]。在特别活动开始之前,在出口收费门处产生了严重的乘客延误。而且更糟糕的是,活动结束后,登机乘客数量超过了入场容量。过度拥挤会发生在特别活动结束后,当乘客登上回家的火车时。由于不是每个人都记得提前准备他们的地铁卡,一些乘客在接近入口/出口门时开始从他们的包或口袋中寻找卡。在现实世界中,这些行为进一步降低了进入/退出能力。另外,考虑到每个南京地铁站上车前对每一个包的安检,这个过程更是让人满为患雪上加霜。尽管OSC站的流量小于OSE站,但由特殊事件引起的突然需求激增仍然值得注意。这一“爆发”使需求比平时增加了五倍以上。至于这两个车站之间的客流量差异,2号线周围有住宅区、学术机构、商业区、购物中心,并连接到中心城市,而10号线主要满足居住在郊区的居民的需求。因此,OSE站的上下车乘客需求高于OSC站。考虑到这些事件的开始时间,并忽略其他时间段的影响,选择了13:30到23:30的数据来具体表示客流的波动性,并降低所选模型的复杂性。由于每个地铁站同时提供上下乘客服务,文章将地铁客流作为一个整体来研究,包括上下乘客。

5039dbbac758fd7bb04a0f2c74524dee.png

结果和讨论

A.ARIMA和GARCH族模型的校准

建模过程包括均值和波动率模型的联合估计。均值模型由ARIMA模型估计,包括阶数选择和参数估计。进行ADF检验是为了确定时变数据是否是平稳的。结果表明,两个地铁站的乘客数据在统计上是平稳的,那么d等于零。自回归项和移动平均项(p,q)的顺序是根据第二节中的逐步程序确定的。OSE站和OSC站分别选取自回归阶数为2和移动平均阶数为2,以及自回归阶数为1和移动平均阶数为1。波动率模型的估计是通过应用GARCH族模型进行的。根据以前的研究结果,GARCH (1,1)最适合反映交通波动动态。为了测试GARCH族模型在估算特殊事件场景下的客流量时的适用性,本研究选择典型的ARIMA-GARCH模型来模拟客流量的平均值和波动性。

客流随时间波动,在特殊事件场景下表现出明显的不稳定模式。为了确定哪种分布更适合研究高客运量,本研究首先考虑了正态分布(ND)、学生t分布(STD)和广义误差分布(GED),以从经验角度推断表征时间序列特征的残差分布。对于这两个站,AIC和BIC值的建模结果在表II中列出。对于这两个台站,遵循student-t分布的GARCH族模型的性能优于正态和广义误差分布,AIC和BIC的平均值分别降低了4.5%和4.4%。考虑到客流分布的偏态性,研究又增加了偏态正态分布(SND)、偏态学生t分布(SSTD)和偏态广义误差分布(SGED)来估计模型的拟合度。与其他偏态分布相比,GARCH族模型的AIC和BIC值在SSTD的两个站都较小,AIC和BIC分别减少了4.6%和4.5%。就标准差和SSTD而言,当使用SSTD建立残差时,大多数GARCH族模型的AIC和BIC值是最小的,除了在OSE站的标准差中SGARCH略大。因此,本研究根据AIC和BIC的度量方法,在波动方程中应用标准差和SSTD,建立了GARCH族模型。

基于智能卡数据的特殊事件地铁客流预测_第8张图片

B.建模结果概述分析

对于两个地铁站,ARIMA和ARIMA-GARCH模型的结果如表三所示。ARIMA和GARCH方程的参数是分开列出的,分别称为“均值方程”和“波动率方程”两个不同的类别。建模性能的评估结果被命名为“建模评估”模型参数、显著性水平以及AIC、BIC和容格盒检验的结果用于分析和选择最能表征特殊事件期间客流均值和波动性趋势特征的模型。

基于智能卡数据的特殊事件地铁客流预测_第9张图片

如表三所示,发现均值和波动率方程中的大多数参数在0.001、0.01或0.05水平上是显著的。根据AIC和BIC的值,ARIMA-NAGARCH最适合这两个地铁站,而ARIMA模型最不适合。混合ARIMA-NAGARCH取得了最优结果。与之前的研究中提出的其他ARIMA-GARCH模型相比,本研究中的新混合ARIMA-NAGARCH在模拟特殊事件期间的湍流客流时表现出更好的适应性。当大型演出举行时,通常会吸引大量观众。由于乘客在活动前后占据了附近的车站,乘客活动的扰动使得某些特定时段的流动模式更加复杂。为了识别平方残差中的序列相关性,应用了Ljung-Box检验。对于列出的所有GARCH族模型,从Ljung-Box检验得出的残差平方的p值表明,残差平方内存在很强的序列相关性,波动率模型假设是有效的,置信度为99.9%。从ARIMA-NAGARCH波动方程中参数的显著性来看,两个站点都存在条件异方差。它反映了由特殊事件(外部冲击)引起的客流大幅波动。至于GARCH效应,当前的条件波动率显著依赖于以前的条件波动率。

C.混合模型预测

在这项研究中,使用10重交叉验证来检验模型的稳健性,并根据有效性指标(MOEs)来衡量预测的准确性和可靠性,有效性指标包括平均绝对百分比误差(MAPE)、均方根误差(RMSE)和平均预测区间长度(MPIL)。先前的经验研究表明,10倍是优化完成验证的时间和最小化数据采样的潜在偏差的最佳倍数。三个MOEs定义为:

基于智能卡数据的特殊事件地铁客流预测_第10张图片

MAPE和RMSE用真实的观测值来衡量预测值的准确性。MPIL可以反映基于预测区间评估的预测的不确定性和可靠性。假设两个模型具有相似的精度性能,具有更窄预测区间的模型提供更可靠和有效的预测客流。

图4和图5显示了ARIMA模型和ARIMA-NAGARCH在两个地铁站的预测值对比。为了更好地说明客流量波动和模型的预测结果,该图定义了“突发”影响区域(BIA):从活动开始前两小时到活动开始后半小时,以及从活动结束前一小时到活动结束后半小时。偏置显示在图4和图5的红色区域。基于10倍交叉验证的结果,ARIMA和ARIMA-NAGARCH的实际观察值和预测值分别在图4和图5中绘制为绿色和红色点。由于捕捉波动性和获得GARCH模型的预测区间非常重要,所以在95%置信水平下,ARIMA-NAGARCH的预测上限和下限也在两个站点的所有时间段分别绘制为蓝色和紫色虚线。ARIMA和ARIMA-NAGARCH的预测精度差异显著。从图中可以看出,在有偏差的情况下,混合ARIMA-NAGARCH的预测直观上更接近实际观测值。还应注意的是,与ARIMA相比,混合模型在非特殊事件期间的预测误差最低。由于后者忽略了方差的变化,它损害了预测的准确性。相比之下,混合模型更好地捕捉了所有时间段的客流波动。在预测区间内,随着乘客数量的激增,它经历了剧烈的波动。通过增加特殊事件前后的间隔宽度,上限和下限倾向于覆盖更多的预测值。

基于智能卡数据的特殊事件地铁客流预测_第11张图片

基于智能卡数据的特殊事件地铁客流预测_第12张图片

a90a13da4cb17f044201639443d2202d.png

Attention

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

你可能感兴趣的:(大数据,python,机器学习,人工智能,数据分析)