民航营销数据分析一例:航班收益影响因素之初探

原创2016-02-18解开颜  航旅IT圈

(致谢:上海交大的郝聚涛博士对此文亦有贡献)

如今互联网行业峰会如此之多,如同过江之鲫,随便找个会场坐下估计不出一分钟,就能听到创新、大数据、云计算等几个名词。从外行的角度看来大数据是个挺了不起的东西,它也确实了不起,不过有一个前提就是我们能够有效地处理数据,怎样从海量数据中找出有用的信息才是最重要的。

光说不练假把式,那不是我的风格,今天就来试试用简单的数据分析方法找出影响航班收益的因素及其程度。

毕竟大数据分析技术的快速发展使得:

原来必须大型IT公司提供的航空运输规划类产品,已经可以由小而美的技术型公司来提供了,

原来进行航空运输规划必须投入巨大成本现在看也不那么必要了:开源软件以及互联网巨头和传统软件公司们开源的大量机器学习库使得这件事的进入门槛和成本大大降低。

这一变化也为小而美的技术型公司带来了大量的机会。在国外民航业开创了电商、云计算、大数据处理及运筹学应用的先河,作为一个民航IT老鸟儿,我依然相信民航业会继续走在IT技术应用的前列。

下面进入正题:

数据准备

采用2015.12.1~15日(两周+1天,能观察周期性变化),某航空公司航线网络上所有成行航班的数据。每条数据包含:航班号,(计划/实际)起飞日期/星期和时间,O&D,里程,经停,机型配置,舱位布局,成行旅客数,每旅客收入,净收入,税费收入等字段。为了简单处理,只分析经停数=1的航班。此时对航班收益可能的影响因素包括:计划起飞时间,起飞星期,航线,里程,机型。数据概况:共选择204条航线,平均每条航线每周航班数35个。

为了简化计算,还需对数据的因素字段做归一化分箱处理,举例来说,把里程<600公里归入类型1,600到1200公里归入类型2,1200+归入类型3;把客座率低且收入(指座公里收入)低的航班归入类型1,客座率低且收入高的航班归入类型2,客座率高且收入低的航班归入类型3,客座率高且收入高的航班归入类型4,等等。

分析过程

数据经过分箱变换后成为分类变量,分析的目的就是分析目标字段和其他因素之间的关系。相关分析包含定性分析和定量分析两个方面,用于确定现象间是否具有统计意义的相关性,以及在相关基础上分析相关方向及紧密程度。

为了说明简单,对于此类多因素的综合影响采取对数线性模型来分析。对数线性模型把列联表的网格频数的对数表示为各变量及其交互效应的线性模型,运用类似方差分析的基本思想检验各个变量及其交互效应的作用大小。

代表二维列联表第i行,第j行的频数

为主效应,

为二级交互效应。

分析主要根据业务需求,来确定自变量选择和分析项目,假如业务场景为分析客座率、收益与航班日期、航线、机型、时间的关系,及其简单交互作用。可用date_type 、city_type 、 distance_type 、airplane_type 、category、time_type来拟合上面方程。然后通过显著性来验证模型和数据拟合程度, 如果显著程度小于0.05,则认为拟合效果不佳,本模型拟合度高于0.1,拟合效果良好。例如下表,航线城市因素分析说明二、三线城市间航班和一、三线城市间航班客座率和收益较好,且二三线航线高于一三线。

交差效应分析结果的出现不仅是由主效应确定,因素间交互也起作用。例如,考虑航线距离和机型的影响,航程为600到1200公里的航班,使用机型2(168~180座)更易实现高收益、高客座率。

结论简述

为简便起见,假设业务需求仅如上所述,分析所选因子主效应或部分二阶交互效应。可得如下结论:

1.航班日期为工作日的航班收益和客座率较好(解读:商务客价值更高)

2.二、三线城市间航班和一、三线城市间航班客座率和收益较好,且二三线航线高于一三线;在二线城市间或二线与三线城市间及一线和三线城市间的航班,航程大于1200公里客座率和收益较高(解读:因所选航空公司的航线网络未覆盖一线城市间航线,缺这一部分结论;同时,惊讶于二三线航线收益高于一三线航线)

3.远程航线收益和客座率较好,高于中程航线(解读:中短程航线的客源受高铁影响很大啊)

4.起飞时间和高客座率、高收益之间无显著关系(解读:颠覆了常识,可能是因为选择甩飞航班分析的缘故)

5.座位在168~180的航班客座率、收益高,且航程为600到1200公里的航班,使用168~180座飞机更易实现高收益、高客座率(解读:简直是经济又划算的机型啊,低成本航空LCC们可据此规划机队)

后续工作

后续工作分为两个步骤。首先,使用更多的数据、针对更多的因素,并试用不同的算法对结果进行交叉对比分析,以得出更准确和有价值的结论(模型)。其次,基于第一步的结论确定模型,用历史数据和实时的流数据训练模型,为航空公司新开航线,在已有航线上增减航班,航线网络优化以及航班收益提升等方面,提供准实时的决策辅助和支撑。

顺便做个广告:如众位看官有这方面的需求,可以各种方式联系我。我的团队已有现成的产品(并为国内几家航空公司采用),然后长期接受各种个性化定制。

觉得本文不错?给作者打个赏吧:P

民航营销数据分析一例:航班收益影响因素之初探_第1张图片

民航营销数据分析一例:航班收益影响因素之初探_第2张图片

你可能感兴趣的:(民航营销数据分析一例:航班收益影响因素之初探)