客服中心话务预测模型应用实践

一、课题背景

客服中心运营管理主要包括话务预测与排班、应急管理、运营现场秩序管理、监控管理等内容。可见做好话务预测,是客服中心现场运营管理中的第一环节,也是最重要的一个环节。只有准确的话务预测,才能精准地进行客服专员需求测算和排班工作,从而保证服务水平,提高人员利用率,降低人力成本。话务预测可以从小时、日、月、年等多时间维度进行预测,细化调整人力资源的分布,同时年度话务预测,对下一年度人员招聘计划起到较大的指导作用。如客服中心年度人员缺口、特殊需求时间点等。总之,提高话务预测准确性,才能保证现场运营平稳、有序,其重要性凸显于运营管理的各个环节。

二、影响话务的几个因素

笔者所在的电力行业客服中心分中心服务13家省公司,服务范围大,影响话务的因素多,主要包括天气情况、业务特点、电力突发故障、电网建设差异、特殊日等。

(一)天气情况

1、恶劣天气:雷雨大风、冰雹、暴雪、强降雨等;

2、特殊季节:如在七、八、九月份的迎峰度夏、一、二月份的迎峰度冬期间,除恶劣天气的影响外,客户使用空调较多,用电负荷大,容易导致电压过低,为避免电力设备超负荷运行,保护系统会自动切断电路,导致停电。 故每天负责话务预测与排班的人员要关注次日省公司天气情况,进行异常天气信息预警,为客服部话务预测、现场排班提供有效数据支撑。

(二)业务特点:因一些省公司具有先用电后付费的业务特点,每月底至次月初,部分供电公司实施欠费停复电,期间客户查电费、缴费后复电等咨询类电话较集中。

(三)电力突发故障:电力设施作为自然体,出现故障是不可避免的,不可抗力对电力设施的破坏影响了设施的稳定运行。故障停电后 ,为了避免大面积停电现象的发生,供电公司需要停电消除故障。

(四)电网建设差异:国家电网公司战略目标中提到要建设成“电网坚强”的现代公司。为了提高电网运行能力,供电公司需要对电网设备进行月度、季度检修。季度检修在每年的春季、秋季进行,主要对电网设施的运行、维护、检修工作,涉及变电站全站停止运行,由该变电站供电的线路同步进行检修,故春季、秋季检修影响范围较广。

(五)特殊日:节假日或非工作日,例如春节、国庆、重大政治类活动等,期间供电公司进行保电优质服务,不安排计划停电检修,相对话务量较低。

剖析完影响话务的因素,在结合历史话务曲线进行预测时,对趋势波动的原因就清晰自明了。下面详细说明话务预测过程。三、话务预测数据清洗

(一)基础数据选择

1、时间周期选择。笔者所在的电力客服中心在2014年底实现了全网全业务统一集中运营,所以2014年前数据不够完善,本次进行话务预测分析时选用2015年度数据作为数据源。在年度、月度、周等维度选择中,因年度和月度的基础数据较少,本次预测使用“周”维度进行预测。

2、地域选择。因各省存在天气情况和业务特点的差异,故话务预测以单个“省”为单位进行,所有服务区域省预测量叠加即可得到分中心预测总量。本次选择的某省份是2014年6月实现了全业务集中,经过半年的磨合和沉淀,2015年的数据趋于稳定,且该省迎峰度夏话务数据特征明显,有代表性。

(二)数据清洗

话务预测的目的是为人员排班提供支撑,故数据源应为人工服务请求量,不包含自助话务量。

图一为某省2015年度周人工请求量(原始数据),图中出现了几个话务量的峰值点(如第32周左右),这些峰值点被考虑为离群值,根据影响话务的因素,经核实,第32周左右为7月底8月初,是迎峰度夏的高峰期,造成话务量突增,从图中也可以看出数据具有明显的月周期性。

  图一:某省2015年度周人工请求量

数据清洗是对数据进行重新审查和校验的过程,目的在于纠正存在的错误,并提供数据一致性。这里需要注意几个细节问题:

1、清洗规则。因话务量受季节性因素影响较大,所以在年度数据清洗时,先计算出每月话务量均值,高于均值50%(这个比例不是绝对的)的数值利用条件格式进行筛选清洗,由其前后数据均值进行替换,进而求出每周话务量和。这样做可避免舍弃月份差异导致话务量波动的参考数据,符合话务特点。

2、统一口径。在日期转换为周时,利用weeknum函数时,这里把周一作为每周的第1天,故选定第二参数为“2”。2015年1月1日至4日为第1周(如表1:年度首周天数),2015年12月28日至12月31日为第53周,均为4天。这里折算时让该阶段的话务量除以实际天数4再乘以7,实现数据的统一口径,如下表1:统一口径数据清洗。

四、话务预测数据模型应用实践

本次使用三种预测模型,分别为最小二乘法、移动平均法和指数平滑法。下面分别从原理、公式和不同参数试算验证准确性进行阐述。

(一)最小二乘法

原理:寻求与给定点(i=0,1,…,m)的距离平方和为最小的曲线,通过最小化误差的平方和寻找数据的最佳函数匹配,采用残差平方和最小的准则。

公式:y = a + b x

参数关系:最小二乘法是从清洗后的数据中寻求变量之间的依赖关系,由得到折线图和散点图计算出预测值与实际值产生的偏差,称之为残差,用R表示,当然偏差越小越好, 但由于其可正可负, 因此总偏差不能很好地反映了变量之间的关系, 因为此时每个偏差的绝对值可能很大,为了改进这一缺陷, 就考虑用残差的平方R2来代替。但是由于绝对值不易作解析运算, 因此, 进一步用来度量总偏差,因偏差的平方和最小可以保证每个偏差都不会很大, 于是问题归结为确定其中的常数和使残差平方为最小。

利用LINEST函数计算出直线的斜率a和截距b,添加趋势线,见图二,得出

y = 242.79x + 41614,R2 = 0.1357。


图二:最小二乘法趋势线

通过数据分析-回归得出拟合图和残差图

  图三:散点拟合图


图四:残差图

从图三中可以看出这些点大致散落在某直线近旁,可以认为变量之间的关系为线性一元函数。但话务量月度变化趋势较明显,比如第31至33周即7月27日至8月10日之间,迎峰度夏的高峰期,残差较大,如图四。经计算得预测准确率在±15%范围的数值占比为69.23%。

(二)移动平均法

定义:根据时间序列逐项推移,依次计算包含一定项数的平均,以此进行预测的方法。

1、一次移动平均法

公式:Ft=(At-1+ At-2+ At-3+…+ At-n)/n

式中,Ft –对下一期的预测值;

n—跨越期数;

At-1—前期实际值;

At-2、 At-3和 At-n分别表示前两期、前三期直至前n期的实际值。

可见:各元素的权重都相等。

分别取n=3、n=5、n=8计算出预测值、预测准确率、误差平方,预测准确率按照“(实际值-预测值)/实际值”计算得出三条预测准确率曲线(见图五),经计算,预测准确率在±15%范围的个数占比分别为66.00%、62.50%、46.67%,准确率都较低(见图五)。

图五:一次移动平均法话务预测准确率

图六:一次移动平均法话务预测准确率占比图

2、二次移动平均法

原理:一次移动平均计算完毕后,形成一个新的时间序列,对它再求二次移动平均值,做出一次移动平均数和二次移动平均数的差值,将差值加到移动平均数上,并考虑趋势变动值。特点:考虑趋势变动值,突破一次移动平均法的局限性,加大了预测范围。

公式:Ft+T =at + btT,

at= Mt’ + (Mt’- Mt’‘)=2 Mt’– Mt’‘

bt=(Mt’ –Mt’‘ )

Ft+T— t+T的预测值,

t—本期

T—本期到预测值的间隔数

Mt’ —一次移动平均数

Mt’‘ —二次移动平均数

图七为n=3 、n=4时运用二次移动平均法的计算结果,经计算,预测准确率在±15%范围的个数占比分别为61.70%、60.00%,准确率较低。


图七:二次移动平均法话务预测准确率

3、移动平均法小结

由一次移动平均法和二次移动平均法得出的预测准确率对比图,可见,在项数n的选择上,n越大对预测的平滑影响越大,滞后于实际数据的偏差也越大,n太小不能有效消除偶然因素的影响。移动平均法预测在该次数据试算中预测准确率表现不佳。

(三)指数平滑法

原理:因时间序列的态势具有稳定性或规则性,所以可被合理地顺势推延。最近的过去态势,在某种程度上会在未来持续,所以将较大的权数放在最近的资料上。

特点:指数平滑法兼容了移动平均所长,不舍弃过去的数据,其包含的信息量是全部的历史数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。

1、一次指数平滑法

原理:任一期的指数平滑值都是上期实际值与当期指数平滑值的加权平均。

公式:St+1= αXt+(1-α)St

a–平滑常数,其取值范围为[0,1];

下图为α=0.3 、α=0.5、α=0.8时运用一次指数平滑法的试算,见图十。其中S1用X1代替,故序号1中α取任意值,该点的预测准确率均为0.00%,不计入试算点的占比中。由图可见,α取不同值时,预测准确率差异不大,计算得预测准确率在±15%范围的个数占比分别为66.67%、70.59%、76.47%,准确率相对前两种方法有改善。


图八:一次指数平滑法话务预测准确率

2、二次指数平滑法

公式:Ft+T =at + btT,

at= Mt’ + (Mt’- Mt’‘)=2 Mt’– Mt’‘

bt=(Mt’ –Mt’‘ )

运用二次指数平滑法,分别取α=0.3 、α=0.5、α=0.8时计算,结果见图十一。其中S1仍用X1代替,该点的预测准确率均为0.00%,不计入试算点的占比中。由图可见,相对一次指数平滑法,α取不同值时,二次指数平滑法预测准确率三者差异较大,经计算,预测准确率在±15%范围的数值占比分别为61.54%、78.85%、88.46%,准确率整体较高。

  图九:二次指数平滑法话务预测准确率

五、结论三种预测公式在不同参数情况下的预测准确率对比,如表3。

  表3:一次指数平滑法话务预测准确率

由表3可见,三个话务预测模型在本次数据试算中,相对来说指数平滑法的预测准确率较高,对比一次和二次指数平滑法,二次指数平滑法预测率更高一些,在α=0.8时,预测准确率在±15%范围的数值占比能达到88.46%的较好水平,拟合度较高,见图十。

  图十:指数平滑法预测准确率对比

需要特别说明的是,不同行业适用不同的预测模型,根据预测维度的不同预测模型的准确率也可能有不同,每种模型式有它的适用范围,不能一概而论地认定某种预测模型好用或者更准确,各种公式需要我们不停地去试算、验证、分析,才能更深层次地挖掘出各种公式的精髓,找出适合自己现场运营特点的最优预测公式。在此感谢周逸松老师的指导,为笔者对话务预测进一步研究奠定了基础,同时希望更多现场运营人员对话务预测这块“敲门砖”倾力研究和探讨。


本文转自d1net(转载)

你可能感兴趣的:(python,数据结构与算法,人工智能)