基于时间序列模型和神经网络模型预测新能源汽车销量

  1. 数据来源

本文数据来源于中国汽车工业协会网的2015年1月~2023年4月的中国新能源汽车销量数据。另外,包括从2015年1月~2023年4月的中国汽车销量数据以及新能源汽车数据的市场渗透率。

  1. 描述性分析

如表 1,本文对新能源汽车销量、市场渗透率和汽车销售量进行了描述性统计分析。从表中可以看出,本研究共有 100 个样本值,新能源汽车销量和市场渗透率的变异系数分别为 1.2002 1.1319,远高于汽车销售量的变异系数 0.2072,说明新能源汽车销量和市场渗透率的相对离散程度很高,反映了中国新能源汽车市场的不稳定性和增长潜力。另一方面,市场渗透率的最小值为 0.22%,最大值达到 33.76%,表明新能源汽车已经占据了一定比例的汽车市场,并且仍有很大的提升空间。因此,有必要关注新能源汽车的发展趋势和消费者需求。 

图 2——传统汽车及新能源汽车基于时间序列模型和神经网络模型预测新能源汽车销量_第1张图片销量

如图 2所示,中国汽车销量呈现出稳定的态势,没有明显的上升或下降趋势,但受到季节性因素的影响,每年的二月份和十月份分别是汽车销售的淡季和旺季。值得注意的是,2020 年二月份的汽车销量出现了异常低迷的现象,这可能与当时的疫情爆发有关,导致了工厂停产和消费者信心下降。但随着疫情得到控制,七月份左右汽车销量恢复到正常水平。

图 3——新能源汽车销量及市场渗透率变化

基于时间序列模型和神经网络模型预测新能源汽车销量_第2张图片


观察图 3,可以明显观察到新能源汽车的销量有增长趋势,且存在一定的季节性波动,且在2022年10月新能源汽车的市场渗透率突破了30%。

 

  1. 建立SARIMA模型
  1. 数据处理

利用r的decompose函数是用来对该时间序列进行经典的季节分解的,即将时间序列分解为趋势、季节和随机三个部分。本文采用加法模型对原序列进行分解,公式为:Yt=Tt+St+et。分解结果如图 4

基于时间序列模型和神经网络模型预测新能源汽车销量_第3张图片图 4——序列趋势,季节,随机图

 


从趋势图中,我们可以看到该时间序列呈现出明显的增长趋势,并且增长速度逐渐加快,但是到了2023年左右,增长速度有所减缓,这可能与政策补贴的退坡有关。从季节图中,我们可以看到时间序列存在着明显的季节周期规律,以12个月为一个周期。从随机图中,我们可以看到随机部分基本趋于平稳,且没有明显的周期效应。

在建立SARIMA模型前,需要对数据进行平稳性检验。本文对原序列进行12步一阶差分,得到新的序列(记为diff_xx)。对diff_xx进行ADF检验和平稳性检验。根据表 2表 3的检验结果,可以认为diff_xx为平稳非白噪序列,因此可以进行下一步的建模。

表 2——ADF检验

你可能感兴趣的:(python,lstm,神经网络,能源,汽车)