本文主要研究了中国新能源汽车的影响及其发展趋势,利用皮尔逊相关系数和多元线性回归研究了影响中国新能源汽车发展的主要因素;用ARIMA时间序列对未来十年新能源做出一定预测;建立随机森林回归模型对新能源汽车对全球传统汽车的影响进行了分析;通过岭回归分析了各国政策对中国新能源汽车发展的影响,最后建立碳排放因子模型对新能源汽车对生态环境的效益处进行分析。
针对问题1:首先我们选取近十年新能源汽车的销售量,保有量和市场份额
来作为三个指标衡量新能源汽车的市场规模,进行可视化分析,发现2013年时,新能源汽车正处于起步阶段,发展较缓慢,直到2022年时,发展各项指标迅速上升,迎来爆发。为了进一步确定影响新能源汽车的原因,我们选取了多个可能因素建立多元线性回归方程,并利用皮尔逊相关系数进行了相关性分析,得到结果是影响新能源汽车发展的主要因素有技术发展水平和基础设施建设,同时相关积极政策在影响中占有很大比重。
针对问题2:我们首先收集近十年新能源汽车销量,保有量以及市场份额等数据,后建立ARIMA时间序列,通过自回归,差分等步骤进行求解,并对结果进行可视化,得到了未来十年的发展得分表,清晰地对未来十年新能源汽车的发展做出了预测,结果预测值为2023的960.6(万辆)一直到1377.5(万辆)详细见表7。
针对问题3:我们以传统燃油车市场份额为目标变量,新能源汽车相关特征为特征变量构建随机森林模型,设置叶子节点数量为50,树的最大深度为10,求解发现影响最大的因素是新能源政府补贴金额(0.20),所以可以得出结论是由于中国政府对新能源汽车行业的大力支持,进而对全国传统汽车市场产生了巨大冲击。
针对问题4:我们首先收集了多国的贸易政策,并统计出其中其他国家对中国新能源汽车出口抵制最多的方面,结果发现是进口关税和相关优惠福利,之后我们统计美国,日本和德国的相关数据,将中国汽车保有量作为目标变量建立岭回归模型,根据方差扩大因子法得到K为0.12,之后求解方程回归系数,发现结果是德国的大多数系数为负值,说明其对中国的抵制效果最明显,而美国和日本虽然并不抵制,但也并无明显的支持倾向。
针对问题5:我们建立了碳因子排放模型,分别对全市推广新能源汽车前后进行碳排放计算,通过市内数据进行了未来几个中国发展的重要时间点上的减排量,
结论是,当推广新能源汽车后,减排量获得明显增加,这就有力的说明了推广新能源对生态环境确实有积极改善作用。
关键词:皮尔逊相关系数 ARIMA 时间序列 决策树 岭回归模型 碳排放因子
中国新能源汽车的崛起已成为国家科技和环保领域的一大亮点。政府在过去的几年里通过一系列激励政策和优惠措施,积极推动新能源电动汽车的研发、生产和普及。这一行业的蓬勃发展不仅受到国内市场的热烈响应,也在国际舞台上树立了中国作为科技创新和环保领导者的形象。在这个背景下,我们可以深入了解新能源汽车的技术特点、市场趋势以及政府政策对行业的影响,以及这一发展是否在全球范围内展现出中国的科技和环保实力。
新能源汽车是指使用非传统燃料作为动力源的车辆。由于他们低污染,低能耗的性能,备受市民欢迎。自2011年以来,中国政府一直积极推动新能源电动汽车的发展,并制定了一系列优惠政策来促进新能源汽车的发展。
问题1.分析影响中国新能源电动汽车发展的主要因素,建立相关数学模型,并进行详细描述。
问题2.收集中国新能源电动汽车行业发展数据,建立数学模型描述,预测未来10年的发展。
问题3.建立数学模型分析新能源电动汽车对全球传统能源汽车行业的影响。
问题4.建立数学模型分析一些国家的抵制政策对中国新能源电动汽车发展的影响。
问题5.分析城市中新能源电动汽车(包括电动公交车)电气化对生态环境的影响。假设城市人口为100万,提供模型的计算结果。
问题6.基于问题5的结论,给市民写一封公开信,宣传新能源电动汽车的好处,以及全球各国电动汽车行业的贡献。
问题1要求分析影响中国新能源汽车发展的主要因素,显而易见,我们可以用一些分析影响因素的模型,例如标准化回归,随机森林,LASSO回归,以及相关性分析等方法,通过分析相关系数即可得到结果。
问题2要求我们对未来十年数据进行一下预测,很明显是个时间序列问题,不过本题的数据较难搜寻,而且要找到一些有效指标,之后可以用ARIMA,LSTM等模型进行预测。
问题3要求我们分析中国新能源汽车的发展对于传统新能源汽车行业的影响,针对这一题,由于同样是分析影响,所以我们可以选一个和问题1不同的模型进行分析。
问题4 要求我们分析其他国家政策对中国新能源电动汽车的发展,首先要选择几个代表性大国的政策,然后对政策内容进行分析,提炼出抵制中国新能源汽车发展的内容,然后建立和问题一类似的的影响分析模型,进行求解。
问题5要求我们分析电气化对于生态环境的影响,可以将没进行过电气化的数据和电气化后的数据进行对照处理,选取相关指标进行分析,若结论是对环境有益的指标会上升,则说明电气化确实对环境有益。
问题6要求我们结合问题五的结果进行一封倡议书的书写,这是一道开放式试题,但主题应该是与倡导电气化有关的。
(1)假设近年的新能源汽车的生产维持稳定。
(2)假设中国新能源汽车的发展趋势具有一定连续性和稳定性。
(3)假设在短期内的未来,无巨大的与新能源有关的行业变革
(4)假设在短期内的未来,中国的出口政策和支持政策无根本上的改变。
问题一问的是影响新能源汽车行业发展的主要因素,以及建模说明各种因素对其发展起到的影响。首先我们将通过对把销售量,保有量,市场份额,当做指标来对近十年新能源汽车的发展指标进行发展趋势的可视化分析,由此来判断在时间这个维度上,新能源汽车发展的大致发展趋势。然后我们确定影响新能源汽车行业发展的因素,这里考虑到政府政策,技术创新,充电基础设施的建设等因素。最后我们会用数学模型对这些因素进行量化,利用回归模型进行拟合,最后总结出主要因素对中国新能源汽车行业发展的具体影响。
中国新能源汽车的发展受到多方面因素的影响,其中包括政府政策、市场需求、技术创新、基础设施建设以及全球能源格局的变化。首先,政府政策是中国新能源汽车发展的关键推动力。这些政策不仅降低了购车成本,也提高了消费者对新能源汽车的接受度,加速了行业的发展。其次,市场需求对新能源汽车发展起到至关重要的作用。随着环保意识的提升和消费者对绿色出行的需求增加,新能源汽车逐渐成为市场的热门选择。技术创新也是中国新能源汽车发展的重要因素。同时,技术创新也降低了生产成本,促进了产业链的进一步完善。基础设施建设是支撑新能源汽车发展的另一关键因素。充电基础设施的建设对于解决新能源汽车的续航和充电问题至关重要。最后,全球能源格局的变化也在一定程度上影响着中国新能源汽车的发展。
基于此,我们收集了2013到2022年近十年的中国新能源汽车和汽车销售总量,新能源汽车保有量以及新能源汽车的市场份额等数据。
综合考量下,我们决定采用销售量,保有量,市场份额三个因素来作为新能源汽车发展的指标,其中保有量可以用来了解新能源汽车在道路上的数量和分布情况。它是一个反映新能源汽车市场渗透率和普及程度的重要指标,而销售量和市场份额则是最直观的指标,用于评估新能源汽车在整个汽车市场中的占比。
数据可视化如下:
在查阅大量相关文献后,我们发现,影响新能源汽车发展的因素主要有以下几个方面:
(4)新能源汽车运营成本:新能源汽车的运营成本主要包括充电成本,而充电成本直接与电能价格相关。如果电能价格相对较低,那么新能源汽车的运营成本相对较低,这对提高其竞争力是有利的。
(5)大众环保意识:市民环保意识的提高使得更多人倾向于选择对环境友好的交通工具。新能源汽车因为减少尾气排放,被认为是相对环保的选择,市民的购车决策中环保意识的提高可能会增加对新能源汽车的需求。
为了评估各指标在新能源汽车领域和发展水平方面的得分,这里我们对得到的新能源汽车发展因素数据表进行标准化并和发展得分,得到数据如下表所示
表2:新能源汽车发展指标数据
年份 |
政府积极政策数量 |
纯电动汽车最高续航里程 |
新能源汽车专利公开量(件) |
充电桩数量(万台) |
电能每年平均价格(元/千千瓦时) |
二氧化碳排放量(亿吨) |
2013 |
7 |
200 |
1567 |
1.2 |
635.49 |
92.4 |
2014 |
9 |
200 |
2345 |
2 |
647.05 |
97.8 |
2015 |
12 |
200 |
3456 |
3.8 |
643.33 |
102.7 |
2016 |
15 |
300 |
5678 |
8 |
370.97 |
103.6 |
2017 |
18 |
300 |
7890 |
15 |
387.36 |
104.2 |
2018 |
21 |
400 |
10123 |
21.4 |
373.87 |
107.8 |
2019 |
24 |
500 |
12345 |
33 |
611.0 |
111.1 |
2020 |
27 |
605 |
15678 |
51.8 |
585.0 |
113.5 |
2021 |
30 |
605 |
18901 |
71.5 |
596.0 |
114.7 |
2022 |
33 |
1032 |
23456 |
261.7 |
449.0 |
121 |
为了进一步统计每个因素与发展得分的关联程度,我们对每一个指标和发展得分进行相关性分析。
相关是一种用来度量两个变量之间关系的统计度量。最常见的相关系数是皮尔逊相关系数,它衡量了两个变量之间的线性关系强度和方向,他的计算公式为:
此公式中r表示皮尔逊系数,Xi和Yi 表示两个变量的取值,和分别表示两个变量的均值。
当相关系数为1时,表示两个变量之间存在完全正的线性关系,即一个变量增加时,另一个也以固定的比例增加。
当相关系数为-1时,表示两个变量之间存在完全负的线性关系,即一个变量增加时,另一个以固定的比例减少。
当相关系数接近0时,表示两个变量之间线性关系较弱或不存在。
一般,我们用下图中数据范围对应的相关程度来进行皮尔逊相关系数分析:
表3:相关强度等级表
数据范围 |
相关程度 |
0.0-0.2 |
极弱相关或无相关 |
0.2-0.4 |
弱相关 |
0.4-0.6 |
中等程度相关 |
0.6-0.8 |
强相关 |
0.8-1.0 |
极强相关 |
最后得到六个发展指标与发展得分的相关关系如下表所示:
表4:六个指标与发展得分的相关关系表
指标 |
新能源汽车专利量(件) |
新能源汽车续航历程(公里) |
政府积极政策数量 |
充电桩数量(万台) |
电能每年平均价格(元/升) |
二氧化碳排放量(亿吨) |
相关系数 |
0.921 |
0.926 |
0.827 |
0.986 |
0.367 |
0.679 |
由图可知,技术发展,政策支持,充电基础设施建设均和新能源汽车行业发展存在较强的极强相关的等级,为进一步确定其相关性,我们采用多元线性回归方程对指标和发展得分进行线性回归。
多元线性回归,是一种用于建立多个自变量与一个因变量之间关系的统计方法。与简单线性回归不同,多元线性回归涉及到两个或更多自变量。这种回归分析的目标是通过拟合一个线性模型,以预测或解释因变量的变化,而发展得分作为因变量,和p个发展因素之间的关系可以用以下回归模型来表示:
其中y是发展得分,x1是新能源汽车专利量,x2是续航里程,x3是政府积极政策数量,x4 是新能源基础设施建设数量。回归后R2为0.9975,F值为696.56.可见回归效果很好,拟合效果图如下:
分析可知,技术发展水平和基础设施建设在图中拟合程度最高,所以影响新能源汽车发展的主要因素有技术发展水平和基础设施建设,同时相关积极政策在影响中占了很大比重。