目录
前言
课题背景和意义
实现技术思路
一、建筑能耗数据处理
二、混合预测模型
三、实验分析
四、总结
实现效果图样例
最后
大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。
对毕设有任何疑问都可以问学长哦!
选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277
大家好,这里是海浪学长毕设专题,本次分享的课题是
毕业设计-基于神经网络的建筑能耗混合预测系统
我国建筑运行能耗持续增长,2018 年在全国 总能耗中的占比已超过 20% . 准确的建筑能耗预 测是制定各种建筑节能策略(如电力故障检测与 诊断、电力优化调度、电网需求响应)的基础, 研究建筑能耗的机理和规律,建立准确、有效的 建筑能耗预测模型具有十分重要的现实意义.建筑能耗预测方法主要分为物理建模方法和 数据驱动方法 . 物理建模方法利用热力学原理 进行能耗建模和分析,由于其需要详细的建筑物 信息,导致建模过程复杂且低效. 相较于物理建 模方法,数据驱动方法利用历史数据进行能耗预 测,其预测的精度更高、速度更快. 数据驱动方法 主要包括人工神经网络、支持向量机、决策树以 及其他的统计学方法. 人工神经网络因函数逼近 能力强、学习速度快被广泛应用于建筑能耗预测 领域. 使用神经网络预测酒店建 筑的能耗,并与支持向量机模型进行比较,结果 表明,神经网络的预测精度更高。
CEEMDAN
能耗数据分解 建筑能耗数据具有非线性、非平稳性的特 点,使得预测模型的输入具有不确定性,导致预 测精度下降. CEEMDAN 算法[19] 是经验模态分 解(empirical mode decomposition, EMD)算法的 改进算法,能够有效解决 EMD 分解模态混叠的 问题,实现对数据更加精确的分解处理. 作为用 于处理非线性、非平稳时间序列的信号分解和分 析方法,CEEMDAN 被广泛应用于各个领域,且有 良好的应用效果。
设 为原始建筑能耗数据信号,利用 CEEMDAN 算法分解能耗数据的步骤如下:
1) 生成含有白噪声的建筑能耗数据信号集,即
2) 对x i (t) 进行 EMD 分解,得到各样本 EMD 分解的 1 阶 IMF 分量IMFi 1 ,将其均值作为 x(t)的 1 阶 IMF 分量,即:
4 ) 定 义K 为 I M F 分量的最高阶次,计算k(k = 1,2,··· ,K)阶残余分量、k+1 阶 IMF 分量,表 达式分别为:
5) 重复步骤 4),直至残余分量 的极值点 个数小于 3 时,不可再分解,算法终止. 最终的分 解结果为:
利用 CEEMDAN 算法进行能耗数据分解的流 程如图所示
样本熵算法
样本熵是表示时间序列复杂度的参数, 广泛应用于时间序列预测领域 . 相比于近似 熵算法,样本熵的计算精度高,且不依赖于数据 长度,具有更好的一致性. 样本熵的值越大,表明 时间序列的波形越混乱,频率也越高. 为了充分 利用不同神经网络模型预测各 IMF 分量,本研究 根据样本熵值的大小,将各 IMF 分量划分为高频 分量和低频分量.
LASSO 特征选择
1、建筑能耗的影响参数分析
建筑能耗的影 响参数有很多,分析各特征参数与能耗的相关 性,合理选择输入特征变量对提高能耗预测的准 确性非常重要 . 影响建筑能耗的因素主要包括 4 个方面:建筑本体特征、外扰、内扰以及历史能 耗. 其中,建筑本体特征主要包括建筑面积、 建筑高度、窗墙比等. 外扰主要有室外温度、相对 湿度、风速、风向以及太阳辐照度等气象参数.
2、LASSO 方法
LASSO 是常用的特征选择方 法,相比于传统方法,具有解释性好、稳定性强的 优点[20,28-29] . LASSO 方法的基本思想是在线性回 归的基础上,通过加入自变量系数绝对值之和小 于阈值的约束条件,并最小化模型残差平方和。
则上式可等价转化为:
LASSO 模型的求解方法有多种,本研究采用 最小角回归法 (least angle regression, LAR)[29-30],该 算法是常用的快速解法,其原理是沿着前 2 个已 确定的特征变量的平分夹角方向,寻找下个较优 特征变量,只需p步最小二乘拟合,即可得到特征 变量系数β,实现快速求解.
RBF 神经网络
RBF 神经网络是 3 层前馈型网络,相比于反 向传播 (back propagation, BP) 神经网络,其结构简 单、学习速度快,具有很强的非线性函数逼近能 力和不规则数据处理能力,广泛应用于模式识 别、信号处理和时间序列预测等领域.
采用 RBF 模型预测建筑能耗的低频 IMF 分量. 如 图所示,典型的 RBF 神经网络结构包括输入 层、隐含层和输出层 . H = [h1,h2,··· ,hm] T i RBF 神经网络的径向基函数一般选取高斯函 数,设径向基向量 ,则第 个隐 含层神经元的输出可以表示为
式中:m为隐含层神经元的个数;X = [x1, x2,··· , xn]
输入向量, n为输入层神经元个数;Ci=[ci1, ci2,··· , cim]为隐含层第i个神经元的中心向量;B = [b1,b2,··· ,bm]为隐含层神经元的基宽向量.
根据上述 RBF 神经网络原理可知,须调整的 参数有 3 个,即中心向量、基宽向量和权值向量. 传统的 RBF 神经网络参数选择方法存在收敛速 度慢、易陷入局部最优的缺点,限制了 RBF 神经 网络的预测能力.
TSA 算法
TSA 算法是由 Kiran 于 2015 年提出的新型 智能优化算法,其优化机制是基于自然界中树与 种子间的关系. 假设生长树的土地作为优化问题 的搜索空间,则认为树和种子的位置是优化问题 的可行解.
TSA 算法被广泛应用于工程设计问题和数值 优化计算中,并取得了良好的效果[33] . 相比于传统 的群智能算法(如 PSO、GA),该算法具备更好的 全局寻优能力,在神经网络参数优化方面具有很 大的潜力.
TSA 算法的种子位置更新公式为:
种子的位置更新由搜索趋势 ST 控制. 种群中 每棵树的种子数在[0.1Npop,0.25Npop] 随机产生. 树 的初始位置产生公式为:
由此得到 TSA 算法的优化过程如图所示 :
LSTM 神经网络
LSTM 神经网络是特殊的递归神经网络 (recurrent neural network, RNN),通过引入具有长时 记忆的细胞状态和具有短时记忆的门控结构 (遗 忘门、输入门、输出门),学习长期依赖信息,有效 解决了 RNN 梯度爆炸和梯度消失的问题,现已广 泛应用于图像文本识别、图像处理领域.
LSTM 网络的结构如图所示
对于时刻t,其 前向计算过程如下:
1) 遗忘门决定从上个时刻的细胞状态中遗忘的信息,计算公式为:
2) 输入门决定上个时刻的细胞状态中需要被 更新的信息,计算当前时刻的新细胞状态,公式为:
3) 输出门根据新细胞状态得出当前时刻的输 出,计算公式为:
由于 LSTM 网络参数较多,考虑到实际工程 的复杂性,也为了保证模型训练效率,本研究采 用自适应矩估计 (adaptive moment estimation, ADAM) 算法[35] 优化 LSTM 的参数. ADAM 算法是 常用的深度学习模型优化方法,具有实现简单、 计算效率高、稳定性强等优点,已被有效应用于 LSTM 参数优化。
TSA-RBF-LSTM 预测模型
如图所示为 TSA-RBF-LSTM 建模的过程.
1) 对 经 CEEMDAN 分解后的 各 IMF 分量进行2) 分别利用高频 IMF 分量和低频 IMF 分量对 LSTM 和 TSA-RBF 进行建模;3) 对各 分量的预测结果进行叠加求和,得到最终的预测 结果. 其中高频、低频 IMF 分量的划分原则如下.
1) 计算各相邻分量间的样本熵差值,即
2) 比较各样本熵差值,选取样本熵差值最大的 2 个 IMF 分量,其对应阶次为:
样本数据获取
以西安市某大型商业建筑能耗数据为例,进 行预测模型的训练和测试. 样本数据中的输入变 量包括此建筑能耗影响因素中的室外气象、人员 流动、照明、电气使用以及历史能耗等 12 个变量 参数. 其中,室外气象数据和人员流动数据来源 于该建筑所安装的环境监测传感器和流动人员监测传感器,采样间隔为 1 h;照明、电气使用以及 历史能耗数据来源于该建筑的能耗监测管理平 台,采样间隔为 1 h.
样本数据中 所有变量及其符号和单位如表所示.
为了保证样本数据质量,采用 3σ准 则剔除数据异常值,采用拉格朗日插值法插 补数据缺失值,处理后的样本能耗值WS如图所示. 图中,n为采样点.
能耗数据分解
WIMF 在利用 CEEMDAN 算法对建筑能耗数据进行 分解时,将白噪声幅值设置为 0.2,白噪声添加次 数取值为 100,迭代次数取值为 500,分解后的各 IMF 分量能耗 如图所示:
原始能耗数据分解完后,再将各 IMF 分量与 原始数据中的特征集分别构成新的样本数据集. 为了降低数据中不同变量的量纲对实验模型误差 的影响,需要归一化处理原始数据,使得各个变 量处于同一量纲级,归一化公式为:
输入特征选择
β = [β1,β2,··· , β12] λ 以样本数据中 的 12 个输入变量参数作 为 LASSO 特征选择的输入,则特征变量的系数向量 . 最优调整参数 通过 10 折交叉 验证确定,共迭代 100 次. 对各 IMF 分量所构成的 数据集进行特征选择,特征选择结果如表所示.
IMF 分量的 LASSO 建模均方误差EMSE随调 整参数λ的变化而收敛,最终得到最优λ参数. 其 中 IMF1 所对应的调整参数λ与特征变量系数向量β的各分量β的关系图如图所示.
结果验证
通过多次对 TSA-RBF-LSTM 预测模型的相关 参数进行调整和测试,最终得出适用于建筑能耗 预测的参数设置,如表所示. 由于 LSTM 网络参 数较多,限于篇幅未列出其权重参数.
利用 LSTM 预测高频分量 IMF1~IMF3,利用 TSA-RBF 预测低频分量 IMF4~IMF9,将各分量预 测结果进行叠加求和,得到最终的预测结果,并 与 RBF、TSA-RBF 和 LSTM 预测模型的结果进行 对比,各模型的预测结果 WP如图所示
4 种模型的预测精度比较结果如表所示. 结果表明,TSA-RBF-LSTM 模型的ERMSE 与EMAPE均优于其他模型,其预测精度更高,准确率 达到 98.72%. 同时,相比于 RBF,TSA-RBF 的预测 精度有所提高,表明 TSA 算法可以用于 RBF 模型 的参数优化.
性能分析
1、CEEMDAN 分解效果验证
分别利 用 RBF 与 LSTM 模型进行预测实验,并以是否采用 CEEMDAN 分解作为自变量,将ERMSE与EMAPE作 为评价指标,实验结果如表所示.
2、RBF 与 LSTM 性能对比
采 用 RBF 和 LSTM 模型对各 IMF 分量分别进行预测实验,并 将 作为对比指标,结果如图所示
3、TSA 算法性能分析
采 用 TSA 算 法 对 RBF 模型的参数进行迭代寻优,并与传统的 GA、 PSO 优化算法进行对比,得到的平均绝对误差EMAE的收敛曲线如图所示.
3、TSA-RBF-LSTM 鲁棒性验证
将 4 种预测模 型对各采样点的绝对误差 绘制成箱线图,结 果如图所示. 可以看出,相比于其他 3 种模型, TSA-RBF-LSTM 模型的箱线图箱体范围最窄,且 上边缘最低,说明该模型能够将预测误差控制在 较小的区间范围内,证明所提出的模型具有很好的鲁棒性.
与未进行 CEEMDAN 能耗数据分解相 比,分解后的 RBF、LSTM 模型的预测精度均更 高,说明 CEEMDAN 算法能够有效地对具有非线 性、非平稳性的能耗数据进行平稳化处理,提升 模型的预测精度. LSTM 模型对于高频 IMF 分量 的预测精度优于 RBF 模型,对于低频 IMF 分量的 预测精度较差,因此,LSTM 模型更适用于高频 IMF 分量的预测,RBF 模型更适用于低频 IMF 分 量的预测。
未来工作中,将进一步研究建筑能耗 和建筑负荷的特征区别、建筑能耗预测模型中解 释变量选择的技术逻辑,对模型输入特征变量选 择和处理进行更深入的分析.
建筑能耗混合预测系统:
我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。
毕设帮助,疑难解答,欢迎打扰!