毕业设计-基于机器学习的建筑能耗预测

目录

前言

课题背景和意义

实现技术思路

一、建筑能耗数据预处理

二、 公共建筑能耗特征分析

 三、基于机器学习的建筑能耗预测模型建模

实现效果图样例

最后


前言


    大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

对毕设有任何疑问都可以问学长哦!

选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277

大家好,这里是海浪学长毕设专题,本次分享的课题是

基于机器学习的建筑能耗预测

课题背景和意义

建筑业作为国民经济支柱性产业,在推动社会发展的同时也消耗了大量能源。推动建筑行业进行节能减排,对实现我国于 2030 年左右使二氧化碳排放达到峰值的节能减排目标具有重要意义。建筑节能减排的一个重要手段是建筑能耗精细化管理,而进行这一工作的基础就是对建筑能耗进行准确的预测,从而支撑建筑运行优化管理,实现节能减排的目标。随着近些年机器学习算法的不断发展,虽然基于各种各样的机器学习算法并利用建筑能耗历史数据可以建立预测模型从而预测出未来一段时期内的建筑能耗,但由于建筑种类多样、运行特点不一,导致没有统一的标准来指导管理人员针对不同建筑选择适合的机器学习预测模型,增加了管理人员建立建筑能耗预测模型的困难程度。因此,尽管已有众多学者提出了以某一类建筑为例的能耗预测的工作方法,但不同建筑类型适用什么样的机器学习算法可以实现更准确的建筑能耗预测效果,以及如何提出普适性的基于机器学习的建筑能耗预测方法,这一问题仍待进一步的研究。

实现技术思路

一、建筑能耗数据预处理

异常数据识别基本原理

历史数据中的异常值会显著影响建筑能耗预测的准确性。为提高预测准确性,首先需要准确识别出历史数据中的异常值,然后再对其进行处理。引入基于机器学习的 K-means 算法来进行异常识别工作。K-means 算法通过计算数据点到聚类中心的欧几里得距离,将数据样本划分为 K 个类簇,最终将相似的数据点划分到同一类簇中。

根据能耗水平,可将该建筑全体逐时能耗划分为高能耗、中能耗、低能耗三类。高能耗对应午餐、晚餐时段,中能耗对应过渡时段,低能耗对应夜间时段。由于空调能耗水平受室外温度影响较大,可引入室外温度和对应时刻数作为聚类参数。

毕业设计-基于机器学习的建筑能耗预测_第1张图片

可以看出在红色圆形数据簇右侧存在明显离群数据,属于异常数据,对这组数据标记异常后剔除。对剔除标记异常数据后的逐时能耗数据再次利用 K-means 算法进行聚类,聚类类别数 K=3,聚类结果如图:

毕业设计-基于机器学习的建筑能耗预测_第2张图片

对上图聚类结果进行分析,可以看出红色圆形数据簇右侧存在明显离群数据,属于异常数据,这组数据标记异常后剔除。同时,绿色星形数据簇左侧存在明显离群数据,属于异常数据,对剔除标记异常数据后的逐时能耗数据再次利用 K-means 算法进行聚类,聚类类别数 K=3,聚类结果如图

毕业设计-基于机器学习的建筑能耗预测_第3张图片

 建筑能耗异常数据修复

数据缺失会给数据挖掘效果造成很大影响。具体到建筑能耗预测领域,数据缺失会大幅提高计算耗时,也会影响预测的准确性,因此需要通过合适的方法进行数据填补修复工作,其中 KNN 算法凭借其简单方便、在历史数据支撑下准确率高的优点,在各领域 的缺失值填补中都得到了广泛应用。

利用 KNN 算法可以准确且合理的实现对建筑能耗异常数据以及缺失值的修复,并且修复结果符合建筑能耗运行规律特征。根据 KNN 算法原理及流程,对识别剔除的某酒店建逐时能耗异常数据进行填补修复,结果如下:

毕业设计-基于机器学习的建筑能耗预测_第4张图片

首先,通过对建筑基本信息和运行规律的梳理,可以对建筑能耗实测数据中存在的不合理 0 值及缺失值进行初步标记筛除。然后,对完成初筛的数据集利用 K-means 算法实现对异常数据的精确识别与标记。之后,利用 KNN 算法对标记的异常数据进行修复。最后,将绘制处理结果展示图,直观展示建筑能耗数据预处理效果。

毕业设计-基于机器学习的建筑能耗预测_第5张图片

二、 公共建筑能耗特征分析

选取办公、商业、酒店和医疗四种常见的公共建筑类型进行研究,由于建筑运行方式的差异,不同类型的公共建筑具有不同的建筑能耗特征

办公建筑能耗特征分析
利用箱线图对办公建筑进行能耗分布特征画像与分析。可以直观看出该案例办公建筑在记录周期内的逐时能耗分布情况。

毕业设计-基于机器学习的建筑能耗预测_第6张图片

对该办公建筑总能耗及四大分项能耗的逐时耗电量进行描述性统计:

毕业设计-基于机器学习的建筑能耗预测_第7张图片

通过对该案例办公建筑历史能耗数值分布特征进行初步分析,发现建筑总能耗、照明插座以及暖通空调能耗都存在分布范围较大的情况。尤其是暖通空调分项能耗的平均值和中位数偏差较大,说明暖通空调分项能耗在记录周期内分布不均匀,

为直观的说明该案例办公建筑能耗在不同季节和昼夜间的运行特征,分别选取该建筑夏季、冬季和过渡季的逐时能耗数据绘制逐时平均能耗堆积柱状图。

毕业设计-基于机器学习的建筑能耗预测_第8张图片

毕业设计-基于机器学习的建筑能耗预测_第9张图片

毕业设计-基于机器学习的建筑能耗预测_第10张图片

 对比分析以上办公建筑各季节逐时平均能耗堆积图可以看出,在全年各季节中照明插座、特殊设备、动力设备等能耗数值基本保持稳定,而暖通空调能耗表现出明显的季节性差异。

商业建筑能耗特征分析
通过对该商业建筑总能耗及四大分项能耗的逐时耗电量进行描述性统计并绘制箱线图:

毕业设计-基于机器学习的建筑能耗预测_第11张图片

为更直观的说明该案例商业建筑能耗在不同季节和昼夜间的运行特征,分别选取该商业建筑夏季 、冬季 和过渡季 的逐时能耗数据绘制逐时平均能耗堆积柱状图

毕业设计-基于机器学习的建筑能耗预测_第12张图片

毕业设计-基于机器学习的建筑能耗预测_第13张图片

毕业设计-基于机器学习的建筑能耗预测_第14张图片

对比分析该案例商业建筑各季节逐时平均能耗堆积图可以发现,该建筑具有明显的昼夜能耗运行差异,白天建筑各项能耗高负荷运行,夜晚各分项能耗保持低负荷或近零负荷运行。

 酒店建筑能耗特征分析

酒店建筑能耗分布箱线图:

毕业设计-基于机器学习的建筑能耗预测_第15张图片

为表明该案例酒店建筑能耗在不同季节和昼夜间的运行特征,分别选取该建筑夏季、冬季和过渡季逐时能耗数据绘制逐时平均能耗堆积柱状图

毕业设计-基于机器学习的建筑能耗预测_第16张图片

毕业设计-基于机器学习的建筑能耗预测_第17张图片

毕业设计-基于机器学习的建筑能耗预测_第18张图片

对比分析以上三张图表可以看出,在全年各季节中照明插座、特殊设备用电、动力设备等能耗数值基本保持稳定,不同季节的能耗差异主要是由暖通空调分项能耗的变化导致的

 三、基于机器学习的建筑能耗预测模型建模

支持向量机回归预测模型

1)支持向量机回归能耗预测原理
支持向量机(support vector machines, SVM)是一种基于统计学理论的数据挖掘处理方法,可以有效的实现分类和回归等数据挖掘效果。
支持向量机通过在满足数据分类要求的基础上将数据集分类并寻找分类最优超平面,可以在保证分类精度的前提下使得超平面两旁的空余区域最大,从而实现了对数据线性分类的最优解。

毕业设计-基于机器学习的建筑能耗预测_第19张图片

2)支持向量机回归能耗预测模型
在阐述说明支持向量机算法的基本原理后,本文利用 Python 语言基于 Keras 平台搭建支持向量机回归(SVR) 能耗预测模型。当训练数据集距离预测数据过远时,会产生训练集数据冗余的问题,这可能会导致支持向量机超平面选择难以逼近最优解,最终影响预测效果。所以需要剔除这部分冗余数据,选择合适的训练长度以实现最佳的预测效果。本文通过全局寻优的方法以确定训练长度,寻优结果。

毕业设计-基于机器学习的建筑能耗预测_第20张图片

长短期记忆神经网络预测模型
1)长短期记忆神经网络算法原理
长短期记忆神经网络(Long Short-term Memory, LSTM)是由循环神经网络(Recurrent Neural Network, RNN)发展而得到的一种特殊的神经网络。长短期记忆神经网络的神经元结构如图:

毕业设计-基于机器学习的建筑能耗预测_第21张图片

2)长短期记忆神经网络能耗预测模型

对于所建立的 LSTM 预测模型来说,最重要的变量参数是选取过去多长的逐时数据作为输入参数,即 look_back 值应选取多少,才能实现最佳的模型预测效果。为解决这一问题,本文通过全局寻优的方式确定了 look_back 值的最优解。

毕业设计-基于机器学习的建筑能耗预测_第22张图片

基于 LSTM 算法的建筑能耗预测模型输入参数,这样就可以利用该模型完成对案例酒店建筑 8 月首周总能耗预测的工作,预测结果如图:

毕业设计-基于机器学习的建筑能耗预测_第23张图片

可以看出,该模型准确的完成了建筑能耗预测工作,可以利用该模型对本文前述各类建筑能耗数据进行预测。

 决策树预测模型

1)决策树 XGBOOST 算法原理
该算法通过改进传统 GBDT gradient boosting decision tree)决策树算法,避免了算法过拟合的问题,当模型存在 t 个决策树时,有:

2)决策树 XGBOOST 能耗预测模型

在阐述说明决策树 XGBOOST 算法原理的基础上,利用 Python 语言基于 Keras平台搭建了XGBOOST 能耗预测模型。当训练数据集数据过多时,会产生训练集数据冗余的问题,这可能会导致支持决策树叶子节点过多,影响预测效果。所以需要剔除这部分冗余数据,通过选择合适的训练长度以实现最佳的预测效果。

毕业设计-基于机器学习的建筑能耗预测_第24张图片

通过以上工作,可以确定基于 XGBOOST算法的建筑能耗预测模型输入参数,从而完成基于 XGBOOST 算法的预测模型建模。这样就可以利用该模型完成对案例酒店建筑 8 月首周总能耗预测的工作,预测结果如图:

毕业设计-基于机器学习的建筑能耗预测_第25张图片

实现效果图样例

模型预测结果分析
办公建筑预测结果分析:

毕业设计-基于机器学习的建筑能耗预测_第26张图片

办公建筑能耗模型预测结果表:

毕业设计-基于机器学习的建筑能耗预测_第27张图片

 对于办公建筑而言,其能耗既具有明显的昼夜差异,也具有明显的工作日和非工作日差异。从预测结果可以看出,基于 SVR LSTM 算法的单因素预测模型预测结果准确度较差,而基于 XGBOOST 算法的多因素预测模型在各个季节的预测中均取得了较好的预测准确性,可以实现良好的预测效果。

我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。

毕设帮助,疑难解答,欢迎打扰!

最后

你可能感兴趣的:(机器学习毕业设计,深度学习,python毕业设计,课程设计,人工智能,python,深度学习)