一个完整的机器学习项目实战代码+数据分析过程:哈佛大学能耗预测项目(Prediction of Buildings Energy Consumption)

目录

  • 哈佛大学能耗预测项目
    • 背景介绍
    • 数据采集
    • 探索性数据分析
    • 预测模型
    • 机器学习方法
    • 总结和结论
    • 项目资料获取:https://download.csdn.net/download/github_38486975/11120922
      • 其他获取方式一:
      • 其他获取方式二:
      • 其他获取方式三:

哈佛大学能耗预测项目

背景介绍

现在,建筑物的能源性能问题是建筑物业主非常关注的问题,因为它转化为成本。根据美国能源部的数据,建筑物消耗的能源约占美国所用能源的40%。一些州和市政当局已采用建筑节能目标,以减少城市地区以及区域和全球的空气污染和气候变化。

在这个项目中,我们对哈佛校园建筑的天气数据,时间数据和历史能耗数据应用五种机器学习模型,以预测未来的能源消耗。这些建筑物中安装了分表和传感器,用于测量三种能源的每小时和每日消耗量:电力,冷凝水和蒸汽。

机器学习模型产生准确的能耗预测,设施管理人员,公用事业公司和建筑调试项目可以使用它们来实施节能政策。对于大学设施,如果他们可以预测所有校园建筑的能源使用,他们可以提前制定计划,以优化冷却器,锅炉和储能系统的运行。

数据采集

我们从两个不同的来源获得了每小时的天气数据,一个位于哈佛大学校园的气象站,以及从位于马萨诸塞州剑桥的气象站购买的气象数据。这些天气数据包含非常详细的天气数据集,包括室外温度,湿度,风速,风向,太阳辐射,大气压力,除湿等。

从Harvard Energy Witness网站下载电力,冷冻水和蒸汽的每小时和每日能耗数据。这些文件包含累积的子表读数和需要清理的大量信息。

最后,我们计算了时间数据,包括一天中的小时,一周中的一天,一年中的一天,一年中的一周, c o s h o u r = cos ⁡ ( h o u r ∗ 2 π / 24 ) coshour = \cos(hour* 2\pi / 24) coshour=coshour2π/24,以及基于学术日历的每日占用率估计。上学日,周末和假日分配不同的占用率。

收集,清理和重新格式化收集的数据的过程需要大量的工作,并且在ipython中有详细记录数据处理 。

探索性数据分析

在设计能量预测模型之前,我们分析了收集的数据,以发现一些有趣的发现,然后我们将进一步探讨。

细节在探索性分析iPython Notebook

预测模型

我们收集了一栋建筑的数据,并将其分为训练和测试集。对于每个机器学习模型,我们使用训练集训练模型以预测能量消耗并使用测试集来验证预测模型。

一旦我们找出最有效的机器学习模型,最有影响力的特征,使用一个建筑物的数据的最合适的参数,这个训练的模型可以用于预测相似类型的另一个建筑物的能量消耗:类似的HVAC系统,类似的房间空间,房间类型(办公室或实验室)。

机器学习方法

  • 高斯过程回归
  • 线性回归
  • K最近邻回归
  • 随机森林回归
  • 支持向量回归

总结和结论

我们的研究结果表明,高斯过程回归优于其他方法。点击总结和结论,以了解更多关键发现。

项目资料获取:https://download.csdn.net/download/github_38486975/11120922

如果觉得文章有帮助,可以用此链接下载,我会得到7个积分(/捂脸),多谢兄dei~~
如果积分不多的小白同学,下面获取方式都一样可以拿到一手资源:

其他获取方式一:

访问Prediction of Buildings Energy Consumption项目介绍主页
(http://cs109-energy.github.io/building-energy-consumption-prediction.html)

其他获取方式二:

在GitHub cs109-energy上查看项目

其他获取方式三:

在Baidu网盘提取码:9uu2

你可能感兴趣的:(Kaggle案例)