预测之相似日算法

最近阅读很多关于相似日预测方面的论文,均是通过构建日特征向量,然后计算其相似度,大多数是考虑因子和量化匹配系数不一样,心得如下:

  • 1、日特征向量=[ 最高温度 最低温度 日类型 ]

    相似度计算公式:欧几里得公式
    预测之相似日算法_第1张图片预测之相似日算法_第2张图片

  • 2、日特征向量=[ 气象因子 日分类 星期类型 日天气类型 ]

    相似度计算公式:夹角余弦公式

  • 3、日特征向量=[ 人体舒适度指数 日期差距 星期类型 日天气类型 ]

    相似度计算公式:夹角余弦公式
    预测之相似日算法_第3张图片

  • 4、趋势相似日和形状相似日

    量化了曲线形状相似度和趋势相似度

  • 5、前趋势相似度

  • 6、日特征向量=[ 气象因素 日期差距 星期类型 重大节假日 ]

    相似度计算公式:将日特征向量分成三类,气象因子、时间因子和星期因子,然后通过关联度计算气象因子匹配系数、时间因子匹配系数和星期因子匹配系数,让通过相乘得出总相似度。

我认为最好是第六种,具体说明一下:

1)气象因子匹配系数
气象因子匹配系数是表示待预测与历史日在气象上的相似程度。通过pearson相关性分析或者互信息分析对短期电力负荷影响最大的气象因素,构建气象因素特征向量,用灰色关联分析来计算得出气象因子匹配系数。
预测之相似日算法_第4张图片
由关联系数的计算公式可知:差异性越小,关联系数越大,待预测与历史日的关联度也越大。取关联度作为气象因子匹配系数。
2)时间因子匹配系数
时间因子匹配系数是表示预测日与历史日在时间是上的相似程度,而时间因素就是指历史日距离待预测日的天数,即日期差距。采用“近大远小”的原则,同时考虑负荷变化的周期性和节假日年周期变化的规律。预测之相似日算法_第5张图片
3)星期因子匹配系数
星期因子匹配系数是表示待预测日和历史日在星期类型上的相似程度。显然,星期类型相近程度越大,星期因子匹配系数应越大。
把星期类型量化,即周一的映射为0.1,周二到周四的映射值为0.2,周五的映射值为0.3,周六的映射值为0.7,周日的映射值为1.预测之相似日算法_第6张图片
4)综合匹配系数
综合考虑上述的匹配系数,采用相乘的方法,得到总相似度。具体而言,就是把气象因子匹配系数、时间因子匹配系数和星期因子匹配系数相乘得到综合匹配系数。综合匹配系数越大,选出来的相似日和预测日特性越接近。

你可能感兴趣的:(数据挖掘)