哈,我又来啦,第一篇扯完淡,这一篇就谈技术吧。之前的研究集中在低频(秒级)数据,用的是各种深度学习方法,因此我就谈谈这种方法。
其实,刚读研时,导师给我的是用隐马尔可夫模型方法,学了大半年,突然导师拿了一篇让我崩溃的论文《Neural NILM: Deep Neural Networks Applied to Energy Disaggregation》,这篇文章应该是深度学习用到nilm领域的鼻祖文章了(我说深度学习,不是NN),你要是问我听谁说的,我记得是在谷歌的nilm讨论组 https://groups.google.com/forum/#!forum/energy-disaggregation ,你翻一下,Kelly(这篇文章的作者,也是nilmtk(后面会讲)的作者,也是UK-dale数据集的作者,现在不做nilm了,好像去deepmind了!)有个帖子大概说的是:我们试试深度学习呗,之前好像没人试,我们看看效果。而让我崩溃的是,看了大半年的fhmm(hmm的变种)方法,在这篇文章里被深度学习吊打。那还有什么可说的,学深度学习呗。
学…… 深度学习学着学着,发现比fhmm好太正常了。虽然nilm领域没这样提过,但是按目前的理解,nilm负荷分解任务就是语音识别中的鸡尾酒会问题,鸡尾酒会问题大概就是(我瞎编,不对的话你百度吧)一个派对上你能听到一堆人乱哄哄的说话,这是输入(在nilm中就是总电表的有功功率(假设只以电表有功作为特征)),而你要做的就是听出来每个人说的是啥(输出,分离出每个人说的啥话),在nilm任务中就是分离出每个电器的功率消耗,你说像不像!一毛一样。
看鸡尾酒会问题的举例,如下图,你走在路上听见啥声都有,你要分离出每种声音(警笛,人声,狗叫什么的)。
再看nilm任务的图如下。这是一个家庭一段时间总电表的有功曲线,其中每种颜色是一个电器的有功消耗,所有电器组成了电表的有功曲线,你说和语音识别领域像不像。(艾玛,终于有张图不是盗的了,这是我毕业论文里的图。我盗我自己?)
说了大半天,我其实想说的是,语音识别领域之前最流行的算法之一就是隐马尔可夫,而深度学习兴起之后……你懂的,语音识别谁不用深度学习。而nilm任务与之这么像,深度学习方法效果好就很正常了。
好,下面,梳理下我看到的一些深度学习方法的论文:
首先,就是2015年Kelly这篇让我崩溃的论文《Neural NILM: Deep Neural Networks Applied to Energy Disaggregation》,深度学习做nilm开山作。
第二:《Sequence-to-point learning with neural networks for nonintrusive load monitoring》
第三:《Sliding Window Approach for Online Energy Disaggregation Using Artificial Neural Networks》
(之所以提二和三,是因为它俩很像,也和我毕业论文有些像,我差点撞车(没撞,兄弟,撞的是翟天临(手动滑稽)),所以印象太深了,这俩是17年18年的文章,是对Kelly2015年那篇文章中RNN方法的改进)
第四:《Denoising autoencoders for Non-Intrusive Load Monitoring: Improvements and comparative evaluation》 2017年这篇是对2015年kelly论文中降噪自编码方法的优化(这篇文章还又把隐马尔可夫踩了一脚,后面会说)
第五:《On the Feasibility of Generic Deep Disaggregation for Single-Load Extraction》这篇是2018nilm国际会议的最佳论文,不过你要说有什么亮点的话……原来都是直接输出电器的有功消耗序列,它反而倒退了,输出的是电器的0,1开关序列。当然,这是有好处的,后面有时间讲。
哇,已经挖了不少坑了,先把上面的讲完再说吧,打算一篇说一集。下面还有一些我经常用的数据集啊,综述啊,也给大家参考下。
《REDD: A Public Data Set for Energy Disaggregation Research》REDD是第一个nilm领域的公开数据集,2011年。
《NILMTK: An Open Source Toolkit for Non-intrusive Load Monitoring》这是kelly14年发布的nilm领域的工具包(tool kit嘛)
《THE UK-DALE DATASET, DOMESTIC APPLIANCE-LEVEL ELECTRICITY DEMAND AND WHOLE-HOUSE DEMAND FROM FIVE UK HOMES》这个UK-DALE数据集,同样出自Kelly(我只能喊666了)
《Dataport and NILMTK: A Building Data Set Designed for Non-intrusive Load Monitoring》为什么要提这个数据集,因为……太踏马6了,美国三个州,700多个家庭的数据……当然,这是1分钟采样的,不过现在dataport推出了1s的。(你也很6)
其他的还有一堆数据集,还有什么方法汇总啊,电气特性啊,什么的,有个综述讲的听好(如果有时间,我以后也说下)。综述《Data Analytics for Energy Disaggregation: Methods and Applications》
工具包和数据集,我应该也会讲一下,这东西确实有点费劲。过星期天喽,回去玩unity了,先再见!