滑动窗口在机器学习中的运用

文章目录

  • 导读
  • 计算机网络的滑动窗口复习
  • 滑动窗口的原理简述
  • 滑动窗口的应用
  • 最后的话

导读

如果接触过计算机网络中的TCP/IP协议的话,你可能会对滑动窗口比较熟悉。那么滑动窗口到底是什么原理?在机器学习中又是如何运用?

计算机网络的滑动窗口复习

在计算机网络中,滑动窗口的主要目的是流量控制,也就是为了处理网络拥塞的情况。对于拥塞,有三种不同策略的滑动窗口,分别是:停止等待后退N帧选择重传。这些就不一一展开了,因为我们接下来主要介绍的和计算机网络的滑动窗口关联并不大。

滑动窗口的原理简述

滑动窗口就像是一张解密卡,中间的可以透光的部分可以让我们看到卡片的后面。

滑动窗口在机器学习中的运用_第1张图片

嗯……是不是暴露年龄了?

如果你恰好有很大一堆需要解密的数据,你就会用这张解密卡从左到右移动,逐渐解开所有的谜题。

这就是滑动窗口的原理。因为是每走一步分析一次,所以滑动窗口对时序数据的分析有着非常大的作用。如果只是单纯的分段分析,有可能会刚好忽略了转折点,最终就没能得到较好的结果。

滑动窗口的应用

正因为滑动窗口对于时序数据的优势,所以滑动窗口将来会更多的应用在涉及时序数据的分析中,比如股票随着时间的涨跌情况脑网络中随时间变化的活动情况电网中各类传感器数据随时间变化的情况等等实时或者准实时业务的分析。

注:准实时可以理解为——采样时间间隔并非1秒,而是根据对业务来说的重要程度自定义的。比如,ICU里的病人需要1秒一次数据采样,因为晚一点人就没了;而糖尿病则几个小时甚至一两天进行一次数据采样,虽然确实是采样分析但是时间间隔相当长,因为体液作用非常慢,间隔太短反而浪费服务器资源。这就是实时和准实时的区别。

到了现在这个“充分挖掘数据价值”的时代中,单一时间片的数据已经远远不够价值地体现了,需要大量的、多个时间维度的分析与评价,最终联系多个时间段的实际情况对实验结果的影响最终得出可能的结论。

听不懂没关系,还是一如既往的小例子。

你的小猫娘并不是一成不变的。她再怎么说也是有懵懂期、好动期、叛逆期和发情期等等,每个阶段都有不同的心理和生理活动,所以想要理解你的小猫娘的话,要是一直将你的小猫娘固定在让你最快乐的那个时段中,最终对小猫娘的理解一定是片面的。而若是动态地分析,不停地按照一定的步长分析每个时段的小猫娘,在保证考虑新时段和旧时段的联系的同时,还要使用相对较长的步长来避免你对过去的小猫娘的不舍。这样最终对小猫娘的理解也会相对来说更为全面

这也正是滑动窗口想要解决的问题。一次只看一小部分,但是每个部分都有相关联的地方,不至于完全隔断,也不至于过度分析。

最后的话

滑动窗口虽然是能够让我们看到相对来说更为连续的数据,但是窗口毕竟是窗口,并不能帮助分析

窗口的实质只不过是使用狭窄的边框屏蔽掉整个数据的其他部分,从而让我们更好地专注于整个数据中的一小部分连续的数据。真正的分析还是得使用能够分析数据的机器学习算法,比如寻优的遗传和免疫、分类的随机森林、预测的回归分析等等。

是不是有点能理解了?

你可能感兴趣的:(机器学习,人工智能,大数据)