时间序列:概述【时间序列挖掘领域主要包括:降维表示、相似性度量、相似性检索、分类、聚类、异常检测、预测、可视化】

在各类大数据研究中,有一类数据是按照时间顺序排列、随时间迁移不断变化的,称为时间序列(Time Series)。时间序列广泛的存在于各行各业中,如 医学医疗、金融财经、水文分析、电力等领域。此外,在生物 基因、物体形态识别等与时间顺序无明显关联的数据类型中,也可以按照一定的规则将其转换成时间序列模式,进而利用时间序列数据挖掘技术进行分析。鉴于时间序列具有数据量大、数据维度高、持续积累等特性,如何从中挖掘潜在的规律和信息已经成为学术界与工业界的研究热点。时间序列数据挖掘已经成为了二十一世纪十大最具挑战性数据挖掘领域的研究内容之一。

随着时间的推移,时间序列表现出来的波动趋势、周期、波峰、波谷等特征中都蕴含着重要的规律和信息,国内外研究人员一直致力于寻求有效的技术路线对时间序列进行探索。

传统的时间序列数据挖掘是基于统计学的理论来进行的。

然而,传统的时间序列挖掘着重于全局,即是构建模型来拟合分析整条时间序列数据。

相对于传统的大数据分析,时间序列数据自有其特性,将传统的方法直接应用于时间序列数据挖掘中尚存在一些不足:

  • 其一,传统的分析模型要求数据的分布符合一定的规则,否则,分析结论难免出现较大失真;
  • 其二,时间序列具有数据量大、维度高的特征,基于全局的分析往往耗时特别长,且会产生“维灾”问题,导致分析性能大幅下降;
  • 其三,实际应用中的时间序列数据挖掘往往更注重于时序数据的局部特征,如相似的波动趋势、异常的数据区间、预测趋势变化等。

时间序列挖掘领域主要包括时间序列的降维表示、相似性检索、分类、聚类、异常检测、预测等研究方向。每个研究方向有其特色的研究内容,各研究方向之间又相互关联、相辅相成。

你可能感兴趣的:(时间序列(Time,Series),时间序列)