Outlier Analysis 2nd Edition笔记(一)

简介

关于时间序列的一个假设是temporal continuity. 说的是数据在时间上具有连续性, 如果不连续, 那就算是异常数据.

Temporal continuity refers to the fact that the patterns in the data are not expected to change abruptly, unless there are abnormal processes at work.

在带有时间维度的多维度数据中(例如文字流数据), temporal continuity效应是很弱的, 目前本章的时间序列检测只适用于如下两个场景:

  1. 纯时间序列数据
  2. 带有时间维度的多维度数据

在多维数据中, 异常既可以发生在时间相关的序列数据中, 也可能发生在与时间无关的独立数据点中, 前者需要检查时间上的数据连续性, 而后者的异常检测和普通数据的异常检测非常类似.

The anomalies in multidimensional streaming data could correspond to either time-instants at which aggregate trends have changed or movelties in individual data points.

Contextual or collective

时间序列中的异常只包含两种: 时间维度相关的(contextual)和时间维度无关的(整个序列数据都是异常值)

Outliers are contextual when the values at specific time stamps suddenly change with respect to their temporally adjacent values

Outliers are collective when entire time series or large subsequences within a time series have unusual shapes.

连续型数据和离散型数据

这里有要注意的地方, 两种不同类型数据的时间序列异常检测方法是不同的, 离散型数据没有连续型数据那样的大小序列的性质.

你可能感兴趣的:(异常检测)