时序分析 46 -- 时序数据转为空间数据 (五) 马尔可夫转换场 python 实践(上)

时序分析 46 时序数据转为空间数据 (五)

马尔可夫转换场 python 实践(上)




import matplotlib.pyplot as plt
import numpy as np
import os
import pandas as pd
import sys

from matplotlib import gridspec
from numba import njit, prange
from pyts.image import MarkovTransitionField

import tsia.plot
import tsia.markov
import tsia.network_graph
%matplotlib inline
tag_df = pd.read_csv("signal-1.csv")
tag_df["timestamp"] = pd.to_datetime(tag_df["timestamp"], format="%Y-%m-%dT%H:%M:%S.%f")
tag_df = tag_df.set_index("timestamp")
fig = plt.figure(figsize=(28,4))
plt.plot(tag_df, linewidth=0.5)

时序分析 46 -- 时序数据转为空间数据 (五) 马尔可夫转换场 python 实践(上)_第1张图片




n_bins = 8
strategy = 'quantile'
X = tag_df.values.reshape(1, -1)
n_samples, n_timestamps = X.shape

mtf = MarkovTransitionField(image_size=48, n_bins=n_bins, strategy=strategy)
tag_mtf = mtf.fit_transform(X)
fig = plt.figure(figsize=(5,4))
ax = fig.add_subplot(111)
_, mappable_image = tsia.plot.plot_markov_transition_field(mtf=tag_mtf[0], ax=ax, reversed_cmap=True)

时序分析 46 -- 时序数据转为空间数据 (五) 马尔可夫转换场 python 实践(上)_第2张图片

  • 将时序数据离散化
  • 构建马尔可夫转换矩阵
  • 估算转换概率
  • 计算马尔可夫转换场
  • 计算聚合的MTF
  • 提取有意义的指标
  • 将转换概率映射回初始信号

Step 1. 数据离散化




(4416, 1)

X_binned, bin_edges = tsia.markov.discretize(tag_df)


unique, counts = np.unique(X_binned, return_counts=True)
print(np.asarray((unique, counts)).T)

[[ 0 552]
[ 1 552]
[ 2 552]
[ 3 552]
[ 4 552]
[ 5 552]
[ 6 552]
[ 7 552]]


array([ 82.4318845 , 118.41579271, 137.42079667, 156.7783225 ,
166.35528917, 175.224915 , 183.85208333, 196.53184021,
255.378145 ])
| Bin | Start | End |
| 0 | 82.4 | 118.4 |
| 1 | 118.4 | 137.4 |
| 2 | 137.4 | 156.8 |
| 3 | 156.8 | 166.4 |
| 4 | 166.4 | 175.2 |
| 5 | 175.2 | 183.9 |
| 6 | 183.9 | 196.5 |
| 7 | 196.5 | 255.3 |

tsia.plot.plot_timeseries_quantiles(tag_df, bin_edges, label='signal-1')

时序分析 46 -- 时序数据转为空间数据 (五) 马尔可夫转换场 python 实践(上)_第3张图片

Step 2. 建立马尔可夫转换矩阵

X_mtm = tsia.markov.markov_transition_matrix(X_binned)

array([[465., 86., 1., 0., 0., 0., 0., 0.],
[ 80., 405., 63., 2., 0., 2., 0., 0.],
[ 3., 59., 379., 96., 9., 2., 2., 1.],
[ 2., 2., 94., 352., 75., 19., 6., 2.],
[ 0., 0., 12., 89., 314., 110., 23., 4.],
[ 0., 0., 0., 9., 125., 312., 86., 20.],
[ 2., 0., 2., 4., 21., 89., 320., 114.],
[ 0., 0., 0., 0., 8., 18., 115., 411.]])

    简单解读一下,第一个单元的465表示有465个时间点上从bin 0到bin 0,bin 0代表82.4到118.4的区间中;第一行第二个单元格中的86表示有86个时间点从bin 0转换到了bin 1,bin 1代表118.4到137.4的区间。其他单元格的意义以此类推。显然对角线上的数值表示了自我转换的计数。

Step 4. 计算转换概率

X_mtm = tsia.markov.markov_transition_probabilities(X_mtm)
np.round(X_mtm * 100, 1)

array([[84.2, 15.6, 0.2, 0. , 0. , 0. , 0. , 0. ],
[14.5, 73.4, 11.4, 0.4, 0. , 0.4, 0. , 0. ],
[ 0.5, 10.7, 68.8, 17.4, 1.6, 0.4, 0.4, 0.2],
[ 0.4, 0.4, 17. , 63.8, 13.6, 3.4, 1.1, 0.4],
[ 0. , 0. , 2.2, 16.1, 56.9, 19.9, 4.2, 0.7],
[ 0. , 0. , 0. , 1.6, 22.6, 56.5, 15.6, 3.6],
[ 0.4, 0. , 0.4, 0.7, 3.8, 16.1, 58. , 20.7],
[ 0. , 0. , 0. , 0. , 1.4, 3.3, 20.8, 74.5]])


(8, 8)
以第二行为例,14.5代表有14.5%的时间点从bin 1转化到了bin 0;11.4代表有11.4%的时间点从bin 1转化到了bin 2。其他以此类推。

Step 5. 计算马尔可夫转换场(MTF)

def _markov_transition_field(X_binned, X_mtm, n_timestamps, n_bins):
    X_mtf = np.zeros((n_timestamps, n_timestamps))
    # We loop through each timestamp twice to build a N x N matrix:
    for i in prange(n_timestamps):
        for j in prange(n_timestamps):
            # We align each probability along the temporal order:
            # MTF(i,j) denotes the transition probability of the bin
            # "i" to the bin "j":
            X_mtf[i, j] = X_mtm[X_binned[i], X_binned[j]]
    return X_mtf

X_mtf = _markov_transition_field(X_binned, X_mtm, n_timestamps, n_bins)
np.round(X_mtf * 100, 1)

array([[68.8, 68.8, 68.8, …, 68.8, 68.8, 68.8],
[68.8, 68.8, 68.8, …, 68.8, 68.8, 68.8],
[68.8, 68.8, 68.8, …, 68.8, 68.8, 68.8],
[68.8, 68.8, 68.8, …, 68.8, 68.8, 68.8],
[68.8, 68.8, 68.8, …, 68.8, 68.8, 68.8],
[68.8, 68.8, 68.8, …, 68.8, 68.8, 68.8]])



(4416, 4416)

unique, counts = np.unique(X_mtf[1], return_counts=True)
print(np.asarray((unique, counts)).T)

[[1.81488203e-03 5.52000000e+02]
[3.62976407e-03 1.10400000e+03]
[5.44464610e-03 5.52000000e+02]
[1.63339383e-02 5.52000000e+02]
[1.07078040e-01 5.52000000e+02]
[1.74228675e-01 5.52000000e+02]
[6.87840290e-01 5.52000000e+02]]

MTF主要是在保留时间域信息的情况下顺序表示马尔可夫转换概率。注意MTF是以时间为下标的。 我们来解读一下MTF中的数值。例如,MTF[1,2] = 68.8%,代表时间点1和2。我们查一下这两个时间点位于哪个分位数或者说位于哪个bin中。


(2, 2)
这两点都位于bin 2中,也就是说 从bin 2到bin 2的概率为68.8%。


(0.10707803992740472, 1)


fig = plt.figure(figsize=(15,12))
ax = fig.add_subplot(1,1,1)
_, mappable_image = tsia.plot.plot_markov_transition_field(mtf=X_mtf, ax=ax, reversed_cmap=True)

时序分析 46 -- 时序数据转为空间数据 (五) 马尔可夫转换场 python 实践(上)_第4张图片

