分布形态的度量_峰度系数的探讨

集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还应掌握数据分布的形态。
描述数据分布形态的度量有偏度系数和峰度系数,
其中偏度系数描述数据的对称性,峰度系数描述与正态分布的偏离程度。

峰度系数反映分布峰的尖峭程度的重要指标.
当峰度系数大于0时,两侧极端数据较多;
当峰度系数小于0时,两侧极端数据较少。

基本条件

*时间T固定,空间S固定

情况1:只改变中枢的T长短

np15a = np.concatenate((np.arange(0.5, 21, 1.5), np.full((12,), 20), np.arange(20, 40, 1.5)), axis=0)
np20a = np.concatenate((np.arange(0, 21, 2), np.full((18,), 20), np.arange(20, 41, 2)), axis=0)
np25a = np.concatenate((np.arange(0, 21, 2.5), np.full((22,), 20), np.arange(20, 41, 2.5)), axis=0)

分布形态的度量_峰度系数的探讨_第1张图片
峰度分别为①-0.34;②0.42;③1.22

结论:

中枢越长,峰度系数越大。

情况2:只改变中枢的位置

分布形态的度量_峰度系数的探讨_第2张图片
峰度分别为:
0 -1.16
1 -0.84
2 -0.61[绿色]
3 -0.77
4 -1.1

结论:

中枢越靠近均值(偏度接近0),峰值越大(-0.61);
②偏度的正负,对峰度没有影响。但偏度的绝对值越大,峰度值越小。

情况3:峰度值为0的abc浪

import numpy as np
from scipy.stats import kurtosis
def skew0(x1, x2, y=500, s=1):
    np00 = np.concatenate((np.arange(y-x2*s, y, s), np.full((x1,), y), np.arange(y+s, y+s+x2*s, s)), axis=0)
    npp = np.empty((0, len(np00)))
    npp = np.vstack((npp, np00))
    kt = kurtosis(npp[0])
    return kt, npp

f12 = np.arange(100, 1000, 1)
for i in f12:
    for j in f12:
        kt, npp = skew0(i, j, 500, 1)
        if abs(kt) < 0.0001:
            print(i, j, i/j, j/i, kt)

结论

①a+c浪 / b浪的时间比值,约等于2.6712;
也就是说a浪和c浪匀速前提下,极限是2.67;
若a和c浪是水平,极限是8;

def skew0(x1, x2, y=500, s=10):
    np00 = np.concatenate((np.full((x2,), s), np.full((x1,), y), np.full((x2,), 2*y - s)), axis=0)
    npp = np.empty((0, len(np00)))
    npp = np.vstack((npp, np00))
    kt = kurtosis(npp[0])
    return kt, npp

你可能感兴趣的:(numpy,时序数据库)