2.3.8 周期变量

对于某些连续变量(比如周期变量),使用高斯分布建模并不合适。

为什么不合适?



考虑观测数据集的均值问题,首先假设为弧度,很明显平均值强烈依赖坐标系(原点)的选取。为了找一个均值不变的度量,我们将观测当做单位圆上的点,这样就可以被描述成一个二维的单元向量(取值区间在-1到1),求平均也就是

根据该均值找到对应的角度,这个定义将会保证均值的位置与极坐标原点的选择无关(???)。另外通常位于单位圆的内部。在笛卡尔坐标系下,因此样本均值的笛卡尔坐标,带入上面的均值公式可得:

使用公式可以求出,也就是观测数据集的均值。


现在我们考虑高斯分布对于周期变量的一个推广: von Mises 分布。
按照惯例我们考虑周期函数分布的周期为,满足下面三个条件:

我们可以很容易地得到一个类似高斯的分布,满足这三个性质:两个变量的高斯分布,均值为,协方差矩阵为,其中是个的单位矩阵。因此

概率为常数的轮廓线是圆形,如图所示。


该分布沿着一个固定半径的圆周的值。如果我们将这个分布的形式从笛卡尔坐标系转换到极坐标系,这样的分布具有周期性。

替换到高斯分布的公式里面,考察指数项(只有指数项与
相关):

定义
,我们得到在单位圆
上的概率分布
的表达式:

这被称为von Mises分布,或者环形正态分布( circular normal )。其中
对应分布的均值,m被称为concentration参数,类似于高斯分布的精度,归一化系数
是零阶修正的第一类 Bessel 函数(???)

对于大的m值,分布逼近高斯分布。


现在考虑von Mises 分布中参数和的最大似然估计,对数似然函数:


  1. 令关于的导数为0:

    使用三角恒等式

    我们有

    这跟我们之前在二维笛卡尔空间的观测下求取的均值相同


  2. 这里没看懂,直接贴图


你可能感兴趣的:(2.3.8 周期变量)