我们有两个周期为 L L L 的函数 g 1 ( t ) g_1(t) g1(t) 和 g 2 ( t ) g_2(t) g2(t),并定义随机过程:
X ( t ) = g 1 ( t + ε ) , Y ( t ) = g 2 ( t + ε ) , X(t) = g_1(t + \varepsilon), \quad Y(t) = g_2(t + \varepsilon), X(t)=g1(t+ε),Y(t)=g2(t+ε),其中 ε \varepsilon ε 是一个均匀分布在 [ 0 , L ] [0, L] [0,L] 上的随机变量,即 ε ∼ U ( 0 , L ) \varepsilon \sim U(0, L) ε∼U(0,L)。目标是求它们的互相关函数:
R X Y ( t , t + τ ) = E [ X ( t ) Y ( t + τ ) ] . R_{XY}(t, t + \tau) = E[X(t)Y(t + \tau)]. RXY(t,t+τ)=E[X(t)Y(t+τ)].
互相关函数 R X Y ( t , t + τ ) R_{XY}(t, t + \tau) RXY(t,t+τ) 衡量的是 X ( t ) X(t) X(t) 和 Y ( t + τ ) Y(t + \tau) Y(t+τ) 之间的相关性,定义为:
R X Y ( t , t + τ ) = E [ X ( t ) Y ( t + τ ) ] . R_{XY}(t, t + \tau) = E[X(t)Y(t + \tau)]. RXY(t,t+τ)=E[X(t)Y(t+τ)].代入 X ( t ) X(t) X(t) 和 Y ( t ) Y(t) Y(t) 的表达式:
= E [ g 1 ( t + ε ) g 2 ( t + τ + ε ) ] . = E[g_1(t + \varepsilon) g_2(t + \tau + \varepsilon)]. =E[g1(t+ε)g2(t+τ+ε)].
因为 ε \varepsilon ε 是随机变量,我们需要对 ε \varepsilon ε 的所有可能值求期望。由于 ε ∼ U ( 0 , L ) \varepsilon \sim U(0, L) ε∼U(0,L),其概率密度函数为:
f ε ( x ) = { 1 L 如果 x ∈ [ 0 , L ] , 0 其他情况 . f_\varepsilon(x) = \begin{cases} \frac{1}{L} & \text{如果 } x \in [0, L], \\ 0 & \text{其他情况}. \end{cases} fε(x)={L10如果 x∈[0,L],其他情况.因此,期望可以表示为积分:
E [ g 1 ( t + ε ) g 2 ( t + τ + ε ) ] = ∫ − ∞ ∞ g 1 ( t + x ) g 2 ( t + τ + x ) f ε ( x ) d x . E[g_1(t + \varepsilon) g_2(t + \tau + \varepsilon)] = \int_{-\infty}^{\infty} g_1(t + x) g_2(t + \tau + x) f_\varepsilon(x) \, dx. E[g1(t+ε)g2(t+τ+ε)]=∫−∞∞g1(t+x)g2(t+τ+x)fε(x)dx.由于 f ε ( x ) f_\varepsilon(x) fε(x) 只在 [ 0 , L ] [0, L] [0,L] 上非零,积分限可以缩减:
= 1 L ∫ 0 L g 1 ( t + x ) g 2 ( t + τ + x ) d x . = \frac{1}{L} \int_{0}^{L} g_1(t + x) g_2(t + \tau + x) \, dx. =L1∫0Lg1(t+x)g2(t+τ+x)dx.
为了简化积分,做变量替换:
v = t + x ⇒ d v = d x . v = t + x \quad \Rightarrow \quad dv = dx. v=t+x⇒dv=dx.当 x = 0 x = 0 x=0, v = t v = t v=t;当 x = L x = L x=L, v = t + L v = t + L v=t+L。因此积分变为:
= 1 L ∫ t t + L g 1 ( v ) g 2 ( v + τ ) d v . = \frac{1}{L} \int_{t}^{t + L} g_1(v) g_2(v + \tau) \, dv. =L1∫tt+Lg1(v)g2(v+τ)dv.
由于 g 1 g_1 g1 和 g 2 g_2 g2 是周期为 L L L 的函数,积分区间 [ t , t + L ] [t, t + L] [t,t+L] 的长度刚好是一个周期。因此,积分结果与起始点 t t t 无关,可以平移积分区间到 [ 0 , L ] [0, L] [0,L]:
= 1 L ∫ 0 L g 1 ( v ) g 2 ( v + τ ) d v . = \frac{1}{L} \int_{0}^{L} g_1(v) g_2(v + \tau) \, dv. =L1∫0Lg1(v)g2(v+τ)dv.
因此,互相关函数为:
R X Y ( t , t + τ ) = 1 L ∫ 0 L g 1 ( v ) g 2 ( v + τ ) d v . R_{XY}(t, t + \tau) = \frac{1}{L} \int_{0}^{L} g_1(v) g_2(v + \tau) \, dv. RXY(t,t+τ)=L1∫0Lg1(v)g2(v+τ)dv.
假设 g 1 ( t ) = cos ( 2 π t L ) g_1(t) = \cos\left(\frac{2\pi t}{L}\right) g1(t)=cos(L2πt), g 2 ( t ) = sin ( 2 π t L ) g_2(t) = \sin\left(\frac{2\pi t}{L}\right) g2(t)=sin(L2πt),则:
R X Y ( τ ) = 1 L ∫ 0 L cos ( 2 π v L ) sin ( 2 π ( v + τ ) L ) d v . R_{XY}(\tau) = \frac{1}{L} \int_{0}^{L} \cos\left(\frac{2\pi v}{L}\right) \sin\left(\frac{2\pi (v + \tau)}{L}\right) \, dv. RXY(τ)=L1∫0Lcos(L2πv)sin(L2π(v+τ))dv.利用三角恒等式可以进一步化简,结果将是一个关于 τ \tau τ 的函数,与 t t t 无关。
柯尔莫哥洛夫存在定理告诉我们:
只要给出一组“自洽的局部描述”(有限维分布族),就一定能构造出一个完整的随机过程,使得这些局部描述是它的“切片”。
就像用乐高积木的局部拼装规则,还原出整个宇宙!
(1) 参数集T
(2) 有限维分布族F
(3) 概率空间(Ω, ℱ, P)
想象你要设计一个“随机股价生成器”:
类比:
(1) 布朗运动(Wiener过程)
(2) 高斯过程
一句话:
“如果你能清晰描述所有有限的‘切片’,那么宇宙一定会帮你拼出完整的‘蛋糕’!”
相容性的意思是:
“高维分布(更多时间点的联合分布)必须兼容低维分布(更少时间点的分布),不能自相矛盾。”
就像你拍了一张全家福(高维),从中裁剪出单人照(低维)时,必须和之前单独拍的个人照一致!
公式:
[
F_{t_1,\cdots,t_m}(x_1,\cdots,x_m) = F_{t_1,\cdots,t_m,\cdots,t_n}(x_1,\cdots,x_m, +\infty,\cdots,+\infty) \quad (m < n)
]
关键:两边的结果必须完全一致!
场景:研究股票价格在周一、周三、周五的联合波动。
相容性要求:
[
F_{周一, 周三}(x_1, x_2) = F_{周一, 周三, 周五}(x_1, x_2, +\infty)
]
即“加入周五的数据后,周一和周三的分布关系不能变”!
相容性本质是高维分布的边缘化必须等于低维分布。
一句话记住:
“高维照片裁剪后,必须和原来拍的低维照片一致!”