自由概率是研究非交换随机变量(non-commutative random variables)的数学理论。“自由(freeness)”或自由独立(free independence)属性类似于经典的独立(independence)概念,它与自由乘积(free products)有关。该理论由 Dan Voiculescu 于 1986 年左右发起,旨在解决自由群因子同构(free group factors isomorphism)问题,这是算子代数(operator algebras)理论中一个重要的未解决问题。给定一些生成元(generators)上的自由群(free group),我们可以考虑由群代数(group algebra)生成的 von Neumann algebra,这是一个 l l 1 \mathrm{ll}_{1} ll1 类因子。同构问题:这些对于不同数量的生成元是否是同构的。甚至不知道任何两个自由群因子是否同构。这类似于 Tarski 的自由群问题(Tarski’s free group problem),即两个不同的非阿贝尔有限生成的自由群(non-abelian finitely generated free groups)是否具有相同的基本理论。
后来建立了与随机矩阵理论、组合学、对称群表示、大偏差、量子信息论和其他理论的联系。自由概率目前正在进行积极的研究。
通常,随机变量位于单位代数(unital algebra) A A A 中,例如 C ∗ -algebra C^{*}\text{-algebra} C∗-algebra 或 von Neumann algebra。代数配备了一个非交换期望(noncommutative expectation),一个线性泛函 ϕ : A → C \phi:A\rightarrow C ϕ:A→C 使得 ϕ ( 1 ) = 1 \phi(1) = 1 ϕ(1)=1。如果乘积 a 1 ⋯ a n a_{1}\cdots a_{n} a1⋯an 的期望为零,且每一个 a j a_{j} aj 的期望为零,且存在于一个 A k A_{k} Ak 中,没有相邻的 a j a_{j} aj 来自于同一个子代数(subalgebra) A k A_{k} Ak,且 n n n 非零,则酉子代数(unital subalgebras) A 1 , ⋯ , A m A_{1},\cdots ,A_{m} A1,⋯,Am 是自由独立的(freely independent)。如果随机变量生成自由独立的酉子代数,则它们是自由独立的。
自由概率的目标之一(仍未实现)是构建 von Neumann algebras 的新不变量,而自由维度(free dimension)被认为是此类不变量的合理候选者。用于构建自由维度的主要工具是自由熵(free entropy)。
自由概率与随机矩阵的关系是自由概率在其他学科中得到广泛应用的一个关键原因。 Voiculescu 在 1983 年左右在算子代数环境(operator algebraic context)中引入了自由度的概念; 一开始与随机矩阵完全没有关系。这种联系直到 1991 年晚些时候才由 Voiculescu 揭示;他的动机是,他在自由中心极限定理(free central limit theorem)中发现的极限分布,以前曾出现在随机矩阵内容中的 Wigner’s semi-circle law 中。
自由累积量泛函(free cumulant functional由 Roland Speicher 引入)在该理论中起着重要作用。 它与集合 1 , … , n { 1, \dots, n } 1,…,n 的非交叉分区(noncrossing partitions)的格(lattice)相关,其方式与经典累积量泛函(classic cumulant functional)与该集合的所有分区的格相关。
Wigner semicircle distribution 是以物理学家 Eugene Wigner 的名字命名,是 [ − R , R ] [−R, R] [−R,R] 上的概率分布,其概率密度函数 f f f 是以 ( 0 , 0 ) (0, 0) (0,0) 为中心的被标度过的半圆(scaled semicircle,即半椭圆(semi-ellipse)):
f ( x ) = 2 π R 2 R 2 − x 2 f(x)={2 \over \pi R^2}\sqrt{R^2-x^2\,}\, f(x)=πR22R2−x2
对于 − R ≤ x ≤ R −R ≤ x ≤ R −R≤x≤R,如果 ∣ x ∣ > R |x|>R ∣x∣>R,则 f ( x ) = 0 f(x) = 0 f(x)=0。
累积概率分布函数的形式为:
1 2 + x R 2 − x 2 π R 2 + arcsin ( x R ) π \frac{1}{2}+\frac{x\sqrt{R^{2}-x^{2}}}{\pi R^{2}}+\frac{\arcsin\left(\frac{x}{R}\right)}{\pi} 21+πR2xR2−x2+πarcsin(Rx)
它也是被标度过的的 Beta 分布(scaled beta distribution):如果 Y Y Y 服从参数 α = β = 3 / 2 \alpha = \beta = 3/2 α=β=3/2 的 Beta 分布,则 X = 2 R Y – R X = 2RY – R X=2RY–R 服从 Wigner 半圆分布。
随着矩阵的大小趋近于无穷大,许多随机对称矩阵的特征值的极限分布会出现这种分布。特征值之间的间距分布由名称相似的 Wigner surmise 解决。
第三类切比雪夫多项式(Chebyshev polynomials)是关于 Wigner 半圆分布的正交多项式(orthogonal polynomials)。
对于正整数 n n n,此分布的第 2 n 2n 2n 个矩为
E ( X 2 n ) = ( R 2 ) 2 n C n E(X^{2n})=\left({R \over 2}\right)^{2n} C_n\, E(X2n)=(2R)2nCn
其中 X X X 是具有此分布的任意随机变量, C n C_{n} Cn 是第 n n n 个 Catalan number:
C n = 1 n + 1 ( 2 n n ) C_n={1 \over n+1}{2n \choose n} Cn=n+11(n2n)
如果 R = 2 R = 2 R=2,则矩是 Catalan number。由于对称性,所有奇数阶矩均为零。
进行替换 x = R cos ( θ ) x=R\cos(\theta) x=Rcos(θ) 代入矩生成函数(moment generating function)的定义方程可知:
M ( t ) = 2 π ∫ 0 π e R t cos ( θ ) sin 2 ( θ ) d θ M(t)=\frac{2}{\pi}\int_0^\pi e^{Rt\cos(\theta)}\sin^2(\theta)\,d\theta M(t)=π2∫0πeRtcos(θ)sin2(θ)dθ
可以得到:
M ( t ) = 2 I 1 ( R t ) R t M(t)=2\,\frac{I_1(Rt)}{Rt} M(t)=2RtI1(Rt)
其中 I 1 ( z ) I_1(z) I1(z) 是修改后的贝塞尔函数。同样,特征函数由下式给出:
φ ( t ) = 2 J 1 ( R t ) R t \varphi(t)=2\,\frac{J_1(Rt)}{Rt} φ(t)=2RtJ1(Rt)
其中 J 1 ( z ) J_1(z) J1(z) 是贝塞尔函数。注意相应的积分涉及
到 sin ( R t cos ( θ ) ) \sin(Rt\cos(\theta)) sin(Rtcos(θ)) 为零。)
在极限 R R R 趋近于零时,Wigner 半圆分布变为 Dirac delta 函数。
在自由概率论中,Wigner 半圆分布的作用类似于经典概率论中的正态分布。即,在自由概率论中,累积量的作用被“自由累积量”所占据,其与普通累积量的关系仅仅是在普通累积量理论中有限集的所有分区的集合的作用被有限集的所有非交叉分区的集合所取代。正如当且仅当分布为正态分布时,大于2次的概率分布的累积量均为零一样,当且仅当分布为Wigner半圆分布时,大于2次的概率分布的自由累积量均为零。
现在啥都是个大字,如大数据,大规模天线阵等等。这里面很容易就会面对大维矩阵的计算问题。大家都知道,求矩阵特征值永远是数学中的中心问题之一。对大维矩阵计算也不例外。
对随机矩阵的特征值分布的研究应该是自从有概率论就有,如许宝騄先生上世际 40 年代就有研究。后来 Wigner 得出,如果 Hermitian 方阵里的所有上三角上(包括对角)的元素都是高斯独立同分布的话,那么当矩阵维数趋于无穷大时,其特征值趋于半圆分布。它叫 Wigner 半圆律。
上个世纪 80 年代,Voiculescu 发明了自由概率理论(free probability theory)。他最早的出发点是想解决冯诺依曼代数的同构性的老问题(1967年),后来无意中他的结果把 Wigner 半圆律大大的推广到了任意有限多个随机矩阵的联合分布。且说了,大维随机矩阵很接近自由了。我开玩笑说,就像穿着衣服的猩猩,当空间维度越来越大时,猩猩们身上穿的衣服被抖得越来越光,最后全光了,当即就完全自由了。
由于自由概率理论可以用来求大维矩阵特征值的渐近分布,过去几年,又兴起大规模天线阵通信,这两者一拍即合,它被用来求大维信道的传输率。听上去似乎很好,遗憾的是,东西是好,但骨头很硬。自由概率中涉及到太多的数学符号和数学概念,据我不完全统计,里面有算子代数,概率论,组合数学,还有复分析。如此庞大的数学阵容,不光让很多学数学出生的人望而却步,更让不是学数学出身的研究人员不堪重负。
wiki: Free probability
wiki: Wigner semicircle distribution