神奇的伽玛函数(下)

转自:

http://www.52nlp.cn/%E7%81%AB%E5%85%89%E6%91%87%E6%9B%B3%E7%A5%9E%E5%A5%87%E7%9A%84%E4%BC%BD%E7%8E%9B%E5%87%BD%E6%95%B0%E4%B8%8B

五、 Γ(n)=(n1)! Γ(n)=(n−1)! 还是  Γ(n)=n! Γ(n)=n! ? 

伽玛函数找到了,我们来看看第二个问题,为何伽玛函数被定义为满足  Γ(n)=(n1)! Γ(n)=(n−1)!? 这看起来挺别扭的,如果我们稍微修正一下,把伽玛函数定义中的  tx1 tx−1 替换为  tx tx
Γ(x)=0txetdt, Γ(x)=∫0∞txe−tdt,
这不就可以使得  Γ(n)=n! Γ(n)=n!了嘛。估计数学界每年都有学生问这个问题,然而答案却一直有一些争议。

欧拉最早的伽玛函数定义还真是如上所示,选择了 Γ(n)=n! Γ(n)=n!,事实上数学王子高斯在研究伽玛函数的时候, 一直使用的是如下定义:
Π(x)=0txetdt, Π(x)=∫0∞txe−tdt,
然而这个定义在历史上并没有流传开来。

勒让德肖像水彩画

欧拉在伽玛函数的推导中实际上引入了两类积分形式
10tx(1t)ydt,0txetdt ∫01tx(1−t)ydt,∫0∞txe−tdt
现在我们分别称为欧拉一类积分和欧拉二类积分。勒让德追随欧拉的脚步,发表了多篇论文对欧拉积分进行了深入的研究和推广,不过在勒让德的研究中,对积分中的参数做了  1 −1的移位修改,主要定义为
B(x,y)=10tx1(1t)y1dt B(x,y)=∫01tx−1(1−t)y−1dt

Γ(x)=0tx1etdt. Γ(x)=∫0∞tx−1e−tdt.
B(x,y) B(x,y) 现在称为贝塔积分或者贝塔函数。其中 Γ(x) Γ(x) 的这个定义选择导致了  Γ(n)=(n1)! Γ(n)=(n−1)! 。实际上伽马函数中的 Γ Γ符号历史上就是勒让德首次引入的,而勒让德给出的这个伽玛函数的定义在历史上起了决定作用,该定义被法国的数学家广泛采纳并在世界范围推广,最终使得这个定义在现代数学中成为了既成事实。

什么原因驱使勒让德偏向选择 Γ(n)=(n1)! Γ(n)=(n−1)! 的定义呢? 这成为了一个谜,没有明确的解释。 不过有数学史研究者们对欧拉的研究表明,在 17301768 1730∼1768 年之间欧拉自己在研究一类积分的时候,实际上就已经对积分中的参数做了 1 −1的移位修改,从而明确的引入了贝塔积分,而这个修改显然被勒让德注意到了。 是什么原因使得欧拉和勒让德在研究他们的积分形式的时候都考虑引入 1 −1 移位修改呢? 有数学家猜测一个可能的原因是这两位数学家注意到,如果按照现代伽玛函数的定义,那么有

B(x,y)=Γ(x)Γ(y)Γ(x+y), B(x,y)=Γ(x)Γ(y)Γ(x+y),

B(x,y) B(x,y) 具有非常漂亮的对称形式。可是如果选取高斯给出的  Π(n)=n! Π(n)=n! 的定义,令
E(x,y)=10tx(1t)ydt E(x,y)=∫01tx(1−t)ydt
则有
E(x,y)=Π(x)Π(y)Π(x+y+1), E(x,y)=Π(x)Π(y)Π(x+y+1),
这个形式显然不如  B(x,y) B(x,y) 具有对称美,而数学家总是很在乎数学公式的美感的。

还有一个类似的解释是从抽象代数的角度提出的,考虑伽玛分布的概率密度函数
fα(x)=<br/><br/>xα1exΓ(α)0for x>0<br/>for x<0<br/><br/><br/> fα(x)={

xα−1e−xΓ(α)for x>0
0for x<0



形成的集合  {fα:α>0} {fα:α>0},那么该集合在卷积运算   之下构成一个抽象代数中的半环,即满足
fαfβ=fα+β. fα∗fβ=fα+β.
而用 Π(x) Π(x) 的定义则无法得到类似的结果。

另外一个更具启发性的解释是也是从抽象代数角度描述的。 对伽玛函数
Γ(x)=0ettx1dt Γ(x)=∫0∞e−ttx−1dt
做一个线性变换  h:tct h:t→ct,可以得到如下函数

Γ(x)cx=0ecttxdtt Γ(x)cx=∫0∞e−cttxdtt

由此  dt/t=dlogt dt/t=dlog⁡t 可以被看成是乘法群  (0,) (0,∞) 上的一个不变测度,在尺度伸缩变换下满足不变性:
d(ct)ct=dtt. d(ct)ct=dtt.
而  ect e−ct 对应于群上的一个加法特征(additive character)  f f, 满足
f(t+s)=f(t)f(s), f(t+s)=f(t)⋅f(s),
tx tx 对应于群上的一个乘法特征(mulpicative character)  g g, 满足
g(ts)=g(t)g(s). g(t⋅s)=g(t)⋅g(s).
由于积分表示的是求和, 所以 (???) (???) 式 被看成是乘法群  (0,) (0,∞) 上加法特征和乘法特征混合乘积的累积求和。有了这个分解,只要在抽象代数的有限域上定义了 f f 和 g g 这两个映射, 实数域上定义的 Γ(x)cx Γ(x)cx 函数就可以被推广到有限域上进行定义,只是无限求和的积分号变成了有限求和符号 Σ Σ 。 进一步,借用贝塔函数和伽玛函数满足的关系式 (???) (???) Beta(x,y) Beta(x,y) 也可以完全类似的在有限域中定义出来, 而这种推广也将变得具有简洁的对称美。当然,这个理由和欧拉、勒让德的选择无关,而是现代数学家们给出的一个额外的解释。

六、伽玛函数欣赏

伽玛函数从它诞生开始就被许多数学家追逐研究,包括高斯、勒让德、威尔斯特拉斯、柳维尔等等,数学家们发现了这个函数大量的奇特性质,在解决许多数学问题的时候是一把利器。伽玛函数作为阶乘的推广,首先它也满足如下的斯特林公式
Γ(x)2πexxx12. Γ(x)≈2πe−xxx−12.
另外, 伽玛函数不仅可以定义在实数集上,基于复变函数的理论还可以延拓到整个复平面上。所以我们不仅可以计算 (12)!,(7.5)! (12)!,(−7.5)!,我们甚至可以计算  (12+13i)! (12+13i)!,阶乘的概念居然可以推广到虚数,这真是太神奇了!

复平面上的伽玛函数

欧拉把 n! n! 推广之后得到了伽玛函数,很自然的一个问题是:伽玛函数是 n! n!的唯一的插值推广函数吗? 当然不是,丹尼尔·贝努利最早的无穷乘积推广就已经说明了存在多种推广延拓的方式。譬如 f(x)=Γ(x)cos(2nπ) f(x)=Γ(x)cos⁡(2nπ) 这个函数显然也满足把  n! n! 延拓到实数集。 那伽玛函数在延拓  n! n! 的时候有什么特殊的地方呢? 从伽玛函数的图像我们可以看到它是一个凸函数,所以我们很自然地会问伽玛函数是否是唯一的满足凸性的阶乘函数,可是答案还是否定的。 那伽马函数为什么鹤立鸡群呢?数学家们发现不仅  Γ(x) Γ(x) 是一个凸函数,  logΓ(x) log⁡Γ(x) 也是一个凸函数,数学上可以证明如下定理:

[Bohr-Mullerup 定理] 如果  f:(0,)(0,) f:(0,∞)→(0,∞),且满足

  1.   f(1)=1 f(1)=1
  2.   f(x+1)=xf(x) f(x+1)=xf(x)
  3.   logf(x) log⁡f(x) 是凸函数

那么  f(x)=Γ(x) f(x)=Γ(x), 也就是  Γ(x) Γ(x)是唯一满足以上条件的函数。


logΓ(x) log⁡Γ(x) 是一个凸函数

伽玛函数有不少等价的表示形式和神奇的结果。高斯给出的伽玛函数的形式是
Γ(x)=limnnxn!x(x+1)(x+2)(x+n). Γ(x)=limn→∞nxn!x(x+1)(x+2)⋯(x+n).
欧拉证明了如下一个漂亮的反射公式
Γ(x)Γ(1x)=πsin(πx). Γ(x)Γ(1−x)=πsin⁡(πx).
维尔斯特拉斯把高斯的伽玛函数形式做一下变换,就得到如下表达为无穷乘积的结果
Γ(x)=1xeγxk=1<br/>exk1+xk. Γ(x)=1xeγx∏k=1∞
exk1+xk.

此处  γ=0.5772156649 γ=0.5772156649⋯ 为欧拉常数。这个结果在复平面上也成立。由于伽玛函数的这个分解形式的启发,导致维尔斯特拉斯发现复平面上任意整函数 f(z) f(z) 都以分解为无穷乘积形式。基于维尔斯特拉斯的这个无穷乘积形式和欧拉的反射公式,分别整理简化一下  Γ(1+x)Γ(1x) Γ(1+x)Γ(1−x),就可以轻松地得到介绍沃利斯公式的时候中提到的  sinx sin⁡x 的无穷乘积展开式。

伽玛函数还有很多妙用,它能扩展一些重要的数学概念,譬如导数。我们可以定义一阶、二阶等整数阶导数,所以一个自然的问题是:我们能定义分数阶的导数吗? 这个问题早年莱布尼茨研究微积分的时候他就提出来过,然而没有获得实质性进展。而欧拉给出了伽玛函数之后,也研究过分数阶导数的问题。我们观察一下函数 f(x)=xn f(x)=xn 的各阶导数

由于k阶导数可以用阶乘表达,于是我们用伽玛函数表达为
f(x)(k)=Γ(n+1)Γ(nk+1)xnk f(x)(k)=Γ(n+1)Γ(n−k+1)xn−k
基于上式,可以把导数的阶从整数延拓到实数集。例如,取 n=1,k=12 n=1,k=12 我
们可以计算  x x 的  12 12阶导数为
f(x)(12)=Γ(1+1)Γ(11/2+1)x11/2<br/>=2xπ. f(x)(12)=Γ(1+1)Γ(1−1/2+1)x1−1/2
=2xπ.

很容易想到对于一般的函数  f(x) f(x) 通过泰勒级数展开可以表达为幂级数,于是借用  xn xn 的分数阶导数,我们可以尝试定义出任意函数的分数阶导数。不过有点遗憾的是这种简单的基于泰勒级数的定义方法不是良定义的,并非对所有函数都适用,但是这个思想却给后来的数学家提供了重要的线索,并由此发展了数学分析中的一个研究课题: Fractional Calculus。 在这种微积分中,分数阶的导数是具有良定义的,而积分作为导数的逆运算,也可以有分数阶。 这听起来真是很神奇,而这一切都要归功于伽玛函数。


n 维球的体积

伽马函数还有一个奇妙的运用是求高维空间中球的体积。我们知道 二维球是圆;其面积为  πr2 πr2,三维球的体积为  43πr3 43πr3,那 n n维空间中半径为 r r的球的体积如何计算呢? 数学上这个体积应该是如下多重积分
Vn(r)={(x1,,xn)|x2i<r2}1dx1dx2dxn Vn(r)=∫⋯∫{(x1,⋯,xn)|∑xi2
可以证明
Vn(r)=πn2rnΓ(n2+1). Vn(r)=πn2rnΓ(n2+1).

下面我们来说一说伽玛函数和数论的关系。 伽玛函数和欧拉常数 γ γ 有密切关系,可以发现
γ=dΓ(x)dx|x=1=<br/>limn(1+12+13++1nlogn) γ=−dΓ(x)dx|x=1=
limn→∞(1+12+13+⋯+1n−log⁡n)

欧拉常数 γ γ 是一个神奇的常数,数学家们至今也没搞清楚它是一个有理数还是一个无理数。进一步还可以发现伽玛函数和黎曼 ζ(s) ζ(s)函数
ζ(s)=1+12s+13s+ ζ(s)=1+12s+13s+⋯
有密切联系,黎曼发现了如下式子
ζ(x)Γ(x)=0ux1eu1du, ζ(x)Γ(x)=∫0∞ux−1eu−1du,
ζ(x)=ζ(1x)Γ(1x)2sπs1sin(πx2). ζ(x)=ζ(1−x)Γ(1−x)2sπs−1sin⁡(πx2).
ζ ζ 函数在解析数论中可是有着举足轻重的地位,因为它涉及了数学中著名的素数分布定理和黎曼猜想,而以上两个式子在分析黎曼猜想过程中有重要作用。数学家蒙哥马利有一句名言:“假如你是一个魔鬼,引诱数学家用自己的灵魂来换取一个定理的证明。多数数学家会想要换取的会是什么定理呢,我想会是黎曼猜想。” 而希尔伯特曾说过,如果他在沉睡1000年后醒来, 他将问的第一个问题便是:黎曼猜想得到证明了吗?

前面提到了  logΓ(x) log⁡Γ(x) 是一个凸函数。对这个函数求导得到的函数
Ψ(x)=dlogΓ(x)dx Ψ(x)=dlog⁡Γ(x)dx
被称为 Digamma 函数,可以证明
Ψ(x)=γ+(x1)(x1)(x2)22!<br/>+(x1)(x2)(x3)33! Ψ(x)=−γ+(x−1)−(x−1)(x−2)2⋅2!
+(x−1)(x−2)(x−3)3⋅3!⋯

这也是一个很重要的函数,具有如下一个漂亮的性质
Ψ(x+1)=Ψ(x)+1x. Ψ(x+1)=Ψ(x)+1x.
函数 Ψ(x) Ψ(x)和欧拉常数 γ γ 以及  ζ ζ 函数都有密切关系,令
Ψn(x)=dn+1logΓ(x)dxn+1, Ψn(x)=dn+1log⁡Γ(x)dxn+1,
可以证明
Ψ1(x)=d2logΓ(x)dx2<br/>=1x2+1(x+1)2+1(x+2)2+. Ψ1(x)=d2log⁡Γ(x)dx2
=1x2+1(x+1)2+1(x+2)2+⋯.

对于几个具体的数值,有如下漂亮的结果
Ψ(1)=γ,Ψ(2)=1γ Ψ(1)=−γ,Ψ(2)=1−γ
Ψ1(1)=ζ(2)=1+122+132+142+<br/>=π26 Ψ1(1)=ζ(2)=1+122+132+142+⋯
=π26

七、随机数学中的伽马函数

伽玛函数在概率统计中频繁现身,众多的统计分布,包括常见的统计学三大分布( t t 分布, χ2 χ2 分布, F F 分布)、贝塔分布、狄利克雷分布的密度公式中都有伽玛函数的身影。当然发生最直接联系的概率分布是直接由伽玛函数变换得到的伽玛分布。对伽玛函数的定义做一个变形,就可以得到如下式子
0xα1exΓ(α)dx=1. ∫0∞xα−1e−xΓ(α)dx=1.
于是,取积分中的函数作为概率密度,就得到一个形式最简单的伽玛分布的密度函数
Gamma(x|α)=xα1exΓ(α). Gamma(x|α)=xα−1e−xΓ(α).
如果做一个变换  x=βt x=βt, 就得到伽玛分布的更一般的形式
Gamma(t|α,β)=βαtα1eβtΓ(α). Gamma(t|α,β)=βαtα−1e−βtΓ(α).


Gamma(t|α,β) Gamma(t|α,β)分布图像

伽玛分布在概率统计领域也是一个万人迷,众多统计分布和它有密切关系。指数分布和  χ2 χ2 分布都是特殊的伽玛分布。另外伽玛分布是一个很强大的先验分布,在贝叶斯统计分析中被广泛的用作其它分布的先验。如果把统计分布中的共轭关系类比为人类生活中的情侣关系的话,那指数分布、泊松分布、正态分布、对数正态分布都可以是伽玛分布的情人。

接下来的内容中我们主要关注 β=1 β=1的简单形式的伽玛分布。伽玛分布首先和泊松分布发生密切的联系。我们容易发现伽玛分布的概率密度和泊松分布在数学形式上具有高度的一致性。参数为 λ λ的泊松分布,概率写为
Poisson(X=k|λ)=λkeλk! Poisson(X=k|λ)=λke−λk!
在伽玛分布的密度中取  α=k+1 α=k+1 得到
Gamma(λ|α=k+1)<br/>=λkeλΓ(k+1)=λkeλk! Gamma(λ|α=k+1)
=λke−λΓ(k+1)=λke−λk!

所以这两个分布的数学形式具有高度的一致性,只是泊松分布是离散的,伽玛分布是连续的。这种数学上的一致性是偶然的吗? 事实上,从泊松分布出发,可以利用一个简单的概率物理模型对伽玛分布的密度函数给出清晰的解释。

泊松分布可以用于描述一段时间内事件发生次数的统计性质,譬如接到的电话的次数。假设我们关心的不是一段有限的时间,而是  (0,) (0,∞) 整个时间轴上接到电话的统计性质,应该如何来描述呢?我们可以假设接到的电话满足如下性质

  1. 概率在时间轴是独立均匀分布的,即每个等长的时间区间上是否接到电话是独立的,并且概率分布一样;每一个长度为h的充分小的时间片上接到一个电话的概率正比于时间片的长度;
  2. 每一个充分小时间片上最多只能接到一个电话。
  3. 平均而言,假设每个长度为1的单位时间片上接到电话个数是1;

如果我们考察  [0,λ] [0,λ] 这个时间区间,那么平均而言,这个长度为  λ λ 的时间片上应该接到  λ λ 个电话,把这个时间区间分成  n n 个独立的小片,那么每个时间片上接到一个电话的概率恰好是  p=λ/n p=λ/n。当 n n 足够大的时候,每个时间片上只能是接到一个电话或者没有接到电话,恰好对应于成功概率为 p p 的一个贝努利实验,于是 n n 个时间片对应于 n n 个独立的贝努利实验,所以  [0,λ] [0,λ]这个时间区间上接到的电话总数 X X 应该符合二项分布
p(X=k)=(nk)pk(1p)nk. p(X=k)=(nk)pk(1−p)n−k.
由于  np=λ np=λ, 于是  n n 趋向于无穷的时候,粒子个数 X X将满足参数为
λ λ 的泊松分布
p(X

你可能感兴趣的:(数学理论)