离散随机变量的熵的推导

熵应满足的性质

根据香侬的《通信的数学理论》, 对于随机变量 Xp, H(X)=H(p1,,pn) 应满足的性质为:

  1. H 应当关于 p 连续。
  2. 如果所有 pi 都相等,即 pi=1n,iN,1in, H 应当是 n 的单调增函数。如果事件的可能性相等,那可能事件越多,选择或者说不确定性也更多。
  3. 如果一项选择被分解为两个连续选择,则原来的 H 应当是各个 H 值的加权和。即: H(Y)=H(X,Y)=H(X)+EX(H(Y|X))

离散随机变量的熵的推导

命题 1

A(n)=H(p1=1n,pn=1n),nN+
A(nm)=mA(n),mN+

证明:

n=1 时显然成立。
假设对于 n 成立, 即 A(nm)=mA(n),
则对于 n+1, 假设有 nm 个桶,每个桶中有 n 个球, 共计 nm+1 个球。可以将在 nm+1 个球中进行一次等概率选择看成两次连续选择:首先在 nm 个桶中进行一次等概率选择,然后如果选择了第 i(iN,1inm) 个桶, 再在第 i 个桶中的 n 个球中进行一次等概率选择。
由规则 3, A(nm+1)=H(Am)+nmi=11nmA(n)=mA(n)+A(n)=(m+1)A(n)

命题 2

K>0,A(n)=Klnn,nN+

证明:

由命题 1 易知 A(1)=0 由单调性, A(n)>0,n>1
t,sN+,s,t>1,ε>0,nN+,n>max{logts,1ε,1},
于是 n>logtsnlogst>1,
因此 mN+,mnlogstm+1
smtn<sm+1
mlnsnlnt<(m+1)lns
mnlntlns<m+1n=mn+1n
|lntlnsmn|1n<ε (1)

A(sm)A(tn)<A(sm+1)
mA(s)nA(t)<(m+1)A(s)
mnA(t)A(s)m+1n=mn+1n
|A(t)A(s)mn|1n<ε (2)

由 (1), (2) 得 |A(t)A(s)lntlns||lntlnsmn|+|A(t)A(s)mn|<2ε
A(t)A(s)=lntlns
A(t)=A(s)lnslnt
固定 s ,令 K=A(s)lns, A(t)=Klnt
由规则 2, K>0

命题 3

H(X)=H(p1,,pm)=Kmi=1pilnpi,iN+,1im,piQ+,mN+

证明

易知存在 nN+,{niN+:1im}, 使得 pi=nin,1im
mi=1pi=1mi=1ni=n,
假设有 m 个桶,第 i(iN,1im) 个桶中有 ni 个球, 共计 n 个球。

将在 n 个可能的结果(球)中进行一次等概率选择看成两次连续选择:首先在 m 个可能的结果(桶)中进行一次选择,选中第 i(iN,1im) 个结果(桶)的概率为 pi, 然后如果选择了第 i(iN,1im) 个(桶), 再在第 i(iN,1im) 个桶中的 ni 个可能的结果(球)中进行一次等概率选择。
由规则 3, A(n)=H(X)+mi=1piA(ni)
H(X)=A(n)mi=1piA(ni)
=Klnnmi=1piKlnni
=(mi=1pi)Klnnmi=1piKlnni
=Kmi=1pilnnni
=Kmi=1pilnpi

命题 4

H(X)=H(p1,,pm)=Kmi=1pilnpi,iN+,1im,piR+,mN+

证明

p=(p1,,pm),p=(p1,,pm),piQ+,iN+,1im,
由规则 1, H(X) 是连续函数,因此
H(X)=limppH(p)=limppKmi=1pilnpi=Kmi=1pilnpi

你可能感兴趣的:(机器学习,概率论与数理统计)