Csiszár divergences

Csiszár divergences

熵函数

熵函数(entropy function) φ : R + + → R + \varphi: \mathbb{R}_{++} \to \mathbb{R}_{+} φ:R++R+,他是凸函数,正的(?),下半连续函数,并且 φ ( 1 ) = 0 \varphi \left( 1 \right) = 0 φ(1)=0
φ ∞ ′ = lim ⁡ x → ∞ φ ( x ) x \varphi_{\infty}^{\prime} = \lim_{ x \to \infty } \frac{\varphi \left( x \right)}{x} φ=limxxφ(x)

性质

φ ∗ \varphi^{*} φ是熵函数的共轭函数,则

  1. ∂ φ ⊂ R + \partial \varphi \subset \mathbb{R}_{+} φR+,即 φ ∗ \varphi^{*} φ单调不减
  2. dom ⁡ φ ∗ = ( − ∞ , φ ∞ ′ ) \operatorname{dom}\varphi^{*} = \left( -\infty, \varphi_{\infty}^{\prime} \right) domφ=(,φ)
  3. lim ⁡ q → − ∞ φ ∗ ( q ) = − φ ( 0 ) , lim ⁡ q → + ∞ φ ∗ ( q ) = + ∞ \lim\limits_{q\to -\infty}\varphi^{*} \left( q \right) = -\varphi \left( 0 \right), \lim\limits_{q\to +\infty}\varphi^{*} \left( q \right) = +\infty qlimφ(q)=φ(0),q+limφ(q)=+

证明:
q < q ′ q < q^{\prime} q<q,
由于 dom ⁡ φ = R + + \operatorname{dom} \varphi = \mathbb{R}_{++} domφ=R++,有 x q − φ ( x ) ≤ x q ′ − φ ( x ) xq-\varphi \left(x\right) \le x q^{\prime} - \varphi\left(x\right) xqφ(x)xqφ(x)
两边同时取 sup ⁡ \sup sup,即可证明1

φ ∞ ′ < ∞ \varphi_{\infty}^{\prime} < \infty φ<, 并且 q > φ ∞ ′ q > \varphi_{\infty}^{\prime} q>φ, 则 lim ⁡ p → ∞ ( p q − φ ( p ) ) = lim ⁡ p → ∞ p ( q − φ ( p ) p ) = + ∞ \lim_{ p \to \infty } \left( pq-\varphi \left(p\right) \right) = \lim_{ p \to \infty } p\left(q - \frac{\varphi \left( p \right)}{p} \right) = +\infty limp(pqφ(p))=limpp(qpφ(p))=+,也就是说 q ∉ dom ⁡ ( φ ∗ ) q \notin \operatorname{dom} \left( \varphi^{*} \right) q/dom(φ)
φ ∞ ′ = ∞ \varphi_{\infty}^{\prime} = \infty φ=,则,对于 ∀ q ∈ R \forall q \in \mathbb{R} qR , lim ⁡ p → ∞ p ( q − φ ( p ) p ) = − ∞ \lim_{ p \to \infty } p\left(q - \frac{\varphi \left( p \right)}{p} \right) = -\infty limpp(qpφ(p))=,
也就是说,关于 p p p是一个强制函数,进而 φ ∗ ( p ) \varphi^{*} \left( p \right) φ(p)有限,即 q ∈ dom ⁡ ( φ ∗ ) q \in \operatorname{dom} \left( \varphi^{*} \right) qdom(φ)

显然 φ ∗ ( q ) ≥ − φ ( 0 ) \varphi^{*} \left( q \right) \ge - \varphi \left( 0 \right) φ(q)φ(0)
q → − ∞ q \to -\infty q, 若 p > 0 p >0 p>0,则 p q − φ ( p ) → − ∞ pq-\varphi \left(p\right) \to -\infty pqφ(p),因此 lim ⁡ q → − ∞ φ ∗ ( q ) = − φ ( 0 ) \lim\limits_{q\to -\infty}\varphi^{*} \left( q \right) = -\varphi \left( 0 \right) qlimφ(q)=φ(0)
q → + ∞ q \to +\infty q+ φ ∗ ( q ) ≥ q × 1 − φ ( 1 ) = q \varphi^{*} \left( q \right) \ge q \times 1 - \varphi \left( 1 \right) = q φ(q)q×1φ(1)=q, 进而 lim ⁡ q → + ∞ φ ∗ ( q ) = + ∞ \lim\limits_{q\to +\infty}\varphi^{*} \left( q \right) = +\infty q+limφ(q)=+

定义

考虑数据定义在空间 X \mathcal{X} X上,正测度集 M + ( X ) \mathcal{M}^+ \left( \mathcal{X} \right) M+(X)
Radon-Nikodym-Lebegue decomposition, α = d α d β + α ⊥   ∀ ( α , β ) ∈ M ( X ) \alpha = \frac{\mathrm{d} \alpha}{\mathrm{d} \beta} + \alpha^{\perp}\ \forall \left( \alpha, \beta \right) \in \mathcal{M} \left( \mathcal{X} \right) α=dβdα+α (α,β)M(X)
熵函数 φ \varphi φ,其中定义 ∀ x < 0 , φ ( x ) = + ∞ \forall x < 0, \varphi \left( x \right)= +\infty x<0,φ(x)=+

则Csiszár divergences定义为
D φ ( α ∣ β ) ≜ ∫ X φ ( d α d β ( x ) ) d β ( x ) + φ ∞ ′ ∫ X d α ⊥ ( x ) \mathrm{D}_{\varphi}(\alpha \mid \beta) \triangleq \int_{\mathcal{X}} \varphi\left(\frac{\mathrm{d} \alpha}{\mathrm{d} \beta}(x)\right) \mathrm{d} \beta(x)+\varphi_{\infty}^{\prime} \int_{\mathcal{X}} \mathrm{d} \alpha^{\perp}(x) Dφ(αβ)Xφ(dβdα(x))dβ(x)+φXdα(x)
离散版本
D φ ( μ ∣ ν ) ≜ ∑ ν i > 0 φ ( μ i ν i ) ν i + φ ∞ ′ ∑ ν i = 0 μ i \mathrm{D}_{\varphi}(\mu \mid \nu) \triangleq \sum_{\nu_i>0} \varphi\left(\frac{\mu_i}{\nu_i}\right) \nu_i+\varphi_{\infty}^{\prime} \sum_{\nu_i=0} \mu_i Dφ(μν)νi>0φ(νiμi)νi+φνi=0μi

你可能感兴趣的:(数学,概率论,凸优化)