最优传输系列(二):熵正则、对偶问题与Sinkhorn算法

目录

  • 熵正则
  • 对偶问题
  • Sinkhorn
  • 引用

熵正则

  • 考虑加入熵正则化的Kantorovitch问题。
  • 目标是得到使得成本最低的 r ( i , j ) r(i,j) r(i,j)
    在这里插入图片描述
  • 其中, h ( r ) h(r) h(r)定义如下:
    在这里插入图片描述
    这是论文中的写法,还有一种写法是:
    h ( r ) = − ∑ i , j r ( i , j ) ( l o g ( r ( i , j ) ) − 1 ) h(r)=-\displaystyle\sum_{i,j} r(i,j)(log(r(i,j))-1) h(r)=i,jr(i,j)(log(r(i,j))1)
    可以看出二者之间差了一个-1,但是据说第二种方法具有计算上的优越性,具体为什么,且看下文。

对偶问题

  • 使用对偶问题来解决上述问题,即在约束下求得最低成本。这是标准的适合对偶问题的场景。
  • 对于对偶问题不熟悉的可以移步我的系列博客:https://blog.csdn.net/qq_41076797/article/details/112676195
    共6篇。
  • 首先拉格朗日乘数法公式如下:(此后的 P ( i , j ) P(i,j) P(i,j)即是 r ( i , j ) r(i,j) r(i,j))
    在这里插入图片描述
    由于偏导数为0,所以可得:
    最优传输系列(二):熵正则、对偶问题与Sinkhorn算法_第1张图片
    有人说:
    在这里插入图片描述
    但我算不出上面说的结果,但又确实有这个公式,此处有些疑问,希望评论区有大佬解答。
    不管怎么说,得到了上面的式子,可以进一步得到
    P i , j = e f i / ε e − C i , j / ε e g j / ε P_{i,j}=e^{f_{i}/ε}e^{-C_{i,j}/ε}e^{g_{j}/ε} Pi,j=efi/εeCi,j/εegj/ε
    K i , j = e x p ( − C i , j / ε ) K_{i,j}=exp(-C_{i,j}/ε) Ki,j=exp(Ci,j/ε) μ i = e f i / ε μ_{i}=e^{f_{i}/ε} μi=efi/ε ν j = e g j / ε ν_{j}=e^{g_{j}/ε} νj=egj/ε
    利用对偶问题帮我们到这里了,下面我们是要求 P i , j P_{i,j} Pi,j的,我们是通过计算 μ i μ_{i} μi ν j ν_{j} νj从而计算出 P i , j P_{i,j} Pi,j的,当然知道了 μ i μ_{i} μi ν j ν_{j} νj也可以求 f i f_i fi等,如 f i = ε l o g μ i f_i=εlogμ_{i} fi=εlogμi,所以下面就是求 μ i μ_{i} μi ν j ν_{j} νj

Sinkhorn

  • μ i μ_{i} μi ν j ν_{j} νj是通过Sinkhorn算法算的。
  • 根据上面的计算我们得到:
    P i , j = μ i K i , j ν j P_{i,j}=μ_{i}K_{i,j}ν_{j} Pi,j=μiKi,jνj
  • 由由于约束条件:
    最优传输系列(二):熵正则、对偶问题与Sinkhorn算法_第2张图片
    则有:
    在这里插入图片描述
    即:
    在这里插入图片描述
    这里 ⊙ ⊙ 是矢量的哈达马积(Hadamard product),也就是元素对应的乘积。这一对等式已经属于一类叫做matrix scaling的数学问题,于是可以通过迭代方式(Sinkhorn就是通过迭代)求解。
    综上:
    在这里插入图片描述
    下面是Sinkhorn算法的内容:
    最优传输系列(二):熵正则、对偶问题与Sinkhorn算法_第3张图片
    解释一下,先初始化 ν ν ν,是m个1组成的向量,既然先初始化了 ν ν ν,那我们就先计算 μ μ μ(第一个计算的是 μ 1 μ^1 μ1),然后计算 ν 1 ν^1 ν1,以此类推,一直迭代,直到收敛(即两次的差值小于某个阈值)。
    下图展示了Sinkhorn的原理:
    最优传输系列(二):熵正则、对偶问题与Sinkhorn算法_第4张图片
    可以清楚地看到,Sinkhorn算法从初始化状态向最优解转变。

引用

  • https://blog.csdn.net/Utterly_Bonkers/article/details/90746259?spm=1001.2014.3001.5502
  • https://blog.csdn.net/Hungryof/article/details/110549879

你可能感兴趣的:(最优传输,最优传输,算法)