最优传输-离散

参考:
1.运筹千里纵横论坛|王祥丰:计算最优传输及其应用浅谈
2.最优传输的理论与计算系列讲座之二:Monge-Kantorovich理论

最优传输研究两个分布之间几何的度量,
概率向量a(n维),每个维度上ai>=0,和为1
离散测度:跟概率向量a有关系,和n个点x1…xn有关。
最优传输-离散_第1张图片
对于离散测度的monge问题,考虑两个离散测度之间的关系,对一个离散测度 a l p h a alpha alpha和一个 b e t a beta beta,希望找到一个映射T,由n维映射扫m维的向量(空间).建立一个映射T#把离散测度 a l p h a alpha alpha映射到离散测度 b e t a beta beta,对monge不一定能匹配很好。
最优传输-离散_第2张图片
monge缺点:
1.希望两个点云是相同大小
2.是组合或非凸优化问题
K松弛
核心:之前M不能把ai拆分,K把任何一个点xi对应的质量ai进行分解,分别传输到不同的yj上。
对应的映射转化为一个耦合(couping)矩阵P代替松弛后的关系
最优传输-离散_第3张图片
对P定义:是nm维,把n维概率向量传输到m维概率向量上,满足所有元素>=0,P乘上m维单位向量要和 a l p h a alpha alpha对应的概率向量要相同,同时 P T P^T PT乘上n维全是1的向量要和 b e t a beta beta对应的概率向量。即P所有的行求和对应向量a,P所有的列求和对应向量n。
最优传输-离散_第4张图片
是一个有界的集合,n+m个等式约束,是一个凸多面体。
有5个点x1…x5,上面对应有质量a1…a5,希望把这5个点的质量转移到另外三个点y1…y3上。
最优传输-离散_第5张图片
左边5个是x1…x5对应的质量,x1数2倍的质量,把红色的质量转移到蓝色的质量上。这个5
3的矩阵就是耦合矩阵P。
最优传输-离散_第6张图片
目标函数是两个矩阵的内积,C是先验的cost矩阵,另一个是要求的耦合矩阵P,当然P要属于刚才定义的U(a,b)集合。
刻画的就是a这个概率向量到b这个概率向量某一种距离度量。
是一个线性规划,且约束条件是凸多面体,解不一定是唯一的。
好处:
1.容易求解
2.当考虑成指派问题的情形,即a,b是均匀分布的概率向量,都是1/n,K是联系的。
最优传输-离散_第7张图片
把cost矩阵C替换成D的p次方,计算刚才的最优传输问题,得到的目标函数值,再求一个1/p次方就得到p-Wasserstein距离,最常用的p=1。
最优传输-离散_第8张图片
在Wasserstein距离下求一个质心
给定一个k个概率分布的集合P,它的Wasserstein质心定义:找另外一个概率分布q,这个概率分布q和这个集合里的所有pk的Wasserstein距离(加权重)求和,来极小化这个问题来得到q。
最优传输-离散_第9张图片
一般就是考虑这两个问题
1.K松弛下对应的最优传输问题
2.定义了Wasserstein距离后定义Wasserstein质心

应用:
用到distribution,用最优传输,是由多标签学习延伸出来的,一个数据有多个标签。同时预测一个数据所有的标签。
但不关心标签的绝对值(每个维度上值是多少),关心输出的label的相对的重要程度,最后的输出可以是一个概率分布,概率向量。
学习一个映射h,把xi这个数据映射到一个概率分布,要用到最优传输。
最优传输-离散_第10张图片
应用2:WGAN
最优传输-离散_第11张图片
应用3:zero-shot learning
最优传输-离散_第12张图片
如何计算最优传输问题
sinkhron
通过在最优传输问题(线性规划)上加一个熵正则项,就变成了一个强凸的函数,有唯一解
最优传输-离散_第13张图片
把上述问题转化为等价的投影问题,投影的度量是KL散度,如果矩阵K是exp这样来定义的,找耦合矩阵P距离矩阵K在KL散度意义下最小。
最优传输-离散_第14张图片
投影满足这样的一个结构, P i , j P_{i,j} Pi,j= U i K i , j v j U_iK_{i,j}v_j UiKi,jvj,还要满足P是耦合矩阵这样一个约束,要满足下面的式子。
最优传输-离散_第15张图片
循环求v,u。之后代入求P
最优传输-离散_第16张图片
看其线性规划的对偶问题,快坐标上升方法,对偶变量f,g
交替计算f,g,得到最优的f,g再得到u,v,再回过去求P。
最优传输-离散_第17张图片

最优传输-离散_第18张图片

离散最优传输问题
最优传输-离散_第19张图片m个生产者,n个消费者,
c ( p i , q j ) c(p_i, q_j) c(pi,qj) 是个常数,表示 p i p_i pi q j q_j qj传递所需要花费的代价
第i个生产者生产总量是 m i u i miu_i miui,第j个消费者消费总量是 v j v_j vj,第i个生产者向第j个消费者运算 g a m m a i j gamma_ij gammaij,对每个生产者,送过去的生产总量等于 m i u i miu_i miui
对整个传输方案,希望代价越小越好。
都是线性的。
最优传输-离散_第20张图片
所有可能的 g a m m a i j gamma_ij gammaij有等式约束和不等式约束,构成凸集,
能量函数是线性函数,与凸多边体相交,最上面交点代表最优传输,最下面代表最差传输。证明了方案存在,最优传输最开始就是线性规划。

对线性规划问题
最优传输-离散_第21张图片
工厂要最大化收益,变量时x1到xn,另外一个工厂要租用我们的设备,第一种车床要y1元…

最优传输-离散_第22张图片
这些线性不等式构成一个凸多面体,要使线性函数最大化,即凸多面体上线性能量最大化。
最优传输-离散_第23张图片
有m种资源,每种资源有对应的报价y,总报价w,要让总报价最小
最优传输-离散_第24张图片
自己生产利润CX要小于租出去的利润。
最优传输-离散_第25张图片
最优传输-离散_第26张图片

最优传输-离散_第27张图片
最优传输-离散_第28张图片
2个生产者,3个消费者,左边是原始问题,右边是对偶问题。
一大半DL算右边,因为左边m*n个未知变量,右边m+n个未知变量(影子价格是未知变量)。
最优传输-离散_第29张图片
第i个生产者影子价格是 f a i i fai_i faii,第j个消费者影子价格是 p o s i j posi_j posij

最优传输-离散_第30张图片
把连续最优传输问题离散化,在原区域 o m i g a omiga omiga中离散采样。
最优传输-离散_第31张图片

Monge问题

Kantarovich问题

最优传输-离散_第32张图片
映射把一个点映射成一个点,方案可以把一个点映射成多个点
最优传输-离散_第33张图片
一个生产者可以对应多个消费者
最优传输-离散_第34张图片
支持集:概率密度大于0的部分。

你可能感兴趣的:(论文,算法,机器学习,python,人工智能,深度学习)